Linode

Amazon OpenSearch Serverless 向量引擎預覽版正式推出,助力客戶輕鬆構建現代生成式 AI 應用

Editor

亞馬遜雲科技宣佈推出 Amzon OpenSech Seeless 向量引擎預覽版。該向量引擎在 Amzon OpenSech Seeless 中提供了一種簡單、可擴展、高性能的相似性搜索功能,讓用戶能夠輕鬆構建由現代化機器學習(ML)增強的搜索體驗和生成式 AI 應用程序,無需管理底層向量數據庫基礎設施。

向量嵌入助力機器學習增強的搜索和生成式 AI 的應用

所有行業的企業都在迅速採用生成式 AI,因爲它能夠處理龐大的數據集、生成自動化內容,並提供媲美人類的交互式響應。通過集成聊天機器人、問答系統和個性化推薦等先進的對話生成式 AI 應用程序,客戶正在想方設法徹底變革最終用戶體驗以及與數字平臺的交互。這些對話應用程序讓用戶能夠用自然語言進行搜索和查詢,並通過理解語義、用戶意圖和查詢上下文,生成酷似人類的響應。

機器學習增強的搜索應用和生成式 AI 的應用程序都需要使用向量嵌入,向量嵌入作爲文本、圖像、音頻和視頻數據的數字表示,可以用來生成動態的相關內容。向量嵌入基於用戶私有數據進行訓練,代表信息的語義和上下文屬性。理想情況下,這些嵌入可以就近存儲和管理,如接近現有的搜索引擎或數據庫等特定領域數據集。由此,企業能夠通過處理用戶查詢找到最近的向量,並將它們與其他元數據結合,從而集成搜索結果。

這一過程完全無需依賴外部數據源或其它應用程序。客戶希望向量數據庫是易於構建的,且便於從原型設計快速到生產環境,這樣他們就可以將精力集中在創建差異化應用程序上。Amzon OpenSech Seeless 向量引擎擴展了 Amzon OpenSech 的搜索能力,使用戶能夠實時存儲、搜索和追溯數十億向量嵌入,並精確進行相似性匹配和語義搜索,無需考慮底層基礎設施。

探索向量引擎功能

構建於 Amzon OpenSech Seeless 的向量引擎天然具備魯棒性。使用向量引擎,用戶不必擔心後端基礎設施的選型、調優和擴展問題。向量引擎可自動調整資源,來適應不斷變化的工作負載模式和需求,從而提供始終如一的快速性能和適當規模。即便向量數量從原型設計期間的數千個猛增至生產環境中的數億個,向量引擎也可以無縫擴展,無需重新索引或重新加載數據來擴展基礎設施。

此外,向量引擎爲索引和工作負載搜索提供了單獨的計算資源,讓用戶可以實時無縫地獲取、更新和刪除向量,同時確保用戶查詢性能絲毫不受影響。所有數據都長久地存儲在 Amzon Simple Stoge Seice(Amzon S3) 中,因此用戶可以獲得與 Amzon S3 相同的數據持久性保證(個9,即99.999999999%)。儘管目前還處於預覽階段,但向量引擎是爲生產環境工作負載設計的,具有應對可用區中斷和基礎設施故障的冗餘機制。

Amzon OpenSech Seeless 向量引擎由開源 OpenSech 項目中的 k 近鄰(kNN)搜索功能提供支持,該功能能夠提供可靠而精確的結果。現今,許多客戶在託管集羣中使用 OpenSech kNN 搜索,以便在應用程序中提供語義搜索和個性化推薦。向量引擎的用戶體驗與 Seeless 環境一樣簡單易用。向量引擎支持歐氏距離、餘弦距離和點積等流行的距離指標,可容納6000個維度,因而非常適合支持各種基礎模型及其他 AI/ML 模型。

用戶還可以存儲各種數據的不同字段,例如元數據中的數字、布爾值、日期、關鍵字和地理位置,以及包含描述性信息的文本等,來爲存儲的向量添加更多上下文信息。多種類型數據的合併降低了複雜性,提升了可維護性,並且避免了數據重複、版本兼容性難題和許可問題,有效地簡化了應用程序棧。向量引擎支持相同的 OpenSech 開源套件 API,讓用戶可以充分利用其豐富的查詢功能,例如全文搜索、高級過濾、聚合、地理空間查詢、嵌套查詢,以加快數據檢索和增強搜索結果。以要求查找距離用戶5英里以內的結果的用例爲例,向量引擎可以在單個查詢中完成這項任務,而不需要維護兩個不同系統,並利用應用邏輯將結果合併。通過集成 LngChin、Amzon Bedock 和 Amzon SgeMke,用戶可以輕鬆地將首選機器學習和 AI 系統與向量引擎集成。

向量引擎支持不同領域的廣泛用例,包括圖像搜索、文檔搜索、音樂檢索、產品推薦、視頻搜索、基於位置的搜索、欺詐檢測以及異常檢測。亞馬遜雲科技預測,將詞彙搜索方法與先進的機器學習和生成式 AI 功能結合的混合搜索將會日益流行。例如,當用戶在電子商務網站上搜索“紅色襯衫”時,語義搜索通過檢索所有紅色來擴大搜索範圍,同時在詞法(BM25 算法)搜索上實現調優和邏輯增強。利用 Amzon OpenSech 過濾功能,企業可以爲用戶提供基於尺寸、品牌、價格範圍和附近商店等信息來優化搜索選項,從而進一步增強搜索結果的相關性,以便打造更個性化、更精準的體驗。向量引擎支持的混合搜索使得用戶能夠在單個查詢調用中查詢向量嵌入、元數據和描述性信息,從而在不構建複雜應用程序代碼的情況下,輕鬆地提供更準確的,與上下文相關的搜索結果。

從預覽到正式可用

亞馬遜雲科技近日宣佈推出向量引擎的預覽版,用戶可以立即開始試用。

在向量引擎正式可用之前,亞馬遜雲科技計劃提供兩項功能,降低客戶首個集合的成本。第一項功能是新的開發-測試選項,它使用戶能夠在沒有備份或副本的情況下啓動集合,從而將入門成本降低50%。向量引擎仍然提供持久性保證,因爲它將所有數據保存在 Amzon S3 中。第二項功能是在初始階段配置0.5 OCU(OpenSech 計算單位)資源,資源將根據用戶的實際工作負載來擴展;如果初始工作負載的規模是數萬到數十萬個向量(取決於維度數量),用戶則可以進一步降低成本。除了這兩項功能外,亞馬遜雲科技將把支持用戶首個集合所需的最低 OCU 從每小時4個降至每小時個。

亞馬遜雲科技還在開發一些新功能,在未來幾個月,將會幫助用戶實現工作負載暫停與恢復,這項新功能對向量引擎十分有用,因爲其中許多用例不需要持續索引數據。


相关文章

  • Linux內核LTS期限將從6年縮短至2年

    在日前舉行的歐洲開源峯會上,Linux內核開發人員兼《Linux Weekly News》執行主編 Jonthn Cobet 介紹了 Linux內核的最新動態以及未來的發展方向。其中一項即將發生的重大變化是:Linux內核的長期支持 (LTS) 時間將從六年縮短至兩年。 目前 Linux社區仍然遵守...

  • Amazon RDS for PostgreSQL已支持Rust語言

    Amzon Reltionl Dtbse Seice(RDS)fo PostgeSQL目前已經支持 Rust語言作爲一種新的可信程序語言。這允許您構建高性能的用戶定義函數,以擴展PostgeSQL進行計算密集型數據處理。 Rust將C語言等編譯語言的性能和資源效率與限制不安全內存使用風險的機制相結合...

  • Linode應用市場新增數據庫集羣部署支持

    Linode應用市場新增了數據庫集羣部署支持。通過啓用後端負載平衡和容錯,在集羣中運行數據庫可以提高性能和可用性。使用Linode提供的Ansible Collection,您可以在短短五分鐘內部署數據庫集羣。 美國主機商Linode提供的數據庫集羣部署目前支持MongoDB、MiDB、Postge...

  • Cloudways新增16個數據中心 爲更多地區用戶提供本地化託管服務

    知名雲服務器託管平臺Cloudwys近日宣佈其服務器陣容增加了6個新的數據中心,由AWS和GCE服務器混合組成,這些將爲Cloudwys用戶開放3個新地點。隨着新數據中心的加入,進一步擴大了Cloudwys覆蓋範圍和客戶需求。 Cloudwys讓用戶可以輕鬆地從AWS、DigitlOcen、Goog...

  • WordPress成立20週年 多地區舉辦慶祝活動

    WodPess於2023年5月27日迎來了20歲生日,官方推出了20週年的相關紀念活動WodPess Chpte聚會,還提供有限量版禮品可以選擇。WodPess最初於2003年作爲b2/cfelog的一箇分支發佈,在其20年的旅程中已經走過了漫長的道路。多年來,它經歷了重大的發展,並引入了諸多功能改...

  • Contabo日本東京數據中心上線

    德國主機商Contbo近日宣佈其日本東京數據中心正式上線,新的數據中心旨在爲日本、韓國和更廣泛的亞太地區用戶提供高性能連接和可靠的雲服務。Contbo目前在歐盟、英國、美國、澳大利亞和亞洲區域部署有8個數據中心,以滿足不同地區用戶需要。 Contbo日本東京機房現已提供雲VPS、存儲VPS、雲VDS...

  • 阿里雲發佈自研CPU芯片倚天710和磐久服務器

    0月9日,202雲棲大會現場,阿里雲推出面向雲原生時代的“磐久”自研服務器系列,自研CPU芯片倚天70也同時亮相。該款服務器將在今年部署,爲阿里雲自用。 據瞭解,自研雲芯片倚天70由阿里巴巴旗下半導體公司平頭哥發佈,是阿里雲推進「一雲多芯」策略的重要一步,也是阿里第一顆爲雲而生的CPU芯片,將在阿里...

  • PHP 8.2.1安全版本發佈 修復了多項錯誤

    PHP 8.2.安全版本發佈,這是PHP語言的最新次要版本,它帶來了各種錯誤修復,包括可能的崩潰修復。主要更新內容如下。 Coe: 修復了錯誤 GH-9905(當類未定義時 constnt () 行爲不一致)。 修復了錯誤 GH-998(xxHsh 的許可證信息未包含在 README.REDIST....

  • Rank Math推出Content AI SEO服務 支持免費試用

    Rnk Mth推出Content AI SEO服務,使用40多種高轉換模板和工具幫助用戶輕鬆地在WodPess中創建SEO優化的內容。該服務目前有Stte、Ceto、Expet方案可選,按年計費,每月$3.99起。當您購買新的Rnk Mth PRO、企業或機構會員資格時,將免費享受30天的Conte...

  • 2022年國家網絡安全宣傳週啓動 活動將從9月5日持續至11日

    2022年國家網絡安全宣傳週於9月5日在安徽合肥開幕,將在全國範圍內持續開展至9月日。其間,各地還將通過線上線下展覽和互動,開展網絡安全教育雲課堂、網絡安全賽事、網絡安全進基層等活動和校園日、電信日、個人信息保護日等6大系列主題日活動。 2022年國家網絡安全宣傳週以“網絡安全爲人民,網絡安全靠人民...