Linode

Amazon OpenSearch Serverless 向量引擎預覽版正式推出,助力客戶輕鬆構建現代生成式 AI 應用

Editor

亞馬遜雲科技宣佈推出 Amzon OpenSech Seeless 向量引擎預覽版。該向量引擎在 Amzon OpenSech Seeless 中提供了一種簡單、可擴展、高性能的相似性搜索功能,讓用戶能夠輕鬆構建由現代化機器學習(ML)增強的搜索體驗和生成式 AI 應用程序,無需管理底層向量數據庫基礎設施。

向量嵌入助力機器學習增強的搜索和生成式 AI 的應用

所有行業的企業都在迅速採用生成式 AI,因爲它能夠處理龐大的數據集、生成自動化內容,並提供媲美人類的交互式響應。通過集成聊天機器人、問答系統和個性化推薦等先進的對話生成式 AI 應用程序,客戶正在想方設法徹底變革最終用戶體驗以及與數字平臺的交互。這些對話應用程序讓用戶能夠用自然語言進行搜索和查詢,並通過理解語義、用戶意圖和查詢上下文,生成酷似人類的響應。

機器學習增強的搜索應用和生成式 AI 的應用程序都需要使用向量嵌入,向量嵌入作爲文本、圖像、音頻和視頻數據的數字表示,可以用來生成動態的相關內容。向量嵌入基於用戶私有數據進行訓練,代表信息的語義和上下文屬性。理想情況下,這些嵌入可以就近存儲和管理,如接近現有的搜索引擎或數據庫等特定領域數據集。由此,企業能夠通過處理用戶查詢找到最近的向量,並將它們與其他元數據結合,從而集成搜索結果。

這一過程完全無需依賴外部數據源或其它應用程序。客戶希望向量數據庫是易於構建的,且便於從原型設計快速到生產環境,這樣他們就可以將精力集中在創建差異化應用程序上。Amzon OpenSech Seeless 向量引擎擴展了 Amzon OpenSech 的搜索能力,使用戶能夠實時存儲、搜索和追溯數十億向量嵌入,並精確進行相似性匹配和語義搜索,無需考慮底層基礎設施。

探索向量引擎功能

構建於 Amzon OpenSech Seeless 的向量引擎天然具備魯棒性。使用向量引擎,用戶不必擔心後端基礎設施的選型、調優和擴展問題。向量引擎可自動調整資源,來適應不斷變化的工作負載模式和需求,從而提供始終如一的快速性能和適當規模。即便向量數量從原型設計期間的數千個猛增至生產環境中的數億個,向量引擎也可以無縫擴展,無需重新索引或重新加載數據來擴展基礎設施。

此外,向量引擎爲索引和工作負載搜索提供了單獨的計算資源,讓用戶可以實時無縫地獲取、更新和刪除向量,同時確保用戶查詢性能絲毫不受影響。所有數據都長久地存儲在 Amzon Simple Stoge Seice(Amzon S3) 中,因此用戶可以獲得與 Amzon S3 相同的數據持久性保證(個9,即99.999999999%)。儘管目前還處於預覽階段,但向量引擎是爲生產環境工作負載設計的,具有應對可用區中斷和基礎設施故障的冗餘機制。

Amzon OpenSech Seeless 向量引擎由開源 OpenSech 項目中的 k 近鄰(kNN)搜索功能提供支持,該功能能夠提供可靠而精確的結果。現今,許多客戶在託管集羣中使用 OpenSech kNN 搜索,以便在應用程序中提供語義搜索和個性化推薦。向量引擎的用戶體驗與 Seeless 環境一樣簡單易用。向量引擎支持歐氏距離、餘弦距離和點積等流行的距離指標,可容納6000個維度,因而非常適合支持各種基礎模型及其他 AI/ML 模型。

用戶還可以存儲各種數據的不同字段,例如元數據中的數字、布爾值、日期、關鍵字和地理位置,以及包含描述性信息的文本等,來爲存儲的向量添加更多上下文信息。多種類型數據的合併降低了複雜性,提升了可維護性,並且避免了數據重複、版本兼容性難題和許可問題,有效地簡化了應用程序棧。向量引擎支持相同的 OpenSech 開源套件 API,讓用戶可以充分利用其豐富的查詢功能,例如全文搜索、高級過濾、聚合、地理空間查詢、嵌套查詢,以加快數據檢索和增強搜索結果。以要求查找距離用戶5英里以內的結果的用例爲例,向量引擎可以在單個查詢中完成這項任務,而不需要維護兩個不同系統,並利用應用邏輯將結果合併。通過集成 LngChin、Amzon Bedock 和 Amzon SgeMke,用戶可以輕鬆地將首選機器學習和 AI 系統與向量引擎集成。

向量引擎支持不同領域的廣泛用例,包括圖像搜索、文檔搜索、音樂檢索、產品推薦、視頻搜索、基於位置的搜索、欺詐檢測以及異常檢測。亞馬遜雲科技預測,將詞彙搜索方法與先進的機器學習和生成式 AI 功能結合的混合搜索將會日益流行。例如,當用戶在電子商務網站上搜索“紅色襯衫”時,語義搜索通過檢索所有紅色來擴大搜索範圍,同時在詞法(BM25 算法)搜索上實現調優和邏輯增強。利用 Amzon OpenSech 過濾功能,企業可以爲用戶提供基於尺寸、品牌、價格範圍和附近商店等信息來優化搜索選項,從而進一步增強搜索結果的相關性,以便打造更個性化、更精準的體驗。向量引擎支持的混合搜索使得用戶能夠在單個查詢調用中查詢向量嵌入、元數據和描述性信息,從而在不構建複雜應用程序代碼的情況下,輕鬆地提供更準確的,與上下文相關的搜索結果。

從預覽到正式可用

亞馬遜雲科技近日宣佈推出向量引擎的預覽版,用戶可以立即開始試用。

在向量引擎正式可用之前,亞馬遜雲科技計劃提供兩項功能,降低客戶首個集合的成本。第一項功能是新的開發-測試選項,它使用戶能夠在沒有備份或副本的情況下啓動集合,從而將入門成本降低50%。向量引擎仍然提供持久性保證,因爲它將所有數據保存在 Amzon S3 中。第二項功能是在初始階段配置0.5 OCU(OpenSech 計算單位)資源,資源將根據用戶的實際工作負載來擴展;如果初始工作負載的規模是數萬到數十萬個向量(取決於維度數量),用戶則可以進一步降低成本。除了這兩項功能外,亞馬遜雲科技將把支持用戶首個集合所需的最低 OCU 從每小時4個降至每小時個。

亞馬遜雲科技還在開發一些新功能,在未來幾個月,將會幫助用戶實現工作負載暫停與恢復,這項新功能對向量引擎十分有用,因爲其中許多用例不需要持續索引數據。


相关文章

  • 亞馬遜雲科技自研芯片Amazon Graviton3 實例已落地中國

    亞馬遜雲科技宣佈通過與光環新網和西雲數據的緊密合作,在亞馬遜雲科技北京區域和寧夏區域推出基於自研芯片 Amzon Giton3 處理器的 Amzon Elstic Compute Cloud(Amzon EC2)M7g 通用型、C7g 計算優化型和 R7g 內存優化型三款實例。 這些實例均基於 Am...

  • 騰訊雲印度尼西亞首個數據中心投入使用

    4月3日騰訊雲在印度尼西亞的首座數據中心在雅加達正式投入使用,未來幾個月預計還將啓用第二座數據中心。 近年來,由於海外需求增加和國內激烈的競爭,騰訊雲已加強了其在全球的發展。該公司的海外數據中心已新加坡,泰國,韓國,日本,印度,俄羅斯,美國,加拿大和德國等國家。到目前爲止,騰訊雲已經在全球27個地理...

  • Drupal 10計劃於2022年8月發佈

    Dupl是一箇免費的、開源的內容管理系統,它的基本特點包括易於使用、模塊化和支持最新技術的協作功能。Dupl 0計劃於2022年8月發佈,它將是Dupl 9的改進版本,帶來了諸多改進和新功能。另外,從Dupl 9升級到Dupl 0會像從Dupl 8升級到Dupl 9一樣簡單。 Dupl 0部分關鍵特...

  • RAKsmart客戶後臺新增服務面板密碼重置功能

    我們在購買RAKsmt海外服務器時,一般會先使用電子郵件地址註冊一箇RAKsmt賬戶,以便訪問客戶後臺管理頁面。RAKsmt後臺功能豐富,可以購買當前在售的服務器產品、獲得技術支持、進行賬戶管理等操作。 點擊訪問:RAKsmt官網 近期,RAKsmt後臺技術支持菜單項新增了服務面板密碼重置功能,不過...

  • OptinMonster 2.6.4及以下版本發現漏洞 建議及時更新

    近日,WodPess常用插件All in One SEO(版本4.0.0 和4..5.2之間)和OptinMonste(版本2.6.4及以下)中發現了嚴重漏洞。擁有較少權限的WodPess用戶(如訂閱者或投稿者)可以利用漏洞並從受影響網站的數據庫中獲取特權信息(如用戶名和密碼)的訪問權限。 爲了修補...

  • 亞馬遜雲科技AWS宣佈推出AWS AppConfig擴展工具

    亞馬遜雲科技AWS宣佈推出AWS AppConfig擴展工具,這是一項新功能,允許客戶增強和擴展功能標記和動態運行時配置數據的能力。 AWS AppConfig是AWS Systems Mnge中的一項功能,允許客戶配置、驗證和部署配置數據,以更安全、更快速地更新應用程序行爲。AppConfig擴展...

  • Amazon OpenSearch Serverless 向量引擎預覽版正式推出,助力客戶輕鬆構建現代生成式 AI 應用

    亞馬遜雲科技宣佈推出 Amzon OpenSech Seeless 向量引擎預覽版。該向量引擎在 Amzon OpenSech Seeless 中提供了一種簡單、可擴展、高性能的相似性搜索功能,讓用戶能夠輕鬆構建由現代化機器學習(ML)增強的搜索體驗和生成式 AI 應用程序,無需管理底層向量數據庫基...

  • GNOME 42發佈 新特性介紹

    GNOME項目近日發佈了GNOME 42,這是其開源桌面環境的最新版本。GNOME 42引入了一些新功能、UI調整和性能提升。預計在下個月發佈的Ubuntu 22.04將啓用GNOME 42桌面環境,下面來看下GNOME 42新特性主要有哪些。 GNOME 42新特性 GNOME 42具有一箇更明亮...

  • 拼多多跨境電商平臺Temu在歐洲上線多箇站點

    在佈局英國市場後,拼多多旗下跨境電商平臺Temu的德國站、荷蘭站、意大利站、法國站、西班牙站均於日前上線。截至目前,Temu官方網站顯示已上線0個海外市場,分別是美國、加拿大、澳大利亞、新西蘭、英國、德國、荷蘭、意大利、法國和西班牙,未來還可能增加更多。 “Temu”官方口號爲“Tem Up,Pic...

  • 寶塔Windows面板新版本7.2.0發佈

    寶塔面板Windows在6月8日已上線了新版本,目前最新版本是7.2.0免費版/企業版,僅支持Windows See 2008/202/206/209 64位系統(中文簡體),支持一鍵WNMP/WAMP/IIS/SQLSee/網站/FTP/數據庫等00多項服務器管理功能,有需求用戶可以下載使用了。 ...