Linode

Amazon OpenSearch Serverless 向量引擎預覽版正式推出,助力客戶輕鬆構建現代生成式 AI 應用

Editor

亞馬遜雲科技宣佈推出 Amzon OpenSech Seeless 向量引擎預覽版。該向量引擎在 Amzon OpenSech Seeless 中提供了一種簡單、可擴展、高性能的相似性搜索功能,讓用戶能夠輕鬆構建由現代化機器學習(ML)增強的搜索體驗和生成式 AI 應用程序,無需管理底層向量數據庫基礎設施。

向量嵌入助力機器學習增強的搜索和生成式 AI 的應用

所有行業的企業都在迅速採用生成式 AI,因爲它能夠處理龐大的數據集、生成自動化內容,並提供媲美人類的交互式響應。通過集成聊天機器人、問答系統和個性化推薦等先進的對話生成式 AI 應用程序,客戶正在想方設法徹底變革最終用戶體驗以及與數字平臺的交互。這些對話應用程序讓用戶能夠用自然語言進行搜索和查詢,並通過理解語義、用戶意圖和查詢上下文,生成酷似人類的響應。

機器學習增強的搜索應用和生成式 AI 的應用程序都需要使用向量嵌入,向量嵌入作爲文本、圖像、音頻和視頻數據的數字表示,可以用來生成動態的相關內容。向量嵌入基於用戶私有數據進行訓練,代表信息的語義和上下文屬性。理想情況下,這些嵌入可以就近存儲和管理,如接近現有的搜索引擎或數據庫等特定領域數據集。由此,企業能夠通過處理用戶查詢找到最近的向量,並將它們與其他元數據結合,從而集成搜索結果。

這一過程完全無需依賴外部數據源或其它應用程序。客戶希望向量數據庫是易於構建的,且便於從原型設計快速到生產環境,這樣他們就可以將精力集中在創建差異化應用程序上。Amzon OpenSech Seeless 向量引擎擴展了 Amzon OpenSech 的搜索能力,使用戶能夠實時存儲、搜索和追溯數十億向量嵌入,並精確進行相似性匹配和語義搜索,無需考慮底層基礎設施。

探索向量引擎功能

構建於 Amzon OpenSech Seeless 的向量引擎天然具備魯棒性。使用向量引擎,用戶不必擔心後端基礎設施的選型、調優和擴展問題。向量引擎可自動調整資源,來適應不斷變化的工作負載模式和需求,從而提供始終如一的快速性能和適當規模。即便向量數量從原型設計期間的數千個猛增至生產環境中的數億個,向量引擎也可以無縫擴展,無需重新索引或重新加載數據來擴展基礎設施。

此外,向量引擎爲索引和工作負載搜索提供了單獨的計算資源,讓用戶可以實時無縫地獲取、更新和刪除向量,同時確保用戶查詢性能絲毫不受影響。所有數據都長久地存儲在 Amzon Simple Stoge Seice(Amzon S3) 中,因此用戶可以獲得與 Amzon S3 相同的數據持久性保證(個9,即99.999999999%)。儘管目前還處於預覽階段,但向量引擎是爲生產環境工作負載設計的,具有應對可用區中斷和基礎設施故障的冗餘機制。

Amzon OpenSech Seeless 向量引擎由開源 OpenSech 項目中的 k 近鄰(kNN)搜索功能提供支持,該功能能夠提供可靠而精確的結果。現今,許多客戶在託管集羣中使用 OpenSech kNN 搜索,以便在應用程序中提供語義搜索和個性化推薦。向量引擎的用戶體驗與 Seeless 環境一樣簡單易用。向量引擎支持歐氏距離、餘弦距離和點積等流行的距離指標,可容納6000個維度,因而非常適合支持各種基礎模型及其他 AI/ML 模型。

用戶還可以存儲各種數據的不同字段,例如元數據中的數字、布爾值、日期、關鍵字和地理位置,以及包含描述性信息的文本等,來爲存儲的向量添加更多上下文信息。多種類型數據的合併降低了複雜性,提升了可維護性,並且避免了數據重複、版本兼容性難題和許可問題,有效地簡化了應用程序棧。向量引擎支持相同的 OpenSech 開源套件 API,讓用戶可以充分利用其豐富的查詢功能,例如全文搜索、高級過濾、聚合、地理空間查詢、嵌套查詢,以加快數據檢索和增強搜索結果。以要求查找距離用戶5英里以內的結果的用例爲例,向量引擎可以在單個查詢中完成這項任務,而不需要維護兩個不同系統,並利用應用邏輯將結果合併。通過集成 LngChin、Amzon Bedock 和 Amzon SgeMke,用戶可以輕鬆地將首選機器學習和 AI 系統與向量引擎集成。

向量引擎支持不同領域的廣泛用例,包括圖像搜索、文檔搜索、音樂檢索、產品推薦、視頻搜索、基於位置的搜索、欺詐檢測以及異常檢測。亞馬遜雲科技預測,將詞彙搜索方法與先進的機器學習和生成式 AI 功能結合的混合搜索將會日益流行。例如,當用戶在電子商務網站上搜索“紅色襯衫”時,語義搜索通過檢索所有紅色來擴大搜索範圍,同時在詞法(BM25 算法)搜索上實現調優和邏輯增強。利用 Amzon OpenSech 過濾功能,企業可以爲用戶提供基於尺寸、品牌、價格範圍和附近商店等信息來優化搜索選項,從而進一步增強搜索結果的相關性,以便打造更個性化、更精準的體驗。向量引擎支持的混合搜索使得用戶能夠在單個查詢調用中查詢向量嵌入、元數據和描述性信息,從而在不構建複雜應用程序代碼的情況下,輕鬆地提供更準確的,與上下文相關的搜索結果。

從預覽到正式可用

亞馬遜雲科技近日宣佈推出向量引擎的預覽版,用戶可以立即開始試用。

在向量引擎正式可用之前,亞馬遜雲科技計劃提供兩項功能,降低客戶首個集合的成本。第一項功能是新的開發-測試選項,它使用戶能夠在沒有備份或副本的情況下啓動集合,從而將入門成本降低50%。向量引擎仍然提供持久性保證,因爲它將所有數據保存在 Amzon S3 中。第二項功能是在初始階段配置0.5 OCU(OpenSech 計算單位)資源,資源將根據用戶的實際工作負載來擴展;如果初始工作負載的規模是數萬到數十萬個向量(取決於維度數量),用戶則可以進一步降低成本。除了這兩項功能外,亞馬遜雲科技將把支持用戶首個集合所需的最低 OCU 從每小時4個降至每小時個。

亞馬遜雲科技還在開發一些新功能,在未來幾個月,將會幫助用戶實現工作負載暫停與恢復,這項新功能對向量引擎十分有用,因爲其中許多用例不需要持續索引數據。


相关文章

  • 阿里雲AI新品通義聽悟開啓公測 用戶可免費領100小時轉寫服務

    阿里雲近日宣佈聚焦音視頻內容的AI新品“通義聽悟”正式上線,成爲國內首個開放公測的大模型應用產品。公測期間,用戶可領取00小時以上聽悟免費轉寫時長。據瞭解,通義聽悟接入了通義千問大模型的理解與摘要能力,可成爲用戶工作學習中的得力AI助手,幫助隨時隨地高效完成對音視頻內容的轉寫、檢索、摘要和整理。 點...

  • Joomla版本更新:Joomla4 beta2發佈

    Jooml4 bet2與2020年06年20日正式發佈,Jooml4 bet2是Jooml4的測試版,也就是說距Jooml4正式版發佈又進了一步,目前Jooml4 bet2版本僅供開發測試使用。 什麼是Jooml4? Jooml4的設計目標是提供一箇可靠,穩定,安全的建站平臺。相信絕大多數的中國用戶...

  • LNMP 1.8正式版上線 新增PHP 8.0支持功能

    LNMP .8正式版已上線,目前可以下載使用。在Linux VPS或獨立主機上安裝LNMP(Nginx/MySQL/PHP),無需單獨輸入命令,安裝優化編譯參數,提高性能,解決不必要的軟件間依賴,操作起來也比較簡單。下面就來看下最新版LNMP .8主要更新功能都有哪些。 LNMP .8正式版主要更新...

  • 騰訊雲第八代全新雲服務器S8/M8重磅發佈

    4月5日騰訊雲正式上線第八代雲服務器標準型實例 S8和內存型實例M8,基於自研服務器的高密設計與硬件升級,搭載第五代英特爾®至強®可擴展處理器的騰訊雲實例S8/M8,計算性能大幅提升,對比騰訊云云服務器上代實例,整機性能提升5%,單核性能提升28%,內存帶寬提升75%。 內置英特爾® 高級矩陣擴展(...

  • Joomla! 4.1.2和3.10.8版本發佈 修復多項安全漏洞

    Jooml! 4..2和3.0.8發佈,它們是Jooml! 4.x和3.x系列的安全版本,解決了一些安全漏洞,幷包含各種錯誤修復和改進。 Jooml! 4..2包括4..中除20220303外的所有安全補丁,該補丁由於實施問題而被恢復。 Jooml! 4..中修復的安全問題: [2022030]低嚴...

  • Cloudways爲WordPress推出了Cron優化器 以減少服務器負載

    Cloudwys近日宣佈推出了Con Optimize,該Con優化器是專門爲WodPess設計的,它會自動檢測應用程序安裝是否是多站點的,在多站點應用程序的情況下,逐個執行每個子站點的事件。它不僅可以無縫地切換到服務器端Cons,還可以智能地交錯它們的執行以減少服務器負載。 Con Jobs通過在...

  • Gutenberg 15.1增加了Openverse集成

    Gutenbeg 5.在媒體標籤中集成了Openese,它包含了超過6億張免費使用的圖片和音頻文件,現在可以在WodPess的編輯器中使用。例如,您可點擊一箇Openese圖片,它會立即作爲一箇圖片塊插入,並自動在標題中添加適當的屬性和許可。這種體驗比從Openese網站下載然後上傳到媒體庫要快得多...

  • Krypt服務器硬盤/內存升級配置價格調降

    Kypt服務器又有新調整啦!此次調整對廣大站長來說也是一種福利,小編收到郵件內容稱Kypt服務器硬盤和內存升級配置價格調降,新價格由今日開始生效,限新購服務器。小編將配置詳情表整理如下,大家可以參考一下。 官網地址:www.kypt.com 舊價格對照表如下: 硬盤容量 舊價格 新價格 TB SAT...

  • WHMCS 8.2新增用戶身份驗證服務功能

    近日WHMCS 8.2新增了用戶身份驗證功能,有效地保證了用戶信息安全,降低欺詐和濫用服務等情況發生。下面就來了解下WHMCS 8.2中的用戶身份驗證是如何發揮作用的。 WHMCS 8.2包括與Nmechep可信服務的集成RVlidtion,能提供自動化的用戶身份驗證。您可以在管理員和客戶端...

  • Vultr通過Sabey數據中心擴展雲GPU容量和Eco Focus

    Vult宣佈位於華盛頓州東韋納奇市SDC市的Sbey數據中心將擴建西雅圖雲數據中心區域,此次擴展包括 NVIDIA HGX H00集羣的大幅增加,這些集羣現在可以按需購買和通過預訂合同購買。 :Vult官網選購 Vult決定在Sbey的工廠進行擴張,凸顯了其在滿足環境、社會和公司治理目標的同時提供尖...