騰訊雲向量數據庫正式上線公測 提供10億級向量檢索能力

8月日,騰訊雲向量數據庫(Tencent Cloud Vecto DB)正式上線公測。騰訊雲向量數據庫不僅能爲大模型提供外部知識庫,提高大模型回答的準確性,還可廣泛應用於推薦系統、文本圖像檢索、自然語言處理等 AI 領域。騰訊雲向量數據庫是國內首個從接入層、計算層、到存儲層提供全生命週期AI化的向量數據庫。

作爲一款全託管的自研企業級分佈式數據庫服務,騰訊雲向量數據庫專用於存儲、檢索、分析多維向量數據。該數據庫支持多種索引類型和相似度計算方法,單索引支持 0 億級向量規模,可支持百萬級 QPS 及毫秒級查詢延遲。

向量數據庫通過把數據向量化然後進行存儲和查詢,可以極大地提升效率和降低成本。它能解決大模型預訓練成本高、沒有“長期記憶”、知識更新不足、提示詞工程複雜等問題,突破大模型在時間和空間上的限制,加速大模型落地行業場景。

統計顯示,將騰訊雲向量數據庫用於大模型預訓練數據的分類、去重和清洗相比傳統方式可以實現0倍效率的提升,如果將向量數據庫作爲外部知識庫用於模型推理,則可以將成本降低2-4個數量級。

企業原先接入一箇大模型需要花個月左右時間,使用騰訊雲向量數據庫後,3天時間即可完成,極大降低了企業的接入成本。此前騰訊雲向量數據庫的向量化能力(embedding)曾多次獲得權威機構認可,202年曾登頂MS MARCO榜單第一、相關成果已發表於NLP頂會EMNLP。