Linode

騰訊雲異構計算平臺全面支持Llama 3 助力一鍵部署和性能翻倍

Editor

近日,號稱史上最強大的開源模型——Met Llm 3 正式發佈。伴隨着日新月異的模型生態,騰訊雲異構計算平臺作爲覆蓋90%+大模型客戶的AI底座,現已做好充足的準備,圍繞Llm 3系列模型,提供從基礎設施到編排調度的智算產品矩陣,爲企業及開發者提供更快部署、更強性能和更高吞吐的全鏈路解決方案。

一、更快部署 通過 HAI 創建 Llm 3 僅需 3 分鐘

隨着大模型時代的到來,應用有望生長出更大價值。如何取得先發優勢、優質的模型能力是構建AI應用核心競爭力的關鍵。爲了解決中小企業及開發者在AI應用上擔心的敏捷部署、成本效益、數據安全等難題,我們推出了全新的即插即用的 GPU 應用服務產品——高性能應用服務 HAI 。不僅提供即插即用的便捷性,還支持 AI 模型在雲端的私有化部署,確保在有豐富模型選擇的同時,數據安全也能得到嚴格保護。

在 Met 發佈 Llm 3 後,騰訊雲 HAI 第一時間支持了 Llm 3 的一鍵部署。通過 HAI 僅需 3 分鐘,中小企業及開發者可以輕鬆實現基於 Llm 3 的應用創作與開發,將其應用於各種場景,如智能客服、內容創作、文本分析等,提升產品競爭力或企業運營效率。

騰訊雲 HAI 提供一鍵即得的澎湃算力與常見環境,助力中小企業及開發者快速部署 LLM、AI 作畫、數據科學等高性能應用,原生集成配套的開發工具與組件,大幅提高應用層的開發生產效率。此前已支持 ChtGLM 系列、Stble Diffusion、Llm 2 等豐富主流模型,同時支持 Notebook、WebUI 等多種圖形化算力交互模式,以應用爲核心降低雲原生 AI 應用落地門檻。

二、更強性能 全新實例 Llm 3 推理性能提高 2-0 倍

在硬件層面,騰訊雲推出的最新一代異構計算 GPU 實例 PNV5b,圍繞 Llm 3 等大模型場景,將AI推理部署性價比提升至新的高度。

Llm 3的模型特點與 Llm 2 十分類似,支持 GQA 機制降低大模型推理過程中的 KV cche 顯存開銷。PNV5b實例採用最新一代 GPU,單卡搭配 48GB 顯存,在算力和顯存匹配上做到了更好的平衡,爲大模型推理提供了更優的性價比。同時,PNV5b 實例在整機架構設計上支持最大單機 8 顆 GPU 高效擴展,大幅提升分佈式推理性能。

在 Llm 3 的推理部署測試中,在典型業務請求壓力條件下,PNV5b 的推理吞吐對比上一代 PNV4 可提升 2-3 倍;而在極端請求壓力測試下,性能可進一步提升至 0 倍。這意味着,PNV5b 實例能提供更好的性能擴展能力,讓用戶在面對大模型的業務洪峯時更加遊刃有餘。

除此之外,PNV5b 通過星星海服務器搭配最新一代 AMD CPU 平臺,提供多種實例規格,可靈活匹配大模型推理、大模型精調、推薦系統等多種場景的實例規格需求。將爲廣大用戶帶來更貼合業務的AI模型訓練和推理體驗,爲企業和開發者創造更多的價值。


相关文章

  • 7月12日CNNIC註冊局.CN/.中國不良應用域名處置規則調整通知

    根據.CN、.中國域名註冊管理機構中國互聯網絡信息中心(CNNIC)的有關通知和要求,自2022年7月2日起,.CN、.中國不良應用域名的處置規則將進行以下調整: 、除對不良應用域名進行暫停解析(seeHold)、禁止更新(seeUpdtePohibited)、禁止轉移(seeTnsfePohibi...

  • 拼多多跨境電商平臺Temu日本站點上線

    近日,拼多多跨境電商平臺Temu日本站點已經上線。Temu日本站依舊延續了低價促銷策略,提供英文及日文兩種語言,結算幣種已更換至日元,賣家的店鋪評分及產品也直接同步遷移。 Temu日本站點開業舉行了不少促銷優惠,大額優惠券包含滿3700減600、滿7500減200、滿5000減3000(日元)等,活...

  • 谷歌宣佈推出新的私有計算服務 以提高Android安全性

    近日谷歌官方宣佈推出一套新的 Pite Compute Seices(私有計算服務),可在私有計算核心和雲之間架起保護隱私的橋樑,此前在 Andoid 2Bet 中引入了 Andoid的 Pite Compute Coe(私有計算核心)。 Andoid 的私有計算核心是一箇開源、安全的環境,與其他操...

  • 微軟宣佈在.NET SDK中內置了對.NET應用容器化的支持

    近日,微軟宣佈在.NET SDK中內置了對.NET應用容器化的支持。公告指出,容器已經成爲在雲中分發和運行各種應用程序和服務的最簡單的方式之一。早在幾年前,.NET運行時就已經針對容器進行了強化。現在,開發人員可通過dotnet publish創建應用程序的容器化版本。 .NET SDK是一組庫和工...

  • GreenGeeks推出新的票證驗證系統 以加強賬戶安全保護

    GeenGeeks近日宣佈推出一箇新的票證驗證(Ticket Vlidtion)系統,用於驗證通過電子郵件打開的支持票證,以進一步加強賬戶安全保護,防止未經授權的訪問。這一新的實施將於2022年5月7日開始。 GeenGeeks是一家以綠色環保爲主題的主機商,旗下產品包括虛擬主機、WodPess主機...

  • 美國主機商RackNerd新增法國斯特拉斯堡和德國法蘭克福兩大機房

    近日老牌美國主機商RckNed新增德國斯特拉斯堡和德國法蘭克福兩大數據中心,到目前爲止RckNed擁有洛杉磯DC0、洛杉磯DC02、洛杉磯DC03、洛杉磯DC05、聖何塞、西雅圖、芝加哥、新澤西、亞特蘭大、達拉斯、水牛城、阿什本、猶他、紐約、坦帕、蒙特利爾、荷蘭阿姆斯特丹、英國倫敦、法國斯特拉斯堡和...

  • Linode宣佈推出新站點/新的雲計算服務和改進的性能

    美國主機商Linode宣佈推出新雲計算網站、新的高級實例,使對象存儲容量增加了一倍,並推出全球負載均衡器計劃,以滿足現代應用程序更高的性能、更低的延遲和真正的全局可擴展性需要。 Linode新的雲計算網站日前新增了巴黎、華盛頓和芝加哥站點,本季度晚些時候也將開放西雅圖和印度欽奈站點,以便將計算、存儲...

  • PayPal老用戶用62開頭銀聯卡交易 滿60美元可享15%美元返現

    PyPl老用戶(在7月23日之前註冊的PyPl個人賬戶的用戶)購物返現活動正在進行中,只需兩步,便可輕鬆參與5%美元返現活動,單筆返現最高5美元,每位PyPl用戶限三筆。下面來看下相關活動詳情。 如何參與5%美元返現活動? 202年7月23日至0月5日,凡成功通過指定活動頁面報名參加活動的PyPl用...

  • Joomla 4.3.0正式版發佈 新功能介紹

    Jooml是一箇模塊化的內容管理系統,可以在Linux、Windows、McOSX等各種不同的平臺上執行,允許您快速構建網站和強大的在線應用程序。Jooml 4.3.0正式版發佈,該版本引入了諸多改進和新功能。 Jooml 4.3.0主要功能介紹: 改進的媒體管理器 排序 圖像縮略圖 SVG文件預覽...

  • 亞馬遜雲科技自研芯片Amazon Graviton3 實例已落地中國

    亞馬遜雲科技宣佈通過與光環新網和西雲數據的緊密合作,在亞馬遜雲科技北京區域和寧夏區域推出基於自研芯片 Amzon Giton3 處理器的 Amzon Elstic Compute Cloud(Amzon EC2)M7g 通用型、C7g 計算優化型和 R7g 內存優化型三款實例。 這些實例均基於 Am...