Linode

騰訊雲異構計算平臺全面支持Llama 3 助力一鍵部署和性能翻倍

Editor

近日,號稱史上最強大的開源模型——Met Llm 3 正式發佈。伴隨着日新月異的模型生態,騰訊雲異構計算平臺作爲覆蓋90%+大模型客戶的AI底座,現已做好充足的準備,圍繞Llm 3系列模型,提供從基礎設施到編排調度的智算產品矩陣,爲企業及開發者提供更快部署、更強性能和更高吞吐的全鏈路解決方案。

一、更快部署 通過 HAI 創建 Llm 3 僅需 3 分鐘

隨着大模型時代的到來,應用有望生長出更大價值。如何取得先發優勢、優質的模型能力是構建AI應用核心競爭力的關鍵。爲了解決中小企業及開發者在AI應用上擔心的敏捷部署、成本效益、數據安全等難題,我們推出了全新的即插即用的 GPU 應用服務產品——高性能應用服務 HAI 。不僅提供即插即用的便捷性,還支持 AI 模型在雲端的私有化部署,確保在有豐富模型選擇的同時,數據安全也能得到嚴格保護。

在 Met 發佈 Llm 3 後,騰訊雲 HAI 第一時間支持了 Llm 3 的一鍵部署。通過 HAI 僅需 3 分鐘,中小企業及開發者可以輕鬆實現基於 Llm 3 的應用創作與開發,將其應用於各種場景,如智能客服、內容創作、文本分析等,提升產品競爭力或企業運營效率。

騰訊雲 HAI 提供一鍵即得的澎湃算力與常見環境,助力中小企業及開發者快速部署 LLM、AI 作畫、數據科學等高性能應用,原生集成配套的開發工具與組件,大幅提高應用層的開發生產效率。此前已支持 ChtGLM 系列、Stble Diffusion、Llm 2 等豐富主流模型,同時支持 Notebook、WebUI 等多種圖形化算力交互模式,以應用爲核心降低雲原生 AI 應用落地門檻。

二、更強性能 全新實例 Llm 3 推理性能提高 2-0 倍

在硬件層面,騰訊雲推出的最新一代異構計算 GPU 實例 PNV5b,圍繞 Llm 3 等大模型場景,將AI推理部署性價比提升至新的高度。

Llm 3的模型特點與 Llm 2 十分類似,支持 GQA 機制降低大模型推理過程中的 KV cche 顯存開銷。PNV5b實例採用最新一代 GPU,單卡搭配 48GB 顯存,在算力和顯存匹配上做到了更好的平衡,爲大模型推理提供了更優的性價比。同時,PNV5b 實例在整機架構設計上支持最大單機 8 顆 GPU 高效擴展,大幅提升分佈式推理性能。

在 Llm 3 的推理部署測試中,在典型業務請求壓力條件下,PNV5b 的推理吞吐對比上一代 PNV4 可提升 2-3 倍;而在極端請求壓力測試下,性能可進一步提升至 0 倍。這意味着,PNV5b 實例能提供更好的性能擴展能力,讓用戶在面對大模型的業務洪峯時更加遊刃有餘。

除此之外,PNV5b 通過星星海服務器搭配最新一代 AMD CPU 平臺,提供多種實例規格,可靈活匹配大模型推理、大模型精調、推薦系統等多種場景的實例規格需求。將爲廣大用戶帶來更貼合業務的AI模型訓練和推理體驗,爲企業和開發者創造更多的價值。


相关文章

  • Ubuntu 21.04 正式發佈 默認使用 Wayland

    4 月 24 日Ubuntu 正式發佈了 2.04 版本,該版本採用了 Linux 5. 穩定版內核,同時內置了微軟 Actie Diectoy 集成、用於 Flutte 應用開發的 SDK,以及默認啓用 Wylnd 替換了已有 36 年曆史的 X Window System。 雖然 Ubuntu ...

  • WordPress 6.1正式版預計於2022年11月1日發佈

    WodPess 6.將於2022年月日發佈,它的測試版已經開始測試。這個主要版本將引入新的默認主題Twenty Twenty-Thee和更多的風格。其他新的改進包括增強的設計工具一致性、更新的塊和流暢的排版。 WodPess 6.的測試版提供了一箇探索新功能和測試其與你的網站兼容性的絕佳機會。Wod...

  • Shopify新增關稅和進口稅計算功能

    Shopify目前已提供在草稿訂單中計算關稅和進口稅功能,方便客戶與您對實際結賬費用一目瞭然,讓國際銷售變得更加簡單。商家可以前往Shopify後臺的設置>稅費和關稅,進行關稅和進口稅設置。 此外,Shopify Tx發佈了增強版銷售稅報告,賣家可以自行篩選和選擇時間範圍,下載稅收和銷售數據C...

  • 亞馬遜雲科技(北京)區域推出數字孿生服務Amazon IoT TwinMaker

    近日亞馬遜雲科技宣佈,通過與光環新網的緊密合作,在亞馬遜雲科技(北京)區域推出數字孿生服務 Amzon IoT TwinMke,該服務可以幫助企業輕鬆、快速地構建現實世界的數字孿生,更好地獲取運營洞察,提升運營效率。 Amzon IoT TwinMke 讓開發人員能夠輕鬆彙集來自多箇來源(如設備傳感...

  • Linode發佈公告:美國亞特蘭大數據中心完成升級

    Linode作爲一家老牌美國主機商,專業提供優質是一家提供優質VPS(Linux系統),高超的專業技術使得Linode一直走在VPS行業前沿,Linode VPS採用SSD硬盤,支持按小時計費,所以在業內有着較高的評價並且受到國內外用戶的一致關注。 目前Linode的數據中心在全球分佈的也是非常多,...

  • 2023年7月4日CNNIC註冊局系統和實名覈驗系統停機升級通知

    CNNIC註冊局日前發佈通知,將於北京時間2023年7月4日09:00-3:00對後臺系統進行維護升級。屆時,國家域名註冊系統、New gTLD域名註冊系統、域名實名覈驗系統等將暫時無法使用。 影響範圍: 、.cn/.中國/.公司/.網絡/.廣東/.佛山 域名註冊、續費、管理和實名認證等; 2、.c...

  • 亞馬遜雲科技中國區域推出Amazon Redshift數據共享功能

    亞馬遜雲科技近日宣佈,完全託管的PB級雲數據倉庫服務Amzon Redshift的數據共享功能現已在由亞馬遜雲科技中國(北京)和(寧夏)區域推出。該功能可以讓客戶安全、方便地在Amzon Redshift集羣之間實時共享數據,助力客戶邁向一箇 “Zeo-ETL” 的未來。 點擊查看:亞馬遜雲科技免費...

  • Fedora 38 Beta版本發佈 已支持測試新功能

    Fedo 38 Bet版本發佈,它是免費開源的Fedo Linux操作系統的最新版本。Fedo 38正式版預估於 4 月下旬推出,本次發佈的Bet版本帶來了一些新功能,包括更新升級了GCC 3編譯器、Ruby 3.2等組件。您可以從官網下載對應的Fedo 38 Bet版本,來測試新功能。 Fedo ...

  • Elementor Hosting新增多項託管功能 以加強網站控制

    Elemento Hosting是作爲使用Elemento構建的WodPess網站的領先解決方案,致力於爲所有級別的Web創建者提供支持,提供有全面的工具和功能來滿足用戶多樣化需求。 Elemento Hosting新增了多項phpMyAdmin、SFTP、網站克隆、域名和電子郵箱等功能,網站創建者...

  • Vultr宣佈與Domino Data Lab和Anaconda合作 加速大規模數據科學

    隨着人工智能(AI)和機器學習的開發、部署和擴展對GPU的需求快速增長,雲計算服務商Vult近日宣佈推出NVIDIA HGX H00(這是NVIDIA用於加速計算的開創性新架構),並與Domino Dt Lb和Ancond合作,以幫助數據科學家加速人工智能和機器學習計劃。 美國主機商Vult除了提供...