Linode

騰訊雲異構計算平臺全面支持Llama 3 助力一鍵部署和性能翻倍

Editor

近日,號稱史上最強大的開源模型——Met Llm 3 正式發佈。伴隨着日新月異的模型生態,騰訊雲異構計算平臺作爲覆蓋90%+大模型客戶的AI底座,現已做好充足的準備,圍繞Llm 3系列模型,提供從基礎設施到編排調度的智算產品矩陣,爲企業及開發者提供更快部署、更強性能和更高吞吐的全鏈路解決方案。

一、更快部署 通過 HAI 創建 Llm 3 僅需 3 分鐘

隨着大模型時代的到來,應用有望生長出更大價值。如何取得先發優勢、優質的模型能力是構建AI應用核心競爭力的關鍵。爲了解決中小企業及開發者在AI應用上擔心的敏捷部署、成本效益、數據安全等難題,我們推出了全新的即插即用的 GPU 應用服務產品——高性能應用服務 HAI 。不僅提供即插即用的便捷性,還支持 AI 模型在雲端的私有化部署,確保在有豐富模型選擇的同時,數據安全也能得到嚴格保護。

在 Met 發佈 Llm 3 後,騰訊雲 HAI 第一時間支持了 Llm 3 的一鍵部署。通過 HAI 僅需 3 分鐘,中小企業及開發者可以輕鬆實現基於 Llm 3 的應用創作與開發,將其應用於各種場景,如智能客服、內容創作、文本分析等,提升產品競爭力或企業運營效率。

騰訊雲 HAI 提供一鍵即得的澎湃算力與常見環境,助力中小企業及開發者快速部署 LLM、AI 作畫、數據科學等高性能應用,原生集成配套的開發工具與組件,大幅提高應用層的開發生產效率。此前已支持 ChtGLM 系列、Stble Diffusion、Llm 2 等豐富主流模型,同時支持 Notebook、WebUI 等多種圖形化算力交互模式,以應用爲核心降低雲原生 AI 應用落地門檻。

二、更強性能 全新實例 Llm 3 推理性能提高 2-0 倍

在硬件層面,騰訊雲推出的最新一代異構計算 GPU 實例 PNV5b,圍繞 Llm 3 等大模型場景,將AI推理部署性價比提升至新的高度。

Llm 3的模型特點與 Llm 2 十分類似,支持 GQA 機制降低大模型推理過程中的 KV cche 顯存開銷。PNV5b實例採用最新一代 GPU,單卡搭配 48GB 顯存,在算力和顯存匹配上做到了更好的平衡,爲大模型推理提供了更優的性價比。同時,PNV5b 實例在整機架構設計上支持最大單機 8 顆 GPU 高效擴展,大幅提升分佈式推理性能。

在 Llm 3 的推理部署測試中,在典型業務請求壓力條件下,PNV5b 的推理吞吐對比上一代 PNV4 可提升 2-3 倍;而在極端請求壓力測試下,性能可進一步提升至 0 倍。這意味着,PNV5b 實例能提供更好的性能擴展能力,讓用戶在面對大模型的業務洪峯時更加遊刃有餘。

除此之外,PNV5b 通過星星海服務器搭配最新一代 AMD CPU 平臺,提供多種實例規格,可靈活匹配大模型推理、大模型精調、推薦系統等多種場景的實例規格需求。將爲廣大用戶帶來更貼合業務的AI模型訓練和推理體驗,爲企業和開發者創造更多的價值。


相关文章

  • InMotionHosting在荷蘭阿姆斯特丹數據中心擴展了託管服務

    InMotionHosting宣佈其荷蘭阿姆斯特丹數據中心已上線了更多託管服務,包括共享虛擬主機、VPS、經銷商和專用服務器託管服務等。歐洲數據中心範圍內,服務器配備了與InMotionHosting其他託管服務相同的旗艦硬件和軟件。從速度提升的NVMe驅動到UltStck配置和其他強大的開源技術,...

  • Hostwinds官網改版升級 新推出中文站點

    Hostwinds成立於200年,是一家美國主機商,主要提供虛擬主機、美國VPS以及美國服務器等多種IDC業務。小編剛剛進去Hostwinds官網,發現官網改版了,整體頁面有趣一些,可支持切換的語言版本也更多一些,英語,中文,法語,韓語,德語,意大利語,俄語,印度語,西班牙語,荷蘭語,阿拉伯語和葡萄...

  • FileZilla Server 1.6.0和1.6.1發佈

    FileZill See是一款開源、免費的FTP客戶端服務器端的項目,具有高安全性和高性能特性。FileZill See .6.0和.6.現已發佈,引入了多項功能,並對發現的錯誤和漏洞進行了修復,主要更新內容如下。 一、FileZill See .6.0 新的功能: UI:現在可以使用協議配置的安全...

  • Amazon EC2 G5實例現已在亞馬遜雲科技中國區域推出

    4月27日起,由 NVIDIA A0G Tenso Coe GPU 提供支持的 Amzon Elstic Compute Cloud(Amzon EC2)G5 實例已在由光環新網運營的亞馬遜雲科技中國(北京)區域和由西雲數據運營的亞馬遜雲科技中國(寧夏)區域推出。G5 實例可用於各種圖形密集型和機器...

  • Rocky Linux 9.0正式版發佈 新特性介紹

    Rocky Linux是一箇開源的企業級操作系統,旨在與Red Ht Entepise Linux®00% :兼容。Rocky Linux 9.0正式版發佈,該版本基於Red Ht Entepise Linux 9,生命週期長達0年,並新增了多項功能特性和安全修復。 生命週期: Rocky Linu...

  • Bzz節點是什麼 Bzz節點搭建教程

    Swm BZZ即將結束空投主網階段,如何在主網上線後第一時間批量部署搶得頭礦?Bzz節點是什麼?Bzz節點如何搭建?來看看下面的Swm BZZ節點搭建流程。 一、Bzz節點是什麼 簡而言之,根據Swm的官方教程將軟件部署在服務器上,然後該項目通過獲得的BZZ幣運行,該幣成爲Swm項目中的BZZ節點。...

  • Cloudways爲WordPress推出了Cron優化器 以減少服務器負載

    Cloudwys近日宣佈推出了Con Optimize,該Con優化器是專門爲WodPess設計的,它會自動檢測應用程序安裝是否是多站點的,在多站點應用程序的情況下,逐個執行每個子站點的事件。它不僅可以無縫地切換到服務器端Cons,還可以智能地交錯它們的執行以減少服務器負載。 Con Jobs通過在...

  • SiteGround主機默認PHP版本升級至7.4

    SiteGound主機算是近幾年比較熱門的美國主機商,它支持上百種CMS外貿自建站程序。SiteGound計劃在202年6月份將升級主機默認PHP版本到7.4,不再支持PHP 7.2及以下低版本。 SiteGound主機之前默認PHP版本是7.3,將於202年6月0日至202年6月2日之間把所有服務...

  • Windows 11系統正式發佈 首次兼容Android應用程序

    昨天微軟正式推出Windows 系統,這是繼Win 0以來最重要的一次更新升級。Windows 採用了全新設計的UI,還引入了Andoid應用程序、新的微軟商店以及性能和多任務方面改進等多項新功能。 Windows 全新設計的UI,界面更加簡潔美觀,具有現代化,方便用戶操作。微軟稱在任務欄居中的開始...

  • 騰訊雲首款ARM架構實例重磅發佈 體驗全新架構算力

    隨着自動駕駛、雲遊戲、VR/AR等 智能化應用的興起,應用需求越來越多樣化,數據中心對芯片架構的需求也越來越多樣化。ARM架構在提供可靠性能的基礎上,低功耗、低開銷,且具備端雲同構的特殊優勢,爲用戶在公有云上提供多樣化架構的算力選擇。騰訊雲重磅推出首款搭載ARM架構處理器的新代CVM標準型SR,提供...