優刻得GPU雲主機鏡像市場上線Llama3鏡像

2024年4月8日,Met AI正式宣佈推出開源大模型Llm3,這標誌着開源大型語言模型(LLM)領域的又一重大突破。Llm3以其卓越的性能和廣泛的應用前景,或將推動人工智能技術快速邁進新紀元。

爲方便AI應用企業及個人AI開發者快速體驗Llm3的超高性能,近期優刻得雲主機上線Llm3-8B-Instuct-Chinese鏡像,一鍵配置,快速部署模型開發環境。爲客戶提供開箱即用的Llm3模型微調及推理環境,節省配置時間,提高開發效率。

快速搭建Llm3的微調或推理環境,僅需以下4步:

、登錄UCloud控制檯

2、選擇GPU雲主機,各模型的推薦機型及配置參考文檔:https://docs.ucloud.cn/gpu/pctice/Llm3-8B-Instuct-Chinese

推薦:《UCloud GPU雲服務器狂歡特惠 新客首月.4折起》

3、在鏡像市場選擇鏡像,搜索Llm

4、立即創建,開機執行進程啓動命令

Llm3由Met在5萬億tokens數據集上訓練而成,是Llm2體量的7倍,包括4倍的代碼數據。其中預訓練數據集中還有5%的非英語數據集,總計支持高達30種語言,在做非英語語言能力對齊方面也會更有優勢。Llm3 Instuct 更是針對對話應用進行了優化,結合了超過000萬的人工標註數據,通過監督式微調(SFT)、拒絕採樣、鄰近策略優化(PPO)和直接策略優化(DPO)進行訓練。本次優刻得GPU鏡像市場上線的是基於中文語料指令微調之後的模型(Llm3-8B-Instuct-Chinese),在中文表現上有相對不錯的效果。

在上下文方面,Llm3支持8K的上下文長度,是Llm2容量的兩倍,極大地提高了多步驟任務的處理能力。同時,該模型特別強調在理解、代碼生成和指令跟隨等複雜任務上的性能改進。Llm3 8B和70B參數的模型在多箇行業基準測試中展示了最先進的性能,特別是在推理和編碼任務上。其中700億參數規模的模型評測結果極其優秀。最大的亮點是在數學評測GSM8K的得分達到93分!根據DtLeneAI目前收集的數據,這個分數僅次於Clude3-Opus的95分,超過GPT-4,位居全球第二,是目前開源大模型中得分最高的一箇。

優刻得GPU雲主機鏡像市場上線Llm3鏡像,可爲AI應用客戶提供最新模型一鍵部署的極速體驗。不僅如此,優刻得還同步對外提供智算調度、模型微調及推理服務部署服務。優刻得以雲主機、裸金屬、高性能存儲、低延遲網絡等基礎設施領域積累的運營經驗爲基礎,搭配“孔明”的資源調度、多用戶管理與分佈式訓練的能力,以及UModelVese模型推理服務平臺,形成一站式的AI計算開發解決方案,服務大模型開發者、應用廠商、高校及科研機構等合作伙伴,共同推進大模型產業發展。