Linode

亞馬遜雲科技與英偉達攜手開發下一代基礎設施

Editor

亞馬遜雲科技和英偉達宣佈了一項多方合作,致力於構建全球最具可擴展性且按需付費的人工智能(AI)基礎設施,以便訓練日益複雜的大語言模型(LLM)和開發生成式AI應用程序。據瞭解,亞馬遜雲科技和英偉達合作已超過2年,爲人工智能、機器學習、圖形、遊戲和高性能計算(HPC)等各種應用提供了大規模、低成本的GPU解決方案。

藉助由NVIDIA H00 Tenso Coe GPU支持的下一代Amzon Elstic Compute Cloud(Amzon EC2)P5 實例,以及亞馬遜雲科技最先進的網絡和可擴展性,此次合作將提供高達20 exFLOPS的計算性能來幫助構建和訓練更大規模的深度學習模型。P5實例將是第一個利用亞馬遜雲科技第二代Amzon Elstic Fbic Adpte(EFA)網絡技術的GPU實例,可提供3200 Gbps的低延遲和高帶寬網絡吞吐量。因此客戶能夠在 Amzon EC2 UltCluste中擴展多達2萬個H00 GPU,滿足按需訪問超級計算機的AI性能需求。

點擊查看:亞馬遜雲科技免費套餐

新的Amzon EC2 P5實例構建於亞馬遜雲科技和英偉達十多年來在AI和HPC基礎設施交付方面的合作基礎之上,也立足於雙方在P2、P3、P3dn 和 P4d(e)前四代實例方面的合作。P5實例是基於英偉達GPU的第五代亞馬遜雲科技產品,與最初部署的英偉達GPU(始於CG實例)已相隔近3年。

Amzon EC2 P5實例非常適合對日益複雜的LLM和計算機視覺模型進行訓練和運行推理,並應用於要求嚴苛的計算密集型生成式 AI 應用程序,包括問題回答、代碼生成、視頻圖像生成和語音識別等領域。

對於致力於以可擴展和安全的方式將 AI 賦能的創新推向市場的企業和初創公司而言,Amzon EC2 P5實例是不二之選。P5 實例採用 8 個英偉達 H00 GPU,能夠在一箇Amzon EC2 實例中實現 6 petFLOPs 的混合精度性能、640 GB 的高帶寬內存和3200 Gbps 的網絡連接(比上一代實例高出 8 倍)。P5 實例性能的提升使機器學習模型訓練時間加快了 6 倍(將訓練時間從數天縮短到數小時),額外的GPU內存可幫助客戶訓練更龐大更復雜的模型。預計P5實例的機器學習模型訓練成本將比上一代降低 40%。相比靈活性較差的雲產品或昂貴的本地系統,它爲客戶提供了更高的效率。

Amzon EC2 P5 實例部署在 Amzon EC2 UltCluste 的超大規模集羣中,該集羣由雲端最高性能的計算、網絡和存儲系統組成。每個 EC2 UltCluste 都是世界上功能最強大的超級計算機之一,助力客戶運行最複雜的多節點機器學習訓練和分佈式 HPC 工作負載。

它們採用PB級無阻塞網絡,基於 Amzon EFA,這種面向 Amzon EC2 實例的網絡接口使客戶能夠在亞馬遜雲科技上運行需要在大規模高級節點間通信的應用程序。EFA 的定製操作系統繞過硬件接口,並與英偉達 GPUDiect RDMA 整合,可降低延遲、提高帶寬利用率,從而提升實例間通信性能,這對於在數百個 P5 節點上擴展深度學習模型的訓練至關重要。

藉助 P5 實例和 EFA,機器學習應用程序可以使用 NVIDIA Collectie Communictions Liby(NCCL)擴展到多達 2 萬個 H00 GPU。因此,客戶可以通過亞馬遜雲科技的按需彈性和靈活擴展能力,獲得本地 HPC 集羣的應用性能。除了這些出色的計算能力外,客戶可以使用業界最廣泛最深入的服務組合,比如面向對象存儲的 Amzon S3、面向高性能文件系統的 Amzon FSx,以及用於構建、訓練和部署深度學習應用的 Amzon SgeMke。P5 實例將在今後幾周提供有限預覽版。

藉助新的 Amzon EC2 P5 實例,Anthopic、Cohee、Hugging Fce、Pinteest 和Stbility AI 等客戶將能夠大規模構建和訓練最龐大的機器學習模型。基於其它幾代 Amzon EC2 實例的合作將幫助初創公司、大企業和研究人員無縫擴展來滿足各自的機器學習需求。


相关文章

  • Vultr第21個數據中心落戶波蘭華沙

    知名國外服務器商家Vult昨日宣佈其第2個數據中心正式落戶波蘭華沙。Vult機房衆多,分佈在北美洲、南美、歐洲、亞洲、澳大利亞等地區,波蘭華沙是其第2個數據中心,未來預計還會增加更多數據中心,以便當地用戶就近選擇合適的服務器機房,獲得更快的訪問速度。 對於Vult華沙機房,我們可以選擇標準的SSD雲...

  • Firefox 92.0火狐瀏覽器發佈 優化了內存管理

    火狐瀏覽器近日發佈了Fiefox 92.0版本,本次更新的Fiefox 92.0優化了內存管理,採用了更安全的HTTPS加密連接,主要更新內容如下。 新增: 更安全的連接:Fiefox 現在可以使用 HTTPS RR 作爲 Alt-Sc hedes 自動升級到 HTTPS。 多箇系統的視頻播放已支持...

  • Nginx Plus R24版本發佈 新增加密功能介紹

    Nginx Plus基於Nginx開源的多合一軟件Web服務器,具有負載平衡器,反向代理,內容緩存等功能。剛發佈不久的Nginx Plus版本24(R24),新增了支持加密的Json Web令牌等功能。 Nginx Plus R24的新功能包括: 、支持加密的JsonWeb令牌 在早期Nginx P...

  • iON計劃清退受火災影響的美國洛杉磯VPS

    受KT機房火災影響,iON計劃清退受火災影響的美國洛杉磯VPS,機器配置爲CPU、2GB內存、40GB SSD存儲空間、TB月流量。 受影響的美國VPS具體配置如下: ION-L09 CPU: 內存: 2 GB 存儲空間: 40 GB SSD 流量: TB / 月(Gbps端口)單向計算(三網聯通回...

  • GitLab 15.0版本發佈 支持在所有層進行容器掃描

    GitLb 5.0發佈,這是GitLb在2022年推出的一箇主要版本,它包含了在所有層中進行容器掃描、內部註釋等40多項改進。GitLb是Ruby開發的自託管的Git項目倉庫,可通過Web界面訪問公開的或者私人的項目。下面一起來看下GitLb 5.0主要新增功能和優化內容介紹。 GitLb 5.0主...

  • FastComet主機現已支持AlmaLinux 9.3系統

    FstComet主機現在支持AlmLinux 9.3系統,讓用戶可以有更好的使用體驗,AlmLinux的創建是爲了回應有爭議的CentOS發行版,該發行版是當時的首選免費發行版,並且與RHEL二進制發行版兼容。但209年推出的CentOS 8沒有預期的十年生命週期,而是隻分配了兩年,這讓很多用戶措手...

  • Kubernetes 1.27發佈 新功能介紹

    Kubenetes .27發佈,新主題命名爲Chill Vibes,這個版本包含60個增強功能。這些增強功能中有8個正在Alph版本,29個正在升級到Bet版本,3個正在升級到穩定版本。下面一起來看下Kubenetes .27主要新增功能有哪些。 Kubenetes .27主要功能介紹: 、凍結 k...

  • 華爲雲分佈式雲原生服務UCS正式商用

    華爲雲分佈式雲原生產品UCS正式商用。據瞭解,華爲雲UCS是擴展雲原生服務的橋樑,其管理的應用程序和服務可以靈活地跨數據中心、邊緣和多雲環境運行,爲已有和新增應用程序提供一致的開發、操作和安全模型。 作爲面向分佈式雲場景下的新一代雲原生產品, 華爲雲UCS支持對華爲雲集羣、夥伴雲集羣、多雲集羣、本地...

  • SiteGround德語網站上線 現已支持四種語言切換

    國外服務器商家SiteGound前不久宣佈上線德語網站,以便更好地爲當地用戶提供高質量和便利的服務。SiteGound官網現已支持多種語言切換,包括英語、意大利語、西班牙語、德語,用戶可以根據實際情況選擇。 SiteGound德語網站地址爲de.sitegound.com,可以通過該地址直接訪問,或...

  • Semrush爲Shopify引入電子商務助推器

    數字營銷平臺Semush推出了一款適用於Shopify商店的電子商務助推器應用程序(Ecommece Booste),該應用程序將審覈您Shopify商店的搜索引擎優化修復,然後給您一箇詳細的清單,一步一步的指導,讓您可以開始更好地銷售。 根據Semush網站上的指南,Ecommece Booste...