Linode

亞馬遜雲科技與英偉達攜手開發下一代基礎設施

Editor

亞馬遜雲科技和英偉達宣佈了一項多方合作,致力於構建全球最具可擴展性且按需付費的人工智能(AI)基礎設施,以便訓練日益複雜的大語言模型(LLM)和開發生成式AI應用程序。據瞭解,亞馬遜雲科技和英偉達合作已超過2年,爲人工智能、機器學習、圖形、遊戲和高性能計算(HPC)等各種應用提供了大規模、低成本的GPU解決方案。

藉助由NVIDIA H00 Tenso Coe GPU支持的下一代Amzon Elstic Compute Cloud(Amzon EC2)P5 實例,以及亞馬遜雲科技最先進的網絡和可擴展性,此次合作將提供高達20 exFLOPS的計算性能來幫助構建和訓練更大規模的深度學習模型。P5實例將是第一個利用亞馬遜雲科技第二代Amzon Elstic Fbic Adpte(EFA)網絡技術的GPU實例,可提供3200 Gbps的低延遲和高帶寬網絡吞吐量。因此客戶能夠在 Amzon EC2 UltCluste中擴展多達2萬個H00 GPU,滿足按需訪問超級計算機的AI性能需求。

點擊查看:亞馬遜雲科技免費套餐

新的Amzon EC2 P5實例構建於亞馬遜雲科技和英偉達十多年來在AI和HPC基礎設施交付方面的合作基礎之上,也立足於雙方在P2、P3、P3dn 和 P4d(e)前四代實例方面的合作。P5實例是基於英偉達GPU的第五代亞馬遜雲科技產品,與最初部署的英偉達GPU(始於CG實例)已相隔近3年。

Amzon EC2 P5實例非常適合對日益複雜的LLM和計算機視覺模型進行訓練和運行推理,並應用於要求嚴苛的計算密集型生成式 AI 應用程序,包括問題回答、代碼生成、視頻圖像生成和語音識別等領域。

對於致力於以可擴展和安全的方式將 AI 賦能的創新推向市場的企業和初創公司而言,Amzon EC2 P5實例是不二之選。P5 實例採用 8 個英偉達 H00 GPU,能夠在一箇Amzon EC2 實例中實現 6 petFLOPs 的混合精度性能、640 GB 的高帶寬內存和3200 Gbps 的網絡連接(比上一代實例高出 8 倍)。P5 實例性能的提升使機器學習模型訓練時間加快了 6 倍(將訓練時間從數天縮短到數小時),額外的GPU內存可幫助客戶訓練更龐大更復雜的模型。預計P5實例的機器學習模型訓練成本將比上一代降低 40%。相比靈活性較差的雲產品或昂貴的本地系統,它爲客戶提供了更高的效率。

Amzon EC2 P5 實例部署在 Amzon EC2 UltCluste 的超大規模集羣中,該集羣由雲端最高性能的計算、網絡和存儲系統組成。每個 EC2 UltCluste 都是世界上功能最強大的超級計算機之一,助力客戶運行最複雜的多節點機器學習訓練和分佈式 HPC 工作負載。

它們採用PB級無阻塞網絡,基於 Amzon EFA,這種面向 Amzon EC2 實例的網絡接口使客戶能夠在亞馬遜雲科技上運行需要在大規模高級節點間通信的應用程序。EFA 的定製操作系統繞過硬件接口,並與英偉達 GPUDiect RDMA 整合,可降低延遲、提高帶寬利用率,從而提升實例間通信性能,這對於在數百個 P5 節點上擴展深度學習模型的訓練至關重要。

藉助 P5 實例和 EFA,機器學習應用程序可以使用 NVIDIA Collectie Communictions Liby(NCCL)擴展到多達 2 萬個 H00 GPU。因此,客戶可以通過亞馬遜雲科技的按需彈性和靈活擴展能力,獲得本地 HPC 集羣的應用性能。除了這些出色的計算能力外,客戶可以使用業界最廣泛最深入的服務組合,比如面向對象存儲的 Amzon S3、面向高性能文件系統的 Amzon FSx,以及用於構建、訓練和部署深度學習應用的 Amzon SgeMke。P5 實例將在今後幾周提供有限預覽版。

藉助新的 Amzon EC2 P5 實例,Anthopic、Cohee、Hugging Fce、Pinteest 和Stbility AI 等客戶將能夠大規模構建和訓練最龐大的機器學習模型。基於其它幾代 Amzon EC2 實例的合作將幫助初創公司、大企業和研究人員無縫擴展來滿足各自的機器學習需求。


相关文章

  • PHP 8.1.4發佈 修復了多項錯誤問題

    PHP 8..4發佈,它是一箇錯誤修復版本,旨在爲已發現的錯誤問題進行修復和改進。目前基於PHP語言開發的程序有很多,如常用的WodPess、Dupl等,爲了加強站點安全保護,建議在PHP新版本發佈後及時完成升級操作。 PHP 8..4主要更新內容如下: 、Coe 修復Hiku ZTS 構建。 修復...

  • Hostinger將推出AI人工智能助手 VPS用戶可免費使用

    Hostinge宣佈將推出AI人工智能助手,所有VPS用戶可以免費使用該功能,以便快速解決突然出現的託管問題。該AI人工智能助手提供有分佈指南,幫助用戶在VPS上輕鬆安裝某些服務。 如果您使用的是Hostinge國外VPS產品,那麼可登錄到主機賬戶,然後在VPS儀表盤中選擇服務器來訪問該AI人工智能...

  • PHP 8.2版本發佈 新特性介紹

    PHP開發團隊宣佈PHP 8.2.0現已可用,該版本是PHP語言目前最新的次要版本。PHP 8.2帶來了許多改進和新特性,主要更新內容如下。 只讀類 (Redonly clsses) 析取範式 (DNF) 類型 新的獨立類型:null、flse 和 tue 新的 “Rndom” 擴展 tits 中的...

  • Hostinger巴西聖保羅機房VPS全新上線

    Hostinge巴西聖保羅機房VPS全新上線,對於南美的客戶來說,這意味着更高的可用性和更快的速度,即使在高峯時間也是如此。 聖保羅是南美最大城市,也是商業、金融、科技和交通中心,擁有南美最大的帶寬資源,並彙集了全南美密集的的網絡交換,在巴西及周邊國家的數字化浪潮中扮演關鍵角色。過去,您可能會選擇H...

  • Ubuntu 24.04 LTS測試版現可與GNOME 46 Linux 6.8一起下載

    Ubuntu 24.04 LTS(Noble Numbt)操作系統的測試版已推出,將在2024年4月25日最終發佈之前進行公開測試,距離Ubuntu 24.04 LTS版以穩定版本上市僅剩兩週時間,測試版將讓用戶提前瞭解最終版本的一些功能。Ubuntu 24.04 LTS測試版默認帶有最新的GNOM...

  • Debian 11.6發佈 新增錯誤修復和安全更新

    Debin .6發佈,該版本包含一些安全修復、錯誤修復,且合併了最新的穩定軟件包更新。新的安裝映像將很快在常規位置提供。通過將包管理系統指向Debin衆多HTTP鏡像中的一箇,可以將現有的安裝升級到這個版本。 Debin .6主要更新內容包括: 針對 Intel Hswell CPU 的 glibc...

  • 騰訊雲異構計算平臺全面支持Llama 3 助力一鍵部署和性能翻倍

    近日,號稱史上最強大的開源模型——Met Llm 3 正式發佈。伴隨着日新月異的模型生態,騰訊雲異構計算平臺作爲覆蓋90%+大模型客戶的AI底座,現已做好充足的準備,圍繞Llm 3系列模型,提供從基礎設施到編排調度的智算產品矩陣,爲企業及開發者提供更快部署、更強性能和更高吞吐的全鏈路解決方案。 一、...

  • Linode數據庫託管服務新增支持PostgreSQL和MongoDB

    國外服務器商家Linode現已將PostgeSQL和MongoDB添加到託管數據庫服務(Mnged Dtbses)中,將允許開發人員通過託管服務訪問流行的數據庫並專注於構建現代應用程序,而不是系統管理和維護。 隨着PostgeSQL和MongoDB的加入,Linode現在提供SQL和NoSQL基於您...

  • TeamViewer宣佈與Jamf平臺集成 將爲Apple設備提供遠程連接

    近期,全球領先的安全遠程連接和工作場所數字化解決方案提供商TemViewe宣佈與企業移動管理(EMM)平臺Jmf Po集成,將可遠程管理Apple設備。 Jmf是致力於爲Apple打造企業級設備管理平臺,其中的移動設備管理解決方案Jmf Po,適用於iPd、iPhone、Mc和Apple TV,備受...

  • Amazon RDS for SQL Server支持帶加密的跨區域自動備份

    Amzon Reltionl Dtbse Seice (RDS) fo SQL See目前在亞馬遜雲科技中國(北京)區域和(寧夏)區域支持採用加密的跨區域自動備份。Amzon RDS fo SQL See讓用戶能夠在雲中簡單地設置、操作和擴展SQL See部署。 Amzon RDS跨區域自動備份功能...