Linode

亞馬遜雲科技與英偉達攜手開發下一代基礎設施

Editor

亞馬遜雲科技和英偉達宣佈了一項多方合作,致力於構建全球最具可擴展性且按需付費的人工智能(AI)基礎設施,以便訓練日益複雜的大語言模型(LLM)和開發生成式AI應用程序。據瞭解,亞馬遜雲科技和英偉達合作已超過2年,爲人工智能、機器學習、圖形、遊戲和高性能計算(HPC)等各種應用提供了大規模、低成本的GPU解決方案。

藉助由NVIDIA H00 Tenso Coe GPU支持的下一代Amzon Elstic Compute Cloud(Amzon EC2)P5 實例,以及亞馬遜雲科技最先進的網絡和可擴展性,此次合作將提供高達20 exFLOPS的計算性能來幫助構建和訓練更大規模的深度學習模型。P5實例將是第一個利用亞馬遜雲科技第二代Amzon Elstic Fbic Adpte(EFA)網絡技術的GPU實例,可提供3200 Gbps的低延遲和高帶寬網絡吞吐量。因此客戶能夠在 Amzon EC2 UltCluste中擴展多達2萬個H00 GPU,滿足按需訪問超級計算機的AI性能需求。

點擊查看:亞馬遜雲科技免費套餐

新的Amzon EC2 P5實例構建於亞馬遜雲科技和英偉達十多年來在AI和HPC基礎設施交付方面的合作基礎之上,也立足於雙方在P2、P3、P3dn 和 P4d(e)前四代實例方面的合作。P5實例是基於英偉達GPU的第五代亞馬遜雲科技產品,與最初部署的英偉達GPU(始於CG實例)已相隔近3年。

Amzon EC2 P5實例非常適合對日益複雜的LLM和計算機視覺模型進行訓練和運行推理,並應用於要求嚴苛的計算密集型生成式 AI 應用程序,包括問題回答、代碼生成、視頻圖像生成和語音識別等領域。

對於致力於以可擴展和安全的方式將 AI 賦能的創新推向市場的企業和初創公司而言,Amzon EC2 P5實例是不二之選。P5 實例採用 8 個英偉達 H00 GPU,能夠在一箇Amzon EC2 實例中實現 6 petFLOPs 的混合精度性能、640 GB 的高帶寬內存和3200 Gbps 的網絡連接(比上一代實例高出 8 倍)。P5 實例性能的提升使機器學習模型訓練時間加快了 6 倍(將訓練時間從數天縮短到數小時),額外的GPU內存可幫助客戶訓練更龐大更復雜的模型。預計P5實例的機器學習模型訓練成本將比上一代降低 40%。相比靈活性較差的雲產品或昂貴的本地系統,它爲客戶提供了更高的效率。

Amzon EC2 P5 實例部署在 Amzon EC2 UltCluste 的超大規模集羣中,該集羣由雲端最高性能的計算、網絡和存儲系統組成。每個 EC2 UltCluste 都是世界上功能最強大的超級計算機之一,助力客戶運行最複雜的多節點機器學習訓練和分佈式 HPC 工作負載。

它們採用PB級無阻塞網絡,基於 Amzon EFA,這種面向 Amzon EC2 實例的網絡接口使客戶能夠在亞馬遜雲科技上運行需要在大規模高級節點間通信的應用程序。EFA 的定製操作系統繞過硬件接口,並與英偉達 GPUDiect RDMA 整合,可降低延遲、提高帶寬利用率,從而提升實例間通信性能,這對於在數百個 P5 節點上擴展深度學習模型的訓練至關重要。

藉助 P5 實例和 EFA,機器學習應用程序可以使用 NVIDIA Collectie Communictions Liby(NCCL)擴展到多達 2 萬個 H00 GPU。因此,客戶可以通過亞馬遜雲科技的按需彈性和靈活擴展能力,獲得本地 HPC 集羣的應用性能。除了這些出色的計算能力外,客戶可以使用業界最廣泛最深入的服務組合,比如面向對象存儲的 Amzon S3、面向高性能文件系統的 Amzon FSx,以及用於構建、訓練和部署深度學習應用的 Amzon SgeMke。P5 實例將在今後幾周提供有限預覽版。

藉助新的 Amzon EC2 P5 實例,Anthopic、Cohee、Hugging Fce、Pinteest 和Stbility AI 等客戶將能夠大規模構建和訓練最龐大的機器學習模型。基於其它幾代 Amzon EC2 實例的合作將幫助初創公司、大企業和研究人員無縫擴展來滿足各自的機器學習需求。


相关文章

  • DigitalOcean Kubernetes已提供SnapShooter備份支持

    DigitlOcen Kubenetes (DOKS)客戶現在可以利用SnpShoote來備份他們的Kubenetes應用程序。SnpShoote無縫發現您的DOKS集羣,允許您定義您的備份策略工作流。然後,用戶可以根據您的計劃利用備份存儲或自帶存儲。 Kubenetes因其可伸縮性、高可用性和廣泛...

  • 拼多多跨境電商平臺Temu日本站點上線

    近日,拼多多跨境電商平臺Temu日本站點已經上線。Temu日本站依舊延續了低價促銷策略,提供英文及日文兩種語言,結算幣種已更換至日元,賣家的店鋪評分及產品也直接同步遷移。 Temu日本站點開業舉行了不少促銷優惠,大額優惠券包含滿3700減600、滿7500減200、滿5000減3000(日元)等,活...

  • Gname域名解析模版功能和IPV6解析類型上線通知

    爲了提升域名管理的靈活性和選擇性,知名域名註冊商Gnme宣佈新增兩項新功能,即域名解析模版功能和IPV6解析類型。這些新功能旨在提供更多便利,幫助您更好地管理域名設置。 、域名解析模版功能 管理多箇域名解析設置可能會耗費大量時間和精力。爲了簡化這個過程,Gnme推出了域名解析模版功能。通過該功能,您...

  • Shopify推出一體化結賬頁面

    Shopify近日宣佈重新設計了結賬頁面,從原有的三頁變成了一頁,爲廣大用戶帶來更便捷的結賬方式,更快地完成顧客的購買並提高轉化率。 在減少頁面數量的過程中,Shopify已經實現了信用卡和賬單地址部分的自動化,並將摺疊與手頭購買不直接相關的額外內容。此外,Shopify還帶來了來自Shop Py的...

  • DigiCert部分根證書將於2023年3月8日起逐步升級變更

    受全球知名信任庫Mozill的根證書最新信任策略(全球所有CA的可信根證書生成後最少5年更換一次,超過時間的可信根會逐漸被Mozill停止信任)影響,DigiCet部分老根證書將於2023年3月8日起逐步做變更處理。 DigiCet根證書變更詳情: 原根證書 影響使用範圍 Mozill不再信任時間 ...

  • Apache Tomcat 10.1.11發佈

    Apche Tomct是由Apche軟件基金會開發和維護的用於J編程的開源Web服務器軟件。Apche Tomct 0..版本已發佈,此版本實現了Jkt EE 0 平臺的規範。 Apche Tomct是開源的Web服務器,用戶可以很容易地從互聯網上下載並配置使用它。Tomct支持SSL協議,因此用戶...

  • Joomla 4.1.3和3.10.9發佈 進行了多項錯誤修復和改進

    Jooml 4..3和3.0.9發佈,這是針對Jooml 4.x和3.x系列的錯誤修復版本,包含了各種錯誤修復和改進。 Jooml 4..3主要更新內容如下: 修復了PHP 8.多項錯誤,包括輸入依賴項、日曆表單字段的過時警告、調試欄的依賴項等 改進了SVG文件上傳問題 (#37703) 語言改進 ...

  • CentOS Linux 8 (2105)版本發佈 主要更新介紹

    CentOS Linux 8最新版本205已發佈,提供CentOS-8.4.205-x86_64-dd.iso下載。該版本基於紅帽企業版Linux 8.4(RHEL 8.4)源代碼,使用CentOS Linux 8系列版本的用戶可運行dnf updte進行更新。 CentOS Linux 8 (20...

  • WordPress 6.5測試版發佈 新功能搶先看

    WodPess已經發布了6.5版的測試版進行測試,這是2024年的第一個重大WodPess更新,並推出了一些不錯的新功能和增強功能,本着本文一起來看看吧。 WodPess 6.5版本新增了字體庫,允許用戶管理其WodPess主題和整個網站中使用的字體。WodPess中的自定義字段已經存在了很長時間,...

  • Linode MySQL數據庫託管服務全面上市

    國外服務器商家Linode近日宣佈旗下的託管數據庫服務(Linode Mnged Dtbses)全面上市,所有數據中心均支持MySQL數據庫託管,並計劃在2022年第二季度支持更多數據庫引擎。 Linode託管數據庫易於使用,允許個人或組織將維護數據庫的部分責任轉移給雲提供商,這樣開發人員可以圍繞高...