亞馬遜的雲計算部門週三宣佈,與人工智能初創公司Hugging Face合作,使在亞馬遜定製計算芯片上運行成千上萬的AI模型變得更加容易。
Hugging Face估值45億美元,已成爲AI研究人員和開發人員共享聊天機器人和其他AI軟件的核心平臺,得到了亞馬遜、Alphabet的谷歌和Nvidia等公司的支持。開發者主要在該平臺上獲取和修改開源AI模型,如Meta Platforms的Llama 3。
然而,開發者在調整了開源AI模型後,通常希望將其用於實際的軟件。週三,亞馬遜和Hugging Face宣佈合作,使開發者可以在亞馬遜網絡服務(AWS)的定製芯片Inferentia2上實現這一目標。
Hugging Face產品和增長負責人Jeff Boudier表示:“對我們來說,非常重要的一點是效率——確保儘可能多的人能夠運行模型,並且以最具成本效益的方式運行。”
AWS希望通過此次合作吸引更多AI開發者使用其雲服務來交付AI。雖然Nvidia在訓練模型的市場中佔據主導地位,但AWS表示,其芯片能夠以較低的成本運行這些已訓練的模型,即進行推理。
AWS人工智能產品負責人Matt Wood說:“你可能每月訓練一次這些模型,但你每小時可能對它們進行成千上萬次的推理操作。這就是Inferentia2真正發揮作用的地方。”