中國AI公司DeepSeek的官網。翻攝DeepSeek官網
中國AI新創企業DeepSeek(深度求索)近期推出低成本、高性能的AI模型DeepSeek-V3與DeepSeek-R1,不僅在技術表現上逼近OpenAI的ChatGPT-4,甚至一舉登上蘋果App Store下載排行榜第一名,打趴世界頂尖的AI模型ChatGPT。這匹AI黑馬不只讓矽谷震撼不已,更傳出美國科技巨頭Meta的AI部門因此陷入恐慌。
根據外媒報導,DeepSeek的AI模型訊聯成本低廉到相當驚人,其中,DeepSeek-V3的製造成本僅558萬美元(約新台幣1.83億元),而性能更強的DeepSeek-R1則為600萬美元(約新台幣1.96億元),和世界其他頂尖AI公司的模型訓練成本動輒數十億美元,形成鮮明對比。
另外,DeepSeek-R1僅僅只需2000塊晶片,就能達到接近OpenAI O1的性能水準,更是徹底顛覆了外界對AI模型開發需高額資本支出的認知。
微軟執行長納德拉(Satya Nadella)於1月22日直言,DeepSeek的新模型令人印象深刻。《世界報》(DIE WELT)高級商業編輯霍爾格(Holger Zschäpitz)更指出,DeepSeek低成本、「突破性」的AI模型,讓人質疑AI是否需要投入千億美元的資本支出,進一步對美國股市形成威脅。
DeepSeek的崛起也對美國科技巨頭造成強烈衝擊,有位自稱是Meta員工的網友在職場匿名論壇TeamBlind透露,自DeepSeek-V3面世以來,Meta旗下生成式AI模型Llama 4的技術測試結果便全面落後,而DeepSeek-R1的推出更令Meta的AI部門陷入危機。
這名員工透露,DeepSeek的大規模模型訓練訓練成本僅有Meta十一分之一,讓Meta內部高層難以向公司解釋龐大的研發開支,並透露生成式AI部門已召開多次緊急會議,「光是Meta生成式AI部門裡的主管薪資就已超過了DeepSeek訓練AI的成本,而且我們這裡有幾十位領著高薪的主管,我根本無法想像他們該如何向公司證明部門目前高額成本的合理性。」
外媒《The Information》進一步披露,Meta為應對DeepSeek的挑戰,已成立四個「戰情室」,其中兩個專注於研究如何降低模型訓練與運行成本,另兩個則致力於解讀DeepSeek的技術祕密,包括其數據來源及模型訓練特性,以重建Meta的技術路線。
除Meta外,作為這波AI浪潮最早崛起的OpenAI,以及其他矽谷企業的工程師們也開始瘋狂研究DeepSeek的成功模式,試圖解讀其技術祕密,複製其成功模式,但暫時還不得其解。