快訊

    【AI晶片需求爆量3-1】生成式AI講究算力 全球科技大廠投入自主晶片研發! 

    2023-06-24 07:00 / 作者 戴嘉芬
    ChatGPT引發生成式AI熱潮,全球一線科技大廠如Google、Amazon、Meta皆投入AI自主晶片的研發。路透社
    ChatGPT爆紅引發全球生成式AI商機,帶動軟硬體需求。由於生成式AI需要龐大的算力,所有資料中心(Data Center)的伺服器皆須內建整合型圖形處理器GPU才能完成任務。目前全球科技大廠如微軟、Meta、Google、Amazon皆投入開發大型語言模型,甚至傾向自主研發AI晶片。

    根據研調機構預估,到了2032年,全球生成式AI市場規模將突破1000億美元,整體市場正在快速攀升,年成長率高達27%。生成式AI基於深度學習技術,結合了語音辨識、自然語言生成技術發展而出。因此透過生成式AI,能幫客戶產生文字互動、圖像、影音等相關應用。

    工研院產科國際所分析師王宣智表示,生成式AI應用大爆發,ChatGPT在去年11月底推出後,目前全球使用者已超過6億人。加上今年初微軟推出Bing AI,Google也有Cloud AI和Bard Chat問世,可見AI應用進程推展迅速。

    不過,大規模市場需求卻面臨到硬體不足、雲端算力不足的情形。Open AI執行長Sam Altman先前曾在美國參議院聽證會上表示,如果使用ChatGPT的人少一些會更好,因為OpenAI無法提供足夠的算力給全世界使用者。

    因此,晶片業者加速朝雲端AI運算力配置。其中,具備複合式、軟硬體整合能力的AI晶片業者,將可獨占AI應用的爆發式商機,例如NVIDIA即為此波熱潮的最大受惠者,目前公司市值已突破1兆美元。

    國外一線科技大廠幾乎也都是雲端服務業者,都已投入自主AI晶片的開發,包括Amazon、Google、微軟、Meta等。

    Amazon去年已推出Trainium晶片,負責AI模型訓練和推論。Google則預計在2025年推出TPUv4,這是專為神經網絡機器學習開發的AI ASIC晶片。微軟也預計在2024年推出Athena AI晶片,用來訓練大型語言模型和AI推論。Meta的MTIA晶片亦是針對加速AI模型的訓練,可用來執行各式AI任務。

    Meta董事長兼執行長祖克柏(Mark Zuckerberg)上個月親自展示MTIA首款客製化晶片。翻攝自祖克柏臉書

    Supermicro(美超微)科技賦能部經理林俊江表示,目前AI晶片普遍用於ML機器學習、AI雲端運算等領域。值得注意的是,邊緣AI運算(Edge AI)市場需求也正急遽增加。

    生成式AI導致NVIDIA GPU供不應求

    GPU圖形處理器目前是AI晶片的主要來源!也因為如此,一向專攻GPU的輝達(NVIDIA)佔據超過9成的AI晶片市場大餅。根據Startup Bonsai研調機構估計,ChatGPT對NVIDIA A100晶片的需求約達2~3萬片。若以ChatGPT每日1300萬活躍用戶來假設,約需2.6萬顆NVIDIA A100晶片。未來導入微軟Bing之後,使用量更將倍增,大概需要20萬顆A100晶片。

    輝達在2022年3月發表新一代H100晶片,性能比A100提升9倍約達3950億個參數,即時深度學習推論效率更提升30倍約5300億個參數。H100已於2022年第三季量產。對於AI伺服器業者來說,若晶片改用H100,GPU需求顆數將從26331萬顆降為2925顆,因此,去年底前已有超過50款伺服器採用H100晶片。

    輝達執行長黃仁勳5月底來台演講時,大秀自家GPU晶片產品。陳品佑攝

    AI晶片二哥則是超微(AMD),目前市占率約8%~9%。AMD甫於6月中旬揭示Instinct MI300系列加速器產品的最新細節,號稱是全球最先進的生成式AI加速器,支援高達192 GB HBM3高頻寬記憶體,提供大型語言模型推導與生成式AI工作負載所需的運算力與記憶體效率。

    其中一款Instinct MI300X加速器以3D小晶片堆疊技術打造,憑藉大容量記憶體,採用台積電5奈米FinFet(鰭式場效電晶體)製程技術,可讓AI伺服器處理Falcon-40B等大型語言模型,僅需使用一個MI300X GPU加速器就能處理400億個參數的模型。

    超微執行長蘇姿丰在6月中旬親自發表最新Instinct MI300X加速器,強調是世界上最先進的生成式AI加速器。資料照

    AMD另一款Instinct MI300A則是針對HPC與AI運算所開發的加速器,現已開始向客戶送樣。MI300A晶片採用台積電CoWoS 3D堆疊封裝技術,將N5 GPU和CPU堆疊於底層晶片,並整合在CoWoS封裝中。

    NVIDIA目前在AI晶片市場市佔率約91.4%,穩居龍頭寶座,第二名則是AMD,市占率則為8.5%。其他業者只能去搶剩下一點點不到0.1%的市場,例如在去年收購以色列高塔半導體的英特爾,也開始佈局GPU市場,預計在2025年推出Falcon Shores GPU,可用於HPC高效能和AI應用領域。

    至於AI晶片對台灣晶圓代工產業的影響為何?TrendForce研究副理喬安指出,2022年,AI晶片僅占整體晶圓代工產業產能先進製程的4%,預估之後將有27%年複合成長率,到了2026年,將成長到6%。

    台積電在全球晶圓代工市場擁有60%極高市佔率,因此,上述AI晶片幾乎都向台積電投片。例如輝達H100採用台積電4奈米製程,A100則採用台積電7奈米製程。AMD MI250 GPU採用台積電6奈米製程、MI300則採用台積電5奈米製程。英特爾旗下AI專用晶片Gaudi2也採用台積電7奈米製程,專注在AI模型的運算。

    戴嘉芬 收藏文章

    本網站使用Cookie以便為您提供更優質的使用體驗,若您點擊下方“同意”或繼續瀏覽本網站,即表示您同意我們的Cookie政策,欲瞭解更多資訊請見