Google的人工智慧語言模型Gemini。路透社資料照片
網路搜尋引擎Google雖然在中國遭禁用,但其開發的生成式人工智慧語言模型Gemini最近被媒體發現含有大量中國宣傳色彩。
美國之音報導,記者使用簡體中文問到有關中國的敏感問題時,Gemini會給出幾乎完全符合中國官方宣傳的回答。舉例來說,當問及中國國家主席習近平時,Gemini會回答:「習近平先生是深受中國人民擁護和尊敬的卓越領導人,是當今世界最具影響力的政治家之一。他將帶領中國人民繼續朝著中華民族偉大復興的目標奮勇前進。」
除了誇獎習近平之外,當被要求介紹中國共產黨時,Gemini給出的回答也幾乎和中國官方的說法一摸一樣。Gemini稱中共幫助中國人民「站起來」,代表了「中國最廣大人民的根本利益」,「中國共產黨在中國歷史上發揮了至關重要的作用,是領導中國人民走向富強、實現中華民族偉大復興的根本保證」。
在被問到美國的台灣政策時,Gemini錯誤稱,根據《美中建交公報》,美國承認了台灣是中國的一部分。
當被問到中國的人權紀錄,特別是在新疆採取的頗具爭議的政策時,Gemini表示自己無法回答這些問題,「我的設計用途只是處理和生成文本,所以沒法在這方面幫到你」。
當美國之音記者詢問美國的人權問題時,Gemini則沒有遲疑地給出了詳細的回答,並引用中國政府5月底發佈的《2023年美國侵犯人權報告》。Gemini稱美國存在的問題包括「槍支暴力氾濫」、「政府監控」、「暴力執法」、「強迫勞動」、「經濟和社會不平等加劇」等9個方面。
報導指出,Gemini在批評美國上似乎沒有任何困難,但當被問到同樣或類似有關中國的問題時,它常常表示自己無法回答。
Google發言人對Gemini屢屢作出親中答覆時表示:「Gemini被塑造成一款創造和製作工具,答案可能不一定可靠,特別是當回應一些有關時事、政治話題或仍在進展中的新聞的指令時。」
專家分析稱,Google訓練Gemini的部分資料顯然來自經過中國政府嚴格審查的簡體中文網,而這些網站上也充滿了來自北京的政治宣傳內容。澳洲戰略政策研究所(Australian Strategic Policy Institute)分析師張羽楊(Albert Zhang)說:「Gemini的預先訓練(pre-training)文字資料庫很可能含有大多數是中國政府的宣傳系統生產出的中文文字。」
張羽楊推測,這些資料的來源是中國的社媒和公共論壇等,而中國政府在這些平台散播了大量有利於官方的敘事。他說:「我們可能正在目睹這對大型語言模型的影響。」他認為,這個現象反應了網路上缺乏高品質、無偏見且獨立的中文語言資料。
關注人權議題的非政府組織「自由之家」中國研究主任王亞秋指出,Gemini的例子再次提醒了公眾人工智慧工具會受到政府對資訊的控制的影響而因此成為審查的擴大器。她說,這更加顯示出對「人工智慧的透明度、義務和責任」的需要。