中國科技公司騰訊集團副總裁蔣杰7日公開介紹騰訊自行研發的人工智慧生成聊天機器人「混元」。翻攝騰訊雲
中國最大網路公司騰訊昨日也加入聊天機器人的熱門戰場,推出「混元」大語言模型,宣稱具有強大中文能力,也不再會有AI回答「胡言亂語」的問題。
騰訊副總裁蔣杰昨日在2023騰訊全球數字生態大會上,公開介紹騰訊推出的生成式人工智慧(AI)「混元大語言模型」。有報導指出,這是騰訊首次披露的通用大語言模型,「具備強大的中文創作能力,複雜語境下的邏輯推理能力,以及可靠的任務執行能力」。
中國科技公司騰訊集團副總裁蔣杰7日公開介紹騰訊自行研發的人工智慧生成聊天機器人「混元」。翻攝騰訊雲
根據蔣杰介紹,「混元」與其他AI聊天機器人最大的不同是,騰訊使用自家產品所累積的海量用戶對話資料,以及「B TO C」和「B TO B」等應用場景訓練「混元」。
騰訊認為,目前檯面上的聊天機器人軟體在實際場景的應用比較受限,大部分停留在高容錯、任務簡單的休閒場景,例如詩詞生成。用戶在使用初期通常會為AI所給出的炫技式詩詞或者回答腦筋急轉彎而感到驚豔。然而,對於容錯率更低或任務更複雜的工作、專業以及嚴肅場景,例客服、醫療診斷、調研統計等領域,往往容易出現張冠李戴、胡言亂語的問題(即大模型「幻覺」),導致使用者對準確性和可靠性的呼聲極高。
由於擔憂聊天機器人出現「幻覺」的限制,一些在嚴肅領域上的企業或個人不敢使用生成式人工智慧軟體。對此,業界往往通過知識圖譜或者搜索外掛的方式試圖解決,但效果並不理想。而騰訊「混元」則是不依賴外掛,在訓練階段透過「探真」演算法進行事實修正,讓混元大模型的幻覺相比主流開源大模型降低了30%至50%。
不僅是降低幻覺,「混元」還宣稱透過強化學習的方法,讓模型學會識別陷阱問題;透過位置編碼優化,提高了超長文的處理效果和性能;提出思維鏈的新策略,讓大模型能夠像人一樣結合實際的應用場景進行推理和決策。它還能進行文學創作、文本摘要、角色扮演等內容創作,做到充分理解用戶意圖,並高效、準確地給出有時效性的答覆。
騰訊表示,混元大模型已經接入騰訊50多個業務並取得初步效果,包括騰訊雲、騰訊廣告、騰訊遊戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ流覽器等業務和產品。
自從OpenAI去年底推出聊天機器人ChatGPT以後,中國包括阿里巴巴、京東、網易和TikTok 母公司字節跳動等多間科技公司紛紛開發可以模仿人類交流的服務,引發了市場熱潮。不過中國的聊天機器人還得面臨另一項問題,也就是政府的言論審查。
中國搜尋引擎龍頭百度日前正式對外公開生成式人工智慧聊天機器人「文心一言」(ERNIE Bot)。美國媒體測試發現,「文心一言」帶有重重審查,極力避免回答任何可能涉及敏感話題的問題。當記者輸入任何與中國國家主席習近平有關的問題,「文心一言」都只給出一份習近平的履歷和頭銜,並立刻結束對話,建議記者「換個話題重新開始吧」。