快訊

    台語語音也通! 聯發科AI語音辨識開源模型比Open AI精準度更高

    2025-07-01 10:43 / 作者 陳俐妏
    聯發科
    聯發科旗下前瞻技術研究單位聯發創新基地發布基於OpenAI Whisper的AI語音辨識開源模型MR Breeze ASR 25,更加理解台灣用語和口音,精準度相較OpenAI的Whisper提升近10%、中英語轉換表現增進56%,且在台灣常見的中、英混合的用語情境上,也達到更高的精準度。模型以Apache 2.0條款釋出,以利促進各類創意AI領域應用。

    聯發創新基地負責人許大山博士表示,開源語音辨識模型雖逐年進步,但對於在地用語及口音的辨識度仍顯不足,例如把「發生什麼事」聽成「花生什麼事」。有鑑於語音辨識是AI應用的關鍵啟動功能,此次特別釋出「聽得懂在地語言」的ASR模型MR Breeze ASR 25,其精準度相較於OpenAI的Whisper提升近10%、中英語轉換表現則增進56%。能以完整的繁體中文AI模型,積極推進繁體中文AI的創新並普及模型於地端及裝置端的使用。

    聯發創新基地自2025起已陸續開源全套繁體中文AI模型,包含整合視覺功能的語言模型(V-LLM)、針對台灣口音調整的文字轉語音模型(TTS)、以及能調用外部資訊的函式呼叫(Function Calling)模型。這次釋出的MR Breeze ASR 25為MR Breeze系列第二代語音辨識開源模型,能即時將語音轉為文字,並透過強化台灣語料及台灣口音,來符合本土應用需求。
    陳俐妏 收藏文章

    本網站使用Cookie以便為您提供更優質的使用體驗,若您點擊下方“同意”或繼續瀏覽本網站,即表示您同意我們的Cookie政策,欲瞭解更多資訊請見