:::
線上收聽
來聊東勢 週五 09:00-09:59

【專業客】人工智慧AI講客靠三箭齊發 從「客語友善環境起步」
2023-03-21 14:15:14

【專業客】人工智慧AI講客靠三箭齊發 從「客語友善環境起步」

編按:《客新聞》將不定期推出【專業客】專欄,我們邀請各行業的專家、學者或是經驗豐富的職人,對當下新聞熱門議題,發表最專業的看法,試圖在各種網路帶風向、假訊息當道的時代,提供理性思考的方向。

【專業客】張陳基 教授

人工智慧AI(Artificial Intelligence)科技與客家話最關鍵的三項技術是「機器翻譯」、「語音合成」、「語音辨識」。用AI科技建立第一步是透過「機器翻譯」(Machine Translation)來建立華語轉客語、客語轉華語的文字翻譯系統。讓客語友善環境後,可以方便民眾去使用客語,無論是客語詞彙的查詢、日常生活對話的應用,甚至是幫助專業的客語書寫,有效率地將各式華語文章翻譯成以客語書寫的文章,同時也可以輔助客語詩詞創作,降低客語文字書寫的門檻。

最重要的一點是可以將很少被民眾所使用的客家特色詞彙、老古人言、客家諺語加入客語翻譯系統的語料庫之中,讓這些逐漸被客家人淡忘的特殊用詞也能夠透過翻譯系統慢慢重新回到日常生活之中。

同時,也要將一些新興用語加入到語料庫之中,讓年輕人也可以在日常生活中方便地使用客語,不至於發生要說客家話的時候捉襟見肘,又回到使用華語來溝通。

AI人工智慧成為未來語言發展的工具。客新聞攝

客語轉華語翻譯系統,幫助客家隨時被看見

現代人經常使用社群媒體,更需要用文字來溝通,因此透過即時翻譯系統,可以幫助現代人在網路時代中更加能展現客家族群的特徵,讓客家隨時隨地被看見。

客語翻譯系統與其他語言翻譯系統不同,由於客語翻譯系統肩負著語言文化傳承的目的,在開發客語翻譯系統的時候,需要依據不同的使用對象及情境來提供翻譯內容。區分成日常生活對話以及專業書寫輔助,日常生活對話翻譯著重在一般民眾的日常對話中,簡單又輕鬆的詞彙用語,結合新興的網路用語,迅速地讓客語回到我們的日常對話,讓客語變得很容易親近又容易使用。

專業書寫輔助翻譯則是以協助客語文字書寫為主,幫助客語詩詞創作,將客家特色詞彙、老古人言、客家諺語呈現在翻譯內容之中,讓客語的文字創作能夠更加凸顯客家文化特色,也藉此讓許多艱深或是客家人常說比較「黑」的客家話也能夠繼續流傳下去,同時針對不同腔調也有不同的客語用字,這些都可以透過翻譯系統輕鬆應用在日常生活之中。

完成這一步之後,使用者可以透過文字,利用華語或是客語來跟客語聊天機器人進行對話,在輸入華語或客語時,就可透過機器人回應客語。

語音合成系統可有效保存不同腔調客語

第二步是客語語音合成系統(Text To Speech, TTS)的建立。語音合成系統(TTS)能將書寫文字轉換為語音。台灣的客語非常的多樣化,是世界語言的珍寶!主要有四縣、海陸、大埔、饒平、詔安,後來加入了南四縣。別忘了還有永定、長樂等腔調。

有些人想到要同時保存和傳承這麼多種腔調的客家話,不免憂心忡忡!但是透過AI語音合成技術,這件事情就會變得很容易!要進行客語語音合成,首先要招募不同腔調的客語發音專家,錄製語料,接著利用AI技術進行訓練,完成之後就能夠依據使用者輸入的客語文字來進行發音。

比較需要注意的是客語多音字的問題,因為依據不同的使用情境或是上下文,相同的客語詞彙會有不同的發音,這點就是客語語音合成的挑戰!但完成客語語音合成系統建置之後,可以永久保存這些客語腔調語音,並且有個像超便利的延伸應用,例如可以推出虛擬網紅(VTuber),讓虛擬網紅主持不同客語腔調的線上節目,利用客語TTS,設計你要讓虛擬網紅表演的客語文字腳本,讓他可以介紹客家文化或是最新時事。

TTS也可以製作有聲電子書、朗讀客語新聞、客語語音助理等等。完成這一步之後,使用者可以用華語跟客語聊天機器人進行對話,你說華語,機器人可以回答客語。

找回阿姆話靠AI發揚光大

最後,要讓電腦聽得懂客家話,就要發展客語語音辨識系統,或稱自動語音辨識(Automatic Speech Recognition, ASR),這也是客語AI技術最大的挑戰。要訓練一個腔調的客語語音辨識需要有一萬小時以上的語音語料才能夠達到足夠正確的辨識率。語音合成技術需要同一位客語發音者進行錄音,而語音辨識技術的訓練語料則需要來自於不同發音者,再加上客語有這麼多不同的腔調,要獲得可以接受的辨識正確率是研究者正在面對的艱難挑戰。

雖然困難,但是完成語音辨識建置工作之後可以幫助客語數位教學邁進一大步,有了客語辨識系統,可以判斷客語發音的正確率,輔助客語教學,讓學生可以自己學習發音,系統會告訴學生發音正確的程度,導正學生的發音。ASR技術可以幫助客語言學習者通過即時反饋和建議更正來改善其發音和口語能力。例如,客語線上學習系統可以使用ASR來聆聽學習者發音的單詞或短語,然後與正確的發音進行比較。

客語ASR也可以用於提供互動式練習,幫助學習者練習其發音和口語能力,提供關於學習者發音的反饋,例如指出需要改進的特定聲音或語調。例如要求學習者重複單詞或短語,然後提供關於其發音的反饋,這對於客語有這麼多不同腔調,又缺乏各腔調專業師資能夠提供發音反饋的學習者來說尤其有用。

完成這一步之後,可以完全以客語來跟機器人進行對話,你說客語,機器人可以用客語回答你!客語語音辨識也可以應用在智慧生活中,用語音來控制生活上的智慧裝置,例如客庄老人居家照護以及日常生活陪伴。期待我們利用AI科技建立客語友善環境,讓客語隨時隨地都看得到、聽得到,也方便使用。

聯合大學張陳基教授認為發展客語AI需從三個步驟開始。資料畫面

【專業客】張陳基教授
經歷:
國立聯合大學教授,新竹關西客家人,任教於客家研究學院文化創意與數位行銷學系,開發有客語翻譯系統、客語聊天機器人阿知牯(Talka)。

這篇文章 【專業客】人工智慧AI講客靠三箭齊發 從「客語友善環境起步」 最早出現於 客新聞 HakkaNews

相關留言

其他新聞

其他公告