語音辨識

應用
機器人:什麼?大聲點我聽不見!

機器人:什麼?大聲點我聽不見!

機器人:什麼?大聲點我聽不見!
編譯/臺大電機系 吳奕萱

人類有個與生俱來的能力:能在吵雜的環境中,分辨出哪句話是哪個人說的,並將不想關注的部份自動「消音」,降低訊息接收的錯誤率。現在,電腦也將具備這樣的能力。Google 新發表的音訊分離技術,藉由分析說話者口部動作影像與聲音特徵,辨別聲音是從誰的口中發出,進而將畫面中每個人物所說的話分離為獨立音軌。如此一來,智能助理也能在吵雜環境中,分辨出自己的使用者所下的指令。
技術
我的口音,機器人聽得懂嗎?

我的口音,機器人聽得懂嗎?

我的口音,機器人聽得懂嗎
編譯/臺大電機系 吳奕萱

同樣說英語,Alexa對於操著不同口音的使用者,會有著相同的待遇嗎?研究人員實際進行了測試,結果顯示:Alexa與臺灣許多英語學習者一樣,面臨著口音辨識的挑戰。當聽到比較少接觸,例如印度或其他與美式發音差異較大的英語口音時,很有可能判讀錯誤或是呈現聽不懂的尷尬狀態。為今之計,除了持續擴大語音資料庫,容納更多非母語英語使用者的樣本外,是否還有其他方式可以避免呢?