不法分子利用AI 語音合成技術進行語音詐財的事件層出不窮,國立臺灣科技大學資訊管理系學生王玟雅、蔡婷玗、陳俞縕及毛世鑫共同開發「護聲符APP」,具備語音真偽辨別及數位音訊防護兩大功能,除了可以分辨語音是AI還是真人,還能為聲音加上特殊的「音訊浮水印」,也就是人類聽不見的音頻或標記,防止聲音被AI軟體進行二次合成利用,音訊浮水印也能作為保障聲音版權的依據,這項設計,在第29屆大專院校資訊應用服務創新競賽中,獲得資安應用組第二名及資訊應用組第三名的佳績。
隊長王玟雅表示,親友曾經接過陌生來電,被誘導進行對話的經歷,再加上看到關於語音詐騙的新聞,讓她萌生設計語音防護系統的想法,希望以科技手段保障聲音權益,因此團隊一起催生了「護聲符APP」,提供語音防護與真偽辨識。
在語音真偽辨識方面,團隊蒐集公開的真人語音資料庫與 AI 合成音訊,利用偵測模型整合與分類,分析真實語音與合成語音的特徵與差異,最終訓練出辨識系統。在背景音乾淨的情況下,該系統對真人語音的辨識準確率高達 99.99%,對 AI 合成音的辨識準確率則為 99.94%。
目前APP 支援音檔上傳與錄製功能,使用者可藉此辨別語音真偽或添加浮水印。王玟雅也將規劃完整開發即時通話中的語音辨識與防護功能。同時,因為目前訓練模型用的語音資料大多為英文,團隊也預計擴展模型的語音數據庫,蒐集更多中文語音樣本進行模型訓練,增強對中文語音的支持,以符合台灣民眾的使用需求。未來,希望可以將「護聲符 APP」發展成合規性工具,應用於通信、聲音版權保障、生物特徵驗證、影視製作等領域,成為具有公信力、保障聲音版權的工具。
團隊成員毛世鑫分享,儘管他原本對語音相關的資安技術不熟悉,但為了完成語音模型的開發,他也特意去進修相關課程,拓展知識層面。來自印尼的成員陳俞縕一開始對於得獎並沒有抱太大的期待,聽到獲獎的消息時,她感到相當驚喜。成員蔡婷玗也說,競賽得獎讓她更有動力去面對未來的各種挑戰,能更有信心迎難而上。