移至主內容

教育部「臺灣臺語語語料庫應用檢索系統」上線

2024/08/27 06:00
2,983次瀏覽 ・ 3次分享 ・ 0則留言
PeoPo推 0
檢舉

照片

教育部委託國家教育研究院建置「臺灣臺語語語料庫應用檢索系統」(網址:https://tggl.naer.edu.tw/)已經公佈予逐家運用,系統查詢的資訊可供國民中小學課程設計、教學佮評量需求外,供下載的語詞資料庫,會當做語音處理,抑是 AI 深度學習的開發模型。

教育部佇一一二年委託國家教育研究院建置佮維護臺灣臺語音語料庫相關計畫,共語料庫的成果加以保存、維護,並增錄教育部辭典佮盧廣誠先生編《華台對照詞典》的例句,延伸建立「臺灣臺語語語料庫應用檢索系統」,包含三大子系統:

一、語料檢索系統:使用者會當查詢超過56,000筆臺灣臺語話料內容,並取得檢索詞彙的配詞、關聯詞佮部份的語音檔。

二、教科書詞彙檢索系統:收錄約1,400條教科書詞,使用者會當查詢各版本臺灣臺語教科書中出現的詞彙佮相關資訊,可供教師利用,豐富教學內容。

三、語法點檢索系統:使用者會當查詢臺灣臺語語法點及其說明佮例句,對深入學習,並供語言研究者來參考。

此外,開放各界申請下載108年教育部辦理臺灣臺語音語料庫計畫成果,包括語料庫、音檔佮 AI 工具模型等等。內容包含兩萬六千外句的文字,逐句有四句至六个發音人共六種聲音來源的音檔總計兩百空八點鐘,另外有語音處理的 AI 工具模型。各項成果適合語言研究者應用佇語料佮文本分析等相關領域,佮資訊人員用以開發語音辨識、語音合做等相關 AI 系統,抑是進一步建置本土語言教學輔助工具。有意申請者會當到網站首頁,點擊正面頂的頂懸「語料申請」進入申請頁面,添畢基本的資訊揤「送出」,會使所添的電子信箱收著申請書檔案,填寫完申請書並簽名了後欲掃描檔回傳,維護團隊佇審核通過後寄送語料庫成果下載連結讓申請人。

自一一一年十一月開始委請國立陽明交通大學辦理新一階段的臺灣臺語料庫建置計畫,預計到一一五年十月完成,共擴大建置約文字語料二千萬字佮口語語料三千點鐘的語料庫,而且繼續來提高語音處理 AI 工具的實用效能,期望為本土語言研究、教學資源建置猶閣有語言 AI 系統的開發貢獻閣較濟的力量。

發言應遵守發言規則

回應文章建議規則:

  • 文章屬於開放討論空間,回應文章的議題與內容不代表本站的立場
  • 於明知不實或過度謾罵之言論,本站及文章撰寫者保留刪除權
  • 請勿留下身份證字號、住址等個人隱私資料,以免遭人盜用,本站不負管理之責
  • 回應禁止使用HTML語法

公民記者留言請先登入

公民記者留言請先登入