你的台語終極詞典:ChhoeTaigi 找台語

科技 2019-01-04

文 / g0v.news

整理和數位化台語字詞資料,提供公開授權的台語字詞資料庫、一次可查詢所有資料的辭典網站和 App。



(Photo credit:找台語 facebook)

家銘過去在學校讀書時,常常覺得格格不入。國立編譯館主編的課本內容不但已經過時,地理、歷史等科目也以中國為主,當時他就深感納悶,為什麼要背誦那些其實與他無關的事物?相反地,在教育體制的設計下,「自己的土地,自己台灣的東西,卻幾乎沒有提到。」

台語,正是在國民黨威權統治時期,不被重視的「自己台灣的東西」。國語運動的推行,導致整整一代人自由運用母語的空間受限,從而造成今日台語傳承嚴重的世代斷層;而即使在還會講台語的族群之中,他們讀、寫的能力,由於過去教育體系從未妥善規劃台語教育,基本上是付之闕如。

有感於此,從小在台語家庭長大的家銘,除了教來自香港的太太說台語,兩年前也進到學校裡面當兼職的台語老師;平時是工程師的他,還利用所學開發了台語輸入法與線上台語辭典 App,希望幫助人們加強台語的讀寫能力。

然而,也是在深入接觸台語文之後,家銘才體認到,對網路世代的台語學習者而言,想利用線上資源學台語,仍有諸多不便。其中一個障礙,就是既有的台語輸入法或辭典 App,時常沒有收錄想找的台語詞彙 — — 這正是「ChhoeTaigi」(找台語)專案想要解決的問題。


彙整民間資源,三十二萬台語字詞庫讓你不再「揣無」

 

多數藉由體制接觸台語的學習者,如果遇到不會講、或不知道怎麼拼寫的台語字詞,最常使用的便是教育部開發的《臺灣閩南語常用詞辭典》。家銘一開始開發輸入法和辭典 app 時,也是利用教育部的字詞資料。然而,很多使用者發現,教育部的辭典只收錄兩萬五千多個「常用詞」,數量根本不敷平常時使用。就連許多第一線的台語老師在學校上台語課時,時常無法找到學生名字的發音。這讓他不禁感慨:「台語老師連小孩子的名字都不知道怎麼唸,要怎麼教他台語?」

除此之外,教育部辭典也僅收錄有漢字的台語字詞,這種「漢字優先」的意識形態,不但忽視歷史上最多台語文文獻就是用羅馬字書寫台語文,除了造成多數人以為不用漢字就無法書寫台語文,也導致許多真正常用的台語字詞無法收錄。舉例來說,台灣知名搞笑天團「浩角翔起」自稱「Phū-lōng-kòng(噗嚨共)天團」、機車的台語是「oo-tóo-bái」,像這類詞語儘管口頭上常用,卻難以用漢字表示,就被排除在正式收錄用字的範圍之外。

事實上,由於民間台語文如白話字歷史已經發展超過 130 年,教會、學者等民間力量早已經累積了不少比教育部辭典更為豐富的字詞資源,例如中教大台語系楊允言教授主導的《台語文記憶》網站、《台文/華文線頂辭典》,以及台語信望愛林俊育長老整理長老教會出版的《甘為霖台語字典》,更翻譯日治時期留下來的《台日大辭典》,乃至近年 g0v 社群藉群眾之力建置的「iTaigi」(愛台語)專案等。不過這些資料散落各處,有的尚未數位化,有的尚未整理,各有各的缺漏,對於一般人而言,要在線上找到一個台語詞彙,往往曠日費時。


(Photo: CC BY 4.0- g0v Summit 2018 記錄組)

「ChhoeTaigi」就是要把這些前人努力的成果,彙整成一份格式統一的完整資料庫,讓往後的台語辭典 App 與輸入法不再掛一漏萬。自專案開始以來,家銘四處走訪台語文運動前輩與各個辭典的維護者,一一取得資料的授權,另外將兩本紙本資料數位化,目前字詞庫中已累計 32 萬個字詞,全部以開放他人使用的 CC 授權釋出。未來家銘將再把這份字詞庫整合到既有的辭典 App 與輸入法後,人們搜尋台語詞彙不用再大海撈針。


找台語,也讓台灣人找回自己的根

 

對家銘來說,「找台語」不只是要方便找到台語字詞,更是要讓台灣人找回自己的根。台語在台灣幾百年的歷史,讓它承載著族群認同與在地文化的特殊意義,就好像許多台灣小吃用台語表達才最為道地;此外台語吸收了英語、西班牙語、荷蘭語、日語、和製漢字、百越語、原住民南島語系等多重語言的元素,許多無法用漢字表達的詞彙,正顯示出台灣的多元文化與複雜的殖民歷史。

對於新一代的「數位原住民」而言,「找台語」專案正提供了另一種「尋根」的可能。由於耳濡目染、能自然學會台語的環境在今日已經愈來愈罕見,加上網路上人們多半是以文字溝通,人們說台語的機會愈來愈少,即使會講的人也不免面臨「語言流失」。當文字的力量比以前更大、也更為重要,完整的字詞資料庫將讓台語學習者不必從「講」開始,反而可從文字閱讀學起,「把這些東西慢慢撿回來」。

不過,家銘也清楚意識到,「找台語」充其量只能算是推行母語台語的地基,「其實以台語和台語文運動來說,在民間前輩的努力下,還是難抵政治力的長期抹殺和不重視,還在很前期的位置在奮鬥」。在解決學習者學習門檻、提高使用者便利性和誘因之後,未來要讓這個專案獲得大量使用,仍有賴相關法源、專責單位、政策、傳播媒體、教育制度、一般人的母語觀念等整體大環境的改善。

團隊成員:吳家銘 Ngô͘ Hê-bí(shiami)、Lîm Bûn-Cheng(BûnCheng)、Tēⁿ Tì-têng(Tìtêng)、Eyes Chen(lovenana1031)、Leo Wu(leowu)

專案網址:https://chhoe.taigi.info/

查看原始文章>

【全文轉載自g0v.news】
~傳遞善意,深表感謝~