跳到主要內容

客家如何面對數位化的公共傳播及資料的開放性

 

How Hakka Faces the Challenges of Digitalization of Public Communication and Open Data

一、從客家聲音媒體到數位資訊傳播的開放
二、古文書裡的口說詞彙及客語拼音文字
三、中文常用輸入法中的客語拼音挑戰
四、資訊使用介面整合及跨平台對話

從客家聲音媒體到數位資訊傳播的開放

客語是活的語言,客傳會經營全國首個以客語為主的講客廣播電臺,自 2017年 6 月 23 日創台開播以來,製播超過 3 萬小時的客語節目音檔,我們共享來自土地的聲音記憶,預計籌劃採集地方故事、民謠及諺語的客家聲音銀行,開始思考如何將這些客家聲音資料,以公共財形式釋出並貢獻給公眾使用。

為了喚起公眾對客家資料開放性、跨領域協作等議題的關注及參與,2020 年12 月起連結客庄夥伴,一起梳理地方累積的一手二手珍貴田野資料,學習使用新的介面操作形成新的客家開放社群,在中文維基平台上陸續上傳客家相關文史資料,過程發現如天下第一字「𠊎」(日常用語的「我」)等客語字及拼音在跨平台的顯示,「我手寫我口」新世代客語跨平台輸入法的發展等課題亦亟需解決及重視。

古老的客語口說詞彙、客語拼音字口說,在民間識字能力未在普及前,是人與人日常互動、聯繫溝通時的主要表達方式,影響了寫在書簡上文字辭彙的選用,形成「我手寫我口」的現象;加上地理環境條件多元,山區連絡不易形成該地語言的慣用方式,甚至同物件的不同說法、或異音同義語料辭彙紛雜等現象。因此,從不同的地域、人群、腔調等語料資料中,不難發現口語和書寫文字在拼音詞意同異等,這些都反應在流傳至今的口傳文學藝術及古文書裡。

客委會投入古老客音的調查研究,近年梳理土地買賣的契約書、家族分家的鬮書、口傳老師傅話民間文學,及傳統民謠山歌等,由龐雜史料中整理出臺灣客音古字,這些客家語料歷史資源未來若系統化對外公開,將是客傳會推展向下扎根客家話的重要基礎。古老客音的口說決定文書及口傳的方式,提供了文字影響

口說的不同視野,對於了解客語拼音隨社會文化的變遷,與他文化互動的腔調多元將有所助益,藉此次參與 COSCUP 開源年會與語言相關技術對話,關注古老客語的開放和應用等議題,期待形成更多在當代客家、新世代觀點的討論及現代工具使用介面的人性化、友善化,讓這個有時間縱深的古老語言,融合當代新生命力的新日常客語,往下流傳。

中文常用輸入法中的客語拼音挑戰

在電腦上要輸入客語,其實是一件不算太簡單的事情,目前在市場上,有教育部在 10 年前開發,4 年前改版的客語拼音輸入法,支援 Windows、Mac 與 Linux 平台, 在 Linux 平台上是採用 SCIM 的架構來處理。還有民間人士烏衣行開發的客語輸入法,只支援 Windows 平台,以及由教會製作,可透過台灣羅馬拼音輸入客語的信望愛台語客語輸入法,支援 Windows 與 Mac OS 平台。

而在手機中,要輸入客語,則是有之前的好客拼音輸入法 (但目前並無在 Google Play Store 上架),以及透過在 Android 上先安裝已經是開源的 Lime 萊姆輸入法,再下載閩客原語 LIME 輸入法詞庫安裝,才有辦法在 Android 手機上面輸入客語。而 iOS 裝置 iPhone、iPad 上的客語輸入法目前是沒有的。以台灣閩南語來說,iOS 上至少還有兩種輸入法可以使用如 Lohankha 羅漢跤台語輸入法、Phah Tâi-gí 台語輸入法,但 iOS 上台灣並沒有適合的客語輸入法 APP 可下載使用。

但電腦和手機的客語資訊問題,還不是只有輸入法而已,最早的問題就是客語字的顯示。所謂客語的天下第一字「𠊎」,在很多人的手機中是無法顯示的,如各位手上的 iPhone 手機,如果沒有安裝能支援客語造字集的字體,就不能顯示這些客語字。而 Android 手機,在 Android 更早的版本之前,也是要下載更換使用如台灣楷體或宋體等具備客語字擴充字集的字型才能夠正確在 Line 顯示這些客語字。所幸,Google 在新版的 Android 10、Android 11 系統中內建的新版本預設字形就已經有具備顯示這些客語字的字集。我們期待蘋果的 iOS 裝置未來也能夠內建具備能顯示客語字的字型。

除了前述問題外,客語輸入在手機與電腦上還有「聲調符號」輸入的問題,電腦上的客語輸入法通常可以裝客語聲調鍵盤來為鍵盤上增加「ˊˇˋˆ⁺」聲調符號的功能,或者是輸入法本身就有內建。但在手機上得安裝類似 codeboard 這樣的 APP,來自定一個有客語拼音符號的鍵盤。類似這樣的主題,其實在輸入原住民族語言上,也有類似的自訂特殊字母鍵盤需求。

至於客語語音輸入,那又是另一個大哉問了。目前台灣已經有團隊在進行中,

而客語有包括「永樂四海大平安」等多種腔調,這些腔調的聲音辨識資源、機器學習訓練模型,很多都還在努力中。

諸君可以發現,目前並未有一個客語輸入法能夠跨手機與電腦等平台,延續使用習慣、詞彙庫等等可共通拓展使用者經驗的解決方案。自然語意、字頻、詞頻與智慧型客語輸入,這些都還需要空間和時間與資源來逐步完成。

客傳會的立場,我們除了推動節目、文化、傳播方面的客家文化發展,數位平台上的客語相關解決方案,客傳會也願意提供自己包括薪傳師、資金、空間等資源來協助,以及大量的五種腔調節目音檔作為公共財加速客語各種應用的開發使用,更希望能夠促成採用新輸入法引擎的跨平台客語輸入法能夠誕生,希望能解決 iOS、Android 兩平台上沒有跨平台客語輸入法的問題,假設能透過類似的輸入法框架,共通相同的客語詞彙庫、字庫,定期能維護和擴充,讓Windows、Mac 與 Linux 等平台也能共下使用是很棒的。如果開源人社群能夠提供我們一些建議與指引,我們會萬分感謝。

資訊使用介面整合及跨平台對話

目前聽聞 Phah Tâi-gí 台語輸入法在 Android、iOS 兩平台的共通性上有了很好的發展,我們也很希望與這樣的團隊做交流與合作,協助打造出優秀的母語輸入法來,讓更多使用者可以在台語(台灣閩南語)、台灣客語、台灣原住民語的資訊應用發展上有更多經驗的傳承,並減少繞路前行的時間。

而線上的華語轉客語、客語轉華語的自動文字翻譯功能,現在已經有人製作 了,但還是需要有系統性地去維護資料庫,這也是我們希望能夠有機會協助的方向,設法完善各種使用者會用到的需求。

面對未來的更多智慧型應用,包括語音輸入、語音辨識,從衛福部關於疫情的指揮中心記者會現在已經有客語同步口譯轉播,華語在 Youtube Live 已經有提供線上自動語音轉文字輸入顯示的頻道,那是否有機會有客語語音自動轉換為文字的顯示呢?這也是我們期許的未來面向之一 。

目前客委會正在草擬《客家語言發展法》,期望以更廣泛、更具體的面向推動客語,以及參預了「國家語言發展會議」,相信未來會有更多語言相關的議題。而我們客傳會在針對客語資訊方面,在公共傳播與資訊領域能夠先做的,有哪些呢?

如果有興趣參與客家資料相關議題的,可以洽各地的客家 Wiki 寫作團隊,也可以和我們聯繫,我們會協助尋找適合的在地社群來一起攜手客家資訊的維基百科條目撰寫。這是個常年的資料編寫計畫,我們相信長期的耕耘,會對我們這塊土地與全球的連結,以及深化保存我們的文化,會一點一滴帶來更有幫助。

針對客語在電腦與手機等平台碰到的問題,我們會建立一個客語輸入與相關顯示議題的網頁,以及專屬信箱ime@hpcf.tw,提供給大家報名參與,亦能討論現況與未來的發展。

現有的問題就是我們需要盤點現有的客語輸入法資源,協助我們決定客語輸入法的框架與走向,我們會整備資源、參與社群對相關專案提供貢獻。

我們歡迎各界有興趣的人幫忙,同時也沒有語言上的限制,我們會適度安排參與的人員,以及協調出可行的專案來。以跨平台客語輸入法來說,是否能夠參考 Phah Tâi-gí 台語輸入法的框架與模式,我們透過建立詞庫的方式,以及選定或加入適當的輸入法,來實現跨平台客語輸入法的誕生。相關的聯絡方式與議題的討論,都可先寫信到 ime@hpcf.tw,我們也設立了 https://ime.hpcf.tw 這個網頁來當作我們的前進點,需要大家的提點或建議。

目前手機平台上還沒有開放原始碼授權的跨平台客語輸入法,以及搭配的客語字集,因此透過群募、我們提供資源等方式,會很期待它能夠在未來順利誕生,也會是開放原始碼授權的形式,提供給公共使用。

下午的議程,有:

五溝工作站的林品軒及劉晉坤站長

五溝聚落位在屏東萬巒,是全國第一個指定保存的客家聚落。五溝水駐地工作站長期在地方進行水文生活及生態調查、環境復育、客家伙房、殲炮城及產業文化的有關工作的經營和推展,與在地人共同守護濕地水圳多年,嘗試在經濟活動與文化、生態保育間取得平衡。隨著工作站陸續有年輕夥伴加入,漸漸意識到過去累積豐厚的一手資料,面臨資料的建置、資料如何分類的問題,也發現客語傳承的挑戰,除了日常生活的使用外,也存在著語言如何透過網際網路流通、與人互動溝通的挑戰。

桃園市客家文化基金會的蔡濟民

在文學與生活間擺渡的家鄉敘事,2019年4月正式對外開放的鍾肇政文學生活園區,在歷經多年保存行動,從策劃龍潭魯冰花藝術季開始,便跟著「跨語言世代」代表之一的鍾老,他將龍潭家鄉的山、水及生活寫進文學作品,無論是乳姑山、龍潭大池、九座寮泉水窟等地景,從人的生活場域轉化成文學地景。而隨著園區的開放,桃園市客家文化基金會延續過去所累積的基礎,以文學作品、多媒體、文化展覽及推廣連結社區,同時也思考數位時代,以鍾老、文學作品及相關文物為核心建構雲端博物館,並順應客家開放資料S計畫的推展,嘗試將一手二手資料推向公眾共享的文化財。

大茅埔調查團的吳哲銘

成軍四年餘的大茅埔調查團,長期在地方蹲點做地方文史、水圳生態等的調查,一邊做社造一邊聽耆老講述東勢大茅埔的生活文化記憶。2020年10月起與團員訂出一天調查日在外面跑,一天維基日共讀資料的定期聚會,想好好面對觀點紛紜的眾聲。隨著大量圖文資料的系統化、維基化的整理過程,一天天累積的新發現、新線索日益龐雜,我們意識到越來越多在地口述與既有文獻立論觀點存在著矛盾,也更加好奇近期找到的老石碑,如果它會講客語,將如何改變近代中臺灣客家聚落發展的歷史觀點!?以及維基客語拼寫書寫的可能性。

他們講述的故事與內容也都是非常值得大家參與,我們下午見。

承蒙大家~~

希望客傳會與講客廣播電台前行的偉大航道上,能夠有你有我,共下一起飛~~

哪裡有客家,哪裡就有客傳會。

留言

這個網誌中的熱門文章

COC 通報處理說明公告 - 20240811 通報事件

各位好, COSCUP COC 服務小組於 2024 年 8 月 11 日接獲一件通報,內容涉及在會期干擾議程進行;並於會後持續發送私訊予會中結識的講者;同時,該行為人亦被紀錄於活動當日干擾志工執行勤務。 有關此事件的處理過程,詳如下述: COC 服務小組接到通報後,於 8 月 15 日正式成立專案小組進行討論與檢視相關資料。經查,通報內容與 COC 條款「持續干擾議程或活動的正常進行,無視工作人員或與會者的制止」相符。同一行為人於大會期間,另有兩位會眾通報類似事件,COC 服務小組皆已明確指正其行為並重申 COC 規範和界線。綜合此次會後通報,行為人經提醒仍多次抵觸 COC 條例。 有鑒於上述行徑已明確影響 COSCUP 其他會眾之權益,COC 服務小組將依照 COSCUP COC 之辦法記錄事件處理過程及結果、行為人資料等,於籌備團隊組長群資料夾建立文件,以俾後續籌備團隊審慎思量該名行為人未來的參與形式與程度。 在此,感謝會眾願意信任 COC 和 COSCUP 團隊並且將其所遇到的事件於會後彙整提供予我們。另本次通報中,通報人所提及之部分事項,因非屬 COSCUP 大會參與期間和相關行為,已建議通報人另行循其他正規途徑處理。在此聲明, COSCUP 的 COC 落實並非要拒任何人於門外,而是希冀透過針對行為本身的評估,為無論志工、社群協調人、講者、廠商與所有會眾營造舒適與安全的交流環境。 我們在乎所有人於 COSCUP 大會的各種參與體驗與感受,如果您在大會和籌組期間有相關困擾,籌備團隊志工將會竭力協助釐清,希望一同打造友善的 COSCUP 與會環境。 COSCUP 2024 COC 服務小組

利用 Jitsi 建立個人化的視訊會議平台

  近期因為疫情的關係,越來越多企業開始實施分流或在家工作,視訊會議的需求也日益增加。 在商用解決方案選擇上,有不少企業會選擇知名品牌的產品,例如  Cisco Webex 、 Google Meet 、 Microsoft Teams 、 Zoom  都是很不錯的方案。 KKBOX 集團在去年便試行及做好充分 work from home 的準備,今年五月也因應疫情升溫,全員 work from home 至今兩個月有餘。 當然,取之 Open Source,也要對社群有些貢獻。在這一屆 COSCUP,我們要來介紹 Open Source 圈中也很知名,效果也很不錯的一套視訊會議平台: Jitsi 。 除了基本的視訊會議功能外,在最後我們也會示範如何透過 Jitsi 畫面輸出到 YouTube/Twitch 或其他支援 RTMP 的平台進行直播。 由於篇幅有限,且 Jitsi 可以調整的細節非常多。今天我們純粹很快速的示範,如何簡單的建置出一個 Jitsi 環境,並提供單場會議內容錄影或直播。 Jitsi 的文件可以在 這裡 找到。 今天透過 AWS Lightsail 的 $10/month instance(1 core CPU + 2GB RAM + 60GB SSD),作業系統則是 Ubuntu 20.04 來示範。當然,使用其他 VPS 亦可,大同小異,這邊直接跳過 VPS 相關的建置過程。 *firewall 相關資料參考 這裡 及 這裡 。 針對系統做必要的更新 基本的 apt repository 更新: $ sudo apt update 因為後面要示範的會議錄影及直播需要使用 ALSA loopback device,如果是 EC2 or Lightsail 則需要額外安裝 generic kernel( 註 ): $ sudo apt install linux-image-generic linux-headers-generic linux-image-extra- virtual 接著做系統套件們的更新: $ sudo apt dist-upgrade $ sudo apt autoremove 如果是 AWS EC2 or Lightsail 則需要另外再將預設的 AWS optimized kernel...

你所不知道的 foodpanda

  2020 左右,隨著新冠疫情流行,台灣也逐漸流行起一股懶人旋風。懶懶躺在沙發上,動動手指滑滑螢幕,生鮮或美食就能快速又安全地由可愛的粉紅色熊貓外送員送達您門口。多數人知道 foodpanda 是台灣最大生鮮美食外送平台,也不少人知道 foodpanda 在台灣不斷擴張業務範圍,但 foodpanda 也有許多台灣科技圈所不知道的事。 例如,foodpanda 其實並非台灣本土廠商,也非只專注在亞洲區域。foodpanda 隸屬於德國 Delivery Hero 集團,業務橫跨歐洲、亞洲、美洲及北非,旗下更有十多個生鮮美食外送品牌。除此之外,foodpanda 於 2021 年時也在台灣正式成立全球第三個 Tech Hub。做為四大產品 RD 研發中心之一,台灣與德國柏林、新加坡及土耳其伊斯坦堡的人才緊密地合作,專注於打造 end-to-end 的顧客體驗。諸如月費方案 Panda Pro、外帶自取、餐廳內用 (目前仍未在台灣上市) 等功能。期待能持續吸收優秀人才、與其它三個跨國研發中心合作,打造後疫情時代新的成長引擎。 事實上,台灣的 foodpanda 研發團隊並不僅止於打造台灣本土產品。反之,我們所建立的平台及產品,已成功於近 20 個國家、10 個品牌上市。要在快速的步調下,打造持續進步且符合不同國家文化客戶需求的產品,我們依靠的是 專案團隊成員一條龍組合 從 Product Manager、Engineering Manager、iOS/Android/Web/Backend developer、QA、Product Designer、Product Analyst 全都在同一個 product line squad。讓相同產品的團隊成員能緊密合作、第一手快速了解市場、滿足需求。 國際專業團隊緊密合作 foodpanda 的 iOS/Android/Web/Backend 等專業工程師,都各自設有其跨 squad 的 chapter 組織。讓工程師能在專案團隊以外,有跨國跨團隊專業能力交流的機會。在 chapter 中,相同技術域領的專家們,會一起制定共同的實作標準、分享在專案中遇到類似的挑戰,並且找出可能的應對方案。因此,在 foodpanda 我們不只打產品專案團隊的速度戰、還打整個集團的整合能力團體戰,讓德國、新加坡、台灣、伊斯坦堡的工程師...