字型故事

文章分類:悠遊字在專欄
2021/09/24

悠遊字在 第117篇 「Unicode與多樣性」

1960年代,艾倫・凱(Alan Kay,*1)提出了「個人電腦」的概念。當時的電腦被稱為第二世代,電路板上裝載電晶體及磁芯記憶體,體積依然龐大,完全無法想像能為個人所擁有。為了實現個人電腦的想法,凱發明了一台機器「Dynabook」,即是現今透過Wi-Fi連接網際網路的筆記型電腦的前身。
 
而後經過60年,到了現今,每天都能看到人們在商店、餐廳、電車及公車上操作智慧型手機的景象。令人不禁感嘆,數位資訊裝置的龍頭究竟何時從電腦取代為智慧型手機了呢。我想,艾倫・凱當年構想的「Dynabook」,或許能說是以智慧型手機的型態在現代社會中實現了。
 
智慧型手機透過Unicode的導入,讓人們得以在螢幕上顯示文字、與電腦交換文字資訊、讓網頁上的文字不變亂碼。Unicode由全錄公司(Xerox)提倡,是由Apple、惠普、IBM、JustSystems、Microsoft、Oracle、SAP、Sun、Sybase等公司設立的非營利團體「The Unicode Consortium」制定的「符號化字元集」。其官網上揭示了組織的中心理念:「讓世界上每個人都能用自己的語言打電話或使用電腦。」
 
Unicode的制定標準在於是否能幫助各技術領域使用各國語言書寫的文章在國際中進行交流、處理及正常顯示。此外,Unicode也支援其他許多古典性、歷史性文字資料的處理。
 
自1991年首次發表Version 1.0,期間經過多次更新,筆者寫作當下(2021/1/7)的最新版本是2020年3月發表的Version 13.0.0,收錄字元(character,*2)143,859字,支援多達154種文字(script,*3)。
※編按:本譯文發布時間2021年9月,最新版本已更新至Version 14.0
 
近年來,各領域紛紛倡導「多樣性」的觀念。Unicode草創於1987年,早在當年便有在文字集合上實現多樣性的理想。
 
那麼最新的Version 13.0.0究竟支援了哪些文字系統呢?雖然名單很長,我還是試著從「Unicode 13.0 Character Code Charts」(*4)當中節錄出來。整理時我盡可能留心確認,如果仍有錯漏,還請各位不吝告知。
 
以下所列的文字系統究竟是何種樣貌,請大家務必至「Unicode 13.0 Character Code Charts」一探文字多樣性的情景。
 

■ 歐洲文字系統(European Scripts)亞美尼亞字母(Armenian)
卡里亞字母(Carian)
高加索阿爾巴尼亞字母(Caucasian Albanian)
賽普勒斯音節文字(Cypriot Syllabary)
西里爾字母(Cyrillic)
愛爾巴桑字母(Elbasan)
喬治亞字母(Georgian)
格拉哥里字母(Glagolitic)
哥德字母(Gothic)
希臘字母(Greek)
拉丁字母(Latin)
線形文字A(Linear A)
線形文字B(Linear B)
呂基亞字母(Lycian)
呂底亞字母(Lydian)
歐甘字母(Ogham)
古匈牙利字母(Old Hungarian)
古義大利字母(Old Italic)
古彼爾姆文(Old Permic)
費斯托斯圓盤文字(Phaistos Disc)
盧恩字母(Runic)
蕭伯納字母(Shavian)
 
■ 非洲文字系統(African Scripts)
阿德拉姆字母(Adlam)
巴姆穆文字(Bamum)
巴薩文(Bassa Vah)
科普特字母(Coptic)
聖書體(Egyptian Hieroglyphs)
吉茲字母(Ethiopic)
梅德法伊德林文(Medefaidrin)
門德基卡庫文(Mende Kikakui)
麥羅埃字母(Meroitic)
西非書面字母(N'Ko)
奧斯曼亞字母(Osmanya)
提非納文字(Tifinagh)
瓦伊文(Vai)
 
■ 中東文字系統(Middle Eastern Scripts)
安納托利亞象形文字(Anatolian Hieroglyphs)
阿拉伯字母(Arabic)
亞蘭字母(Aramaic, Imperial)
阿維斯陀字母(Avestan)
花剌子模文(Chorasmian)
楔形文字(Cuneiform)
埃利邁文(Elymaic)
哈特拉文(Hatran)
希伯來文(Hebrew)
曼達文字(Mandaic)
納巴泰字母(Nabataean)
古北阿拉伯字母(Old North Arabian)
古南阿拉伯字母(Old South Arabian)
碑刻巴列維文(Pahlavi, Inscriptional)
詩篇巴列維文(Pahlavi, Psalter)
帕爾邁拉字母(Palmyrene)
碑刻帕提亞文(Parthian, Inscriptional)
腓尼基字母(Phoenician)
撒瑪利亞字母(Samaritan)
敘利亞字母(Syriac)
亞茲迪文(Yezidi)
 
■ 中亞文字系統(Central Asian Scripts)
摩尼字母(Manichaean)
瑪欽文(Marchen)
蒙古文(Mongolian)
古粟特字母(Old Sogdian)
突厥字母(Old Turkic)
八思巴字母(Phags-Pa)
粟特字母(Sogdian)
索永布字母(Soyombo)
藏文(Tibetan)
札那巴札爾方形字母(Zanabazar Square)
 
■ 南亞文字系統(South Asian Scripts)
阿洪姆文(Ahom)
孟加拉-阿薩姆文(Bengali and Assamese)
拜克舒基文(Bhaiksuki)
婆羅米文(Brahmi)
查克馬文(Chakma)
天城文(Devanagari)
迪維斯阿庫魯文(Dives Akuru)
多格拉文(Dogra)
古蘭塔文(Grantha)
古吉拉特文(Gujarati)
貢賈拉貢德文字(Gunjala Gondi)
古木基文(Gurmukhi)
凱提文(Kaithi)
卡納達文(Kannada)
佉盧文(Kharoshthi)
可吉文(Khojki)
庫達瓦迪文(Khudawadi)
絨巴文(Lepcha)
林布文(Limbu)
馬哈佳尼文(Mahajani)
馬拉雅拉姆文(Malayalam)
馬薩拉姆貢德文字(Masaram Gondi)
曼尼普爾文(Meetei Mayek)
莫迪文(Modi)
默祿文(Mro)
穆爾塔尼文(Multani)
南迪城文(Nandinagari)
紐瓦字母(Newa)
桑塔利文(Ol Chiki)
奧里亞文(Oriya / Odia)
索拉什特拉文(Saurashtra)
夏拉達文(Sharada)
悉曇文字(Siddham)
僧伽羅文(Sinhala)
索拉僧平文字(Sora Sompeng)
錫爾赫特文(Syloti Nagri)
塔克里字母(Takri)
坦米爾文(Tamil)
泰盧固文(Telugu)
它拿字母(Thaana)
提爾胡塔文(Tirhuta)
梵文吠陀擴展(Vedic Extensions)
文喬字母(Wancho)
瓦蘭齊地文(Warang Citi)
 
■ 東南亞文字系統(Southeast Asian Scripts)
占語字母(Cham)
哈乃斐羅興亞文字(Hanifi Rohingya)
克耶里字母(Kayah Li)
高棉文(Khmer)
寮文(Lao)
緬甸文(Myanmar)
新傣仂文(New Tai Lue)
創世紀苗文(Nyiakeng Puachue Hmong)
救世苗文(Pahawh Hmong)
包欽豪文(Pau Cin Hau)
德宏傣文(Tai Le)
老傣文(Tai Tham)
越南傣文(Tai Viet)
泰文(Thai)
 
■ 印尼-大洋洲文字系統(Indonesia & Oceania Scripts)
峇里字母(Balinese)
巴塔克文(Batak)
布吉文(Buginese)
布希德文(Buhid)
哈努諾文(Hanunoo)
爪哇字母(Javanese)
望加錫文(Makasar)
勒姜字母(Rejang)
巽他字母(Sundanese)
他加祿字母(Tagalog)
塔格巴努亞文(Tagbanwa)
 
■ 東亞文字系統(East Asian Scripts)
注音符號(Bopomofo)
中日韓統一表意文字(CJK Unified Ideographs / Han)
中日韓相容表意文字(CJK Compatibility Ideographs)
中日韓漢字部首補充(CJK Radicals / Kangxi Radicals)
韓文字母(Hangul Jamo)
平假名(Hiragana)
萬葉假名(Kana Supplement)
漢文(Kanbun)
片假名(Katakana)
契丹小字(Khitan Small Script)
老傈僳文(Lisu)
柏格理苗文(Miao)
女書(Nushu)
西夏文(Tangut)
彝文音節(Yi)
 
■ 美洲文字系統(American Scripts)
切羅基文(Cherokee)
德瑟雷特字母(Deseret)
歐塞奇字母(Osage)
統一加拿大原住民音節文字(Unified Canadian Aboriginal Syllabics)

 


注釋
*1 艾倫・凱(Alan Kay,1940年-)
美國電腦科學家、教育家、爵士樂演奏家,人稱「個人電腦之父」。1960年代就為當時昂貴且體積龐大、由多數人共同擁有、共同使用的電腦設想到「個人使用」的方向,前衛性地思考個人用電腦應該會是什麼模樣。
 
*2 字元(character)
字符,和語言直接相關,表示含義的符號或記號。
 
*3 文字(script)
又稱為文字系統、書寫系統、用字系統。用來書寫同種文字的統合性文字系統,文字系統和語言並非一比一對應,一個文字系統能用來書寫多種語言,例如:阿拉伯文、漢字、西里爾字母、天城文、拉丁文等。相反,亦有一個語言使用多個文字系統來書寫的情形,例如日文由漢字、平假名、片假名這三個文字系統所構成,書寫上缺一不可。
 
*4 Unicode 13.0 Character Code Charts
https://www.unicode.org/charts/
 
【參考資料】
・《Unicode戰記》 日文書名「ユニコード戦記」 小林龍生著 東京電機大學出版社 2011年
・《字碼的世界》 日文書名「文字コードの世界」 安岡孝一、安岡素子著 東京電機大學出版社 1999年
・Unicode官方網站:https://home.unicode.org


▶ 一覽 悠遊字在專欄 文章
 

 作者簡介

mk88
DynaComware Corp 顧問

1942年出生於東京都。
1966年畢業於桑澤設計研究所視覺設計學科。
曾任職於設備機器廠商、報社、廣告公司,並在綜合印刷公司參與了DTP黎明期的多國語處理及印刷工作流程的建構。
設計學校畢業後曾以平面設計師的身分經歷了活字、照相排版、DTP印刷工作。
1998年起任職於DynaComware Corp。
曾擔任網頁印刷服務、數位文件管理工具、電子書專用字型開發、字型授權業務、中文字碼規格GB18030日本國內普及諮詢窗口等職務。
Blog:mk88の独り言(mk88的自言自語)