Emoji是圖還是字?Emoji到底如何運作?
平日大家使用即時通訊軟件時,少不免加入很多表情符號,同樣一句說話,有否表情符號意思上有不少分別。當大家在選擇表情符號去表達心情,有想過 表情符號到底是甚麼?是圖?是字?曾經使用Android 及 iOS的用家,應該發現兩者的表情符號有些許分別。到底原因為何呢?
表情符號來自日本,英文是Emoji,是絵文字的日文羅馬字拼法。最初發明的目的是為了改善即時通訊軟件的一大問題,就是純以文字溝通往往使人感 到冷冰冰。因此加入不同的表情,去彌補訊息上無法顯示的語氣。請留意Emoji與 Emoticon並非同一樣,Emoticon指的是外國人比較常用 的 :), :‑), =.= 等等以ASCII 文字組成的表情,而非大家早已習以為常的 😣😕😶 等。
https://gdb.voanews.com/2A6A3519-E2F8-4022-965B-564F27D78D04_w640_s.jpg
Emoji最初出現時間為1999年,總共有十二個版本(與Unicode一樣,原因以下詳談)。最初只有79個(實際上加入時間為2010年,但由於本身該編碼值已在Unicode 1.0發佈, 所以Unicode1.0亦支援一些emoji),時至今日,第十一個版本已經有1212個,數量上已 經逼近很多語言常用的字數量,例如中文常用字才八千多個,英文常用詞語也只有3000多個。有人因此提出Emoji已經自成一國,應該升格做語言了。 對電腦而言,其實Emoji跟一個平常的中文字,都是由一個叫Unicode的編碼標準所定義的。但在深究何謂Unicode前,先講一下亂碼的故事。
如果大家「腦齡」較久的話,應該見過一個情況稱為亂碼。所謂文字亂碼,通常會出現在英文以外的網站之中,就是明明整個網站都正常載入,但是所有文 字都變成了火星文,無法閱讀。原因是我們的瀏覽器設定了一個編碼標準(例如Big5),然而該網站的編碼卻是另外一個(例如GBK),同樣科啟兩個 字,在Big 5中的是代表為 ACEC及B1D2,在GBK中卻是BFC6及86A2, 在GBK中對應 ACEC及B1D2 卻是ACEC沒有字 符,B1D2卻代表币字。 因為如果一個Big 5的網站用一個使用GBK的瀏覽器去閱讀的話,科啟二字就會出現了亂碼變成了币 。不只中 文,很多其他語言皆有同樣問題。
那為何英文很少出現亂碼?因為大家慣用的美式鍵盤上所以字符,都是基於ASCII標準的,而由於一開始的電腦發展主力由美國推動,因此當標準需要制 定時,一開頭美式鍵盤的標準就發揚光大了。
亂碼與Emoji有何關係?為了解決不同語言的亂碼問題,一個國際標準組織名為統一碼聯盟就努力推動一個能代表所有人類符號的編碼系統。不論正 體中文、簡體中文、英文、西班牙,甚至乎蘇美爾文,都會是該編碼的一部份。這個編碼相信大家也聽過,就是大家耳熟能詳的Unicode,中文名也就是萬國 碼,也叫作統一碼。萬國碼能夠代表超過一百萬的文字,而截至現時,只是用了約13萬個。當手機時代到來,大家經常使用Emoji,因此順理成章於2008年將 emoji作為文字加入了unicode 。正因如此,今日大家電話都能無痛顯示 Emoji,再無亂碼的問題。 其實統一碼聯盟都經歷過一番討論,以下是他們的Emoji的介紹
Characters considered for encoding must normally be in widespread use as elements of text. The emoji and various symbols were added to Unicode because of their use as characters for text-messaging in a number of Japanese manufacturers’ corporate standards...
雖然Emoji已多達千個,然而其實常用的往往都是那數十個,例如牛津字典年度文字,就是笑到流眼淚的😂。想必大家經常使用。 又例如苦笑滴汗的😅,也是經常使用的。這兩個Emoji的 unicode 就是U+1F602及U+1F605。 那為何有時Emoji有不同外表呢?其實這與中文字有不同字型相當類似,萬國碼定義的只是文字的意思,不會硬性要求該文字到底外表應該是如何代表。 因此衍生出許多不同變化,以笑到流眼淚😂(Face with tears of Joy)為例.根據Emoji百科 emojipedia: 以下全部都是😂
流口水的🤤,則有以下變化:
不知大家最喜歡用的又是那個Emoji?最新的標準又加入了許多有趣的Emoji,又令Emoji可以表達意思更豐富了。