Re: [提問] 關於韓國的一些問題?
※ 引述《rnw (06年戀上寶兒(BOA))》之銘言:
: 想請問一下,"韓文"為何稱是"最有系統的文字"?
: 它有系統在那裡呢??解說越詳細越好!!
: 謝謝!!
: 一個韓文字佔電腦幾個位元呢?? 謝謝!!
這和編碼技術有關,不同的編碼方式所佔的位元組數不同
一般討論編碼多以「位元組 byte」為單位,而不用「位元 bit」(1 byte = 8 bits)
韓文所使用的字符集的標準一般依據韓國產業規格 KS X 1001 (舊稱 KSC 5601)
這個字符集標準,包括了拉丁希臘字母、日文假名、基里爾字母、韓文,以及漢字
而韓文字符集所使用的編碼則有相當多種:EUC-KR, ISO-2002, UHC, UTF-8 等等
Extended Unix Code 中的 EUC-KR 使用 2 個位元組來編碼韓文
ISO-2002-KR 使用跳逸字元方式編碼,韓文部分一樣是使用 2 個位元組來編碼
Unified Hangul Code (UHC) 為微軟設計的韓文編碼,又稱 CP949,一樣是 2 位元組
上述皆是以 2 位元組方式編碼韓文,而下面的則是屬於變動長度的編碼方式
Johab (組合) 編碼,這是利用韓文字母組合成字的特色設計的編碼方式
一個韓文字最少必須有二個字母,最多可以由六個字母構成
所以 Johab 編碼韓文最少 2 bytes,最多 6 bytes
而 UTF-8 則是 Unicode 的編碼方式之一,是一種可變長度的編碼法
UTF-8 編碼最少是 1 byte,最多可達 6 bytes
而韓文在 UTF-8 的區間主要是在 2 ~ 4 個位元組之內
以上大約是在韓國主要使用的編碼方式,而在朝鮮官方也有自己的標準
朝鮮國家規格 KPS 9566 定義朝鮮文的字符集的編碼方式
KPS 9566 早先主要使用 EUC-JP 進行編碼,2003 年新版本則直接以字符集順序編碼
基本上 KPS 9566 和韓國的 KS X 1001 差異不大,韓文編碼所使用的位元組為 2 bytes
: 還有,韓國有十二生肖這種東西嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.109.19.235
推
09/28 12:47, , 1F
09/28 12:47, 1F
推
09/28 12:58, , 2F
09/28 12:58, 2F
推
09/28 20:13, , 3F
09/28 20:13, 3F
推
09/28 22:25, , 4F
09/28 22:25, 4F
討論串 (同標題文章)
Korea 近期熱門文章
PTT美食旅遊區 即時熱門文章