網站首頁 學習教育 IT科技 金融知識 旅遊規劃 生活小知識 家鄉美食 養生小知識 健身運動 美容百科 遊戲知識 綜合知識
當前位置:趣知科普吧 > IT科技 > 

漢字機內碼佔幾個字節

欄目: IT科技 / 發佈於: / 人氣:2.11W

一個漢字的機內碼佔2個字節。因爲漢字處理系統要保證中西文的相容,當系統中同時存在ASCII碼和漢字國標碼時,將會產生二義性。

漢字機內碼佔幾個字節

計算機只識別由0、1組成的代碼,ASCII碼是英文資訊處理的標準編碼,漢字資訊處理也必須有一個統一的標準編碼。 漢字交換碼(國標碼)主要用於漢字資訊交換,我國國家標準局於1981年5月頒佈了《資訊交換用漢字編碼字元集——基本集》,代號爲GB2312-80,共對6763個漢字和682個圖形字元進行了編碼,其編碼原則爲:漢字用兩個字節表示,原則上,兩個字節可以表示 256×256=65536 種不同的符號,作爲漢字編碼表示的基礎是可行的。但考慮到漢字編碼與其它國際通用編碼,如ASCII 西文字元編碼的關係,我國國家標準局採用了加以修正的兩字節漢字編碼方案,只用了兩個字節的低7位。這個方案可以容納 128×128=16384 種不同的漢字,但爲了與標準ASCII碼相容,每個字節中都不能再用32個控制功能碼和碼值爲32的空格以及127的操作碼。所以每個字節只能有94個編碼。這樣,雙七位實際能夠表示的字數是:94×94=8836個。