在UTF-8編碼中,一個中文字符等于三個字節,一個中文標點符號占三個字節;一個英文字符等于一個字節,一個英文標點占一個字節;一個數字符號等于一個字節。
本文操作環境:windows10系統,DELL G3電腦。
在UTF-8編碼中:一個中文等于三個字節,中文標點占三個字節。
一個英文字符等于一個字節,英文標點占一個字節。
Unicode編碼:一個英文等于兩個字節,一個中文(含繁體)等于兩個字節。中文標點占兩個字節,英文標點。
擴展資料:
UTF-8使用1~4字節為每個字符編碼:
1、一個US-ASCIl字符只需1字節編碼(Unicode范圍由U+0000~U+007F)。
2、帶有變音符號的拉丁文、希臘文、西里爾字母、亞美尼亞語、希伯來文、阿拉伯文、敘利亞文等字母則需要2字節編碼(Unicode范圍由U+0080~U+07FF)。
3、其他語言的字符(包括中日韓文字、東南亞文字、中東文字等)包含了大部分常用字,使用3字節編碼。
4、其他極少使用的語言字符使用4字節編碼。