字符集就是一组规定了的字和符号。 例如,GB2312-1980,它含ASCII字符,日文假名(字母),俄文字母,7千左右的中文字。 GB2312 code page 是双bytes 码,两字节大于 0xA0A0 的表. 也就是说code page 里可能含有部分空白(少数码,没有字符)。 UTF 是unicode的传送码,即unicode编码后的编码。UTF的编码方法很简单,用算术表达式计算就可以了,看3字节的Utf-8数据没意思。unicode 与字符集对应。Utf-8与unicode值对应。