一般从ASCII码来判断:
当认为存放字符的单元是无符号字符时,ASCII小于等于127的是西文字符(或常用字符),否则是汉字。
当认为存放字符的单元是有符号字符时,ASCII为正数的字符为西文字符,为负数的是汉字编码。
因为汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。例如:有两个字节的内容为30H和21H,它既可表示汉字“啊”的国标码,又可表示西文“0”和“!”的ASCII码。为此,汉字机内码应对国标码加以适当处理和变换。
扩展资料:
ASCII 码使用指定的7 位或8 位二进制数组合来表示128 或256 种可能的字符。标准ASCII 码也叫基础ASCII码,使用7 位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0 到9、标点符号,以及在美式英语中使用的特殊控制字符 。其中:
0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符),如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(响铃)等;通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;ASCII值为8、9、10 和13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。
参考资料来源:百度百科-ascii码
一般从ASCII码来区别
当认为存放字符的单元是无符号字符时,ASCII小于等于127的是西文字符(或常用字符),否则是汉字
当认为存放字符的单元是有符号字符时,ASCII为正数的字符为西文字符,为负数的是汉字编码
西文字符在编码中有固定的位置,计算机会判断这是哪个字符的