编码及字符集探讨

简介:
我们用到的工具UltraEdit
 
1.文件编码
新建一个文本文件,我们知道我们输入一篇文章,可能需要保存到存储设备中,既然存储,那么我们怎么存呢,我们知道计算机只认识0和1,对于语言文字中的各种符号标记我们怎么存储到计算机中,这就有个编码的问题了。
我们知道如果识别一个学生,我们可以通过给学生编号的方式来管理,这就是学号,而对于各种字符我们类似,进行编码的方式来识别,
了解ASCII码的知道,它用0-255定义这么256个英文及标点等符号。只需要一个字节也就是8个比特位就够了。
对于像我们中文这样的亚洲文字怎么办呢,于是出现了各种编码,比如GB2312,GBK等等。
他们使用2个字节存储汉字。
 
另存我们的文件,存储格式我们用ANSI方式,
这样英文占1个字节,而汉字占2个字节。
 
我们输入几个字符:
 
InBlock.gifABCDE中文
这样是5个英文字母和2个汉字共占9个字节,你可以查看下文件属性验证下。
 
我们在ultraEdit里面Ctrl+H用16进制方式查看下
 
 
我们看到41是A的ASCII码,依次42,43,44,45是BCDE
 
而 D6 D0是 中
CEC4是 文
 
 




 本文转自 xcf007 51CTO博客,原文链接:http://blog.51cto.com/xcf007/149549 ,如需转载请自行联系原作者

相关文章
|
6天前
|
存储 自然语言处理 C++
Unicode编码
Unicode编码
30 4
|
6天前
|
存储 JavaScript Java
[字符编码] 理论篇:常见字符集与编码方式
[字符编码] 理论篇:常见字符集与编码方式
75 0
|
10月前
|
存储 Java 关系型数据库
【精炼易懂】字符集、编码、乱码问题、ASCII、GBK、Unicode、UTF-8详解+实例说明
【精炼易懂】字符集、编码、乱码问题、ASCII、GBK、Unicode、UTF-8详解+实例说明
5065 4
|
存储 编解码 算法
字符编码的前世今生
字符编码的前世今生
132 0
|
关系型数据库 MySQL Shell
latin1字符集的数据转换为utf8字符集
latin1字符集的数据转换为utf8字符集
864 0
|
存储 编解码 Windows
理解字符编码
理解字符编码
理解字符编码
|
存储 自然语言处理 JavaScript
【字符编码】彻底理解字符编码
在解决昨天的问题时,又引出了很多新的问题,如为什么要进行编码,这些编码的关系如何,如ASCII,IOS-8859-1,GB2312,GBK,Unicode之间的关系,笔者想要彻底理解字符编码背后的故事,遂进行了探索,具体笔记如下。如园友能读完本篇文章,我相信会解开很多疑惑
257 0
【字符编码】彻底理解字符编码
|
存储 自然语言处理 JavaScript
【字符编码】彻底理解字符编码
 在解决昨天的问题时,又引出了很多新的问题,如为什么要进行编码,这些编码的关系如何,如ASCII,IOS-8859-1,GB2312,GBK,Unicode之间的关系,笔者想要彻底理解字符编码背后的故事,遂进行了探索,具体笔记如下。如园友能读完本篇文章,我相信会解开很多疑惑。
269 0
【字符编码】彻底理解字符编码
|
存储 小程序 Windows
字符编码
字符编码知识:Unicode、UTF-8、ASCII、GB2312等编码之间是如何转换的?
150 0
|
JavaScript 自然语言处理