计算机中所有的数据本质上都是以0和1的组合来存储
在计算机中会将中文内存转换成 01010101010… ,最终存储到硬盘上。
每一个字都会对应一串由0101组成的代码,举例
李 -> 01111111 00011010 010110110
又 -> 01001111 10010000 001110100
懂 -> 11111111 00000000 010101010
每个编码可以比作为一套密码本。
在计算机中有很多种编码。举例:
每种编码都有自己的一套密码本,都维护这自己的一套规则,如:
utf-8编码:
李 -> 01111111 00011010 010110110
又 -> 01001111 10010000 001110100
懂 -> 11111111 00000000 010101010
gbk编码:
李 -> 11111111 00000010
又 -> 01001111 01111111
懂 -> 00110011 10101010
所以,使用的不同的编码保存文件时,硬盘的文件中存储的0/1也是不同的。
以某个编码的形式进行保存文件,以后就要以这种编码去打开这个文件。否则就会出现乱码。举例:
UTF-8编码去保存李又懂:01110111 00011010 010110110 01001011 10010000 001100100 11111011 00000000 010101010
GBK编码形式去打开:乱码
这时候就理解为什么有时候我们打开一个文件是乱码了,
因为你打开的时候的编码和别人保存的时候不一致。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容