在一些文字处理中,很容易看到一些文件的乱码,比如
乱码,指的是由于本地计算机在用文本编辑器打开源文件时,使用了不相应字符集而造成部分或所有字符无法被阅读的一系列字符。造成其结果的原因是多种多样的。
举个最简单的例子,我在纸上写上cache,有的人理解为”擦车”,有的人理解为”缓冲”,有的人理解为”女装品牌”
所以我们文件的编码和编辑器的编码要统一,否则就会出现乱码
我们来操作一下吧,首先在用户root的家目录下新建一个文件夹,并进入文件夹
我们创建一个文件,并使用file查看文件的编码(file命令就是用于辨识文件类型的,更多用法使用help命令查看)
提示我们文件是空的,那么我们使用vim编辑,输入一些英文和数字
保存,退出,再次用file查看
发现文本文件使用的编码是”ASCII”编码(它是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC 646)
我们再次编辑输入一些中文
查看文件编码
编码文件变成了”UTF-8″(用此编码在网页上可以统一页面显示中文简体繁体及其它语言)
我们先简单介绍一个查看文件内容的命令”cat”,之前一直在使用vim,查看文件的同时还能编辑文件,但是我们只想看文件内容的时候使用”cat”是比较方便的,我们来试一下
我们在电脑上新建一个文本文件,并随便输入一些中文
通过上节说的Xftp的方式,将文件传到linux上
然后用cat查看一下文件内容吧
内容变成了乱码
看一下文件格式
这里虽然显示文件编码为ISO-8859,但是其实是GBK编码的,我们改一下xshell的设置
选择gbk
之后再次查看文件内容
能够正确显示了,那么我们编辑一下这个文件呢”vim 02.txt”
看不到文件内容
我们还是需要将这个文件转变成utf-8格式的,linux下使用gbk格式编辑会有问题
如何更改文件编码呢,这里可以在windows上处理,也可以在linux下处理
1.windows上需要将文件另存为”UTF-8″格式的文件
2.在linux上使用”iconv”命令
“iconv -f GBK -t UTF-8 待转码文件名 -o 输出文件名”
这里命令为”iconv -f GBK -t UTF-8 02.txt -o 03.txt”
生成一个新的文件03.txt,将xshell的编码改回成utf-8
再次查看文件编码和内容
编辑也没有问题了
以上就是linux容易出现的中文乱码的问题,可能我的描述有点乱,实际操作几次就很清晰了
如发现本站有涉嫌抄袭侵权/违法违规等内容,请联系我们举报!一经查实,本站将立刻删除。