检查文件编码ITeye - AG环亚娱乐

检查文件编码ITeye

2019年03月13日11时48分15秒 | 作者: 海逸 | 标签: 编码,文件,转化 | 浏览: 3087

查看文件编码
在Linux中查看文件编码能够经过以下几种方法:
1.在Vim中能够直接查看文件编码
:set fileencoding
即可显示文件编码格局。
假如你仅仅想查看其它编码格局的文件或许想处理用Vim查看文件乱码的问题,那么你能够在
~/.vimrc 文件中增加以下内容:

set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936

这样,就能够让vim自动辨认文件编码(能够自动辨认UTF-8或许GBK编码的文件),其实就是按照 fileencodings供给的编码列表测验,假如没有找到适宜的编码,就用latin-1(ASCII)编码翻开。
2. enca (假如你的体系中没有装置这个指令,能够用sudo yum install -y enca 装置 )查看文件编码
$ enca filename
filename: Universal transformation format 8 bits; UTF-8
CRLF line terminators
需求阐明一点的是,enca对某些GBK编码的文件辨认的不是很好,辨认时会呈现:
Unrecognized encoding

文件编码转化
1.在Vim中直接进行转化文件编码,比方将一个文件转化成utf-8格局
:set fileencoding=utf-8

2. enconv 转化文件编码,比方要将一个GBK编码的文件转化成UTF-8编码,操作如下
enconv -L zh_CN -x UTF-8 filename

3. iconv 转化,iconv的指令格局如下:
iconv -f encoding -t encoding inputfile
比方将一个UTF-8 编码的文件转化成GBK编码
iconv -f GBK -t UTF-8 file1 -o file2
查看文件编码file指令
file ip.txt  ip.txt: UTF-8 Unicode text, with escape sequences
一、使用iconv指令进行编码转化文件内容编码转化  iconv指令用于转化指定文件的编码,默许输出到标准输出设备,亦可指定输出文件。  用法: iconv [选项...] [文件...]  有如下选项可用:  输入/输出格局标准:  -f, from-code=称号 原始文本编码  -t, to-code=称号 输出编码  信息:  -l, list 罗列一切已知的字符集  输出操控:  -c 从输出中疏忽无效的字符  -o, output=FILE 输出文件  -s, silent 封闭正告  verbose 打印进展信息  -?, help 给出该体系求助列表  usage 给出扼要的用法信息  -V, version 打印程序版本号  比如:  iconv -f utf-8 -t gb2312 aaa.txt bbb.txt  这个指令读取aaa.txt文件,从utf-8编码转化为gb2312编码,其输出定向到bbb.txt文件。
二、文件名编码转化
由于现在用linux,本来在windows里的文件都是用GBK编码的。所以copy到linux下是乱码,文件内容能够用iconv来转化但是很多中文的文件名仍是乱码,找到个能够转化文件名编码的指令,就是convmv。
convmv指令具体参数  例如
convmv -f GBK -t UTF-8 *.mp3
不过这个指令不会直正的转化,你能够看到转化前后的比照。假如要直正的转化要加上参数 notest
convmv -f GBK -t UTF-8 notest *.mp3
-f 参数是指出转化前的编码,-t 是转化后的编码。这个千万不要弄错了。否则或许仍是乱码哦。还有一个参数很有用。就是 -r 这个表明递归转化当时目录下的一切子目录。
* 需求装置 convmv-1.10-1.el5.noarch.rpm 
三、  更好的傻瓜型指令行东西enca,它不但能智能的辨认文件的编码,并且还支撑成批转化。  1.装置 
$sudo apt-get install enca 
2.查看当时文件编码 
enca -L zh_CN ip.txt  Simplified Chinese National Standard; GB2312  Surrounded by/intermixed with non-text data 
3.转化  指令格局如下 
$enca -L 当时言语 -x 方针编码 文件名 
例如要把当时目录下的一切文件都转成utf-8 
enca -L zh_CN -x utf-8 * 
查看文件的编码 enca -L zh_CN file 
将文件编码转化为"UTF-8"编码 enca -L zh_CN -x UTF-8 file
假如不想掩盖原文件能够这样  enca -L zh_CN -x UTF-8 file1 file2

http://blog.csdn.net/jnbbwyth/article/details/6991425
版权声明
本文来源于网络,版权归原作者所有,其内容与观点不代表AG环亚娱乐立场。转载文章仅为传播更有价值的信息,如采编人员采编有误或者版权原因,请与我们联系,我们核实后立即修改或删除。

猜您喜欢的文章