Perl中检测文件编码

| 暂无评论 | 暂无引用通告

-->

一个脚本用于分析应用程序的日志,但是在这些日志文件中,有的编码是utf-8的,有的编码是gbk的.对于utf-8的日志文件,需要将内容转换成gbk的编码,这样看到的中文才不至于乱码:

因此,在perl脚本中加入以下行判断日志内容,如是不是gbk的编码,就对其转码:

$line=encode ("gbk",decode("utf-8",$line)) unless (detect($line) =~ /gb/);

这里用到的模块有:

use Encode;

use Encode::CN;

use Encode::Detect::Detector;

暂无引用通告

发送引用通告网址: http://supersun.info/mt/mt-tb.cgi/903
如果您想引用这篇日记到您的Blog,请复制上面的链接,放置到您发表文章时的相应界面中。

发表评论

最新资源

  • IMG_1437.JPG
  • line.png
  • bar.png
  • perl_calander.jpg

关于此日记

此日记由 supersun 发表于 2008年12月 9日 14:17

此Blog上的上一篇日记用perl脚本代替htpasswd生成加密串

此Blog上的下一篇日记用inotify监控文件系统事件备份海量小文件

首页归档页可以看到最新的日记和所有日记。