uchardet 是Mozilla通用字符集检测库的原生C++实现的C语言绑定。
uchardet是一个编码检测库,它接收无任何附加信息的一串未知字符编码的字节序列,并尝试确定文本的编码。
universalchardet的原始代码可在http://lxr.mozilla.org/seamonkey/source/extensions/universalchardet/找到
universalchardet使用的技巧可在http://www.mozilla.org/projects/intl/UniversalCharsetDetection.html描述
apt-get install uchardet libuchardet-dev
brew install uchardet
cmake .
make
make install
uchardet Command Line Tool
Version 0.0.1
Author: BYVoid
Bug Report: http://code.google.com/p/uchardet/issues/entry
Usage:
uchardet [Options] [File]
Options:
-v, --version Print version and build information.
-h, --help Print this help.
查看 uchardet.h