uchardet 0.0.1

uchardet 0.0.1

测试已测试
语言语言 C++C++
许可证 自定义
发布最后发布2014年12月

Hoa V. DINH 维护。



uchardet 0.0.1

uchardet 是Mozilla通用字符集检测库的原生C++实现的C语言绑定。

uchardet是一个编码检测库,它接收无任何附加信息的一串未知字符编码的字节序列,并尝试确定文本的编码。

universalchardet的原始代码可在http://lxr.mozilla.org/seamonkey/source/extensions/universalchardet/找到

universalchardet使用的技巧可在http://www.mozilla.org/projects/intl/UniversalCharsetDetection.html描述

支持编码

  • Unicode
    • UTF-8
    • UTF-16BE / UTF-16LE
    • UTF-32BE / UTF-32LE / X-ISO-10646-UCS-4-34121 / X-ISO-10646-UCS-4-21431
  • 中文
    • ISO-2022-CN
    • BIG5
    • EUC-TW
    • GB18030
    • HZ-GB-23121
  • 日语
    • ISO-2022-JP
    • SHIFT_JIS
    • EUC-JP
  • 韩语
    • ISO-2022-KR
    • EUC-KR
  • 西里尔文
    • ISO-8859-5
    • KOI8-R
    • WINDOWS-1251
    • MACCYRILLIC
    • IBM866
    • IBM855
  • 希腊语
    • ISO-8859-7
    • WINDOWS-1253
  • 希伯来语
    • ISO-8859-8
    • WINDOWS-1255
  • 其他
    • WINDOWS-1252

安装

Ubuntu/Debian

apt-get install uchardet libuchardet-dev

Mac

brew install uchardet

从源代码构建

cmake .
make
make install

使用方法

命令行

uchardet Command Line Tool
Version 0.0.1

Author: BYVoid
Bug Report: http://code.google.com/p/uchardet/issues/entry

Usage:
 uchardet [Options] [File]

Options:
 -v, --version         Print version and build information.
 -h, --help            Print this help.

查看 uchardet.h

相关项目

许可证

mozilla 公共许可证版本 1.1