mecab-ko-dic-utf-8 0.1.3

mecab-ko-dic-utf-8 0.1.3

Jamie Birch维护。



  • 作者
  • 姓名和电子邮件

mecab-ko-dic-utf-8

mecab-ko-dic (一个用于 Mecab 的韩语文档),以 UTF-8 格式组织,作为一个 Cocoapod 和 npm 包,用于 iOS/macOS。

安装

从 Cocoapods 安装

在您的 Podfile 中指定此 pod

pod 'mecab-ko-dic-utf-8'
pod update

从 npm 作为 Cocoapod 安装(用于 React Native iOS 应用)

添加此 npm 包

yarn add mecab-ko-dic

# or:

npm install --save mecab-ko-dic

然后,在您的 Podfile 中指定此 pod

pod 'mecab-ko-dic-utf-8', :podspec => '../node_modules/mecab-ko-dic/mecab-ko-dic-utf-8.podspec'

不要忘记安装 pods。

cd ios
pod update

功能架构

关于meccab-ko-dic使用的词典格式和词性标注的文档记录在这个Google电子表格中,通过mecab-ko-dic仓库README链接。

注意ko-dic比NAIST JDIC少一个功能列,并且信息完全不同(例如不提供单词的“原始形式”)。

标签是对世宗(Sejong)规定的标签进行的一点点修改。从世宗到meccab-ko-dic标签名的映射在上述链接的电子表格的“태그 v2.0”标签页中给出。

电子表格中“사전 형식 v2.0”标签页完全说明了字典格式(韩文)。任何空白值默认为*

索引 角色(韩文) 角色(英语) 备注
0 词性标签 词性标注 见电子表格的“태그 v2.0”标签页
1 意义类别 意义 (示例过少,无法确信)
2 单双音标识 存在与否 T代表真;F代表假;否则为*
3 读音 读法 通常与表面对应,但是对外来词等可能不同,例如汉字
4 类型 类型 以下之一:Inflect(活用);Compound(复合名词);或Preanalysis(预分析)
5 第一个词性 第一个词性 例如,给定一个词性标注为“VV+EM+VX+EP”,则返回VV
6 最后一个词性 最后一个词性 例如,给定一个词性标注为“VV+EM+VX+EP”,则返回EP
7 表达 表达 "描述活用、复合名词和关键分析如何组织的字段" – 介绍用法、复合名词和关键分析如何组织的字段

示例特征字符串

mecab-ko-dic是一个使用MeCab进行韩语形素分析的项目。

mecab    SL,*,*,*,*,*,*,*
-    SY,*,*,*,*,*,*,*
ko    SL,*,*,*,*,*,*,*
-    SY,*,*,*,*,*,*,*
dic    SL,*,*,*,*,*,*,*
은    JX,*,T,은,*,*,*,*
MeCab    SL,*,*,*,*,*,*,*
을    JKO,*,T,을,*,*,*,*
사용    NNG,행위,T,사용,*,*,*,*
하    XSV,*,F,하,*,*,*,*
여    EC,*,F,여,*,*,*,*
,    SC,*,*,*,*,*,*,*
한국어    NNG,*,F,한국어,Compound,*,*,한국/NNG/*+어/NNG/*
형태소    NNG,*,F,형태소,Compound,*,*,형태/NNG/*+소/NNG/*
분석    NNG,행위,T,분석,*,*,*,*
을    JKO,*,T,을,*,*,*,*
하    VV,*,F,하,*,*,*,*
기    ETN,*,F,기,*,*,*,*
위한    VV+ETM,*,T,위한,Inflect,VV,ETM,위하/VV/*+ᆫ/ETM/*
프로젝트    NNG,*,F,프로젝트,*,*,*,*
입니다    VCP+EF,*,F,입니다,Inflect,VCP,EF,이/VCP/*+ᄇ니다/EF/*
.    SF,*,*,*,*,*,*,*
EOS

许可

mecab-ko-dic-utf-8仅在Apache 2.0许可证下可用:mecab-ko-dic-utf-8/bundleContents/COPYING

另见