mecab-ko-dic-utf-8
mecab-ko-dic (一个用于 Mecab 的韩语文档),以 UTF-8 格式组织,作为一个 Cocoapod 和 npm 包,用于 iOS/macOS。
安装
从 Cocoapods 安装
在您的 Podfile
中指定此 pod
pod 'mecab-ko-dic-utf-8'
pod update
从 npm 作为 Cocoapod 安装(用于 React Native iOS 应用)
添加此 npm 包
yarn add mecab-ko-dic
# or:
npm install --save mecab-ko-dic
然后,在您的 Podfile
中指定此 pod
pod 'mecab-ko-dic-utf-8', :podspec => '../node_modules/mecab-ko-dic/mecab-ko-dic-utf-8.podspec'
不要忘记安装 pods。
cd ios
pod update
功能架构
关于meccab-ko-dic使用的词典格式和词性标注的文档记录在这个Google电子表格中,通过mecab-ko-dic
的仓库README链接。
注意ko-dic比NAIST JDIC少一个功能列,并且信息完全不同(例如不提供单词的“原始形式”)。
标签是对世宗(Sejong)规定的标签进行的一点点修改。从世宗到meccab-ko-dic标签名的映射在上述链接的电子表格的“태그 v2.0”标签页中给出。
电子表格中“사전 형식 v2.0”标签页完全说明了字典格式(韩文)。任何空白值默认为*
。
索引 | 角色(韩文) | 角色(英语) | 备注 |
---|---|---|---|
0 | 词性标签 | 词性标注 | 见电子表格的“태그 v2.0”标签页 |
1 | 意义类别 | 意义 | (示例过少,无法确信) |
2 | 单双音标识 | 存在与否 | T 代表真;F 代表假;否则为* |
3 | 读音 | 读法 | 通常与表面对应,但是对外来词等可能不同,例如汉字 |
4 | 类型 | 类型 | 以下之一:Inflect (活用);Compound (复合名词);或Preanalysis (预分析) |
5 | 第一个词性 | 第一个词性 | 例如,给定一个词性标注为“VV+EM+VX+EP”,则返回VV |
6 | 最后一个词性 | 最后一个词性 | 例如,给定一个词性标注为“VV+EM+VX+EP”,则返回EP |
7 | 表达 | 表达 | "描述活用、复合名词和关键分析如何组织的字段" – 介绍用法、复合名词和关键分析如何组织的字段 |
示例特征字符串
mecab-ko-dic是一个使用MeCab进行韩语形素分析的项目。
mecab SL,*,*,*,*,*,*,*
- SY,*,*,*,*,*,*,*
ko SL,*,*,*,*,*,*,*
- SY,*,*,*,*,*,*,*
dic SL,*,*,*,*,*,*,*
은 JX,*,T,은,*,*,*,*
MeCab SL,*,*,*,*,*,*,*
을 JKO,*,T,을,*,*,*,*
사용 NNG,행위,T,사용,*,*,*,*
하 XSV,*,F,하,*,*,*,*
여 EC,*,F,여,*,*,*,*
, SC,*,*,*,*,*,*,*
한국어 NNG,*,F,한국어,Compound,*,*,한국/NNG/*+어/NNG/*
형태소 NNG,*,F,형태소,Compound,*,*,형태/NNG/*+소/NNG/*
분석 NNG,행위,T,분석,*,*,*,*
을 JKO,*,T,을,*,*,*,*
하 VV,*,F,하,*,*,*,*
기 ETN,*,F,기,*,*,*,*
위한 VV+ETM,*,T,위한,Inflect,VV,ETM,위하/VV/*+ᆫ/ETM/*
프로젝트 NNG,*,F,프로젝트,*,*,*,*
입니다 VCP+EF,*,F,입니다,Inflect,VCP,EF,이/VCP/*+ᄇ니다/EF/*
. SF,*,*,*,*,*,*,*
EOS
许可
mecab-ko-dic-utf-8
仅在Apache 2.0许可证下可用:mecab-ko-dic-utf-8/bundleContents/COPYING
。