Kafka 0.1

Kafka 0.1

Taichi Kato 维护。



Kafka 0.1

  • Taichi Kato


License License License License

Kafka 是一个高级的自然语言处理库,用 Swift 编写。它旨在快速、简单且易于集成到应用中。Kafka 目前提供用于标注和解析的线性 神经网络模型,包括预训练模型和词向量。它是一项商业开源软件,采用 MIT 许可证发布。

💫 现在推出 0.1 版本! 在此查看发布说明。

文档

文档
数据 包含词嵌入、POS 标签列表和依赖关系标签列表
依赖关系解析器 依赖关系解析器解析单词标记之间的依赖关系
文档 用于访问语言注释的容器
Kafka 库的接口
数学 包含常用数学计算的辅助函数
部分解析 部分解析是弧标准依赖关系解析的快照
转换器 包含数据类型之间的转换方法

功能

  • 非破坏性分词
  • 命名实体识别
  • 预训练的统计模型和词向量
  • 业界领先的速度
  • 易于深度学习集成
  • 词性标注
  • 标签化的依赖关系解析
  • 语法驱动句子分割
  • 内置的语法和 NER 可视化工具

系统要求

iOS 12.0+ | macOS 10.14+ | Mac Catalyst 13.0+ | tvOS 12.0+ | watchOS 5.0+

集成

CocoaPods

您可以通过将Kafka添加到您的Podfile中来使用CocoaPods安装它。

platform :ios, '13.0'
use_frameworks!

target 'MyApp' do
    pod 'Kafka'
end

Carthage

您可以通过将Kafka添加到您的Cartfile中来使用Carthage安装它。

github "questo-ai/kafka"

如果您使用Carthage构建依赖项,请确保已将Kafka.framework添加到目标对象的“链接框架和库”部分,并在Carthage框架复制构建阶段中包含它们。

使用

初始化

import Kafka
// Initialise a dependency parser
let parser = DependencyParser()

解析

let doc = Doc(string: "Memories warm you up from the inside. But they also tear you apart.") // From Haruki Murakami, Kafka on the Shore
let result = parser.predict(text: doc)

使用依赖数据

/// The dependency arcs is stored as a property of Doc, with type [[(Int, Int, String)]]
/// arcs is a list of triples (idx_head, idx_dep, deprel) signifying the
/// dependency relation `idx_head ->_deprel idx_dep`, where idx_head is
/// the index of the head word, idx_dep is the index of the dependant,
/// and deprel is a string representing the dependency relation label.
print(result.arcs)