测试已测试 | ✓ |
语言语言 | SwiftSwift |
许可证 | 自定义 |
发布最新发布 | 2016年5月 |
SPM支持 SPM | ✗ |
由 Alejandro Isaza 维护。
依赖关系 | |
HDF5Kit | ~> 0.1 |
Peak/MIDI | ~> 1.2 |
Upsurge | ~> 0.7.1 |
IntuneFeatures 框架包含从音频文件生成特征和从相应的 MIDI 文件生成特征标签的代码。目前支持以下特征
CompileFeatures 命令行应用程序接受音频和 MIDI 文件作为输入,并生成包含特征和标签的 HDF5 数据库。然后可以使用这些 HDF5 文件来训练神经网络,用于转写或其他相关任务。
特征是从每个连续的音频数据窗口中提取出来的。窗口大小和窗口之间的步长可以配置,但是窗口大小必须是 2 的幂。然后,每个窗口乘以 汉明窗口化函数。为了获得频谱功率,对每个窗口计算 FFT,并将结果频谱分为 等音律 频段的带状。
从 FFT 中提取峰值,并通过高度阈值和最小峰值距离要求进行过滤。计算每个频段的峰值位置,作为峰值频率与频段中心频率之间的距离。
IntuneFeatures 在 MIT 许可证下提供。有关更多信息,请参阅 LICENSE 文件。版权©2016 Venture Media Labs。