0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Daniel Povey:Kaldi 核心算法 K2 0.1 版本已发布

工程师邓生 来源:蓝鲸TMT 作者:蓝鲸TMT 2020-11-16 11:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

11月15日讯,在第五届Kaldi技术交流会上,Kaldi之父Daniel Povey博士与来自北京各大互联网公司、知名高校的开发者们深入交流下一代Kaldi社区未来的发展。

Daniel Povey博士目前担任小米集团语音首席科学家,由他开发和维护Kaldi 集成了多种语音识别模型,是业界语音识别框架基石。加入小米一年,Daniel Povey设计并开发出了新一代Kaldi。新一代Kaldi分成三个部分,包括核心算法部分,训练数据准备部分、示例脚本集合部分。

据介绍,其中,Lhotse(训练数据准备部分)将替代以前Kaldi中所有数据准备相关的工作,操作各种音频和文本的元数据。Lhotse除了Kaldi本身,也适用于其他应用。而且Lhotse纯Python代码,方便易用。

Icefall(示例脚本集合部分)将代替Kaldi中的示例脚本集合,并独立成为一个单独的子项目。之所以要把示例脚本集合与核心算法分开,是考虑到示例脚本可能会非常庞大,且经常变动。

新一代Kaldi的核心部分叫“k2”。k2可以让开发者很容易在PyTorch/TensorFlow中实现各种语音识别相关算法,比如CTC、LF—MMI、RNN—T、2nd—pass语言模型等,消除以往语音识别算法中训练跟解码不匹配的问题。同时,通过k2可以实现(置信度逐渐提高的)多轮解码过程。

Daniel Povey博士透露,k2核心代码已完成。约41000行代码(主要是C++),本周刚发布0.1版本。他在本次线下活动中强调:“今天有太多人依托Kaldi在做自己的事业,有很多人为Kaldi社区一直在做贡献,Kaldi会始终坚持开源。”

小米集团副总裁、技术委员会主席崔宝秋指出,拥抱开源是小米工程文化的重要组成部分。崔宝秋在接受蓝鲸TMT记者专访时表示,Kaldi的一些语音技术与代码已经在一些小米的产品线使用,未来其语音技术将在小米的手机、音箱、电视以及更多智能家居与智能穿戴设备中使用,小米非常重视语音技术。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4806

    浏览量

    98566
  • 核心技术
    +关注

    关注

    4

    文章

    625

    浏览量

    20527
  • 开源
    +关注

    关注

    3

    文章

    4347

    浏览量

    46445
  • 小米
    +关注

    关注

    70

    文章

    14547

    浏览量

    152601
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI 算法核心知识清单(深度实战版2

    三、机器学习核心算法(入门到实战)​1.监督学习算法(已知标签的模型训练)​线性模型​线性回归(回归任务):​核心原理:假设y=w₀+w₁x₁+w₂x₂+...+wₙxₙ+ε(ε为误差项),通过
    的头像 发表于 04-24 11:58 135次阅读
    AI <b class='flag-5'>算法</b><b class='flag-5'>核心</b>知识清单(深度实战版<b class='flag-5'>2</b>)

    ASPICE 3.1 与 4.0 版本核心差异:从软件专属到全系统覆盖(四)

    行业应用中的核心痛点。 ASPICE 4.0 版本 ASPICE 4.0 版本彻底解决了这一问题, 正式新增 HWE 硬件工程过程组 ,包含 HWE.1 硬件需求分析、HWE.2 硬件
    发表于 04-08 09:48

    端子电流循环寿命试验机核心算法解析:温升预测模型与寿命衰减曲线拟合

    端子电流循环寿命试验机的核心算法,是实现端子寿命精准预测、测试过程智能管控的关键,其中温升预测模型与寿命衰减曲线拟合两大核心算法,分别解决了测试过程中的温度动态调控与寿命趋势研判问题,共同构建起科学
    的头像 发表于 04-02 09:21 173次阅读
    端子电流循环寿命试验机<b class='flag-5'>核心算法</b>解析:温升预测模型与寿命衰减曲线拟合

    没有专利的opencv-python 版本

    所有 官方发布的 opencv-python 核心版本(无 contrib 扩展)都无专利风险——专利问题仅存在于 opencv-contrib-python 扩展模块中的少数算法(如
    发表于 12-13 12:37

    蓝牙信标、UWB等主流室内定位无线技术的参数对比、核心算法和选型指南详解(二)

    本文系统解析室内定位无线技术,涵盖蓝牙、Wi-Fi、UWB、RFID、超声波、可见光等主流技术的原理、参数对比与核心算法(RSSI、TDOA、AoA),并提供按精度、成本、场景匹配的选型指南,助力民用、工业、资产盘点及特殊环境下的最优技术选择。
    的头像 发表于 12-12 16:28 1939次阅读
    蓝牙信标、UWB等主流室内定位无线技术的参数对比、<b class='flag-5'>核心算法</b>和选型指南详解(二)

    国密系列算法简介及SM4算法原理介绍

    对128位原始密钥进行异或,然后将结果分为K0、K1、K2K3四个32位数据。用32位固定参数Rcon对K0、
    发表于 10-24 08:25

    AppGallery Connect(HarmonyOS 5及以上) --公开测试创建并发布测试版本(一)

    )的公开测试版本会自动下架。 发布测试版本 首先,您需创建并发布测试版本。最多支持1个公开测试版本
    发表于 09-26 17:24

    github 上的 nano版本已经更新到了4.1.1,是否能提供4.1.1版本的mdk pack包?

    github 上的 nano版本已经更新到了4.1.1,是否能提供4.1.1版本的mdk pack包, 会方便很多
    发表于 09-17 06:36

    创建并发布测试版本(一)

    版本号规范 测试版本的VersionGode必须高于发布过的全网版本的VersionGode。 测试版本的VersionCode不能低于
    发表于 09-16 15:21

    液态金属电阻率测试仪的核心算法与信号处理技术

    液态金属电阻率测试仪之所以能在科研与工业领域精准捕捉液态金属的电学特性,背后离不开核心算法与信号处理技术的协同支撑。这两大技术如同测试仪的“智慧大脑” 与 “敏锐感官”,前者负责将原始测量数据转化
    的头像 发表于 09-01 09:21 746次阅读
    液态金属电阻率测试仪的<b class='flag-5'>核心算法</b>与信号处理技术

    ‌Groq LPU 如何让万亿参数模型「飞」起来?揭秘 Kimi K2 40 倍提速背后的黑科技

    Groq LPU 如何让万亿参数模型「飞」起来?揭秘 Kimi K2 40 倍提速背后的黑科技‌ 最近,Moonshot AI 的千亿参数大模型 ‌Kimi K2‌ 在 ‌GroqCloud‌ 上
    的头像 发表于 08-07 10:01 1337次阅读

    万亿参数!元脑企智一体机率先支持Kimi K2大模型

    应用大模型提供高处理性能和完善的软件工具平台支持。   Kimi K2是月之暗面推出的开源万亿参数大模型,创新使用了MuonClip优化器进行训练,大幅提升了模型的学习效率。K2在代码生成、数学推理、Agent多步骤任务上展现出领先能力,评测指标达到业界领先水平。自
    的头像 发表于 07-22 09:27 697次阅读
    万亿参数!元脑企智一体机率先支持Kimi <b class='flag-5'>K2</b>大模型

    全方位解析,眺望电子2K3000核心板参数与设计

    前言:6月26日,广州眺望电子作为龙芯硬件生态在大湾区的核心合作伙伴,在北京中关村国际创新中心举行的2025龙芯产品发布会暨用户大会上登台展示基于龙芯2K3000核心板、工控板、工控机
    的头像 发表于 07-04 14:02 2147次阅读
    全方位解析,眺望电子<b class='flag-5'>2K</b>3000<b class='flag-5'>核心</b>板参数与设计

    求助,关于CYW20721B2版本 4.4.2及更高版本的关闭睡眠问题求解

    CYW20721B2 库的新版本已发布版本 v4.7.0,但它并未修复睡眠问题。 因此我被迫使用版本 v4.2.1,但当 HCI 传输未
    发表于 06-26 07:11

    K1,K2,K3是圆形旋转开关问题

    如图所示,K1,K2,K3是圆形旋转开关(控制M的转速),一次只有一个接通,当任意一个接通时,K4闭合则M1得电工作,需三个开关二极管但不懂选型,请热心网友们支招,多谢!
    发表于 05-15 21:06