0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Nomad AI计划开发适用于更广泛音频识别的应用

我快闭嘴 来源:36kr网 作者:李子月 2021-01-25 12:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Nomad AI由法国人Vivien Seguy于2018年创立,运营着三个App:和弦自动识别 Chord AI、图片识别词典Yomiwa(日语)和HanYou(中文)。公司注册于爱沙尼亚,得益于其e-residency政策(无论你实际居住在哪里,都可以在爱沙尼亚创建一家公司,并在线管理),Vivien可以一边工作一边旅行。现由于疫情原因回到家乡法国中部的克莱蒙费朗Clermont-Ferrand,办公室设在联合办公空间Turing 22。

Vivien 拥有法国巴黎综合理工学院(École Polytechnique)数学与计算机科学学士学位、英国帝国理工学院应用数学硕士学位,日本京都大学机器学习博士学位。Chord AI、Yomiwa和HanYou的iOS版属于Vivien的公司Nomad AI,他现在全职运营这三个App。Guillaume Bellec现任洛桑联邦理工学院(École Polytechnique Fédérale de Lausanne EPFL)博士后研究员,Chord AI的Android版在他注册的公司Bellec Research名下;Antoine Rolet目前在东京做自由软件工程师,Yomiwa和HanYou的Android版由他注册的公司管理。

进入博士项目前,Vivien已开始着手制作一个日语OCR(光学字符识别)应用。后于博士期间结识Antoine Rolet,正式开始开发日语词典Yomiwa,并进一步将其改编成中文词典HanYou。两个App分别发布于2013年和2014年,是最早的几款具有OCR功能的应用之一,甚至早于谷歌翻译。在Apple Store和Play store上有很多日语和中文词典的应用,以Pleco为代表,Pleco内容更加丰富,得益于其多年来与专业词典编辑的合作关系。Vivien表示,Yomiwa和HanYou是唯一具有光学识别、形态文字分析、手写识别、自动从新闻中获取词表等独特功能的词典应用,并计划进一步充实词典内容。Yomiwa和HanYou可以免费下载使用,一些特殊功能,如相机OCR或全自动每日单词列表,需要通过购买 “专业版 ”来解锁。模式为单次付费,而非会员制。

音频识别是Vivien更感兴趣的领域。博士期间Vivien和Antoine Rolet一起做了一个关于盲源分离的研究项目,目的是将混合的声音从单一的录音中分离出来。同时,Vivien的合伙人又发表了一篇名为 “Spectral Optimal Transport ”的论文,利用Vivien的研究课题--最优传输来建立一个钢琴音符识别算法。后来,Vivien在ICLR2018会议上认识了另一位博士生Guillaume Bellec,他也是一位业余音乐人,他们开始一起讨论如何实现这个想法,Chord AI项目由此才正式开始。

Chord AI利用机器学习算法自动识别音乐中的和弦、调性、节拍等,可以从本地文件、麦克风、甚至在同一设备中播放的YouTube上来获取音频。Vivien强调了大量准确标注数据的重要性。几个创始人最开始在公开的注释数据集(如Isophonics、JAAH和Billboard )训练算法,数据在数量和质量上非常有限,无法达到目标精度,Vivien希望能够实现在和弦识别方面远超最新研究论文中的最先进结果。因此他们很快就开始建立自己的数据库,并自己对音频进行标注,还对音乐进行程序化合成。他们还专门做了一个私人的iOS应用,专门用来简化用和弦和节拍注释歌曲的过程。因此,Vivien表示Chord AI在识别和弦精度上高于同类公司,如Chord Tracker和Chordify;Yamaha的应用 “Chord Tracker ”似乎比Chordify或MyChord精度更高,但它只能从本地文件中获取音频。Chord AI现可以免费下载和使用大部分功能。一些特殊的功能,如高级和弦识别或音高转换,需要解锁 “专业版”才能使用。费用为10美元/次(截至2021年1月),并不是会员模式。

Chord AI的iOS和Android版本共有约15万活跃用户,日下载增量1000次(大约50%在美国,30%在亚洲,20%在欧洲)。每天在这1000个新用户中,约有5%的用户最终购买了 “专业版”。Vivien表示,Chord AI在法国约有200-300万潜在用户,世界范围内潜在用户超过1亿。Yomiwa的iOS和Android版本共有约30万活跃用户,日下载增量300次,约有2%的新用户最终购买了“专业版”。 HanYou的iOS和Android版本拥有约3万活跃用户,日下载增量50次,约有3%的新用户最终购买了“专业版”。2020年,Chord AI、Yomiwa和HanYou的营业总额约为10万美金。Vivien预计三个App的总营业额在2021年至少能翻三倍。

Vivien正在筹划与Guillaume一起围绕Chord AI成立一个初创公司,并开发另一个不仅限于音乐,而是适用于更广泛音频的应用。总部将位于欧洲,但没有确定具体的城市。目前Nomad AI还没有融过资,前期费用都由创始人承担。现计划为新初创公司筹集100万欧元,用于团队建设,增添一名COO、一名CMO、两到三名机器学习工程师。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    7767

    浏览量

    92698
  • AI
    AI
    +关注

    关注

    90

    文章

    38225

    浏览量

    297083
  • iOS
    iOS
    +关注

    关注

    8

    文章

    3400

    浏览量

    155191
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【飞凌OK-MX9596-C开发板试用】③云端AI拍照识别

    。 本篇基于此,开发云端AI拍照识别。 简单来说,就是拍照,并调用云端AI工具,进行图像文本识别,再将
    发表于 11-01 22:12

    模板驱动 无需训练数据 SmartDP解决小样本AI算法模型开发难题

    。但是这个平台不适用于小样本AI模型开发,特别是一些特殊行业,数据本来就不多,但又有着需求,因此陷于两难。面临这种市场困境,慧视光电推出了一个全新的AI平台Sma
    的头像 发表于 09-09 17:57 1187次阅读
    模板驱动  无需训练数据  SmartDP解决小样本<b class='flag-5'>AI</b>算法模型<b class='flag-5'>开发</b>难题

    哪些离线语音芯片适用于家电设备

    ​哪些离线语音芯片适用于家电设备?选择适用于家电设备的离线语音芯片时,需综合考量家电的使用环境、功能需求、成本预算等多方面因素。以下为您推荐几款性能出色的离线语音芯片:   适合家电设备使用的离线
    的头像 发表于 08-06 17:27 653次阅读
    哪些离线语音芯片<b class='flag-5'>适用于</b>家电设备

    用于无线 LAN 的 2.4 GHz 高效前端和适用于蓝牙®应用的端口 skyworksinc

    电子发烧友网为你提供()用于无线 LAN 的 2.4 GHz 高效前端和适用于蓝牙®应用的端口相关产品参数、数据手册,更有用于无线 LAN 的 2.4 GHz 高效前端和适用于蓝牙®应
    发表于 07-01 18:32
    <b class='flag-5'>用于</b>无线 LAN 的 2.4 GHz 高效前端和<b class='flag-5'>适用于</b>蓝牙®应用的端口 skyworksinc

    适用于 WLAN 和蓝牙®应用的 2.4 GHz 高效前端 skyworksinc

    电子发烧友网为你提供()适用于 WLAN 和蓝牙®应用的 2.4 GHz 高效前端相关产品参数、数据手册,更有适用于 WLAN 和蓝牙®应用的 2.4 GHz 高效前端的引脚图、接线图、封装手册
    发表于 06-20 18:30
    <b class='flag-5'>适用于</b> WLAN 和蓝牙®应用的 2.4 GHz 高效前端 skyworksinc

    2.4 GHz、256 QAM 前端模块,用于 WLAN/ 和端口,适用于蓝牙®应用 skyworksinc

    电子发烧友网为你提供()2.4 GHz、256 QAM 前端模块,用于 WLAN/ 和端口,适用于蓝牙®应用相关产品参数、数据手册,更有2.4 GHz、256 QAM 前端模块,用于 WLAN
    发表于 06-18 18:30
    2.4 GHz、256 QAM 前端模块,<b class='flag-5'>用于</b> WLAN/ 和端口,<b class='flag-5'>适用于</b>蓝牙®应用 skyworksinc

    用于 WLAN/ 的 2.4 GHz、256 QAM 前端模块和适用于蓝牙®应用的端口 skyworksinc

    电子发烧友网为你提供()用于 WLAN/ 的 2.4 GHz、256 QAM 前端模块和适用于蓝牙®应用的端口相关产品参数、数据手册,更有用于 WLAN/ 的 2.4 GHz、256 QAM 前端
    发表于 06-18 18:30
    <b class='flag-5'>用于</b> WLAN/ 的 2.4 GHz、256 QAM 前端模块和<b class='flag-5'>适用于</b>蓝牙®应用的端口 skyworksinc

    适用于电机控制的电流滤波方法

    纯分享帖,需要者可点击附件免费获取完整资料~~~*附件:适用于电机控制的电流滤波方法.pdf【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,删除内容!
    发表于 06-18 16:04

    NVIDIA扩展适用于AI工厂数字孪生的Omniverse Blueprint

    NVIDIA 宣布大幅扩展适用于 AI 工厂数字孪生的 Omniverse Blueprint,为工程团队提供更多 AI 工厂构建工具,目前已作为预览版推出。
    的头像 发表于 05-22 09:48 762次阅读

    如何制作适用于Visionfive 2的Debian + UEFI固件系统?

    制作适用于Visionfive 2的Debian + UEFI固件系统
    发表于 03-10 07:51

    AI开发板】正点原子K230D BOX开发板来了!一款性能强悍且小巧便携的AI开发板!

    的13.7倍,十分适用于机器视觉、图像处理等的应用开发! 正点原子K230D BOX开发板标配一块2.4寸的高分辨率MIPI触摸屏和一个高清摄像头模组,且板载了双色LED、蜂鸣器、音频
    发表于 02-18 16:56

    OpenAI计划开发可替代手机的生成式AI专用终端

    近日,据日经报道,人工智能研究公司 OpenAI 的 CEO Sam Altman 在接受采访时透露,OpenAI 计划开发一款可替代手机的生成式 AI 专用终端。 据了解,OpenAI 在生成式
    的头像 发表于 02-05 14:50 950次阅读

    OTL电路适用于哪些设备

    音响系统中。由于省去了昂贵的输出变压器,电路设计更加简洁,同时保持了良好的音质表现。它的小体积、低成本和宽频响等优点,使其在音频设备中备受青睐。 耳机放大器 : OTL电路也适用于耳机放大器,能够提供清晰、纯净的音质,满足用户对音
    的头像 发表于 01-16 09:35 991次阅读

    适用于TCA9511A的EVM用户指南

    电子发烧友网站提供《适用于TCA9511A的EVM用户指南.pdf》资料免费下载
    发表于 12-23 15:32 0次下载
    <b class='flag-5'>适用于</b>TCA9511A的EVM用户指南

    适用于PoE应用的低成本隔离式电源

    电子发烧友网站提供《适用于PoE应用的低成本隔离式电源.pdf》资料免费下载
    发表于 12-21 09:39 0次下载
    <b class='flag-5'>适用于</b>PoE应用的低成本隔离式电源