0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌最新AI实验项目,根据用户指挥动作实时生成交响乐

DPVg_AI_era 来源:lq 2019-01-04 09:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

谷歌最新AI实验项目,根据用户指挥动作实时生成交响乐,圆你一个指挥家的梦!只需一个摄像头,浏览器内即可运行,快来试试吧!

如果你是一位古典乐发烧友,而且有做乐团指挥的梦想,听见古典乐就走不动道,就算没有乐队,也能自己对着空气手舞足蹈指挥一番,那么恭喜你,谷歌最新的人工智能实验项目简直就是为你量身定制的。而且,不用担心旁边有人对你指手画脚。

这个项目名为“半导体”,其中融合了谷歌过去一系列机器学习实验中的最新成果。包括AIDuet(邀请用户在浏览器中播放虚拟钢琴演奏,并提供虚拟伴奏),以及AutoDraw(可以解释用户绘制的粗糙涂鸦是什么,并将这些画作转变成为整洁的剪贴画)。

该项目可以跟踪用户的动作,就像用户在真正的管弦乐队前挥舞双手一样,并根据对用户动作的分析结果,实时生成一段交响乐。

想试试吗?只需在谷歌浏览器中启动“半导体”,允许其访问网络摄像头权限,然后面向摄像头后退一步,直到你的手臂位于屏幕内的框架中,就可以开始指挥自己的“乐队”了。不一定非要使用传统的指挥手势,本项目会提供建议提示,帮助你一路顺利完成指挥。

全程无需指挥棒随意放飞自我

本项目背后的核心技术是PoseNet,这是一种面向姿势估计的机器学习模型,可以在浏览器中对人的姿势和动作进行分析和估计。它无需任何专门的硬件或软件,即可检测到图像和视频中的人物形象。

最重要的是,因为所有处理都在浏览器中进行,所以无需向Google或其他任何人发送任何数据,因此你可以完全自娱自乐,无需担心由于数据泄露引发的一些不必要的尴尬。

这个项目可让用户通过浏览器管理自己的管弦乐队。你可以通过移动手臂,来改变交响乐的速度、音量和乐器种类。该项目使用PoseNet,这是一个可在浏览器中使用的机器学习库,通过网络摄像头捕捉动作。

PoseNet使用来自现场乐器演奏时录制的数百个微小音频文件,算法会根据捕捉到的动作信息播放这些音频。

关于PoseNet和姿势估计

姿势估计指的是检测图像和视频中的人物形象的计算机视觉技术,比如可以确定某人的肘部出现在图像中的位置。需要明确的是,这项技术无法识别图像中的人物身份。该算法仅仅是估计关键身体的关节在图像中的相对位置。

姿势估计有许多用途,比如用于基于身体反应的交互式装置,以及增强现实设备、动画制作、健身等用途。过去,虽然许多的姿势检测系统是开源的,但都需要专门的硬件或摄像头,以及相当繁复的系统设置。

由于TensorFlow.js上的PoseNet在可浏览器中运行,只要有网络摄像头,任何人都能在浏览器中体验这项技术。目前该模型已经开源,Javascript的开发人员只需几行代码即可使用。更重要的是,这实际上可以更好地保护用户的隐私。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6244

    浏览量

    110229
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261392
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136215

原文标题:谷歌最新AI实验:人人都是指挥家,实时生成交响乐

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    安达发|箱包厂不“包”治百病?那是你没遇上这款计划排产软件!

    在箱包生产行业,生产计划的安排就像是一场精密的交响乐演奏,每一个环节都需要精准配合,才能奏出高效生产的美妙乐章。而如今,计划排产软件正逐渐成为这场交响乐中不可或缺的指挥家。 传统排产的痛点与无奈 在
    的头像 发表于 11-11 11:32 235次阅读
    安达发|箱包厂不“包”治百病?那是你没遇上这款计划排产软件!

    在金属加工线的交响中:EtherCAT与PROFINET的协奏

    来自不同“国度”、说着不同“语言”的设备,像一支训练有素的交响乐团般协同工作。 这次的项目,是一条铝合金型材的冲压成型线。其核心控制大脑,是业内广泛使用的西门子S7-1500系列PLC。它通常使用PROFINET这门高效的“工厂通用语”来发号施令。然而
    的头像 发表于 10-21 09:41 109次阅读
    在金属加工线的<b class='flag-5'>交响</b>中:EtherCAT与PROFINET的协奏

    惊爆!冶金化工行业通信困局Modbus RTU 转 Profibus竟被这招轻松化解

    在冶金与化工这两大工业支柱领域,自动化生产就像一场精密的交响乐,每一个设备都是不可或缺的音符。而通信协议,便是指挥这场交响乐的乐谱。Modbus RTU 与 Profibus 便是其中两首不同风格
    的头像 发表于 09-29 14:58 176次阅读
    惊爆!冶金化工行业通信困局Modbus RTU 转 Profibus竟被这招轻松化解

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    图像的快速鉴别,满足实时或准实时的应用需求。 3. 数据采集 AI图片数据集,本项目使用gemini生成图片,使用的是gem来实现的。 提示
    发表于 08-21 13:59

    关于鸿蒙App上架中“AI文本生成模块的资质证明文件”的情况说明

    的内容(不管是图片、文字还是视频)以及AI生成的内容(也不管是什么形式),都要进行审核功能,不能有违法违规信息,会进行现场测试,但是测试标准为止,对我的项目的测试……就是在生成的内容上
    发表于 06-30 18:37

    《DNESP32S3使用指南-IDF版_V1.6》第五十七章 AI库简介

    第五十七章 AI库简介 鑫的ESP-WHO库是一个基于鑫芯片的图像处理开发平台,其中包括了实际应用中可能出现的开发示例,如人脸检测、人脸识别、猫脸检测和手势识别等。开发者可以
    发表于 03-21 09:47

    ​Diffusion生成动作引擎技术解析

    Diffusion生成动作引擎 Diffusion生成动作引擎是一种基于扩散模型(Diffusion Models)的生成式人工智能技术
    的头像 发表于 03-17 15:14 2696次阅读

    Deepseek背后的伙伴-晶振担当什么角色?

    作为DeepSeek智能系统的核心时序引擎,晶振以卓越的时间管理能力,支撑着AI模型的推理、训练与实时响应。在数字世界的交响乐中,每一个音符的精准节拍都离不开隐于幕后的指挥家——晶振。
    的头像 发表于 03-07 18:47 1782次阅读
    Deepseek背后的伙伴-晶振担当什么角色?

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    再次感谢发烧友提供的阅读体验活动。本期跟随《AI Agent 应用与项目实战》这本书学习如何构建开发一个视频应用。AI Agent是一种智能应用,能够根据
    发表于 03-05 19:52

    AI Agent 应用与项目实战》阅读心得2——客服机器人、AutoGen框架 、生成式代理

    及时处理。 第5章的斯坦福AI小镇项目生成式代理技术做出了开创性的探索。该项目的核心是将LLM与计算交互代理相结合,构建了一个具有记忆、反思、规划能力的智能体系统。在技术实现层面,记
    发表于 02-25 21:59

    谷歌Gemini AI目标年底用户达5亿

    即将在AI市场掀起新的波澜。 据悉,谷歌的目标是在今年年底前,让全球有5亿人使用基于Gemini AI技术构建的聊天机器人。然而,目前谷歌尚未公布Gemini的具体
    的头像 发表于 01-18 11:30 1261次阅读

    生成AI工具好用吗

    当下,生成AI工具正以其强大的内容生成能力,为用户带来了前所未有的便捷与创新。那么,生成AI
    的头像 发表于 01-17 09:54 810次阅读

    谷歌加速AI部门整合:AI Studio团队并入DeepMind

    旗下,此举旨在更好地整合人工智能部门,以提升各大项目的推进效率。 AI Studio团队在谷歌内部扮演着举足轻重的角色,主要负责打造谷歌旗下的AI
    的头像 发表于 01-13 14:40 1130次阅读

    名单公布!【书籍评测活动NO.55】AI Agent应用与项目实战

    ,或协助制定营销策略。 医疗健康:AI Agent 已在医疗领域展现巨大潜力,如对常见的疾病进行预诊断,或基于患者的健康数据生成个性化的治疗方案。 教育领域:对用户进行个性化学习路径安排、智能辅导等通过
    发表于 01-13 11:04

    借助谷歌Gemini和Imagen模型生成高质量图像

    在快速发展的生成AI 领域,结合不同模型的优势可以带来显著的成果。通过利用谷歌的 Gemini 模型来制作详细且富有创意的提示,然后使用 Imagen 3 模型根据这些提示
    的头像 发表于 01-03 10:38 1332次阅读
    借助<b class='flag-5'>谷歌</b>Gemini和Imagen模型<b class='flag-5'>生成</b>高质量图像