0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Stability AI推出Stable audio的文本到音频生成人工智能平台

IEEE电气电子工程师 来源:IEEE电气电子工程师 2023-09-20 10:20 次阅读

Stability AI是一家主要以人工智能生成的视觉效果而闻名的公司,它推出了一个名为Stable audio的文本到音频生成人工智能平台。

Stable Audio使用扩散模型,与该公司更受欢迎的图像平台Stable diffusion的AI模型相同,但使用音频而非图像进行训练。用户可以使用它为任何项目生成歌曲或背景音频。

音频扩散模型倾向于生成固定长度的音频,这对音乐制作来说很糟糕,因为歌曲的长度可能不同。Stability AI的新平台允许用户发出不同长度的声音,要求公司对音乐进行训练,并在歌曲的开始和结束时间周围添加文本元数据。

同时,它可以实现实时的音频生成,无需等待长时间的渲染过程。Stability AI 宣称,Stable Audio 模型可以在一秒内渲染出 95 秒的立体声音频,并且只需要一个 NVIDIA A100 GPU

并且,Stable Audio是一个开源的项目,任何人都可以免费使用和修改。Stability AI 希望通过开源的方式促进 AI 领域的创新和发展,并让更多人享受到 AI 技术带来的便利和乐趣。

该公司在一份声明中表示:“Stable Audio代表了Stability AI生成音频研究实验室Harmonai的尖端音频生成研究。我们会继续改进我们的模型架构、数据集和训练程序,以提高输出质量、可控性、推理速度和输出长度。”

文本到音频的生成并不是什么新鲜事,因为生成人工智能领域的其他大牌一直在玩弄这个概念。Meta于8月发布了AudioCraft,这是一套生成的人工智能模型,有助于根据提示创建听起来自然的ERM、声音和音乐。到目前为止,它只提供给研究人员和一些音频专业人士。谷歌的MusicLM也可以让人们产生声音,但只对研究人员开放。

审核编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 音频
    +关注

    关注

    28

    文章

    2600

    浏览量

    79969
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264044
  • 人工智能
    +关注

    关注

    1776

    文章

    43845

    浏览量

    230600
  • 模型
    +关注

    关注

    1

    文章

    2704

    浏览量

    47685
  • 数据集
    +关注

    关注

    4

    文章

    1178

    浏览量

    24351

原文标题:Stability AI发布AI音频平台Stable Audio

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    5G智能物联网课程之Aidlux下人工智能开发

    .pdf 人工智能 软件平台使用指导A:AidLux平台介绍 8分29秒 https://t.elecfans.com/v/25505.html *附件:AidLux平台使用介绍.pd
    发表于 04-01 10:40

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,该模型以其独特的功能吸引了众多关注。此模型具备从单张图像中生成
    的头像 发表于 03-22 10:30 254次阅读

    OpenAI首席技术官穆拉蒂:Sora今年发布,音频生成功能将提升场景呈现

    穆拉提还提到,Sora将覆盖音频生成领域,以增强应用效果;考虑到人工智能生成内容有时不够精确,OpenAI拟允许用户自主修改、创建视听内容。
    的头像 发表于 03-14 14:17 100次阅读

    嵌入式人工智能的就业方向有哪些?

    。 国内外科技巨头纷纷争先入局,在微软、谷歌、苹果、脸书等积极布局人工智能的同时,国内的BAT、华为、小米等科技公司也相继切入嵌入式人工智能的赛道。那么嵌入式AI可就业的方向有哪些呢
    发表于 02-26 10:17

    OpenAI新年开出王炸,视频生成模型Sora问世

    近日,OpenAI在AI生成视频领域取得重大突破,发布了全新的生成人工智能模型“Sora”。该模型在视频生成方面展现出了惊人的能力,通过
    的头像 发表于 02-20 11:46 373次阅读

    生成人工智能和感知式人工智能的区别

    生成新的内容和信息的人工智能系统。这些系统能够利用已有的数据和知识来生成全新的内容,如图片、音乐、文本等。生成
    的头像 发表于 02-19 16:43 548次阅读

    Stability AI试图通过新的图像生成人工智能模型保持领先地位

    Stability AI的最新图像生成模型Stable Cascade承诺比其业界领先的前身Stable Diffusion更快、更强大,而
    的头像 发表于 02-19 16:03 431次阅读
    <b class='flag-5'>Stability</b> <b class='flag-5'>AI</b>试图通过新的图像<b class='flag-5'>生成人工智能</b>模型保持领先地位

    关于生成人工智能你应该知道的7件事

    ChatGPT和类似的人工智能工具可以生成包括文本、图像和音频在内的内容,让高等教育领域领导者、教师、学生和其他人既兴奋又担忧。我们应将人工智能
    的头像 发表于 02-19 13:27 386次阅读
    关于<b class='flag-5'>生成</b>式<b class='flag-5'>人工智能</b>你应该知道的7件事

    OpenAI发布文生视频模型Sora,引领AI频生成新纪元

    人工智能(AI)领域掀起新一轮革命浪潮的,正是OpenAI最新推出的文生视频大模型——Sora。这款被业界广泛赞誉的模型,以其“逼真”和“富有想象力”的视频生成能力,彻底颠覆了传统视
    的头像 发表于 02-19 11:03 443次阅读

    Cognizant推出支持生成人工智能的新平台

    Cognizant,全球领先的信息技术服务公司,近日宣布推出一个革命性的平台——Cognizant Flowsource,旨在为企业提供下一代软件工程解决方案。该平台专注于生成
    的头像 发表于 02-03 16:11 451次阅读

    Stability AI推出迄今为止更小、更高效的1.6B语言模型

    Stability AI 宣布推出迄今为止最强大的小语言模型之一 Stable LM 2 1.6B。
    的头像 发表于 01-23 10:11 292次阅读
    <b class='flag-5'>Stability</b> <b class='flag-5'>AI</b><b class='flag-5'>推出</b>迄今为止更小、更高效的1.6B语言模型

    ai人工智能机器人

    随着时间的推移,人工智能的发展越来越成熟,智能时代也离人们越来越近,近几年人工智能越来越火爆,人工智能的应用已经开始渗透各行各业,与生活交
    发表于 09-21 11:09

    AI 人工智能的未来在哪?

    人工智能AI智能大模型已经孵化;繁衍过程将突飞猛进,ChatGPT已经上线。 世界首富马斯克认为AI对人类是一种威胁;谷歌前CEO施密特认为AI
    发表于 06-27 10:48

    IGT Solutions推出企业级生成人工智能平台TechBud.AI以实现卓越客户体验

    释放快速创新以推动持续且盈利性的业务成果 西雅图2023年6月23日 /美通社/ -- IGT Solutions 推出了创新、先进的企业级生成人工智能平台TechBud.
    的头像 发表于 06-24 21:20 346次阅读

    使用OpenVINO™在算力魔方上加速stable diffusion模型

    Stable Diffusion 是 stability.ai 开源的 AI 图像生成模型,实现输入文字,生成图像的功能。
    的头像 发表于 05-12 09:10 943次阅读
    使用OpenVINO™在算力魔方上加速<b class='flag-5'>stable</b> diffusion模型