Stability AI推出Stable audio的文本到音频生成人工智能平台-电子发烧友网

Stability AI是一家主要以人工智能生成的视觉效果而闻名的公司，它推出了一个名为Stable audio的文本到音频生成人工智能平台。

Stable Audio使用扩散模型，与该公司更受欢迎的图像平台Stable diffusion的AI模型相同，但使用音频而非图像进行训练。用户可以使用它为任何项目生成歌曲或背景音频。

音频扩散模型倾向于生成固定长度的音频，这对音乐制作来说很糟糕，因为歌曲的长度可能不同。Stability AI的新平台允许用户发出不同长度的声音，要求公司对音乐进行训练，并在歌曲的开始和结束时间周围添加文本元数据。

同时，它可以实现实时的音频生成，无需等待长时间的渲染过程。Stability AI 宣称，Stable Audio 模型可以在一秒内渲染出 95 秒的立体声音频，并且只需要一个 NVIDIA A100 GPU。

并且，Stable Audio是一个开源的项目，任何人都可以免费使用和修改。Stability AI 希望通过开源的方式促进 AI 领域的创新和发展，并让更多人享受到 AI 技术带来的便利和乐趣。

该公司在一份声明中表示：“Stable Audio代表了Stability AI生成音频研究实验室Harmonai的尖端音频生成研究。我们会继续改进我们的模型架构、数据集和训练程序，以提高输出质量、可控性、推理速度和输出长度。”

文本到音频的生成并不是什么新鲜事，因为生成人工智能领域的其他大牌一直在玩弄这个概念。Meta于8月发布了AudioCraft，这是一套生成的人工智能模型，有助于根据提示创建听起来自然的ERM、声音和音乐。到目前为止，它只提供给研究人员和一些音频专业人士。谷歌的MusicLM也可以让人们产生声音，但只对研究人员开放。

审核编辑：彭菁

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

音频

音频

+关注

关注
28

文章
2600

浏览量
79969
AI

AI

+关注

关注
87

文章
26443

浏览量
264044
人工智能

人工智能

+关注

关注
1776

文章
43845

浏览量
230600
模型

模型

+关注

关注
1

文章
2704

浏览量
47685
数据集

数据集

+关注

关注
4

文章
1178

浏览量
24351

原文标题：Stability AI发布AI音频平台Stable Audio

文章出处：【微信号：IEEE_China，微信公众号：IEEE电气电子工程师】欢迎添加关注！文章转载请注明出处。

5G智能物联网课程之Aidlux下人工智能开发

.pdf 人工智能 软件平台使用指导A：AidLux平台介绍 8分29秒 https://t.elecfans.com/v/25505.html *附件：AidLux平台使用介绍.pd

发表于 04-01 10:40

Stability AI推出全新Stable Video 3D模型

近日，Stability AI 推出了全新的 Stable Video 3D 模型，该模型以其独特的功能吸引了众多关注。此模型具备从单张图像中生成

发表于 03-22 10:30 •254次阅读

OpenAI首席技术官穆拉蒂：Sora今年发布，音频生成功能将提升场景呈现

穆拉提还提到，Sora将覆盖音频生成领域，以增强应用效果；考虑到人工智能生成内容有时不够精确，OpenAI拟允许用户自主修改、创建视听内容。

发表于 03-14 14:17 •100次阅读

嵌入式人工智能的就业方向有哪些?

。国内外科技巨头纷纷争先入局，在微软、谷歌、苹果、脸书等积极布局人工智能的同时，国内的BAT、华为、小米等科技公司也相继切入到嵌入式人工智能的赛道。那么嵌入式AI可就业的方向有哪些呢

发表于 02-26 10:17

OpenAI新年开出王炸，视频生成模型Sora问世

近日，OpenAI在AI生成视频领域取得重大突破，发布了全新的生成式人工智能模型“Sora”。该模型在视频生成方面展现出了惊人的能力，通过

发表于 02-20 11:46 •373次阅读

生成式人工智能和感知式人工智能的区别

生成新的内容和信息的人工智能系统。这些系统能够利用已有的数据和知识来生成全新的内容，如图片、音乐、文本等。生成式

发表于 02-19 16:43 •548次阅读

Stability AI试图通过新的图像生成人工智能模型保持领先地位

Stability AI的最新图像生成模型Stable Cascade承诺比其业界领先的前身Stable Diffusion更快、更强大，而

发表于 02-19 16:03 •431次阅读

关于生成式人工智能你应该知道的7件事

ChatGPT和类似的人工智能工具可以生成包括文本、图像和音频在内的内容，让高等教育领域领导者、教师、学生和其他人既兴奋又担忧。我们应将人工智能

发表于 02-19 13:27 •386次阅读

OpenAI发布文生视频模型Sora，引领AI视频生成新纪元

在人工智能(AI)领域掀起新一轮革命浪潮的，正是OpenAI最新推出的文生视频大模型——Sora。这款被业界广泛赞誉的模型，以其“逼真”和“富有想象力”的视频生成能力，彻底颠覆了传统视

发表于 02-19 11:03 •443次阅读

Cognizant推出支持生成式人工智能的新平台

Cognizant，全球领先的信息技术服务公司，近日宣布推出一个革命性的平台——Cognizant Flowsource，旨在为企业提供下一代软件工程解决方案。该平台专注于生成式

发表于 02-03 16:11 •451次阅读

Stability AI推出迄今为止更小、更高效的1.6B语言模型

Stability AI 宣布推出迄今为止最强大的小语言模型之一 Stable LM 2 1.6B。

发表于 01-23 10:11 •292次阅读

ai人工智能机器人

随着时间的推移，人工智能的发展越来越成熟，智能时代也离人们越来越近，近几年人工智能越来越火爆，人工智能的应用已经开始渗透到各行各业，与生活交

发表于 09-21 11:09

AI 人工智能的未来在哪？

人工智能、AI智能大模型已经孵化；繁衍过程将突飞猛进，ChatGPT已经上线。世界首富马斯克认为AI对人类是一种威胁；谷歌前CEO施密特认为AI

发表于 06-27 10:48

IGT Solutions推出企业级生成式人工智能平台TechBud.AI以实现卓越客户体验

释放快速创新以推动持续且盈利性的业务成果西雅图2023年6月23日 /美通社/ -- IGT Solutions 推出了创新、先进的企业级生成式人工智能平台TechBud.

发表于 06-24 21:20 •346次阅读

使用OpenVINO™在算力魔方上加速stable diffusion模型

Stable Diffusion 是 stability.ai 开源的 AI 图像生成模型，实现输入文字，生成图像的功能。

发表于 05-12 09:10 •943次阅读