0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种针对来自互联网的数万亿个单词训练的语言模型

倩倩 来源:新经网 2020-07-07 08:58 次阅读

商业概览:

OpenAI是一个人工智能研究实验室,由OpenAI LP及其上级组织非营利组织OpenAI Inc.组成。该公司是技术巨头DeepMind的竞争对手,在人工智能(AI)领域进行研究,以共同促进并以有益于整个人类的方式开发友好的AI。该组织由埃隆·马斯克(Elon Musk),萨姆·奥特曼(Sam Altman)等人于2015年年底在旧金山成立,他们共同认捐了10亿美元。马斯克于2018年2月从董事会辞职,但仍是捐助者。2019年,OpenAI LP从微软获得了10亿美元的投资。2020年6月,OpenAI宣布了GPT-3,这是一种针对来自互联网的数万亿个单词训练的语言模型。它还宣布了一个关联的API,简称为“ API”,将成为其首个商业产品的核心。GPT-3旨在以自然语言回答问题,但也可以在各种语言之间进行翻译,并且可以连贯地生成即兴文本。

自动点唱机:

自动点唱机是一种神经网络,可以产生包括基本唱歌在内的音乐,作为各种类型和艺术风格的原始音频。他们将发布模型权重和代码,以及用于探索生成的样本的工具。自动音乐生成可追溯到半个多世纪。一种突出的方法是以钢琴卷的形式象征性地产生音乐,该音乐指定要演奏的每个音符的时机,音高,速度和乐器。这导致了令人印象深刻的结果,例如制作巴赫合唱,使用多种乐器的和弦音乐以及时长的音乐作品。

但是符号生成器有局限性,它们无法捕获人的声音或音乐必不可少的许多更细微的音色,动态性和表现力。另一种方法是将音乐直接建模为原始音频。由于音序很长,因此在音频级别上生成音乐非常具有挑战性。17以CD质量(44 kHz,16位)播放一首典型的4分钟歌曲需要超过1000万步。为了进行比较,GPT-2有1,000个时间步长,而OpenAI Five每场比赛花费了数万个时间步长。因此,要学习音乐的高级语义,模型将必须处理极长距离的依赖关系。

MuseNet:

MuseNet是一个深度神经网络,可以用10种不同的乐器生成4分钟的音乐作品,并且可以将乡村音乐,莫扎特音乐和甲壳虫音乐的风格进行组合。MuseNet并未根据他们对音乐的理解进行明确编程,而是通过学习预测数十万个MIDI文件中的下一个标记来发现和谐,节奏和风格的模式。MuseNet使用与GPT-2相同的通用无监督技术,GPT-2是一种大型变压器模型,经过训练可以预测序列中的下一个标记(无论是音频还是文本)。MuseNet使用Sparse Transformer的重新计算和优化的内核来训练具有24个关注头的72层网络-充分关注4096个令牌的上下文。如此长的语境可能是它能够记住片段中长期结构的原因之一。

其使命:

OpenAI的使命是确保人工智能(AGI)惠及全人类,人工智能(AGI)表示高度自主的系统,在大多数具有经济价值的工作中,它们要胜过人类。该公司将尝试直接建立安全有益的AGI,但如果他们的工作帮助其他人实现了这一目标,也将认为他们的使命已经实现。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1776

    文章

    43845

    浏览量

    230590
  • OpenAI
    +关注

    关注

    8

    文章

    756

    浏览量

    5911
收藏 人收藏

    评论

    相关推荐

    【书籍评测活动NO.30】大规模语言模型:从理论到实践

    多种形式和任务。这个阶段是从语言模型向对话模型转变的关键,其核心难点在于如何构建训练数据,包括训练数据内部多个任务之间的关系、
    发表于 03-11 15:16

    工业互联网实训是什么?工业互联网实训包括哪些?

    工业互联网实训是一种针对工业互联网领域的培训课程,旨在帮助学员掌握工业互联网的基本概念、技术、应用和发展趋势。通过实训,学员可以了解工业
    的头像 发表于 01-17 17:00 288次阅读

    【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

    、计算机时代、互联网时代,而这个时代叫做 ——人工智能时代 想象 GPT 是语言天才,她擅长制作一种特殊的串联词语游戏。这个游戏的目标是在给定的起始词汇后,找到
    发表于 12-22 10:18

    工业互联网中的标识解析技术

    工业互联网的核心是数据的价值发现问题,但由于历史原因,“信息孤岛”现象在企业内部、企业之间大量存在。标识解析技术是目前可见解决“信息孤岛”、完成工业大数据汇聚以及在此基础上形成信息融合理解的关键技术。分析了标识解析在工业互联网领域应用要解决的几个关键环节,并且给出了进行工
    发表于 09-19 06:07

    训练语言模型带来的硬件挑战

    生成式AI和大语言模型(LLM)正在以难以置信的方式吸引全世界的目光,本文简要介绍了大语言模型训练这些
    的头像 发表于 09-01 17:14 1111次阅读
    <b class='flag-5'>训练</b>大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>带来的硬件挑战

    Nodemcu和visuino显示来自互联网的实时新闻

    电子发烧友网站提供《Nodemcu和visuino显示来自互联网的实时新闻.zip》资料免费下载
    发表于 06-28 09:42 0次下载
    Nodemcu和visuino显示<b class='flag-5'>来自</b><b class='flag-5'>互联网</b>的实时新闻

    工信部:工业互联网产业规模已超1.2万亿

    近年来,我国工业互联网从无到有,从小到大,逐步形成自己的认知体系、实践路径和实践成果,产业规模已经超过1.2万亿元。张云明总结了我国工业互联网发展的三方面成就。
    的头像 发表于 06-20 11:13 305次阅读

    如何将模块连接到互联网和Arduino板?

    我如何将模块连接到互联网和 Arduino 板
    发表于 06-12 06:12

    如何存储来自esp的响应以确保它已连接到互联网

    如何存储来自 esp 的响应(例如“确定”)以确保它已连接到互联网。 我将 main.c 文件与查询起附加,以帮助您更好地理解。 (显示错误的行是粗体和下划线)。
    发表于 06-09 07:36

    Android自动连接但未检测到互联网是怎么回事?

    : - 安装 AdAway 以阻止对互联网存在检查的请求 - 第三方应用程序,例如自动化;可以工作,但会是巨大的能源消耗者 ——在 ESP 上找到一种方法来“模拟”
    发表于 06-07 08:17

    如何通过ESP8266共享互联网

    我正在尝试通过 OTA 上传代码。但我无法将所有 ESP8266 都连接到互联网,所以我选择 hc12 进行远程传输。但我对如何通过 ESP8266 共享互联网有疑问。 有任何可能通过 hc12 与 esp8266 共享互联网
    发表于 05-31 08:17

    在数字时钟项目中使用ESP8266,ISP失去互联网连接怎么解决?

    我在数字时钟项目中使用 ESP8266。我遇到的问题是我的 ISP 偶尔会断开互联网连接。该程序发现它仍然连接到 WiFi,但是当它尝试从互联网检索时间时,它会循环直到 ISP 重新建立互联网连接
    发表于 05-30 06:19

    如何将房间的窗户连接到互联网

    看看我是如何制作很棒的项目的,我将房间的窗户连接到互联网
    发表于 05-22 07:40

    谷歌发布语言模型PaLM2,突破3.6万亿个令牌的训练数量

    据悉,令牌是指训练语言模型所使用的单词串,它们对于教导模型如何预测字符串中可能出现的下一个单词
    的头像 发表于 05-18 11:15 324次阅读
    谷歌发布<b class='flag-5'>语言</b><b class='flag-5'>模型</b>PaLM2,突破3.6<b class='flag-5'>万亿</b>个令牌的<b class='flag-5'>训练</b>数量

    互联网如何实现上网?

    互联网
    YS YYDS
    发布于 :2023年04月30日 20:51:55