0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

亚马逊宣布:他们计划向公众公开“Topical Chat”数据集

电子工程师 来源:lp 2019-04-04 11:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

4月1 日, 亚马逊宣布:他们计划向公众公开“Topical Chat”数据集,超410万单词21万句子的语料库将于2019年9月17日发布。

该数据集是为参加Alexa Prize Socialbot Grand Challenge 3竞赛的团队开发的,申请截止日期为2019年5月14日,比赛于2019年9月9日开始。所有参加Alexa Prize竞赛的团队将可以访问此数据集的扩展版本(扩展主题聊天数据集),其中包括正在进行的集合和注释的结果。

主题聊天数据集将包含超过210,000个句子(超过4,100,000个单词),可支持高质量,可重复的研究,将成为研究界公开可用的最大社交对话和知识数据集。

每个语料库的对话和对话轮次与提供给众包工作者的知识相关联,并且所述知识是从与一组实体相关的一系列“非结构化”和“松散结构化”的文本资源中收集的。

亚马逊高级首席科学家Dilek Hakkani-Tur在博客文章中明确表示,没有任何语料是与Alexa客户的互动。

该数据库是实现基于知识的神经反应生成系统的后续研究,解决其他公开数据集无法解决的自然对话中的难题。这将使研究者可以专注于研究对话中主题和知识选择方面的转换,以及如何在对话中融入事实和观点。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据集
    +关注

    关注

    4

    文章

    1232

    浏览量

    26059
  • 亚马逊
    +关注

    关注

    8

    文章

    2725

    浏览量

    85455

原文标题:亚马逊将公布超过最大会话和知识数据集,超400万字

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    看点:消息称台积电3纳米订单激增 亚马逊正式公布裁员计划 宇树王兴兴获上交所聘任

    给大家分享一些科技巨头的动态: 亚马逊正式公布裁员计划 据新华社报道,亚马逊在28日正式宣布计划裁减约1.4万名公司职员,此次裁员旨在通过将
    的头像 发表于 10-29 18:36 1151次阅读

    看点:亚马逊云科技否认大中华区裁员 黑石计划投资7亿美元建数据中心 小鹏首个欧洲本地化生产项目启动

    给大家分享一些业界资讯: 亚马逊云科技否认大中华区裁员 网传 亚马逊云科技(AWS)大中华区计划大规模裁员,裁员或超20%。对此网络传言,亚马逊云科技发言人表示,严重失实,
    的头像 发表于 09-15 16:49 636次阅读

    IBM与美国网球协会携手推出2025年美国网球公开赛AI驱动的球迷体验

    体验 北京2025年8月19日 /美通社/ -- IBM(纽约证券交易所代码:IBM)与美国网球协会(USTA)宣布,将在今年的美网公开赛期间,为US
    的头像 发表于 08-19 21:40 626次阅读
    IBM与美国网球协会携手推出2025年美国网球<b class='flag-5'>公开</b>赛AI驱动的球迷体验

    微软开源GitHub Copilot Chat,AI编程迎来新突破

    30分,微软首席执行官Satya Nadella大家展示了VS Code的最新AI开源编辑器GitHub Copilot Chat。 GitHub Copilot Chat的一大技术亮点是其支持
    的头像 发表于 07-02 09:34 849次阅读
    微软开源GitHub Copilot <b class='flag-5'>Chat</b>,AI编程迎来新突破

    数据下载失败的原因?

    数据下载失败什么原因太大了吗,小的可以下载,想把大的下载去本地训练报错网络错误 大的数据多大?数据量有多少?
    发表于 06-18 07:04

    SAP与亚马逊云科技推出AI联合创新计划,打造生成式AI解决方案,助力客户应对市场波动与供应链复杂性

    北京 2025年5月26日 /美通社/ -- 在SAP蓝宝石大会上,亚马逊云科技与SAP宣布启动全新的AI联合创新计划,帮助合作伙伴构建生成式AI应用和智能体,助力客户快速解决实时业务挑战。 许多
    的头像 发表于 05-26 16:54 442次阅读

    SAP与亚马逊云科技推出AI联合创新计划,打造生成式AI解决方案, 助力客户应对市场波动与供应链复杂性

    北京 ——2025 年 5 月 26 日 在SAP蓝宝石大会上,亚马逊云科技与SAP宣布启动全新的AI联合创新计划,帮助合作伙伴构建生成式AI应用和智能体,助力客户快速解决实时业务挑战。 许多企业
    发表于 05-26 11:44 1102次阅读

    请问NanoEdge AI数据该如何构建?

    我想用NanoEdge来识别异常的声音,但我目前没有办法生成模型,我感觉可能是数据的问题,请问我该怎么构建数据?或者生成模型失败还会有哪些原因?
    发表于 03-10 08:20

    Krea发布Deepseek R1驱动的Chat功能

    近日,Krea平台迎来了一项重大更新——全新发布的Krea chat功能。这一功能由Deepseek R1驱动,为用户带来了前所未有的便捷体验。 通过Krea chat,用户可以直接在聊天窗口中调用
    的头像 发表于 02-08 11:09 974次阅读

    微软重新推出免费企业版Copilot:Microsoft 365 Copilot Chat

    据外媒最新报道,微软近期重新推出了其备受关注的企业版Copilot,并命名为“Microsoft 365 Copilot Chat”。这一新版本的最大亮点在于其免费提供的AI代理功能,为用户带来
    的头像 发表于 01-17 10:08 994次阅读

    比亚迪将很快宣布墨西哥建厂计划

    据最新报道,比亚迪墨西哥总经理Jorge Vallejo在一场活动中透露,比亚迪将“很快”宣布在墨西哥建立制造工厂的计划。这一消息对比亚迪在拉丁美洲市场的进一步扩张具有重要意义。 在活动
    的头像 发表于 01-15 11:43 1610次阅读

    lmp91200成的spi没有MISO,控制器它写命令不会返回数据是哪里出了问题?

    lmp91200成的spi没有MISO,那么控制器它写命令,不会返回数据,控制器如何知道发送过去的数据没有出错?
    发表于 01-01 06:46

    亚马逊云科技发布全新数据中心组件

    近日,亚马逊云科技宣布了一项重大创新,推出了一系列全新的数据中心组件。这些组件旨在满足新一代人工智能(AI)创新的需求,并帮助客户应对日益复杂且多变的应用场景。 亚马逊云科技通过对电源
    的头像 发表于 12-24 15:05 827次阅读

    大陆计划拆分汽车业务并独立上市

    近日,大陆宣布了其执行董事会会议上的重要决定:拆分汽车子集团业务,并制定了具体的实施计划。这一决定旨在推动公司业务的进一步发展和优化。 据悉,该拆分计划将于2025年3月正式提交给
    的头像 发表于 12-20 15:55 831次阅读