0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

上海人工智能实验室发布多模态语料

微云疏影 来源:综合整理 作者:综合整理 2023-08-17 10:17 次阅读

近日,上海人工智能实验室发布联合语言资料数据联盟会员单位,共同发布“生万权”1.0多模式词典训练语言资料开源。

“书生·万卷”1.0将集中语言资料数据联盟会员们丰富的内容积累和上海人工智能实验室的数据处理能力等优势,为学术界及产业界提供高品质的大规模模型多模态事前训练语言资料。开放源代码提供2tb以上的数据,多种融合,精细处理,价值排序,使用方便高效。

此次开放源代码“书生·万卷”1.0包含文本、图片、文本和视频三部分数据集。其中,文本数据来自网页,百科全书,书籍,专利,教材,考试题等,数据总量超过5亿个,数据大小也超过1tb,涵盖科技,文学,媒体,教育,法律等多个领域。

图像和文字数据主要来自公开网页,经过处理形成图像和文字交叉的文件。总数字超过2200万个,数据大小超过140gb,涵盖新闻事件、人物、自然景观、社会生活等多个领域。

视频数据主要是中国中央电视台(cctv)和上海文广集团提供,新闻、电影、电视等多种类型的节目,包括视频,视频文件总数超过1000个,数据大小超过900gb,内容是军事、文艺、体育、自然、知识、影像艺术等领域覆盖着。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1776

    文章

    43899

    浏览量

    230638
  • 源代码
    +关注

    关注

    95

    文章

    2929

    浏览量

    66064
  • 模型
    +关注

    关注

    1

    文章

    2707

    浏览量

    47702
收藏 人收藏

    评论

    相关推荐

    上海人工智能实验室发布自动驾驶视频生成模型GenAD

    上海人工智能实验室近日取得重大技术突破,联合香港科技大学、德国图宾根大学及香港大学共同研发并发布了大规模自动驾驶视频生成模型——GenAD。这一创新模型通过精准预测和模拟真实世界场景,为自动驾驶技术的研究与应用提供了强有力的支撑
    的头像 发表于 03-26 10:40 184次阅读

    百川智能与北京大学将共建通用人工智能联合实验室

    近日,百川智能与北京大学携手合作,共同签署了“北大——百川通用人工智能联合实验室”的共建协议,标志着双方在人工智能领域迈出了坚实的合作步伐。
    的头像 发表于 03-21 11:45 402次阅读

    Cognizant成立高级人工智能实验室

    近日,全球领先的IT解决方案提供商Cognizant宣布在旧金山成立高级人工智能(AI)实验室。该实验室的成立标志着Cognizant在人工智能领域的进一步深耕,旨在通过前沿技术和创新
    的头像 发表于 03-11 10:36 170次阅读

    上海AI实验室发布新一代书生·视觉大模型

    近日,上海人工智能实验室上海AI实验室)联手多所知名高校及科技公司共同研发出新一代书生·视觉大模型(InternVL)。
    的头像 发表于 02-04 11:25 642次阅读

    大众汽车成立人工智能实验室

    德国汽车制造商大众汽车公司近日宣布,已成立自己的人工智能实验室。这一重要举措凸显了汽车行业在前沿技术应用方面日益增长的雄心。
    的头像 发表于 02-03 16:44 634次阅读

    大众汽车自建人工智能实验室

    德国大众汽车集团(Volkswagen Group)近日宣布,已成立自己的人工智能实验室,旨在成为“全球联网的中心和孵化器”。该实验室的主要任务并非直接应用于量产汽车,而是致力于在全球范围内寻找与
    的头像 发表于 02-02 10:12 252次阅读

    人工智能领域多模态的概念和应用场景

    随着人工智能技术的不断发展,多模态成为了一个备受关注的研究方向。多模态技术旨在将不同类型的数据和信息进行融合,以实现更加准确、高效的人工智能应用。本文将详细介绍多
    的头像 发表于 12-15 14:28 3124次阅读

    ai人工智能机器人

    随着时间的推移,人工智能的发展越来越成熟,智能时代也离人们越来越近,近几年人工智能越来越火爆,人工智能的应用已经开始渗透到各行各业,与生活交融,成为人们无法拒绝,无法失去的一个重要存在
    发表于 09-21 11:09

    《通用人工智能:初心与未来》-试读报告

    作者给出的结论。整体读下来,可以给我们关于通用人工智能全面的了解。作者也反复强调了通用人工智能与专用智能的区别。尤其是人们错误的认为一堆专用智能堆砌起来就是通用
    发表于 09-18 10:02

    2024上海人工智能大会(世亚智博会)定于3月在上海跨国采购会展中心召开

    2024上海人工智能大会(世亚智博会)定于3月在上海跨国采购会展中心召开
    的头像 发表于 08-30 16:41 746次阅读
    2024<b class='flag-5'>上海人工智能</b>大会(世亚智博会)定于3月在<b class='flag-5'>上海</b>跨国采购会展中心召开

    中科创达与北京智源人工智能研究院成立人工智能大模型联合实验室

    中科创达董事长兼CEO赵鸿飞、高级副总裁蔡蓉、副总裁朱红芹与北京智源人工智能研究院理事长张宏江、院长黄铁军、常务副院长曹岗、副院长兼总工程师林咏华等共同出席了联合实验室成立仪式。
    的头像 发表于 07-13 14:39 440次阅读

    大模型标准化专题组成立!中国人工智能领域迈出重要一步

    中国人工智能领域又迎来了一次里程碑式的事件!近日,第六届世界人工智能大会在上海开幕,国家标准委指导的国家人工智能标准化总体组宣布我国首个大模型标准化专题组组长,由
    的头像 发表于 07-10 10:16 279次阅读

    燧原科技加入人工智能开放计算体系-DeepLink,共建AI软硬件生态

    2023年7月7日,燧原科技与上海人工智能实验室合作,基于人工智能开放计算体系-DeepLink共建AI软硬件生态,当前双方的合作主要基于燧原科技已量产的第二代训练产品云燧T20和第二代推理产品
    的头像 发表于 07-07 15:45 272次阅读

    中科创达与亚马逊云科技成立人工智能联合创新实验室

    今日,中科创达与亚马逊云科技人工智能联合创新实验室揭牌仪式在中科创达技术大会暨产品发布会上举行。
    的头像 发表于 05-19 09:42 449次阅读

    必示科技受邀参加上海人工智能大会并分享金融行业AIOps落地经验

    “数智互联,瞰见未来”2023第六届上海人工智能大会近日圆满闭幕,必示科技作为智能运维行业代表企业,受邀出席并分享题为《AI赋能金融运维领域的落地与应用》的主题演讲。 本届上海人工智能大会
    的头像 发表于 05-05 11:41 370次阅读
    必示科技受邀参加<b class='flag-5'>上海人工智能</b>大会并分享金融行业AIOps落地经验