0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里巴巴、智源研究院、清华大学联合发布全新AI模型,提升AI理解能力

工程师邓生 来源:雷锋网 作者:雷锋网 2021-01-12 17:25 次阅读

1月12日,阿里巴巴、智源研究院、清华大学等联合研究团队发布面向认知的超大规模新型预训练模型“文汇”。该模型不仅能提升AI的理解能力,还可基于常识实现AI创作,未来将应用于文本理解、人机交互、视觉问答等场景。

与传统AI训练需要人工标注数据不同,面向认知的预训练语言模型提供了一种全新的学习思路,即AI首先自动学习大量语言文字和图像数据,记忆和理解其中的信息以及人类语言表述的规律后,再进一步学习专业领域知识,从而让AI同时掌握常识和专业知识。

此次发布的“文汇”是目前国内规模最大的预训练模型,参数量级达113亿,采用阿里自研的统一多种并行策略的高性能分布式框架,使用模型并行、流水并行、数据并行训练进行分布式训练。“文汇”突破了多模态理解与多模态生成两大难题,可轻松理解文本图像信息,并能完成创造性任务。例如,仅需输入诗歌题目、朝代以及作者,“文汇”即可自动生成仿古诗词。目前,“文汇”已支持基于认知推理的多种自然语言及跨模态应用任务,部分应用即将上线。

模型可根据诗歌题目、朝代以及作者自动生成诗歌

达摩院2020十大科技趋势曾提到:AI已经在“听、说、看”等感知智能领域达到或超越了人类水准,但其逻辑推理能力依旧处于初级阶段,多模态预训练模型是实现感知智能向认知智能跨越的关键基础。达摩院智能计算实验室负责人周靖人表示,“预训练语言模型是过去70多年以来最具创新的自然语言模型之一,其模型设计难度也远高于传统模型,达摩院研究团队将持续攻克算法及系统工程难题,加速人工智能走向认知智能。”

作为国内最早投入认知智能研究的科技公司之一,阿里巴巴已有30多个研究成果被国际顶级会议收录,获得世界人工智能大会最高奖项—SAIL奖,与清华大学联合获得国家科学技术进步奖二等奖,旗下图神经网络框架Graph Learn已面向全球开源,可减少模型的算力、存储资源消耗,同时缩短算法开发上线周期。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26424

    浏览量

    264025
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1571

    浏览量

    46432
  • 清华大学
    +关注

    关注

    2

    文章

    64

    浏览量

    17778
  • 理解
    +关注

    关注

    0

    文章

    4

    浏览量

    8002
收藏 人收藏

    评论

    相关推荐

    苹芯科技杨越出席AI模型生态发展论坛,探讨人工智能技术发展

    4月19日,由清华大学校友会等联合主办的清华大学上海校友会AI模型生态发展论坛成功举办。苹芯科技CEO杨越博士受邀参加
    的头像 发表于 04-23 14:26 243次阅读

    腾讯携手清华港科大推出图生视频模型:Follow-Your-Click,实现在线物体追踪

    月 15 日消息,腾讯与清华大学及香港科技大学联合发布新型图生视频模型 “Follow-Your-Click”,已上线 GitHub(代码于四月份公开)并发布相关
    的头像 发表于 03-15 16:24 251次阅读

    阿里巴巴推出全新AI图生视频模型EMO

    近日,阿里巴巴集团智能计算研究院宣布推出了一款革命性的AI图片-音频-视频模型技术——EMO。据官方介绍,EMO是一种先进的音频驱动肖像视频生成框架,能够将静态照片转化为生动逼真的动态
    的头像 发表于 03-05 11:00 572次阅读

    阿里巴巴涨超3% 财报或超预期

    阿里巴巴涨超3% 今日港股开盘后阿里巴巴涨超3%,恒生科技表现也很亮眼。快手、比亚迪电子、联想集团等多股上涨。 阿里巴巴将于2月7日发布2024财年第三季度财报,业界分析会超预期。
    的头像 发表于 02-06 16:05 1213次阅读

    阿里巴巴推出自主多模态AI代理MobileAgent

    阿里巴巴最近推出了一款名为MobileAgent的自主多模态AI代理,这款产品模拟人类操作手机,并采用纯视觉解决方案,无需任何系统代码。
    的头像 发表于 02-04 10:34 505次阅读

    产学研三界顶级大咖分享:RISC-V场景Show暨开源生态高级别论坛定档12/19

    12月19日,RISC-V场景Show暨开源生态高级别论坛即将开幕。本次论坛将邀请来自中科计算技术研究所副所长包云岗、嘉楠科技AI软件总监张晓晶、阿里巴巴达摩
    发表于 12-15 18:36

    2023云栖大会 阿里巴巴要打造AI时代最开放的云

    年的云栖大会为期三天,设有两场主论坛与500多场分论坛,吸引了全球44个国家和地区的8万多名从业者参会。 在开幕式上蔡崇信表示,AI将成为各行各业的新型生产力,并对算力提出更高要求。从底层算力到AI平台再到模型服务,
    的头像 发表于 11-01 17:42 781次阅读

    眸瑞科技与沐曦集成电路联合发布首个AI模型“贴图超分”技术

    近日,长沙眸瑞网络科技有限公司(下称“眸瑞科技”)与沐曦集成电路(上海)有限公司(下称“沐曦”)联合发布首个AI模型“贴图超分”技术。
    发表于 09-06 14:08 253次阅读

    阿里平头哥发布首个 RISC-V AI 软硬全栈平台

    HHB 实现了在典型网络性能比第三方工具平均提升 88%,并增加支持运行 Transformer、TensorFlow、PyTorch 等 170 余个主流框架 AI 模型。 基于此,平头哥
    发表于 08-26 14:14

    70%家长想给孩子普及AI,腾讯科学小会发布内测版“AI编程第一课”

    世界”,荟集科研机构、高等院校、AI业界的科学家,为广大青少年量身定制“AI探索一日之旅”,并启动“AI编程第一课”公益项目内测。 中国科学院科技战略咨询研究院院长潘教峰、
    的头像 发表于 08-22 15:22 402次阅读
    70%家长想给孩子普及<b class='flag-5'>AI</b>,腾讯科学小会<b class='flag-5'>发布</b>内测版“<b class='flag-5'>AI</b>编程第一课”

    清华大学大语言模型综合性能评估报告发布!哪个模型更优秀?

    近日,清华大学新闻与传播学院发布了《大语言模型综合性能评估报告》,该报告对目前市场上的7个大型语言模型进行了全面的综合评估。近年,大语言模型
    的头像 发表于 08-10 08:32 675次阅读
    <b class='flag-5'>清华大学</b>大语言<b class='flag-5'>模型</b>综合性能评估报告<b class='flag-5'>发布</b>!哪个<b class='flag-5'>模型</b>更优秀?

    纵目科技与清华大学共同成立智能辅助驾驶系统联合研究中心

    今日,纵目科技宣布与国内顶尖学府——清华大学共同成立智能辅助驾驶系统联合研究中心(以下简称“联合研究中心”),并在
    的头像 发表于 05-31 09:52 321次阅读
    纵目科技与<b class='flag-5'>清华大学</b>共同成立智能辅助驾驶系统<b class='flag-5'>联合</b><b class='flag-5'>研究</b>中心

    中国开源未来发展峰会“问道 AI 分论坛”即将开幕!

    是致力于推动中国开源事业发展的非营利机构,于 2022 年 12 月 31 日在重庆揭牌,由重庆市政府批复设立,由清华大学,华中科技大学,重庆大学,中冶赛迪,中国信科,中科等知名高校
    发表于 05-09 09:49

    清华大学深圳国际研究生院携手中微电科技联合招收博士后

    清华大学深圳国际研究生院联合深圳中微电科技有限公司成立国产GPU芯片核心技术研发设计课题组,启动联合培养博士后的招收工作。
    的头像 发表于 05-05 15:36 505次阅读
    <b class='flag-5'>清华大学</b>深圳国际<b class='flag-5'>研究</b>生院携手中微电科技<b class='flag-5'>联合</b>招收博士后

    开源鸿蒙OpenHarmony系统已成功用于微纳卫星

    软件研究所、中国科学院微小卫星创新研究院清华大学、大连理工大学、武汉大学、长光卫星、北京爱太空科技、航天创客和
    发表于 04-26 13:59