0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里巴巴、智源研究院、清华大学联合发布全新AI模型,提升AI理解能力

工程师邓生 来源:雷锋网 作者:雷锋网 2021-01-12 17:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1月12日,阿里巴巴、智源研究院、清华大学等联合研究团队发布面向认知的超大规模新型预训练模型“文汇”。该模型不仅能提升AI的理解能力,还可基于常识实现AI创作,未来将应用于文本理解、人机交互、视觉问答等场景。

与传统AI训练需要人工标注数据不同,面向认知的预训练语言模型提供了一种全新的学习思路,即AI首先自动学习大量语言文字和图像数据,记忆和理解其中的信息以及人类语言表述的规律后,再进一步学习专业领域知识,从而让AI同时掌握常识和专业知识。

此次发布的“文汇”是目前国内规模最大的预训练模型,参数量级达113亿,采用阿里自研的统一多种并行策略的高性能分布式框架,使用模型并行、流水并行、数据并行训练进行分布式训练。“文汇”突破了多模态理解与多模态生成两大难题,可轻松理解文本图像信息,并能完成创造性任务。例如,仅需输入诗歌题目、朝代以及作者,“文汇”即可自动生成仿古诗词。目前,“文汇”已支持基于认知推理的多种自然语言及跨模态应用任务,部分应用即将上线。

模型可根据诗歌题目、朝代以及作者自动生成诗歌

达摩院2020十大科技趋势曾提到:AI已经在“听、说、看”等感知智能领域达到或超越了人类水准,但其逻辑推理能力依旧处于初级阶段,多模态预训练模型是实现感知智能向认知智能跨越的关键基础。达摩院智能计算实验室负责人周靖人表示,“预训练语言模型是过去70多年以来最具创新的自然语言模型之一,其模型设计难度也远高于传统模型,达摩院研究团队将持续攻克算法及系统工程难题,加速人工智能走向认知智能。”

作为国内最早投入认知智能研究的科技公司之一,阿里巴巴已有30多个研究成果被国际顶级会议收录,获得世界人工智能大会最高奖项—SAIL奖,与清华大学联合获得国家科学技术进步奖二等奖,旗下图神经网络框架Graph Learn已面向全球开源,可减少模型的算力、存储资源消耗,同时缩短算法开发上线周期。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296493
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1645

    浏览量

    48928
  • 清华大学
    +关注

    关注

    2

    文章

    72

    浏览量

    18351
  • 理解
    +关注

    关注

    0

    文章

    4

    浏览量

    8121
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为联合发布工业与AI融合应用指南

    11月20日,华为、中国信通清华大学人工智能研究院、罗兰贝格管理咨询公司联合编写的《工业与AI融合应用指南》(以下简称《指南》)全文
    的头像 发表于 11-25 15:37 311次阅读

    凌思微联合主办两场BMC技术盛会圆满成功

    发展研究中心、清华大学集成电路学院等联合发起单位支持下,于杭州湾智慧谷圆满举行,杭州市科技局、萧山区科技局相关领导及阿里云、高校专家出席。
    的头像 发表于 10-16 10:21 584次阅读

    华为联合发布AI CITY城市智能体前瞻研究报告

    在第十一届中国国际大数据产业博览会“数字政府”交流活动上,国家数据发展研究院携手华为技术有限公司(以下简称“华为”)联合发布AI CITY城市智能体前瞻研究报告》,旨在探索人工智能新
    的头像 发表于 09-01 10:37 1003次阅读

    全球首个胃癌影像筛查AI模型发布

    浙江省肿瘤医院联合阿里巴巴达摩发布了全球首个胃癌影像筛查AI模型DAMO GRAPE,首次利
    的头像 发表于 06-30 14:37 3663次阅读

    导远科技与清华大学无锡应用技术研究院达成合作

    近日,导远科技与清华大学无锡应用技术研究院(以下简称:研究院)达成合作。导远科技将提供高精度定位产品及解决方案,以支持研究院在L4级自动驾驶和人形机器人领域的技术研发及转化落地。
    的头像 发表于 06-12 16:34 800次阅读

    2025年开放原子校清华大学站成功举办

    近日,由开放原子开源基金会、清华大学计算机科学与技术系、清华大学软件学院主办的开放原子“校行”(清华站)在清华大学成功举办。
    的头像 发表于 04-22 16:46 756次阅读

    普华基础软件莅临阿里巴巴达摩调研交流

    近日, 普华基础软件股份有限公司(以下简称普华基础软件)董事、总经理刘宏倩一行前往阿里巴巴达摩(杭州)科技有限公司(以下简称达摩)调研交流,阿里巴巴集团高层及达摩
    的头像 发表于 04-08 10:10 948次阅读

    清华大学与华为启动“卓越中心”专项合作

    、中国工程院士郑纬民教授、清华大学计算机系主任尹霞教授、清华大学科研副院长李水清教授,以及华为常务董事汪涛、华为北京研究所所长姜向中、华
    的头像 发表于 02-18 14:11 1060次阅读

    清华大学发布:DeepSeek从入门到精通

    《DeepSeek:从入门到精通》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后团队精心撰写的一份专业文档。该文档篇幅长达104页,文档的核心内容围绕DeepSeek的技术
    的头像 发表于 02-14 09:49 1.2w次阅读
    <b class='flag-5'>清华大学</b><b class='flag-5'>发布</b>:DeepSeek从入门到精通

    阿里巴巴Qwen大模型助力开发低成本DeepSeek替代方案

    近日,阿里巴巴的开源Qwen2.5模型AI领域再次展现其强大实力,为斯坦福大学与伯克利大学研究
    的头像 发表于 02-12 13:42 1258次阅读

    Qwen大模型助力开发低成本AI推理方案

    阿里巴巴的开源Qwen2.5模型近期在AI领域引发了广泛关注。这一大模型的推出,为斯坦福大学与伯克利大学
    的头像 发表于 02-12 09:19 980次阅读

    清华大学未央书院一行到访光峰科技参观交流

    近日,清华大学未央书院“机动万里”实践支队到访光峰科技进行参观交流,期间与光峰研究院的研发成员就激光光学应用的创新与发展,进行交流互动。
    的头像 发表于 01-16 10:41 791次阅读

    浪潮信息与智研究院携手共建大模型多元算力生态

    近日,浪潮信息与北京智人工智能研究院正式签署战略合作协议,双方将紧密合作,共同构建大模型多元算力开源创新生态。 此次合作旨在提升模型创新
    的头像 发表于 12-31 11:49 872次阅读

    看点:阿里发布模型报告 苹果股价连续四日再创新高 传阿里巴巴与韩国易买得合并

    给大家带来一些行业资讯: 阿里发布模型报告 日前阿里巴巴集团携手中国电子技术标准化研究院联合发布
    的头像 发表于 12-27 16:04 1078次阅读

    安谋科技与智研究院达成战略合作,共建开源AI“芯”生态

    12月25日,安谋科技(中国)有限公司(以下简称“安谋科技”)与北京智人工智能研究院(以下简称“智研究院”)正式签署战略合作协议,双方将面向多元
    发表于 12-26 17:06 627次阅读
    安谋科技与智<b class='flag-5'>源</b><b class='flag-5'>研究院</b>达成战略合作,共建开源<b class='flag-5'>AI</b>“芯”生态