0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里巴巴、智源研究院、清华大学联合发布全新AI模型,提升AI理解能力

工程师邓生 来源:雷锋网 作者:雷锋网 2021-01-12 17:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1月12日,阿里巴巴、智源研究院、清华大学等联合研究团队发布面向认知的超大规模新型预训练模型“文汇”。该模型不仅能提升AI的理解能力,还可基于常识实现AI创作,未来将应用于文本理解、人机交互、视觉问答等场景。

与传统AI训练需要人工标注数据不同,面向认知的预训练语言模型提供了一种全新的学习思路,即AI首先自动学习大量语言文字和图像数据,记忆和理解其中的信息以及人类语言表述的规律后,再进一步学习专业领域知识,从而让AI同时掌握常识和专业知识。

此次发布的“文汇”是目前国内规模最大的预训练模型,参数量级达113亿,采用阿里自研的统一多种并行策略的高性能分布式框架,使用模型并行、流水并行、数据并行训练进行分布式训练。“文汇”突破了多模态理解与多模态生成两大难题,可轻松理解文本图像信息,并能完成创造性任务。例如,仅需输入诗歌题目、朝代以及作者,“文汇”即可自动生成仿古诗词。目前,“文汇”已支持基于认知推理的多种自然语言及跨模态应用任务,部分应用即将上线。

模型可根据诗歌题目、朝代以及作者自动生成诗歌

达摩院2020十大科技趋势曾提到:AI已经在“听、说、看”等感知智能领域达到或超越了人类水准,但其逻辑推理能力依旧处于初级阶段,多模态预训练模型是实现感知智能向认知智能跨越的关键基础。达摩院智能计算实验室负责人周靖人表示,“预训练语言模型是过去70多年以来最具创新的自然语言模型之一,其模型设计难度也远高于传统模型,达摩院研究团队将持续攻克算法及系统工程难题,加速人工智能走向认知智能。”

作为国内最早投入认知智能研究的科技公司之一,阿里巴巴已有30多个研究成果被国际顶级会议收录,获得世界人工智能大会最高奖项—SAIL奖,与清华大学联合获得国家科学技术进步奖二等奖,旗下图神经网络框架Graph Learn已面向全球开源,可减少模型的算力、存储资源消耗,同时缩短算法开发上线周期。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41976

    浏览量

    303074
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1653

    浏览量

    49378
  • 清华大学
    +关注

    关注

    2

    文章

    74

    浏览量

    18431
  • 理解
    +关注

    关注

    0

    文章

    4

    浏览量

    8144
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    北京大学阿里巴巴达摩合作研究成果荣登国际顶级学术期刊自然

    昨天,国际顶级学术期刊《自然》(Nature)发表了北京大学阿里巴巴达摩的合作研究成果,利用AI和开源卫星影像绘制出首张全国尺度高精度风
    的头像 发表于 05-22 16:12 370次阅读

    阿里巴巴正式发布全新一代千问旗舰模型Qwen3.7-Max

    5月20日,阿里巴巴正式发布全新一代千问旗舰模型Qwen3.7-Max。这款面向智能体时代全面设计的大模型,在三方机构Arena全球大
    的头像 发表于 05-21 09:10 662次阅读

    阿里巴巴发布2026财年Q4及全年财报

    近日,阿里巴巴集团正式发布2026财年第四季度及全年财报,交出了一份"基本盘稳健、AI引擎加速"的年度答卷。
    的头像 发表于 05-14 10:21 638次阅读

    阿里巴巴达摩发布新一代旗舰CPU产品玄铁C950

    3月24日,阿里巴巴达摩主办的2026玄铁RISC-V生态大会在上海举行。
    的头像 发表于 03-25 14:03 597次阅读

    《大模型工具大全》:一次看遍各个领域的AI利器

    近日,由北京航空航天大学人文与社会科学高等研究院联合清华大学新闻与传播学院、人工智能学院双聘教授新媒沈阳团队核心成员何静副教授主导编写的科普报告《大
    的头像 发表于 03-11 14:43 463次阅读
    《大<b class='flag-5'>模型</b>工具大全》:一次看遍各个领域的<b class='flag-5'>AI</b>利器

    沐曦股份联合清华大学发布磁性材料AI原子基座模型

    2月27日,沐曦股份联合清华大学等多家研究机构联合发布了磁性材料AI原子基座模型。该
    的头像 发表于 03-03 15:25 678次阅读
    沐曦股份<b class='flag-5'>联合</b><b class='flag-5'>清华大学</b><b class='flag-5'>发布</b>磁性材料<b class='flag-5'>AI</b>原子基座<b class='flag-5'>模型</b>

    清华大学深圳国际研究生院:研发“鸽眼”传感器,让机器人感知逼近人类!

    重要性日益凸显。然而,当前机器人的触觉系统在感知维度、分辨率和信号理解能力上仍远逊于人类,难以支撑复杂、动态的真实场景任务。 近日,清华大学深圳国际研究生院丁文伯团队联合多所
    的头像 发表于 01-20 16:09 1062次阅读
    <b class='flag-5'>清华大学</b>深圳国际<b class='flag-5'>研究生院</b>:研发“鸽眼”传感器,让机器人感知逼近人类!

    清华大学“启·创”计划走进拓维信息,校企共探AI时代产学研合作新范式

    1月13日,清华大学“启·创”计划第十三期赴湘社会实践活动暨TalkwebHouse创业私董会第二期在拓维信息圆满举办。清华大学创业团队20余名师生,与拓维信息团队深入对话,围绕“AI+”产业融合
    的头像 发表于 01-16 14:04 764次阅读
    <b class='flag-5'>清华大学</b>“启·创”计划走进拓维信息,校企共探<b class='flag-5'>AI</b>时代产学研合作新范式

    华为联合发布工业与AI融合应用指南

    11月20日,华为、中国信通清华大学人工智能研究院、罗兰贝格管理咨询公司联合编写的《工业与AI融合应用指南》(以下简称《指南》)全文
    的头像 发表于 11-25 15:37 883次阅读

    芯盾时代荣登AI100应用标杆榜单

    11月16日,由国家高新区人工智能产业协同创新网络、中央广播电视总台《赢在AI+》节目组、清华大学可持续社会价值研究院、中国人民大学交叉科学研究院
    的头像 发表于 11-19 18:03 1934次阅读
    芯盾时代荣登<b class='flag-5'>AI</b>100应用标杆榜单

    凌思微联合主办两场BMC技术盛会圆满成功

    发展研究中心、清华大学集成电路学院等联合发起单位支持下,于杭州湾智慧谷圆满举行,杭州市科技局、萧山区科技局相关领导及阿里云、高校专家出席。
    的头像 发表于 10-16 10:21 1555次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    和探索;人类级别的理解能力;常识推理;现实世界的知识整合。 3、测试时计算 测试时计算(TTC)是指在模型推理阶段利用额外的计算资源来提升泛化性能。 4、具身智能与渗透式AI 1)具身
    发表于 09-18 15:31

    华为联合发布AI CITY城市智能体前瞻研究报告

    在第十一届中国国际大数据产业博览会“数字政府”交流活动上,国家数据发展研究院携手华为技术有限公司(以下简称“华为”)联合发布AI CITY城市智能体前瞻研究报告》,旨在探索人工智能新
    的头像 发表于 09-01 10:37 1452次阅读

    全球首个胃癌影像筛查AI模型发布

    浙江省肿瘤医院联合阿里巴巴达摩发布了全球首个胃癌影像筛查AI模型DAMO GRAPE,首次利
    的头像 发表于 06-30 14:37 4046次阅读

    导远科技与清华大学无锡应用技术研究院达成合作

    近日,导远科技与清华大学无锡应用技术研究院(以下简称:研究院)达成合作。导远科技将提供高精度定位产品及解决方案,以支持研究院在L4级自动驾驶和人形机器人领域的技术研发及转化落地。
    的头像 发表于 06-12 16:34 1305次阅读