0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大力布局AI大模型,并购光年之外后,美团又入股智谱华章!

Carol Li 来源:电子发烧友网 作者:李弯弯 2023-08-01 00:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)日前,中文认知大模型平台智谱AI关联公司北京智谱华章科技有限公司发生工商变更,股东新增美团旗下天津三快科技有限公司,注册资本由约1480.69万人民币增至约1652.86万人民币。

智谱AI在大模型上的技术积累

智谱AI成立于2019年,由清华大学计算机系知识工程实验室的技术成果转化而来,致力于打造新一代认知智能通用模型。

智谱AI与清华大学知识工程实验室合作研发了双语千亿级超大规模预训练模型GLM-130B,并构建了高精度通用知识图谱,形成数据与知识双轮驱动的认知引擎,基于此模型打造了ChatGLM(chatglm.cn)。此外,智谱AI还推出了认知大模型平台Bigmodel.ai,包括CodeGeeX和CogView等产品,提供智能API服务,链接物理世界的亿级用户、赋能元宇宙数字人、成为具身机器人的基座。

GLM-130B于2022年8月正式上线。据公开资料显示,在准确性等关键指标与OpenAI、谷歌大脑和Meta等公司的大模型对比中,GLM表现依然出色,在MMLU、LAMBADA、BIG-bench-lite指标测试上,甚至超过了GPT-3和Meta的OPT大模型。

GLM-130B支持中英双语,在多个公开评测集上性能超过GPT-3。同时该模型还支持英伟达、华为昇腾、海光DCU以及神威超算等多种芯片,支持快速推理,通过量化仅需4张英伟达RTX3090就可以运行千亿模型,实现真正的大模型普惠。

2023年3月,智谱AI开源了GLM系列模型的新成员——中英双语对话模型ChatGLM-6B,支持在单张消费级显卡上进行推理使用。

这是继此前开源GLM-130B千亿基座模型之后,智谱AI再次推出大模型方向的研究成果。与此同时,基于千亿基座模型的ChatGLM也同期推出,初具问答和对话功能。

ChatGLM-6B 模型基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。ChatGLM-6B 使用了和 ChatGLM 相同的技术,针对中文问答和对话进行了优化。

据悉,经过约1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62亿参数的ChatGLM-6B 虽然规模不及千亿模型,但大大降低了推理成本,提升了效率,并且已经能生成相当符合人类偏好的回答。

美团在大模型领域的大力布局

在投资入股智谱AI之前,今年6月,美团宣布以总价2.85亿美元(约合20.65亿元)收购了创立仅四个月、美团联合创始人王慧文成立的大模型公司光年之外。

对于此次并购,美团表示,光年之外是中国领先的AGI创新者,其目前的管理与技术团队具有开发深度学习框架的高水平经验。公司通过收购事项可以获得领先的AGI技术及人才,有机会加强其于快速增长的人工智能行业中的竞争力。

光年之外虽然成立时间不长,却在两个月时间便完成了以产品和技术人才为主的团队搭建,吸引了多名人工智能领域顶级专家和创业者的加入,包括有着“搜狗输入法之父”之称的马占凯、北京智源人工智能研究院副院长刘江、曾任微软亚洲研究院主管研究员的袁进辉等。业界人士认为,这些人才过渡到美团,如果能把价值发挥出来,将会创造出无限可能。

此次投资入股智谱AI,也足以看出美团大模型领域的发展极其看好。目前,美团投资架构主要包括美团战投,以及2017年成立的私募股权基金美团龙珠,前身是“美团点评产业基金”。美团龙珠,主要专注于消费与科技方向布局。

美团龙珠创始合伙人朱拥华表示,从今年的维度来看,内部认为AI会有可能影响一切,尤其大模型的影响是方方面面的。他预计2025-2030年期间,所有行业都会因为AI有巨大的调整。他强调,“这个时代的脚步大家要抓住。”

智谱AI在知识智能方有着深厚的技术积累,在人才方面,智谱AI汇聚了顶尖技术研发团队和资深顾问。核心团队中,CEO张鹏毕业于清华计算机系,董事长刘德兵系中国工程院高文院士弟子,总裁王绍兰为清华创新领军博士。

在应用上,智谱AI打造的认知大模型平台以及数字人和科技情报产品,已经在中国科协、北京市科委、华为、腾讯等1000余家企事业单位得到引用。同时,智谱AI已与北京中医药大学东方医院共同开发了数字中医大模型。

据相关负责人介绍,数字中医大模型目前已完成千余本中医古籍书籍、中西医教材、期刊、医案、诊疗信息等数据的收集与加工,人们可以在“中医小助手”线上平台,初步体验基于大模型能力所实现的根据症状描述生成处方、中医中药知识问答等功能。

小结

先是并购大模型相关企业光年之外,后是投资入股人才技术兼备的AI大模型研发商智谱华章,足见美团对大模型未来发展的极度看好。经过大半年时间的发展,如今大模型已经进入应用落地探索期,美团未来在其中能够取得怎样的成绩,越来越值得期待了。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38303

    浏览量

    297406
  • AI大模型
    +关注

    关注

    0

    文章

    395

    浏览量

    955
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    千亿并购案敲定!全球并购狂潮下AI成焦点,模拟企业抱团

    元/股。   此次交易不仅是A股首例“子吞母”式并购案例,也是国内AI芯片领域最大规模并购交易之一。这起标志性事件,将成为2025年全球半导体并购浪潮中的最新注脚。   今年以来,国际
    的头像 发表于 06-11 00:14 8142次阅读
    千亿<b class='flag-5'>并购</b>案敲定!全球<b class='flag-5'>并购</b>狂潮下<b class='flag-5'>AI</b>成焦点,模拟企业抱团

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    千方科技AI+交通应用获海外代表认可

    近日,由商务部主办、工信部中小企业发展促进中心承办的“上合组织人工智能发展研修班”、“秘鲁智慧城市研修班”代表相继到访千方科技参观调研。从搭载最新AI算法的智能摄像单元,到大模型赋能交通行业细分领域的落地实践,千方科技在
    的头像 发表于 08-13 13:46 821次阅读

    华为CANN与智GLM端侧模型完成适配

    已于7月28日正式开源其新一代基座模型GLM-4.5,其GLM端侧模型已完成与CANN的适配。这标志着国产大模型与计算架构在端云协同方向实现关键突破,国产AI生态正加速迈入深度融合阶段
    的头像 发表于 08-11 11:00 2256次阅读

    Cognizant加速AI模型企业级开发

    全球最先进的AI/机器学习模型 新泽西州蒂内克2025年7月31日 /通社/ -- Cognizant(纳斯达克股票代码:CTSH)今日宣布推出AI Training Data Se
    的头像 发表于 07-31 17:25 603次阅读

    云知声荣登甲子光年2025中国AI产业逐浪者榜单

    近日,由甲子光年主办的「AI共潮生·2025甲子引力X科技产业新风向」在上海工业智能中心成功举办。云知声凭借山海大模型的领先技术实力与多领域产业落地成果,荣耀入选【星辰100】2025中国AI
    的头像 发表于 05-26 14:13 636次阅读

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    AI的演进正在逼近“终端智能涌现”的拐点,从通用模型向场景落地迁移成为关键议题。联发科以“AI随芯,应用无界”为主题召开天玑开发者大会2025(MDDC 2025),不仅聚合了全球生态资源,还
    发表于 04-13 19:52

    AI模型端侧部署正当时:移远端侧AI模型解决方案,激活场景智能新范式

    AI技术飞速发展的当下,AI模型的应用正从云端向端侧加速渗透。作为全球领先的物联网整体解决方案供应商,移远通信凭借深厚的技术积累与前瞻性的战略布局,在
    的头像 发表于 03-26 19:05 1036次阅读
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>端侧部署正当时:移远端侧<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>解决方案,激活场景智能新范式

    中科视语入选甲子光年《2025 中国AI Agent行业研究报告》

    告旨在挖掘AI智能体领域的创新典范与行业标杆,中科视语坤川智能体应用平台的入选标志着其在AIAgent技术研发与商业化落地方面的综合实力获得高度认可。大模型点燃智
    的头像 发表于 03-13 16:24 938次阅读
    中科视语入选甲子<b class='flag-5'>光年</b>《2025 中国<b class='flag-5'>AI</b> Agent行业研究报告》

    训练好的ai模型导入cubemx不成功怎么处理?

    训练好的ai模型导入cubemx不成功咋办,试了好几个模型压缩了也不行,ram占用过大,有无解决方案?
    发表于 03-11 07:18

    使用OpenVINO™推理引擎进行推理时,如何更改模型布局

    无法为一系列网络准备输入。 第一个模型的输出在 CHW 布局中,但第二个模型的输入在 NCHW 布局中。
    发表于 03-06 07:21

    鼎捷雅典娜接入DeepSeek大模型,加速 AI 应用创新布局

    鼎捷数智(股票代码:300378)近日宣布,DeepSeek大模型已全面集成至鼎捷IndepthAI智能体平台及鼎捷全线智能应用,标志着鼎捷以“智能+”战略为引领,AI布局再上新台阶。通过接入
    的头像 发表于 02-10 15:18 1055次阅读
    鼎捷雅典娜接入DeepSeek大<b class='flag-5'>模型</b>,加速 <b class='flag-5'>AI</b> 应用创新<b class='flag-5'>布局</b>

    上汽乘用车与达成战略合作

    近日,上汽乘用车与宣布达成了一项重要的战略合作。此次携手,标志着两大行业巨头将共同致力于资源整合与优势互补,旨在进一步挖掘汽车市场的巨大潜力,共同构建一个覆盖全链路的汽车业务生态。 这一战略合作
    的头像 发表于 01-21 15:22 1206次阅读

    GLM-Zero深度推理模型预览版正式上线

    近日,智公司宣布其深度推理模型GLM-Zero的初代版本——GLM-Zero-Preview已正式上线。这款模型是智首个基于扩展强化学习技术训练的推理
    的头像 发表于 01-02 10:55 821次阅读

    清言英特尔酷睿Ultra专享版发布,离线模型玩转AIPC

    近日,国内领先的大模型厂商智谱在智清言的官网发布了智清言英特尔酷睿Ultra专享版,这个版本可以利用英特尔酷睿Ultra处理器提供的澎湃的AI算力,在不联网的情况下就可在PC本地运
    的头像 发表于 12-18 11:52 945次阅读