0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

腾讯公布大语言模型训练新专利

科技绿洲 来源:网络整理 作者:网络整理 2025-02-10 09:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,腾讯科技(深圳)有限公司公布了一项名为“大语言模型的训练方法、装置、计算机设备及存储介质”的新专利。该专利的公布,标志着腾讯在大语言模型训练领域取得了新的突破。

据专利摘要显示,该方法通过在大语言模型的训练过程中引入第一摘要文本和第二摘要文本,为模型提供了更为丰富的学习信息。这两个摘要文本在信息量上存在差异,且第一摘要文本中既包含正确语句也包含错误语句。这一设计使得模型在训练过程中,能够通过对比学习两个不同摘要文本的内容,同时区分并学习第一摘要文本中的正确语句和错误语句。

这一创新性的训练方法,有效避免了由于摘要文本单一而导致的模型过拟合和生成不准确等问题。通过引入更多样化的学习信息,模型能够更好地泛化到新的数据上,从而提高其泛化性能。同时,对正确语句和错误语句的区分学习,也进一步提升了模型的准确性。

腾讯此次公布的新专利,不仅展示了其在人工智能领域的深厚技术积累,也为大语言模型的训练提供了新的思路和方法。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49741

    浏览量

    261549
  • 腾讯
    +关注

    关注

    7

    文章

    1682

    浏览量

    50770
  • 语言模型
    +关注

    关注

    0

    文章

    570

    浏览量

    11255
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    在Ubuntu20.04系统中训练神经网络模型的一些经验

    本帖欲分享在Ubuntu20.04系统中训练神经网络模型的一些经验。我们采用jupyter notebook作为开发IDE,以TensorFlow2为训练框架,目标是训练一个手写数字识
    发表于 10-22 07:03

    3万字长文!深度解析大语言模型LLM原理

    我们正在参加全球电子成就奖的评选,欢迎大家帮我们投票~~~谢谢支持本文转自:腾讯技术工程作者:royceshao大语言模型LLM的精妙之处在于很好地利用数学解决了工业场景的问题,笔者基于过往工程经验
    的头像 发表于 09-02 13:34 3085次阅读
    3万字长文!深度解析大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>LLM原理

    硬件与应用同频共振,英特尔Day 0适配腾讯开源混元大模型

    今日,腾讯正式发布新一代混元开源大语言模型。英特尔凭借在人工智能领域的全栈技术布局,现已在英特尔® 酷睿™ Ultra 平台上完成针对该模型的第零日(Day 0)部署与性能优化。值得一
    的头像 发表于 08-07 14:42 1122次阅读
    硬件与应用同频共振,英特尔Day 0适配<b class='flag-5'>腾讯</b>开源混元大<b class='flag-5'>模型</b>

    请问如何在imx8mplus上部署和运行YOLOv5训练模型

    我正在从事 imx8mplus yocto 项目。我已经在自定义数据集上的 YOLOv5 上训练了对象检测模型。它在 ubuntu 电脑上运行良好。现在我想在我的 imx8mplus 板上运行该模型
    发表于 03-25 07:23

    用PaddleNLP为GPT-2模型制作FineWeb二进制预训练数据集

    作者:算力魔方创始人/英特尔创新大使刘力 《用PaddleNLP在4060单卡上实践大模型训练技术》发布后收到读者热烈反响,很多读者要求进一步讲解更多的技术细节。本文主要针对大语言模型
    的头像 发表于 03-21 18:24 3832次阅读
    用PaddleNLP为GPT-2<b class='flag-5'>模型</b>制作FineWeb二进制预<b class='flag-5'>训练</b>数据集

    训练好的ai模型导入cubemx不成功怎么处理?

    训练好的ai模型导入cubemx不成功咋办,试了好几个模型压缩了也不行,ram占用过大,有无解决方案?
    发表于 03-11 07:18

    小白学大模型训练语言模型的深度指南

    在当今人工智能飞速发展的时代,大型语言模型(LLMs)正以其强大的语言理解和生成能力,改变着我们的生活和工作方式。在最近的一项研究中,科学家们为了深入了解如何高效地训练大型
    的头像 发表于 03-03 11:51 1211次阅读
    小白学大<b class='flag-5'>模型</b>:<b class='flag-5'>训练</b>大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>的深度指南

    华为公布AI模型训练与车辆控制专利

    近日,华为技术有限公司在技术创新领域再次迈出重要一步,其申请的“模型训练方法、车辆的控制方法及相关装置”专利于2月18日正式公布。这一专利
    的头像 发表于 02-20 09:14 729次阅读

    用PaddleNLP在4060单卡上实践大模型训练技术

    作者:算力魔方创始人/英特尔创新大使刘力 之前我们分享了《从零开始训练一个大语言模型需要投资多少钱》,其中高昂的预训练费用让许多对大模型
    的头像 发表于 02-19 16:10 2134次阅读
    用PaddleNLP在4060单卡上实践大<b class='flag-5'>模型</b>预<b class='flag-5'>训练</b>技术

    腾讯元宝AI产品更新,正式接入DeepSeek R1模型

    元、DeepSeek大模型精心开发的AI产品,具备强大的跨知识领域和自然语言理解能力。通过此次更新,腾讯元宝将能够更深入地理解用户的提问,进行深度思考和逻辑推理,从而给出更为详细和准确的回答。 值得一提的是,
    的头像 发表于 02-14 09:29 1332次阅读

    胡瀚接棒腾讯多模态大模型研发

    近日,前微软亚洲研究院视觉计算组的首席研究员胡瀚宣布加入腾讯,这一变动引起了业界的广泛关注。据悉,胡瀚将接替已离职的腾讯混元大模型技术负责人之一的刘威,全面负责腾讯多模态大
    的头像 发表于 01-09 15:49 984次阅读

    语言模型管理的作用

    要充分发挥语言模型的潜力,有效的语言模型管理非常重要。以下,是对语言模型管理作用的分析,由AI部
    的头像 发表于 01-02 11:06 573次阅读

    腾讯混元大模型开源成绩斐然,GitHub Star数近1.4万

    内外部技术的开源共享,旨在促进技术创新与生态发展。 据悉,腾讯混元大模型已经在多个模态上实现了开源,包括语言模型、文生图大模型、文生3D大
    的头像 发表于 12-26 10:30 1057次阅读

    GPU是如何训练AI大模型

    在AI模型训练过程中,大量的计算工作集中在矩阵乘法、向量加法和激活函数等运算上。这些运算正是GPU所擅长的。接下来,AI部落小编带您了解GPU是如何训练AI大模型的。
    的头像 发表于 12-19 17:54 1325次阅读

    AI大语言模型开发步骤

    开发一个高效、准确的大语言模型是一个复杂且多阶段的过程,涉及数据收集与预处理、模型架构设计、训练与优化、评估与调试等多个环节。接下来,AI部落小编为大家详细阐述AI大
    的头像 发表于 12-19 11:29 1221次阅读