书生・浦语 2.0（InternLM2）大语言模型开源

1 月 17 日，书生・浦语 2.0（InternLM2）发布会暨书生・浦源大模型挑战赛启动仪式在上海举行。上海人工智能实验室、商汤科技联合香港中文大学和复旦大学共同发布了新一代大语言模型书生・浦语 2.0（InternLM2）。

这个模型在 2.6 万亿 token 的高质量语料基础上进行训练，包含 7B 和 20B 两种参数规格以及基座、对话等版本，以满足不同复杂应用场景的需求。上海 AI 实验室秉持“以高质量开源赋能创新”的理念，为 InternLM2 提供免费商用授权。

InternLM2 的核心理念在于回归语言建模的本质，通过提高语料质量和信息密度，提升模型基座的语言建模能力。它在数理、代码、对话、创作等方面都有显著进步，综合性能达到同量级开源模型的领先水平。它支持 200K token 的上下文，一次性接收并处理约 30 万汉字的输入内容，准确提取关键信息，实现长文本中的精准筛选。

在评测中，研究人员定义了语言、知识、推理、数学、代码、考试等六个能力维度，并在 55 个主流评测集上对多个同量级模型进行了综合评测。结果显示，InternLM2 的轻量级（7B）及中量级（20B）版本在同量级模型中表现优异。与初代 InternLM 相比，InternLM2 在各项能力上都有显著提升，特别是在推理、数学和代码方面。

审核编辑：黄飞

阅读全文

人工智能(229987) 人工智能(229987)
商汤科技(35825) 商汤科技(35825)
大模型(810) 大模型(810)

会写代码的AI开源了

和 CodeParrot。尽管 Codex 本身不是开源的，但我们发现，针对自然语言建模，现有的开源模型确实在某些编程语言中取得

2022-08-16 15:46:16

1907

如何利用Transformers了解视觉语言模型

将模型称为 “视觉语言” 模型是什么意思？一个结合了视觉和语言模态的模型？但这到底是什么意思呢？

2023-03-03 09:49:37

665

“悟道3.0”系列大模型全面开源，有助于AI应用普及！

新阶段，此次发布的一系列成果包括“悟道·天鹰”（Aquila）语言大模型系列、天秤（FlagEval）开源大模型评测体系与开放平台、“悟道 · 视界”视觉大模型系列，以及一系列多模态模型成果。悟道3.0 全面开源意味着什么悟道·天鹰语言大模型是首

2023-06-14 00:06:00

1457

2023年科技圈热词“大语言模型”，与自然语言处理有何关系

电子发烧友网报道（文/李弯弯）大语言模型（LLM）是基于海量文本数据训练的深度学习模型。它不仅能够生成自然语言文本，还能够深入理解文本含义，处理各种自然语言任务，如文本摘要、问答、翻译

2024-01-02 09:28:33

1267

开源图形语言

有没有开源的Labview（类似的图形语言），而且跨平台的？？？

2013-11-03 10:40:36

开源技术平台介绍

操作性，各种设备都可以直接相互查找、连接和通信，而无需借助中间服务器。- 许可协议：Apache2.0、BSD- 开发语言：C，C ++，OBJ-C，Java- 系统平...

2021-08-20 07:21:00

C语言开源项目

值得学习的C语言开源项目- 1. WebbenchWebbench是一个在linux下使用的非常简单的网站压测工具。它使用fork()模拟多个客户端同时访问我们设定的URL，测试网站在压力下工

2021-08-20 06:15:10

FM语训系统集中管理柜的重要性

在聋儿语言康复训练机构、学校中FM无线调频系统目前被广泛运用，但是也存在一些问题需要注意：1、聋儿语言康复训练机构是以班级为单位，每个学生的助听器、人工耳蜗的防潮保管问题日渐突出。2、每个学生

2017-08-15 14:29:30

FM无线调频语训系统对聋儿康复有什么作用？

。1991年美国言语-语言和听力协会建议对听障婴儿使用FM装置以直接促进其语言发育。随着经济条件的改善和中国***的重视，越来越多的中国聋儿开始使用FM 无线调频语训设备，并从中获益。在使用FM无线调频

2017-07-26 14:07:07

Github开源的数字手势识别CNN模型简析

2.概述一个简单的AI开发sampleGithub开源的数字手势识别CNN模型，识别数字0-10十一种手势类LeNet-5，两个卷积层，两个池化层，一个全连接层，一个Softmax输出层3.RKNN

2022-04-02 15:22:11

Harmony的图形示例，启动默认显示语言切换方法

大家好：Harmony的下列安装目录中有一个aria_._.ion天气预报示例，位于以下位置：Harmonyv2_06appsgfxaria_._forecast这是三国语言的一个示例。它可以用英语、简体中文和西班牙语提供。原来它是英语当它被打开。如何更改启动到西班牙语的默认语言？谢谢您。

2020-03-24 07:48:46

OpenHarmony开源硬件分享会-OH2.0升级子系统直播课件

`OpenHarmony开源硬件分享会-OH2.0升级子系统直播课件`

2021-06-23 14:32:13

SUSE Euler Linux 2.0 通过欧拉开源社区 OSV 产品兼容性认证

近日，SUSE Euler Linux 2.0 通过了欧拉开源社区的技术测评，完全符合其针对 OSV 的产品兼容性认证，本次认证同时涵盖 x86 和 arm64 两种架构。这表明，SUSE

2022-08-10 11:09:08

openDACS第一批开源EDA核心贡献者名单、openDACS V2.0版本在CCF Chip2022正式发布

openDACS v2.0-EDA开源论坛在2022年7月30日于南京CCF Chip2022正式举行。openDACS工委会主任李华伟老师公布了论坛议程：一、 openDACS工作委员会隆重发布了

2022-08-15 14:11:17

【书籍评测活动NO.30】大规模语言模型：从理论到实践

;gt;社区活动专版标题名称必须包含【大规模语言模型：从理论到实践】+自拟标题注意事项 1、活动期间如有作弊、灌水等违反电子发烧友论坛规则的行为一经发现将立即取消获奖资格 2、活动结束后获奖

2024-03-11 15:16:39

【书籍评测活动NO.31】大语言模型：原理与工程实践

深远影响，尤其在优化业务流程和重塑组织结构方面。然而，在研究和实践过程中，我们遇到了一个主要挑战：市场上缺乏大语言模型在实际应用方面的资料。现有的资料多聚焦于理论研究，而具体的实践方法多被保密，难以获得

2024-03-18 15:49:46

中科院微电子汪令飞：介绍openDACS器件模型&抽取提取SIG，发布开源薄膜晶体管模型v1.0

器件模型&参数提取SIG组长，介绍了SIG总体情况，包括四个方面内容：SIG研究方向介绍技术趋势和相关业界产品开源目标与计划开源版本发布最后代表中国科学院微电子研究所，发布

2022-07-06 09:57:44

关于labview输入越南语乱码

请问有没有大佬知道labview支不支持越南语语言啊，我开了unicode输入越南语还是会乱码，可以显示出越南语但是输入到具体结构里面就会乱码。请问有大佬知道怎么解决吗

2022-09-27 15:57:29

关于自然语言处理之54 语言模型(自适应)

自然语言处理——54 语言模型(自适应)

2020-04-09 08:20:30

多国语言手机输入法及字库（MTK 07/08系列、ULC2等多种平台）

提供多国语言手机输入法及字库（MTK 07/08系列、ULC2等多种平台）专业提供多国语言输入法及字库，可用于MTK（07A/07B/08A/08B)系列、ULC2等多种手机平台。产品包括：韩语

2009-06-04 09:32:46

多国语言手机输入法及字库（MTK 07/08系列、ULC2等多种平台）

2009-06-04 09:33:26

嵌入软件静态解析工具

检查功能，Code Metrics计测功能适用于掌握以往程序的内容，审阅会议时评估程序等，有利于改善软件质量的工具产品概要 CasePlayer2是通过解析ANSI C语言，C++，嵌入式C语言（非

2023-08-02 11:51:36

恩智浦最新的应用处理器 i.MX 95采用专有NPU IP进行片上AI加速

Mali GPU，以及恩智浦专用的2-TOPS Neutron NPU 和一个内部开发的图像信号处理器 (ISP)。 ISP处理相机接口和图像预处理，包括高动态范围 (HDR)、降噪和边缘增强等任务

2023-02-16 11:20:03

提供多国语言手机输入法及字库（适用于MTK、ULC2等多种平台）

  专业提供多国语言输入法及字库，可用于MTK、ULC2等多种手机平台。产品包括：韩语、印度语、乌尔都语、孟加拉语、哈萨克语、阿拉伯语、波斯语、俄语、泰语、越南语

2009-05-18 11:29:00

现有多国语言手机输入法及字库（MTK 07/08系列、ULC2等多种平台）

2009-06-04 09:33:57

自然语言处理的语言模型

自然语言处理——53 语言模型（数据平滑）

2020-04-16 11:11:25

阿里开源自研语音识别模型DFSMN使用技巧指南

重磅！阿里开源自研语音识别模型DFSMN，准确率高达9604%

2019-09-16 06:53:06

C语言2.0

C语言2.0

2006-04-08 02:04:16

模型动力电学实验室2.0

模型动力电学实验室2.0

2006-04-10 21:36:53

唇语识别中的话题相关语言模型研究_王渊

2017-03-19 11:28:16

自然语言处理常用模型解析

自然语言处理常用模型使用方法一、N元模型二、马尔可夫模型以及隐马尔可夫模型及目前常用的自然语言处理开源项目/开发包有哪些？

2017-12-28 15:42:30

5382

Bird 2.0空中机器人开源系统

本文档内容介绍了Bird 2.0空中机器人开源系统。

2018-01-22 16:46:12

专家解读GPT 2.0 VS BERT!GPT 2.0到底做了什么

在谈GPT 2.0之前，先回顾下它哥GPT 1.0，这个之前我在介绍Bert模型的时候介绍过，过程参考上图，简述如下：GPT 1.0采取预训练+FineTuning两个阶段，它采取

2019-02-18 09:56:20

9668

初步认识鸿蒙系统2.0版本及其开源路线

华为鸿蒙操作系统（Harmony OS 2.0）已于2020年9月10日在华为开发者大会上正式发布和对外开源了，这意味着开发者可以拿到Harmony OS 2.0的源代码了。虽然已经离开源发布有整整

2020-10-26 14:23:43

5809

华为openharmony 2.0

华为openharmony 2.0 华为openharmony 2.0，今日在深圳·国际开源谷召开定向共建邀请会，预计五月下旬正式开源 2021年5月16日，开放原子开源基金会(以下简称“基金会

2021-06-21 20:10:37

1022

华为OpenHarmony 2.0开源的亮点

OpenHarmony 2.0 Canary代码托管平台已经上线 gitee 开源，OpenHarmony是华为自主研发、不兼容安卓的全领域下一代开源操作系统。开放原子开源基金会（以下简称“基金会

2021-06-22 09:58:51

2010

一种基于乱序语言模型的预训练模型-PERT

由于乱序语言模型不使用[MASK]标记，减轻了预训练任务与微调任务之间的gap，并由于预测空间大小为输入序列长度，使得计算效率高于掩码语言模型。PERT模型结构与BERT模型一致，因此在下游预训练时，不需要修改原始BERT模型的任何代码与脚本。

2022-05-10 15:01:27

1173

外置BFO V2.0通孔版开源分享

电子发烧友网站提供《外置BFO V2.0通孔版开源分享.zip》资料免费下载

2022-07-25 09:21:28

HHKB Lite 2 Teensy 2.0控制器开源

电子发烧友网站提供《HHKB Lite 2 Teensy 2.0控制器开源.zip》资料免费下载

2022-07-28 11:53:13

模型铁路动画的DCC解码开源分享

电子发烧友网站提供《模型铁路动画的DCC解码开源分享.zip》资料免费下载

2022-08-08 09:26:00

DIY PCB BassWasp HAT 2.0开源分享

电子发烧友网站提供《DIY PCB BassWasp HAT 2.0开源分享.zip》资料免费下载

2022-08-22 14:23:52

NVIDIA NeMo最新语言模型服务帮助开发者定制大规模语言模型

NVIDIA NeMo 大型语言模型（LLM）服务帮助开发者定制大规模语言模型；NVIDIA BioNeMo 服务帮助研究人员生成和预测分子、蛋白质及 DNA

2022-09-22 10:42:29

742

编辑机器人2.0开源分享

电子发烧友网站提供《编辑机器人2.0开源分享.zip》资料免费下载

2022-10-20 14:21:00

监测植物的压力2.0开源分享

电子发烧友网站提供《监测植物的压力2.0开源分享.zip》资料免费下载

2022-11-02 11:06:15

物联网家庭安全模型开源分享

电子发烧友网站提供《物联网家庭安全模型开源分享.zip》资料免费下载

2022-11-10 09:55:01

REEE机器v2.0开源分享

电子发烧友网站提供《REEE机器v2.0开源分享.zip》资料免费下载

2022-11-10 11:21:57

人类跟随机器人v2.0开源分享

电子发烧友网站提供《人类跟随机器人v2.0开源分享.zip》资料免费下载

2022-11-11 14:21:45

AI大模型开源之困：垄断、围墙与算力之殇

也是在这样的共识下，前不久阿里巴巴达摩院在云栖大会上推出的中文模型开源社区“魔搭”（ModelScope）在AI界引起了很大的关注，目前国内的一些机构已经开始在该社区上贡献模型，或是建立自己的开源模型体系。

2022-12-06 14:36:58

491

支持Python和Java的BigCode开源轻量级语言模型

BigCode 是一个开放的科学合作组织，致力于开发大型语言模型。近日他们开源了一个名为 SantaCoder 的语言模型，该模型拥有 11 亿个参数

2023-01-17 14:29:53

692

大型语言模型有哪些用途？

大型语言模型能识别、总结、翻译、预测和生成文本及其他内容。 AI 应用在大型语言模型的帮助下，可用于解决总结文章、编写故事和参与长对话等多种繁重工作。大型语言模型（LLM）是一种深度学习算法，可以

2023-02-23 19:50:04

3887

FlagOpen大模型技术开源体系，开启大模型时代“新Linux”生态

“大数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。语言大模型ChatGPT成为现象级应用，人工智能进入普及应用的新时期。智源研究院2020年搭建大模型攻关团队，2021年6月推出

2023-03-01 15:10:07

503

大型语言模型有哪些用途？大型语言模型如何运作呢？

大型语言模型能识别、总结、翻译、预测和生成文本及其他内容。

2023-03-08 13:57:00

6989

商汤发布多模态多任务通用大模型“书生2.5”，迈向AGI通用人工智能

其拥有 30亿参数，是目前全球开源模型中 ImageNet准确度最高、规模最大，同时也是物体检测标杆数据集COCO中唯一超过65.0 mAP的模型。

2023-03-15 17:23:53

1079

Dolly 2.0发布，首个真正开放、可商用的指令调优LLM

Dolly 2.0 是一个基于 EleutherAI pythia 模型系列的 12B 参数语言模型，并在透明且免费提供的数据集上进行了微调；该数据集称为 databricks-dolly-15k，也已开源发布。

2023-04-14 09:33:12

1496

各种大语言模型是彻底被解封了

基础 LLM 基本信息表，GPT-style 表示 decoder-only 的自回归语言模型，T5-style 表示 encoder-decoder 的语言模型，GLM-style 表示 GLM 特殊的模型结构，Multi-task 是指 ERNIE 3.0 的模型结构

2023-04-20 11:25:44

1071

一套开源的大型语言模型（LLM）—— StableLM

对于任何没有额外微调和强化学习的预训练大型语言模型来说，用户得到的回应质量可能参差不齐，并且可能包括冒犯性的语言和观点。这有望随着规模、更好的数据、社区反馈和优化而得到改善。

2023-04-24 10:07:06

2168

AI大语言模型的原理、演进及算力测算专题报告

GPT是基于Transformer架构的大语言模型，近年迭代演进迅速。构建语言模型是自然语言处理中最基本和最重要的任务之一。GPT是基于Transformer架构衍生出的生成式预训练的单向语言模型，通过对大量语料数据进行无监督学习

2023-04-28 10:01:59

585

“伶荔”(Linly) 开源大规模中文语言模型

Linly-Chinese-LLaMA：中文基础模型，基于 LLaMA 在高质量中文语料上增量训练强化中文语言能力，现已开放 7B、13B 和 33B 量级，65B 正在训练中。

2023-05-04 10:29:07

706

直播预告 | CSDN《开谈》—开源大模型崛起

当今，开源大模型已经成为人工智能领域的重要趋势。其发展离不开深度学习技术的不断发展和优化，同时也离不开社区的协作和创新。未来，开源大模型将在哪些领域和应用场景中得到更广泛的应用？具有哪些优势

2023-05-17 01:25:02

242

PyTorch教程9.3.之语言模型

电子发烧友网站提供《PyTorch教程9.3.之语言模型.pdf》资料免费下载

2023-06-05 09:59:00

PyTorch教程-9.3. 语言模型

9.3. 语言模型¶ Colab [火炬]在 Colab 中打开笔记本 Colab [mxnet] Open the notebook in Colab Colab [jax

2023-06-05 15:44:24

268

清华等开源「工具学习基准」ToolBench，微调模型ToolLLaMA性能超越ChatGPT

最近，清华大学自然语言处理实验室等支持的开源社区OpenBMB （Open Lab for Big Model Base）发布了ToolBench项目，可以帮助开发者构建开源、大规模、高质量的指令调优数据，促进构建具有通用工具使用能力的大型语言模型。

2023-06-08 11:39:32

360

模型当道开源聚力｜2023开放原子全球开源峰会开源大模型分论坛圆满收官

6月13日，2023开放原子全球开源峰会开源大模型分论坛圆满举行。本场论坛汇聚了中国大模型领域的专家，包括工业界和学术界的主流玩家，共同探讨大模型的最新技术和应用，为业内人士提供时新的技术资讯

2023-06-16 21:15:01

1059

模型当道开源聚力｜2023开放原子全球开源峰会开源大模型分论坛圆满收官

6 月 13 日，2023 开放原子全球开源峰会开源大模型分论坛圆满举行。本场论坛汇聚了中国大模型领域的专家，包括工业界和学术界的主流玩家，共同探讨大模型的最新技术和应用，为业内人士提供时新的技术

2023-06-19 11:32:16

416

悟道·天鹰 Aquila + 天秤 FlagEval，打造大模型能力与评测标准双标杆

为推动大模型在产业落地和技术创新，智源研究院发布“开源商用许可语言大模型系列+开放评测平台” 2 大重磅成果，打造“大模型进化流水线”，持续迭代、持续开源开放。 01 悟道·天鹰（Aquila

2023-06-27 16:37:27

244

大型语言模型的应用

大型语言模型（LLM）是一种深度学习算法，可以通过大规模数据集训练来学习识别、总结、翻译、预测和生成文本及其他内容。大语言模型（LLM）代表着 AI 领域的重大进步，并有望通过习得的知识改变

2023-07-05 10:27:35

1463

语言模型的发展历程基于神经网络的语言模型解析

简单来说，语言模型能够以某种方式生成文本。它的应用十分广泛，例如，可以用语言模型进行情感分析、标记有害内容、回答问题、概述文档等等。但理论上，语言模型的潜力远超以上常见任务。

2023-07-14 11:45:40

454

2023年发布的25个开源大型语言模型总结

来源： DeepHub IMBA 大型语言模型(llm)是一种人工智能(AI)，在大量文本和代码数据集上进行训练。它们可以用于各种任务，包括生成文本、翻译语言和编写不同类型的创意内容。今年开始

2023-07-28 12:20:02

440

阿里云开源AI大模型，挑战Meta、OpenAI

亲爱的朋友，欢迎收看河套IT WALK总第91期。今日全球重大技术新闻目录： · Google 的 RT-2：当人工智能遇上机器人 ·IBM联手NASA：开源地理空间AI模型，助力气候科学

2023-08-04 18:45:01

511

AI大模型的开源算法介绍

AI大模型的开源算法介绍什么是开源？简单来说就是不收取任何费用，免费提供给用户的软件或应用程序。开源是主要用于软件的术语，除了免费用户还可以对开源软件的源代码进行更改，并根据自身的使用情况进行

2023-08-08 17:25:01

1234

2023年发布的25个开源大型语言模型总结

大型语言模型(llm)是一种人工智能(AI)，在大量文本和代码数据集上进行训练。它们可以用于各种任务，包括生成文本、翻译语言和编写不同类型的创意内容。今年开始，人们对开源LLM越来越感兴趣。这些模型

2023-08-01 00:21:27

554

清华大学大语言模型综合性能评估报告发布！哪个模型更优秀？

近日，清华大学新闻与传播学院发布了《大语言模型综合性能评估报告》，该报告对目前市场上的7个大型语言模型进行了全面的综合评估。近年，大语言模型以其强大的自然语言处理能力，成为AI领域的一大热点。它们

2023-08-10 08:32:01

607

嘉楠开源通用大语言模型Toucan中的INT4量化技术解析

ChatGPT与其之后不断涌现的大语言模型（LLM）迅速席卷了整个时代。随着计算机对人类自然语言的领悟程度突飞猛进，我们与计算机的交互方式正在迅速而深刻地改变着，这也即将带来一场既广泛又具有极强创新性的商业模式转型。

2023-08-19 14:57:11

912

检索增强的语言模型方法的详细剖析

本篇内容是对于ACL‘23会议上陈丹琦团队带来的Tutorial所进行的学习记录，以此从问题设置、架构、应用、挑战等角度全面了解检索增强的语言模型，作为对后续工作的准备与入门，也希望能给大家带来

2023-08-21 09:58:01

1234

大语言模型“书生·浦语”多项专业评测拔头筹

最近，AI大模型测评火热，尤其在大语言模型领域，“聪明”的上限被不断刷新。商汤与上海AI实验室等联合打造的大语言模型“书生·浦语”（InternLM）也表现出色，分别在智源FlagEval

2023-08-25 13:00:02

315

训练大语言模型带来的硬件挑战

生成式AI和大语言模型（LLM）正在以难以置信的方式吸引全世界的目光，本文简要介绍了大语言模型，训练这些模型带来的硬件挑战，以及GPU和网络行业如何针对训练的工作负载不断优化硬件。

2023-09-01 17:14:56

1046

百度千帆大模型2.0一天可跑通大模型效果验证

百度千帆大模型2.0一天可跑通大模型效果验证今天的2023百度云智大会上，百度智能云宣布千帆大模型平台2.0全面升级，百度千帆大模型2.0升级之后能力强悍，现在在千帆一站式工具链平台，当天就可以跑通大模型效果验证。经过升级的千帆整套的工具链可以无缝衔接全生命周期的各个业务流程，给开发者极大的提高效率。

2023-09-05 16:17:45

684

腾讯发布混元大语言模型

腾讯发布混元大语言模型腾讯全球数字生态大会上腾讯正式发布了混元大语言模型，参数规模超千亿，预训练语料超2万亿tokens。作为腾讯自研的通用大语言模型，混元大语言模型具有中文创作能力、任务执行

2023-09-07 10:23:54

815

性能超越开源模型标杆Llama2-70B，书生·浦语大模型InternLM-20B开源发布

）开源首发。同时，书生·浦语面向大模型研发与应用的全链条工具链全线升级，与InternLM-20B一同继续全面开放，向企业和开发者提供免费商用授权。今年6月首次发布以来，书生·浦语历多轮升级，在开源社区和产业界产生广泛影响。 InternLM-20B模型性能先进且应用便捷，以不足三分之一的参

2023-09-20 16:45:02

644

揭秘编码器与解码器语言模型

Transformer 架构的问世标志着现代语言大模型时代的开启。自 2018 年以来，各类语言大模型层出不穷。

2023-10-24 11:42:05

337

基于检索的大语言模型简介

简介章节讲的是比较基础的，主要介绍了本次要介绍的概念，即检索（Retrieval）和大语言模型（LLM）

2023-11-15 14:50:36

282

浪潮信息发布源2.0基础大模型，千亿参数全面开源

11月27日，浪潮信息发布"源2.0"基础大模型，并宣布全面开源。源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型，在编程、推理、逻辑等方面展示出了先进的能力。

2023-11-28 09:10:14

417

阿里云通义千问720亿参数模型宣布开源

12月1日，阿里云通义千问720亿参数模型Qwen-72B宣布开源。与此同时，他们还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。

2023-12-01 17:08:08

801

大语言模型简介：基于大语言模型模型全家桶Amazon Bedrock

本文基于亚马逊云科技推出的大语言模型与生成式AI的全家桶：Bedrock对大语言模型进行介绍。大语言模型指的是具有数十亿参数（B+）的预训练语言模型（例如：GPT-3, Bloom, LLaMA)。这种模型可以用于各种自然语言处理任务，如文本生成、机器翻译和自然语言理解等。

2023-12-04 15:51:46

356

大语言模型概述

在科技飞速发展的当今时代，人工智能技术成为社会进步的关键推动力之一。在广泛关注的人工智能领域中，大语言模型以其引人注目的特性备受瞩目。大语言模型的定义及发展历史大语言模型是一类基于深度学习技术

2023-12-21 17:53:59

555

大语言模型使用指南

在信息爆炸的时代，我们渴望更智能、更高效的语言处理工具。GPT-3.5等大语言模型的崛起为我们提供了前所未有的机会。这不仅是技术的进步，更是人与机器共舞的一幕。本篇文章将带你走进这个奇妙的语言王国

2023-12-29 14:18:59

276

大语言模型推断中的批处理效应

随着开源预训练大型语言模型（Large Language Model, LLM ）变得更加强大和开放，越来越多的开发者将大语言模型纳入到他们的项目中。其中一个关键的适应步骤是将领域特定的文档集成到预训练模型中，这被称为微调。

2024-01-04 12:32:39

228

商汤科技发布新一代大语言模型书生·浦语2.0

1月17日，商汤科技与上海AI实验室联合香港中文大学和复旦大学正式发布新一代大语言模型书⽣·浦语2.0（InternLM2）。

2024-01-17 15:03:57

332

机器人基于开源的多模态语言视觉大模型

ByteDance Research 基于开源的多模态语言视觉大模型 OpenFlamingo 开发了开源、易用的 RoboFlamingo 机器人操作模型，只用单机就可以训练。

2024-01-19 11:43:08

106

字节发布机器人领域首个开源视觉-语言操作大模型，激发开源VLMs更大潜能

对此，ByteDance Research 基于开源的多模态语言视觉大模型 OpenFlamingo 开发了开源、易用的 RoboFlamingo 机器人操作模型，只用单机就可以训练。使用简单、少量的微调就可以把 VLM 变成 Robotics VLM，从而适用于语言交互的机器人操作任务。

2024-01-23 16:02:17

169

Meta发布CodeLlama70B开源大模型

Meta发布CodeLlama70B开源大模型 Meta发布了开源大模型CodeLlama70B，号称是CodeLlama系列体量最大、性能最强的大模型。 Code Llama 70B 有一个很出色

2024-01-31 10:30:18

879

上海AI实验室发布新一代书生·视觉大模型

近日，上海人工智能实验室（上海AI实验室）联手多所知名高校及科技公司共同研发出新一代书生·视觉大模型（InternVL）。

2024-02-04 11:25:58

580

大模型开源开放评测体系司南正式发布

近日，大模型开源开放评测体系司南（OpenCompass2.0）正式发布，旨在为大语言模型、多模态模型等各类模型提供一站式评测服务。OpenCompass2.0的发布，将为模型技术创新提供重要的技术支撑。

2024-02-05 11:28:12

526

昆仑万维发布新版MoE大语言模型天工2.0

昆仑万维科技今日震撼发布全新升级的「天工2.0」MoE大语言模型以及配套的新版「天工AI智能助手」APP。此次更新标志着国内首个搭载MoE架构的千亿级参数大语言模型AI应用正式面向广大C端用户免费

2024-02-06 16:19:51

756

大语言模型中的语言与知识：一种神秘的分离现象

自然语言处理领域存在着一个非常有趣的现象：在多语言模型中，不同的语言之间似乎存在着一种隐含的对齐关系。

2024-02-20 14:53:06

谷歌大型模型终于开放源代码，迟到但重要的开源战略

在人工智能领域，谷歌可以算是开源的鼻祖。今天几乎所有的大语言模型，都基于谷歌在 2017 年发布的 Transformer 论文；谷歌的发布的 BERT、T5，都是最早的一批开源 AI 模型。

2024-02-22 18:14:34

143

谷歌发布轻量级开源人工智能模型Gemma

谷歌近日宣布推出开源人工智能（AI）模型系列Gemma，旨在为开发人员和研究人员提供一个负责任的AI构建平台。这一举措标志着自2022年OpenAI的ChatGPT引领AI聊天机器人热潮后，谷歌首次发布重要的开源大型语言模型（LLM），直接与ChatGPT展开竞争。

2024-02-23 11:38:33

345

IBM在watsonx上提供开源的Mistral AI模型

IBM 提供 Mixtral-8x7B 的优化版本，该版本可将延迟时间最多缩短 75% IBM、第三方和开源模型的目录不断增加，为客户提供更多选择和灵活性是 watsonx 人工智能与数据平台

2024-03-12 19:10:36

1053

已全部加载完成

搜索历史

书生・浦语 2.0（InternLM2）大语言模型开源

评论