电子发烧友App

硬声App

0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

电子发烧友网>人工智能>微软宣布推出一个27亿参数的语言模型Phi-2

微软宣布推出一个27亿参数的语言模型Phi-2

收藏

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论

查看更多

相关推荐

如何利用Transformers了解视觉语言模型

模型称为 “视觉语言模型是什么意思?一个结合了视觉和语言模态的模型?但这到底是什么意思呢?
2023-03-03 09:49:37665

如何计算transformer模型参数

1. 前言 最近,OpenAI推出的ChatGPT展现出了卓越的性能,引发了大规模语言模型(Large Language Model,LLM)的研究热潮。大规模语言模型的“大”体现在两个方面:模型
2023-07-10 09:13:575737

商汤日日新大模型全面升级,SenseCore可支持20个千亿参数量大模型同时训练

将多方位全面升级,并宣布在该体系下一系列的大模型产品更新和落地成果。   “日日新SenseNova ”全面升级及应用落地   商汤科技发布的“商量”2.0版本,是一个千亿级参数的自然语言处理模型,它突破了大语言模型输入长度的限制,推出不同参数量级的模型版本,可完
2023-07-13 00:13:002385

2023年科技圈热词“大语言模型”,与自然语言处理有何关系

等。   2023年,大语言模型及其在人工智能领域的应用已然成为全球科技研究的热点,其在规模上的增长尤为引人注目,参数量已从最初的十几亿跃升到如今的一万亿。参数量的提升使得模型能够更加精细地捕捉人类语言微妙之处,更加深入地理解人类语
2024-01-02 09:28:331267

微软推出智能音箱Invoke 后来者的追赶能否反超

曼·卡顿等其他品牌。   毫无意外,微软在2017年Build开发者大会上推出了智能音箱。这也意味着,继亚马逊和谷歌之后,另一个科技巨头试图在智能音箱领域手握风云。   美国当地时间5月10日
2017-05-21 09:33:09

微软Fluent设计系统 支持VR、触摸、手写多种方式

输入。   5月12日消息,在Build 2017开发者大会上,微软推出了Fluent Design,它是设计系统,可以方便开发者跨设备开发用户界面。从许多方面看,Fluent Design
2017-05-13 09:28:46

微软HoloLens正研发AI芯片 可识别语音和图像

进行调整,使其具有独无二的功能。   去年,微软使用数千这样的芯片,次性将英文维基百科翻译为西班牙语,共有 500 万篇文章,30 亿词汇,用时仅不到十分之秒。下步,微软将让他们的云用户
2017-07-31 21:17:15

微软回应不提高在华专利费

Smith表示,他为了这个消息直等到凌晨2点,很高兴看到商务部宣布的结果。  Brad Smith表示,这次中国商务部的审批有两点重要意义。其这对微软诺基亚来说是有里程碑意义的事件,“因为只有中国批准
2017-11-27 11:30:06

微软开源了更安全的 C 语言版本:Checked C

微软开源了 Checked C[1] ,这是 C 语言的扩展版本,可以用于解决 C 语言中的系列安全相关的隐患。正如其名字所示,Checked C 为 C 语言增加了检查。这个检查可以帮助
2016-06-20 17:26:16

微软或明年推第2代Surface 采用AMD处理器

发表的微博称,微软计划在2013年推出Surface RT 2平板电脑。这款平板电脑的显示屏尺寸比10.6英寸Windows RT平板电脑稍微小些。传言称,这种平板电脑将配置高通的芯片组,目前
2012-12-03 09:32:54

微软的平板谁在卖?

`微软近日宣布与戴尔达成项合作协议,从下个月起,企业客户可以通过戴尔的企业销售部门购买Surface Pro平板电脑和Surface配件。这是微软与惠普、埃森哲等公司合作后,在企业市场推广其平板
2017-06-23 14:44:04

微软语音识别系统错误率仅为5.1%,达成新的精准里程碑!

  导读:微软今天宣布,其会话语音识别系统的误率达到了5.1%,是目前为止最低的。 [img][/img]   这数据超过了微软人工智能和研究团队去年5.9%的误差率,并将其准确性与专业的人
2017-08-23 09:18:35

Flex电源模块宣布推出其DC-DC转换器系列

Flex电源模块(Flex Power Modules)宣布推出其DC-DC转换器系列中的最新型号PKB4216HDPI,旨在用于电信市场领域的射频功率放大器(RFPA)应用。继最近推出的750W
2020-10-30 06:17:55

HarmonyOS/OpenHarmony应用开发-Stage模型ArkTS语言AbilityStage

): string;启动specified ability时触发的事件。参数名类型必填说明wantWant是Want类型参数,传入需要启动的ability的信息,如ability名称,包名等
2023-04-07 15:16:35

MathWorks宣布推出2011b版MATLAB和Simulink

MathWorks日前宣布推出 2011b版 (R2011b) MATLAB 和 Simulink 产品系列。此版本新引入了 Simulink Code Inspector,它可以实现
2011-09-08 15:45:03

XP Power正式宣布推出两款新的板上PCB安装单输出AC-DC电源

XP Power正式宣布推出两款新的板上PCB安装单输出AC-DC电源,为现代家庭、物联网(IoT)和工业技术应用提供方便、经济的解决方案。
2020-10-29 09:51:55

Xeon Phi绕道CPU

我们知道此前的Xeon Phi(至强融核)协处理器家族包括3100、5100和7100系列,都是像GPU那样通过PCIe x16插槽安装在x86服务器上。Xeon Phi x100有板载内存(类似于NVIDIA/AMD的显存),但访问系统主内存就要绕道CPU的内存控制器,从而影响到效率。
2019-08-08 07:05:09

iFLY投融资日报 | 10亿!「医联」跻身互联网医疗独角兽

,青岛巨峰科创等跟投共同完成。Pico是家初创公司,主要做VR头显产品的研发、生产、销售。4、建立珠宝首饰大数据模型系统,款多多完成1.6亿元C轮融资珠宝首饰供应链平台款多多宣布完成1.6亿元C轮融资
2018-08-01 09:34:25

iFLY投融资日报 | 「开思汽配」B轮累计融资达6.5亿

本帖最后由 讯飞开放平台 于 2018-8-27 09:05 编辑 国 内1、开思汽配完成B3轮融资,B轮累计融资达6.5亿汽配交易平台开思宣布已完成超过2.5亿元的B3轮融资,此轮融资由沣源
2018-08-27 09:04:04

iFLY投融资日报 | 小米上市首日破发,掌通家园获C2轮数亿融资

财务顾问。诸葛找房是国内家房产领域的大数据和人工智能创业公司,也是房产信息行业里的家第三方找房比价平台,拥有自行研发的房产智能搜索引擎。5、掌通家园宣布获得C2轮数亿融资,将用于平台研发和市场拓展掌通家园
2018-07-10 09:28:50

iFLY投融资日报 | 游侠汽车B+轮融资3.5亿美金 整体估值达33.5亿美金!

金融切入,来构建自己的会员体系,最终形成了“金融+旅游+商品”这会员服务产品。4、“企业运营合伙人”兑吧集团完成1.1亿美元C轮融资“企业运营合伙人”兑吧集团宣布完成1.1亿美元C轮融资,投资方为兰馨
2018-08-23 09:11:27

iFLY投融资日报 | 美容美发也玩融资,阿里口碑投资1亿

资本担任融资财务顾问。2、「上上签」获3.58亿元C轮融资,老虎环球基金领投8月31日消息,中国电子签约公司“上上签”宣布完成3. 58 亿元人民币C轮融资,由老虎环球基金领投,老股东DCM、经纬、晨兴
2018-09-04 09:43:50

pspice 逻辑门怎么样修改模型参数

模型我看不懂,跟其他的比如ua741的不同,ua741的模型打开是项的参数,直接改数字就行,逻辑门怎么改啊……图片是7408的pspice model,表示看不懂啊。
2014-06-24 10:09:17

pytorch训练出来的模型参数保存为嵌入式C语言能够调用形式的方法

在深度学习算法嵌入式开发应用中,如何把在pytorch下训练得到的模型参数,提取出来保存成C语言能够调用的数组形式,是嵌入式应用开发的重要步骤。以下介绍简单的例子,下文中的代码来自莫凡教程,是
2021-12-15 06:57:18

【书籍评测活动NO.30】大规模语言模型:从理论到实践

模型实践和理论研究的过程中,历时8月完成 《大规模语言模型:从理论到实践》 书的撰写。希望这本书能够帮助读者快速入门大模型的研究和应用,并解决相关技术问题。 本书经上市,便摘得京东新书日榜销售
2024-03-11 15:16:39

【书籍评测活动NO.31】大语言模型:原理与工程实践

深远影响,尤其在优化业务流程和重塑组织结构方面。然而,在研究和实践过程中,我们遇到了主要挑战:市场上缺乏大语言模型在实际应用方面的资料。现有的资料多聚焦于理论研究,而具体的实践方法多被保密,难以获得
2024-03-18 15:49:46

【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

预训练语言模型。该模型最大的特点就是基于以较小的参数规模取得了优秀的性能,根据官网提供的信息,LLaMA的模型包含4版本,最小的只有70亿参数,最大的650亿参数,但是其性能相比较之前的OPT
2023-12-22 10:18:11

三星高调宣布旗下WP7.5机型全部升级7.8的背后

Flash,Focus 2等。如果按照三星官方所言,其中原生以及升级至Windows Phone 7.5版本的机型都将升级至7.8版本。不过最终更新机型都将以三星推送结果为准,微软在其中也会起到
2012-12-23 11:03:51

你如何看微软的新Logo?

前夕宣布换标也证明了微软对这款新品的支持力度。微软前后两代Logo对比(图片来自网络)  我们注意到,和之前传闻不同的是微软的新Logo左侧带有四色块,最后的f和t字相连接,而之前的Logo则将o和s连接。新的Logo将逐渐在微软各个新品中开始使用,而旧版Logo依旧会继续沿用段时间。`
2012-08-28 09:18:48

使用bmpaddle转换模型时应该如何参数填写方式

,608,609]\" –model参数模型所在文件夹那级;paddle模型2种:组合式(combined model)和非复合式(uncombined model);组合式就是__model__
2023-09-19 07:05:28

元件的中文模型参数

请教:有人用中文版的Multisim13 导出了2N3773这个元件的中文参数图,不知是在哪个路径下面导出来的。我只能在元件模型编辑界面上看到英文Spice参数没有这个清楚。
2018-03-01 21:32:07

华为宣布投10亿美元补贴开发者打造鸿蒙手机生态!

!这样来虽然短期内可能华为手机会非常痛苦,但是华为可以依托十几亿人的国内市场做根基,先把软件生态建立完全,然后再去国外推广,相信有国内市场的支持,华为相比之前的微软,三星等厂商建立自己的移动生态更有戏!声明
2020-09-18 10:17:25

如何建立simulink模型

模型转嵌入式代码流程,害怕以后忘记了,特记录下来。Step1:建立simulink模型Step2:设置求解器参数:2.1选择离散型,固定步长,并设置对应步长值。2.2code gen...
2021-12-17 07:58:51

投融资 | 融资20亿美元,Grab在东南亚地位再获巩固

外1、Grab宣布完成20亿美元融资,华兴资本担任财务顾问东南亚领先的O2O移动平台Grab Holdings Inc.宣布已完成20亿美元的新轮融资。丰田汽车公司(丰田)与多家全球金融机构,包括
2018-08-08 09:17:46

投融资日报 | 「雷石科技」B 轮融资近 2 亿元 !

DoorDash融资2.5亿美元,估值翻番至40亿美元美国外卖创业公司DoorDash宣布,已在最新轮融资中筹集了2.5亿美元资金,估值为40亿美元。这是DoorDash的估值在5月内第二次增加倍以上
2018-08-20 08:58:31

投融资日报 | 比特大陆融资5.6亿美元,估值已达146亿

值为140亿美元,融资后,比特大陆估值为146亿美元。完成这轮融资后,比特大陆可能9月会向港交所递交招股书,预计今年底,明年初在香港上市。2、优客工场宣布再融资3亿人民币 估值124亿共享办公领域
2018-08-15 08:38:18

抖音日活用户破6亿可能吗

抖音日活用户破6亿可能吗✦抖音宣布日活跃用户破6亿,未来年让创作者收入800亿✦ TikTok:已向美国***提交解决方案,相信可以解决安全顾虑✦ 百度CTO王海峰发布百度大脑6.0,AI新基建加速产...
2021-07-28 09:49:57

比尔盖茨抛售微软股票套现近8亿

8推进造成正常放缓。  根据文件记录显示,比尔·盖MAX3232EUE+T茨正在不断减持手中的微软股票  2007年,比尔·盖茨共售出微软股票8000万股,价值达25.4亿美元。  2008年8月
2012-10-25 16:21:19

使用CubeAI上传和使用2不同模型的示例?

我想将 2 不同的 ML 模型上传到微控制器并在我用于分类的模型之间交换(在微控制器内)但是,代码似乎只能正确生成模型的代码。这个对吗?还是应该为两者生成代码?有没有使用多个模型的例子?
2022-12-02 07:19:57

求助耦合电感2模型参数如何转换?

耦合电感有2模型1.告知耦合电感的2自感、互感以及耦合系数2.匝数比、自感量、漏感量(相当于理想变压器原边和副边的电感量)请问我已知耦合电感的模型2的三参数如何将其转换为耦合电感模型1的3参数2模型参数是如何转换的呢?求求大佬帮助
2020-01-03 14:55:51

消息称微软正测试自有品牌智能手机

尚未被告知微软的计划。  全球智能手机市场正在不断膨胀。市场研究公司IDC预计,今年全球智能手机出货量将增长38.8%,达到6.86亿部。  2010年,微软推出款面向年轻MAX3232EUE+T人
2012-11-02 16:31:55

科技大厂竞逐AIGC,中国的ChatGPT在哪?

便吸引了超过1亿用户的关注,跃成为20年来互联网领域增长最快的消费类应用。 北京时间2月7日凌晨,美国科技巨头谷歌紧急入局,宣布基于LaMDA大模型的人工智能对话式机器人“Bard”正在进行
2023-03-03 14:28:48

第二代Raspberry Pi发布,微软推出Windows 10 for Raspberry Pi 2

部真正具有可用性的PC。当然售价仍然保持35刀。下面来段有RS的DesignSpark团队发布的树莓派2的介绍视频:同时微软同时推出了Windows 10 for Raspberry Pi 2,它将
2015-02-02 21:56:26

聆听微软Band 2手环的心声:仍然有缺陷,但在正确的方向上迈出了

的问题,我们曾在原有的设计上,增加了新的传感器了。 Band 2手环可能不会是完美的健身伙伴,但它非常非常接近微软理想中的目标。下面是来自用户对微软Band 2手环评价,我微软将其总结出了这几
2015-10-30 16:50:09

自然语言处理的语言模型

自然语言处理——53 语言模型(数据平滑)
2020-04-16 11:11:25

融资大事件 | 寒武纪完成数亿美元B轮融资;Google 向京东投资 5.5 亿美元

发生了什么?跟小麦起来看看:1、寒武纪完成数亿美元B轮融资,投后估值25亿美元全球智能芯片领域首个独角兽寒武纪宣布完成数亿美元的B轮融资,投后整体估值达25亿美元。寒武纪科技是全球第一个成功流片并
2018-06-25 11:32:52

谷歌为何揪住微软不放?

`昨天微软很恼怒。缘由无他,就是因为谷歌不厚道。狠狠地摆了微软刀。在微软正准备发布补丁的前两天,谷歌很“诡异”地公布了微软的漏洞,打了微软措手不及。微软高管甚至痛斥谷歌不顾用户的安全。“谷歌
2015-01-14 10:22:23

赛灵思推出全球最大容量的FPGA – Virtex UltraScale+ VU19P

自适应和智能计算的全球领先企业赛灵思公司(Xilinx, Inc.,(NASDAQ:XLNX))今天宣布推出全球最大容量的 FPGA – Virtex UltraScale+ VU19P,从而进
2020-11-02 08:34:50

轿车参数化分析模型的构造研究及应用

的分析方法的具体实现在结合开发过程特点的基础上提出分析用的参数化简化模型和概念设计阶段的车身开发平台利用高效的分析模型和统的开发环境加快车身早期开发过程本文在充分研究国外早期车身开发流程的基础上依托
2009-04-16 13:40:51

阿里云宣布推出Serverless Kubernetes服务 30秒即可完成应用部署

摘要: 阿里云宣布推出Serverless Kubernetes服务,容器服务新增Serverless形态。5月2日,阿里云宣布推出Serverless Kubernetes服务,容器服务新增
2018-05-03 15:38:01

鸿蒙os用户达2亿!官方:版本必须再更新!

今天华为开发者大会 2021(Together)主题演讲上,华为宣布,HarmonyOS 设备数量超 1.5 亿,成为史上发展最快的终端操作系统。这个发展速度真的是前无古人,后无来者啊!1.5 亿
2021-10-23 16:38:58

Synopsys天宣布推出其Synphony HLS (Hi

Synopsys天宣布推出其Synphony HLS (High Level Synthesis)解决方案 新思科技公司,今天宣布推出其Synphony HLS (High Level Synthesis)解决方案。该解决方案集成了M语言和基于模型的综合
2009-11-04 16:55:53962

微软Visual Studio支持R语言

微软 Visual Studio 近日宣布开始支持R语言,并推出免费开源的R语言工具(R Tools for Visual Studio,RTVS),目前RTVS已经进入公开预览阶段(0.2
2017-10-12 11:47:530

自然语言处理常用模型解析

自然语言处理常用模型使用方法一、N元模型二、马尔可夫模型以及隐马尔可夫模型及目前常用的自然语言处理开源项目/开发包有哪些?
2017-12-28 15:42:305382

微软宣布Azure IoT Edge开源

今年微软带来了Azure IoT Edge Runtime的开源并宣布与高通、大疆的合作;推出Project Kinect for Azure微软新一代深度摄像头在内的传感器套件以及混合现实技术。
2018-05-11 16:41:225255

英特尔Xeon Phi™协处理器车间:编程模型(1)

® Xeon Phi coprocessor HW abstraction Section 1: Intel® approach, HW abstraction
2018-09-29 05:06:002282

英特尔Xeon Phi™协处理器车间:编程模型(4)

® Xeon Phi coprocessor HW abstraction, Section 4: Architecturally independent vs dependent programming approaches
2018-09-28 05:33:001640

OpenAI宣布,发布了7.74亿参数GPT-2语言模型

就在本周,OpenAI宣布,发布了7.74亿参数GPT-2语言模型,15.58亿的完整模型也有望于几个月内发布,并将GPT-2这6个月的进展情况在博客上和大家做了介绍,本文将为大家梳理。
2019-09-01 09:10:442704

微软亚研提出VL-BERT,现取得了当前单模型的最好效果

来自中科大、微软亚研院的研究者们提出了一种新型的通用视觉-语言预训练模型(Visual-Linguistic BERT,简称 VL-BERT),该模型采用简单而强大的 Transformer 模型作为主干网络,并将其输入扩展为同时包含视觉与语言输入的多模态形式,适用于绝大多数视觉-语言下游任务。
2019-09-03 15:04:505147

微软宣布推出目前最安全的Windows 10设备

微软宣布推出安全核心PC,这是目前最安全的Windows 10设备,具有集成的硬件,固件,软件和身份保护功能。Windows OEM产品必须满足微软列出的严格安全要求才能获得此认证。
2019-11-01 14:44:05508

微软宣布未来将不再发展Visual Basic编程语言

微软近日宣布,未来将不再发展Visual Basic(以下简称VB)这门编程语言,只会做一些稳定性、兼容性的维护工作。
2020-03-16 15:56:302512

微软翻译器新增五种印度语言的实时翻译 印度语言支持总数达到10种

微软印度宣布微软翻译器现在将提供古吉拉特语、马拉地语、卡纳达语、马来语和旁遮普语五种语言的实时翻译。微软翻译器允许用户使用Windows、iOS、安卓和网络版的Translate应用,翻译实时对话
2020-04-17 10:29:102844

Google科学家设计简化稀疏架构Switch Transformer,语言模型参数量可扩展至 1.6 万亿

刚刚,Google Brain 高级研究科学家 Barret Zoph 发帖表示,他们设计了一个名叫「Switch Transformer」的简化稀疏架构,可以将语言模型参数量扩展至 1.6 万亿
2021-01-13 16:50:492638

微软推出针对最新行业云定位的零售云

微软宣布推出Microsoft Cloud for Retail,这是针对特定行业和领域的最大的云提供商的又一个迹象。
2021-01-17 09:38:561334

谷歌训练开发一个万亿参数的AI语言模型

参数是机器学习算法的关键。它们是从历史训练数据中学到的模型的一部分。一般来说,在语言领域,参数的数量和复杂性之间的相关性非常好。例如,OpenAI的GPT-3是有史以来训练了1750亿个参数的最大语言模型之一,它可以进行原始类比、生成配方,甚至完成基本代码。
2021-01-18 16:19:541630

谷歌推出1.6万亿参数的人工智能语言模型,打破GPT-3记录

  古谚道:“熟读唐诗三百首,不会作诗也会吟。” 这句话放在目前的人工智能语言模型中也非常适用。 此前,OpenAI 的研究人员开发出 “GPT-3”,这是一个由 1750 亿个参数组成的 AI
2021-01-18 17:16:072111

微软视觉语言模型有显著超越人类的表现

视觉语言(Vision-Language,VL)系统允许为文本查询搜索相关图像(或反之),并使用自然语言描述图像的内容。一般来说,一个VL系统使用一个图像编码模块和一个视觉语言融合模块。微软研究部门
2021-01-19 14:32:091476

一个GPU训练一个130亿参数模型

现在的模型动辄数百、数千亿参数,普通人训不动怎么办? 前不久,谷歌发布了参数量为 1.6 万亿的语言模型Swith Transformer,将 GPT-3 创下的参数量记录(1750 亿)推至新高
2021-02-11 09:04:002167

谷歌开发出超过一万亿参数语言模型,秒杀GPT-3

继GPT-3问世仅仅不到一年的时间,Google重磅推出Switch Transformer,直接将参数量从GPT-3的1750亿拉高到1.6万亿,并比之前最大的、由google开发的语言模型
2021-01-27 16:26:561857

微软DeBERTa登顶SuperGLUE排行榜

在最新的 NLU 测试基准 SuperGLUE 中,微软提出的 DeBERTa 登顶榜单,并超越人类。 去年 6 月,来自微软的研究者提出一种新型预训练语言模型 DeBERTa,该模型使用两种新技术
2021-02-05 09:25:131418

微软宣布Office 2021家庭版价格不变

微软今天宣布,Office2021即将在今年晚些时候发售,登陆 Windows 和 macOS 平台,售价保持不变。此外,微软还将会推出面向商业客户的 Office LTSC 消费者长期支持版。
2021-02-19 14:45:222130

ADRF6720-27 S参数

ADRF6720-27 S参数
2021-06-04 08:05:142

浪潮、英伟达微软相继发布2500亿、5300亿参数的巨量模型,超过GPT-3

Turing-NLG相继出现。   2020年6月OpenAI在发布了GPT-3,这是当时训练的最大模型,具有1750亿个参数。近段时间,浪潮、英伟达与微软相继发布2500亿参数、5300亿参数的巨量模型,超过GPT-3。   中国工程院院士王恩东认为,人工智能的大模型时代已经到来,利用先进算法,整
2021-10-18 14:41:093136

使用DeepSpeed和Megatron驱动MT-NLG语言模型

尽管巨型语言模型正在推动语言生成技术的发展,但它们也面临着偏见和毒性等问题。人工智能社区正在积极研究如何理解和消除语言模型中的这些问题,包括微软和 NVIDIA 。
2022-04-17 11:25:341946

一种基于乱序语言模型的预训练模型-PERT

由于乱序语言模型不使用[MASK]标记,减轻了预训练任务与微调任务之间的gap,并由于预测空间大小为输入序列长度,使得计算效率高于掩码语言模型。PERT模型结构与BERT模型一致,因此在下游预训练时,不需要修改原始BERT模型的任何代码与脚本。
2022-05-10 15:01:271173

支持Python和Java的BigCode开源轻量级语言模型

BigCode 是一个开放的科学合作组织,致力于开发大型语言模型。近日他们开源了一个名为 SantaCoder 的语言模型,该模型拥有 11 亿个参数
2023-01-17 14:29:53692

大型语言模型有哪些用途?

大型语言模型能识别、总结、翻译、预测和生成文本及其他内容。 AI 应用在大型语言模型的帮助下,可用于解决总结文章、编写故事和参与长对话等多种繁重工作。 大型语言模型(LLM)是一种深度学习算法,可以
2023-02-23 19:50:043887

对标 ChatGPT,百度正式推出语言模型“文心一言”!;日媒:与中国“脱钩”蔓延至软件开发

热点新闻 1、对标 ChatGPT,百度正式推出语言模型“文心一言” 百度今(16)日下午于北京总部召开新闻发布会。发布会上,百度正式推出语言模型文心一言,并展示了文心一言在多个使用场景中的综合
2023-03-17 04:40:01604

NVIDIA 为全球企业带来生成式 AI 推出用于创建大型语言模型和视觉模型的云服务

为AI驱动的应用构建自定义模型   加利福尼亚州圣克拉拉 – GTC – 太平洋时间 2023年3月21日 – 为了加速企业应用生成式AI,NVIDIA今日宣布推出一套云服务,使企业能够构建、完善
2023-03-22 13:45:40261

使用LoRA和Hugging Face高效训练大语言模型

在本文中,我们将展示如何使用 大语言模型低秩适配 (Low-Rank Adaptation of Large Language Models,LoRA) 技术在单 GPU 上微调 110 亿参数的 FLAN-T5 XXL 模型
2023-04-14 17:37:401503

微软将向美国政府客户提供OpenAI的GPT模型

微软增加了对大型语言模型(llm)的支持。openai推出chatgpt后,llm的使用大幅增加,微软持有openai的股份,许多类型的公司争相在llm上构建功能。
2023-06-08 10:35:43759

微软韦青:“大语言模型”之于人类,新启蒙时代的思考

日前,由微软和湛庐合办的以 GPT 将如何改变世界为主题的新书共读会上,有关以 GPT 为代表的 大语言模型 提升社会生产力,打破传统人机交互模式的话题引起了与会者的广泛思考。 作为一种重要的推动力
2023-07-12 00:10:01382

语言模型的发展历程 基于神经网络的语言模型解析

简单来说,语言模型能够以某种方式生成文本。它的应用十分广泛,例如,可以用语言模型进行情感分析、标记有害内容、回答问题、概述文档等等。但理论上,语言模型的潜力远超以上常见任务。
2023-07-14 11:45:40454

盘古大模型参数量有多少

盘古大模型参数量有多少 盘古大模型(PanGu-α)是由中国科学院计算技术研究所提供的一种语言生成预训练模型。该模型基于Transformer网络架构,并通过在超过1.1TB的文本数据上进行训练
2023-08-17 11:28:181789

语言模型“书生·浦语”多项专业评测拔头筹

语言模型评测8月排行榜 和 中文通用大模型综合性评测基准SuperCLUE 7月评测榜 两项业内权威大模型评测榜单中获得优异成绩。 “ FlagEval是知名人工智能新型研发机构 北京智源人工智能研究院 推出的大模型评测体系及开放平台。 FlagEval大模型评测体系构建了“能力-任务
2023-08-25 13:00:02315

腾讯发布混元大语言模型

腾讯发布混元大语言模型 腾讯全球数字生态大会上腾讯正式发布了混元大语言模型参数规模超千亿,预训练语料超2万亿tokens。 作为腾讯自研的通用大语言模型,混元大语言模型具有中文创作能力、任务执行
2023-09-07 10:23:54815

浪潮信息发布源2.0基础大模型,千亿参数全面开源

11月27日,浪潮信息发布"源2.0"基础大模型,并宣布全面开源。源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。
2023-11-28 09:10:14417

阿里云通义千问720亿参数模型宣布开源

12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。与此同时,他们还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。
2023-12-01 17:08:08801

语言模型简介:基于大语言模型模型全家桶Amazon Bedrock

本文基于亚马逊云科技推出的大语言模型与生成式AI的全家桶:Bedrock对大语言模型进行介绍。大语言模型指的是具有数十亿参数(B+)的预训练语言模型(例如:GPT-3, Bloom, LLaMA)。这种模型可以用于各种自然语言处理任务,如文本生成、机器翻译和自然语言理解等。
2023-12-04 15:51:46356

微软Phi-2 2.7B性能领先谷歌Gemini Nano-2 3.2B

今年九月份,微软又进一步推出Phi-1.5版,尽管依旧仅含13亿元参数,但已可创作诗歌、电子邮件及故事,甚至可以对大量文本进行总结概括。在常识、语言理解以及推理的基准测试中,该版本的模型在部分领域已经可以媲美甚至超越含有高达100亿参数的同类模型
2023-12-13 11:05:34488

微软正式发布一个27亿参数语言模型Phi-2

先后和 OpenAI、Meta 牵手推动大模型发展的微软,也正在加快自家小模型的迭代。
2023-12-14 15:45:11449

语言模型概述

在科技飞速发展的当今时代,人工智能技术成为社会进步的关键推动力之一。在广泛关注的人工智能领域中,大语言模型以其引人注目的特性备受瞩目。 大语言模型的定义及发展历史 大语言模型是一类基于深度学习技术
2023-12-21 17:53:59555

优于10倍参数模型微软发布Orca 2 LLM

微软发布 Orca 2 LLM,这是 Llama 2 的一个调优版本,性能与包含 10 倍参数模型相当,甚至更好。
2023-12-26 14:23:16247

语言模型使用指南

在信息爆炸的时代,我们渴望更智能、更高效的语言处理工具。GPT-3.5等大语言模型的崛起为我们提供了前所未有的机会。这不仅是技术的进步,更是人与机器共舞的一幕。本篇文章将带你走进这个奇妙的语言王国
2023-12-29 14:18:59276

模型与人类的注意力视角下参数规模扩大与指令微调对模型语言理解的作用

近期的大语言模型(LLM)在自然语言理解和生成上展现出了接近人类的强大能力,远远优于先前的BERT等预训练模型(PLM)。
2024-01-04 14:06:39139

韩国Kakao宣布开发多模态大语言模型“蜜蜂”

韩国互联网巨头Kakao最近宣布开发了一种名为“蜜蜂”(Honeybee)的多模态大型语言模型。这种创新模型能够同时理解和处理图像和文本数据,为更丰富的交互和查询响应提供了可能性。
2024-01-19 16:11:20221

Stability AI推出迄今为止更小、更高效的1.6B语言模型

Stability AI 宣布推出迄今为止最强大的小语言模型之一 Stable LM 2 1.6B。
2024-01-23 10:11:21238

已全部加载完成