搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

最佳开源模型刷新多项SOTA，首次超越Mixtral Instruct！「开源版GPT-4」家族迎来大爆发

【导读】Mixtral 8x7B模型开源后，AI社区再次迎来一大波微调实践。来自Nous Research应用研究小组团队微调出新一代大模型Nous-Hermes 2 Mixtral 8x7B，在主流基准测试中击败了Mixtral Instruct。

Mixtral 8x7B开源模型的诞生，正如Llama一样，为开源社区了带来曙光。

前段时间，Mixtral刚刚发布了8x7B模型的论文。在基准测试结果中，其性能达到或超过 Llama 2-70B和GPT-3.5。

甚至，Mixtral在数学、代码生成和多语言理解任务方面表现亮眼。

最近，一个开源研究小组Nous Research推出了新一代旗舰大模型Nous-Hermes 2 Mixtral 8x7B。

这是首个通过RLHF训练的模型，并在主流基准测试中超越Mixtral Instruct，成为最佳开源模型。

此外，Nous Research团队发布的SFT和SFT+DPO模型，以及DPO适配器将为用户提供更多选择。

在所有的基准测试中，Nous-Hermes 2 Mixtral 8x7B模型也略不逊色。

目前，这些模型同样在Hugging Face上开源上线。

最佳开源模型诞生

据介绍，最新模型是在Mixtral 8x7B MoeLLM微调训练而来。

具体来说，Nous-Hermes 2 Mixtral 8x7B是在1,000,000个条目进行了训练（主要是GPT-4生成的数据），以及整个AI领域开放数据集等其他高质量数据集。

研究人员同时还发布了SFT Only版本，以及SFT+DPO版本。

模型演示

那么，Nous Research团队最新的模型能力有多强？

编写可视化数据代码完全是小菜一碟。

它还能写赛博朋克的迷幻诗。

可以执行反向翻译，从输入文本中创建提示信息。

基准测试

与Mixtral基础模型相比，Mixtral 8x7B上的Nous-Hermes 2在以下基准测试中取得了全面提升，也是MistralAI首次击败旗舰型号Mixtral Finetune。

在GPT4All中，Nous-Hermes Mixtral 8x7B（SFT+DPO）拿下了75.7分，位列榜单第三。

在AGIEval的排行中，Nous-Hermes Mixtral 8x7B（SFT+DPO）拿下了46.05的成绩。

此外，在BigBench Reasoning Test中，Nous-Hermes 2 Mixtral 8x7B（SFT+DPO）霸榜第一。

背后团队

成立于2023年，Nous Research是一个在大模型领域发布开源研究而闻名的私人应用研究小组。

去年12月，这个研究团队成员曾发布了一款轻量的视觉语言模型——Nous Hermes 2 Vision。

这个模型以希腊神使赫尔墨斯的名字命名。它通过用户上传的图像数据，通过自然语言提供详细的答案。

就在前几天，Nous Research宣布了一轮520万美元的种子融资，涉及了多位天使投资人。

到目前为止，Nous Research已经发布了40多个开源模型，包括Hermes、YaRN、Capybara、Puffin和Obsidian系等系列。

Mixtral模型，会将成为开源版GPT-4

继2023年年初Llama发布之后，一系列羊驼家族瞬间爆发。年底，Mixtral的开源MoE发布，更是为开源年做了一个完美的收尾。

有网友表示，Mixtral或将有实力将于今年接管GPT-4。

在Chatbot Arena排行榜上，Mixtral成为（继GPT-4、Claude和Mistral Medium之后）唯一能打的开源模型，也是仅有7B参数的最小模型，甚至比谷歌的Gemini Pro还要好！

而且它是开源的！任何人可以获取该模型，并将其部署到自己的设备，而且可以对其进行微调，可以随心所欲地使用它。

现在，在Mixtral-7B上进行微调、部署的模型案例，也是非常的多。

比如，有网友用树莓派在本地跑起了Phi-2、Mistral和LLaVA等模型。

还有人出了一款APP，名为Offline Chat：Private AI，能够在iPhone上离线跑Mistral 7B模型。

这样一来，模型生成的内容，可以保障安全和隐私。

还有人用直接偏好微调了Mistral-7B模型。

具体来说，研究人员将使用一种类似RLHF的技术：直接偏好优化(DPO)对OpenHermes-2.5进行微调，从而创建NeuralHermes-2.5。

为此，他们还引入了一个偏好数据集，描述DPO算法的工作原理，并将其应用到模型中。我们将看到它显著提高了OpenLLM排行榜上基本模型的性能。

有网友进行的海底捞针实验中， Mistral-7B-Instruct-v0.2在80000 token情况下，召回率下降。

相信未来，Mixtral模型会向羊驼家族一样，迎来大爆发。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

开源

开源

+关注

关注
3

文章
4031

浏览量
45549
模型

模型

+关注

关注
1

文章
3648

浏览量
51692
数据集

数据集

+关注

关注
4

文章
1230

浏览量
26035
大模型

大模型

+关注

关注
2

文章
3440

浏览量
4960

原文标题：最佳开源模型刷新多项SOTA，首次超越Mixtral Instruct！「开源版GPT-4」家族迎来大爆发

文章出处：【微信号：CVSCHOOL，微信公众号：OpenCV学堂】欢迎添加关注！文章转载请注明出处。

评论

OpenCV学堂
专栏

0 文章 0 阅读 0 粉丝 0 点赞

关注个人主页

Hot 灰度共生矩阵(GLCM)基本原理
Hot UNet和UNet++：医学影像经典分割网络对比

New 常见人体姿态评估显示方式的两种方式
New 手写图像模板匹配算法在OpenCV中的实现

精选推荐
更多

文章

资料

帖子

温补晶振选型有哪些关键参数呢？

赛思电子
1天前

288 阅读

低功耗、结构简：干簧传感器赋能家电精准运动感知

斯丹麦德电子
5小时前

461 阅读

预算紧张如何打造高精度实验室？航智HZ6011一台整合电压源电流源与测量表

深圳航智
7小时前

775 阅读

【深度实战】MYD-LR3576 AMP非对称多核开发指南：从配置到实战

米尔电子
11小时前

575 阅读

SiC功率MOSFET内部晶胞单元的结构

翠展微电子
9小时前

705 阅读

POWERPCB视频教程

yaoyuan123
6144

免费

0下载

新唐N79E815核心开发板原理图和PCB图

o_dream
0.53 MB

免费

29下载

基于Cadence Virtuoso 设计平台的单片射频收发集成电路的设计过程

你又知道了
208.69KB

3积分

16下载

摆你一度:非安装式系统安全软件

王越建
0.02 MB

免费

0下载

KubeDirector k8s上应用程序的部署和管理工具

李华瑞
0.31 MB

免费

0下载

基于米尔安路飞龙派FPGA FPSoC+baremetal硬核开发

北方·
19小时前

39 阅读

轻松做出漂亮的LabVIEW界面-FlateUI2.0

yk74110
19小时前

114 阅读

【社区活动】电子发烧友十二月份活动汇总

dianzi_0101
19小时前

300 阅读

飞凌嵌入式ElfBoard-文件I/O的深入学习之I/O多路复用

jf_13411809
19小时前

189 阅读

无刷电机结构问题请教

jf_36226609
19小时前

159 阅读

推荐专栏
更多

企业产品

资料

方案
更多

华秋（原“华强聚丰”）：

电子发烧友

华秋开发

华秋电路(原"华强PCB")

华秋商城(原"华强芯城")

华秋智造

My ElecFans

APP
网站地图

设计技术

可编程逻辑

电源/新能源

MEMS/传感技术

测量仪表

嵌入式技术

制造/封装

模拟技术

RF/无线

接口/总线/驱动

处理器/DSP

EDA/IC设计

存储技术

光电显示

EMC/EMI设计

连接器

行业应用

LEDs

汽车电子

音视频及家电

通信网络

医疗电子

人工智能

虚拟现实

可穿戴设备

机器人

安全设备/系统

军用/航空电子

移动通信

工业控制

便携设备

触控感测

物联网

智能电网

区块链

新科技

特色内容

专栏推荐

学院

设计资源

设计技术

电子百科

电子视频

元器件知识

工具箱

VIP会员

最新技术文章

产品地图

品牌地图

社区

小组

论坛

问答

评测试用

企业服务

产品

资料

文章

方案

企业

供应链服务

硬件开发

华秋电路

华秋商城

华秋智造

nextPCB

BOM配单

媒体服务

网站广告

在线研讨会

活动策划

新闻发布

新品发布

小测验

设计大赛

华秋

关于我们

投资关系

新闻动态

加入我们

联系我们

举报投诉

社交网络

微博

移动端

发烧友APP

硬声APP

WAP

联系我们

广告合作

王婉珠：wangwanzhu@elecfans.com

内容合作

黄晶晶：huangjingjing@elecfans.com

内容合作（海外）

张迎辉：mikezhang@elecfans.com

供应链服务 PCB/IC/PCBA

江良华：lanhu@huaqiu.com

投资合作

曾海银：zenghaiyin@huaqiu.com

社区合作

刘勇：liuyong@huaqiu.com

关注我们的微信

下载发烧友APP

电子发烧友观察

电子工程师社区

1-32层PCB打样·中小批量

元器件现货·全球代购·SmartBOM

SMT贴片·PCBA加工

PCB Manufacturer

华秋简介

企业动态

联系我们

企业文化

企业宣传片

加入我们

版权所有 © 湖南华秋数字科技有限公司

长沙市望城经济技术开发区航空路6号手机智能终端产业园2号厂房3层（0731-88081133）
电子发烧友 （电路图） 湘公网安备43011202000918 工商网监湘ICP备2023018690号-1