0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

PerfXCloud顺利接入MOE大模型DeepSeek-V2

perfxlab 来源:perfxlab 2024-07-27 10:08 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

今日,在 PerfXCloud 重磅更新支持 llama 3.1 之后,其平台再度实现重大升级!目前,已顺利接入被誉为全球最强的 MOE 大模型DeepSeek-V2,已在 PerfXCloud(澎峰云)官网的体验中心对平台用户免费开放体验。

DeepSeek-V2

DeepSeek-V2是强大的专家混合(MOE)语言模型,在目前大模型主流榜单中,DeepSeek-V2 综合能力表现出色:

中文综合能力(AlignBench)开源模型中最强,与GPT-4-Turbo,文心4.0等闭源模型在评测中处于同一梯队

英文综合能力(MT-Bench)与最强的开源模型LLaMA3-70B同处第一梯队,超过最强MOE开源模型Mixtral 8x22B

知识、数学、推理、编程等榜单结果也位居前列

支持128K上下文窗口

wKgZomakVtiAA-GLAAGKlzEyOjY270.png

PerfXCloud

PerfXCloud是澎峰科技为开发者和企业量身打造的AI开发和部署平台。它专注于满足大模型的微调和推理需求,为用户提供极致便捷的一键部署体验。

PerfXCloud为算力中心提供大模型AI科学与工程计算的整体运营解决方案,助力算力中心升级成为“AI超级工厂”

wKgaomakVtiAMNCmAAKqFAnrxaY517.png

PerfXCloud模型广场

PerfXCloud介绍 目前,PerfXCloud(澎峰云)已面向基石用户免费开放DeepSeek-V2236B的API调用接口。赶快注册申请成为基石用户来体验吧!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    4431

    浏览量

    46606
  • 语言模型
    +关注

    关注

    0

    文章

    575

    浏览量

    11376
  • 大模型
    +关注

    关注

    2

    文章

    3877

    浏览量

    5300
  • DeepSeek
    +关注

    关注

    2

    文章

    862

    浏览量

    3485

原文标题:PerfXCloud 再度升级,免费开放体验全球顶尖 MOE 大模型 DeepSeek-V2 236B!

文章出处:【微信号:perfxlab,微信公众号:perfxlab】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    使用NVIDIA Blackwell和GPU加速端点构建DeepSeek V4大模型

    DeepSeek 刚刚发布了第四代旗舰模型,推出 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 两款产品,均致力于实现高效的百万词元上下文推理。
    的头像 发表于 05-16 09:16 311次阅读
    使用NVIDIA Blackwell和GPU加速端点构建<b class='flag-5'>DeepSeek</b> <b class='flag-5'>V</b>4大<b class='flag-5'>模型</b>

    摩尔线程完成DeepSeek-V4全链路工程化适配:S5000基于MUSA+SGLang实现复杂MoE模型快速落地

    近日,摩尔线程依托旗舰级AI训推一体智算卡MTT S5000与自研MUSA软件栈,基于SGLang 开源推理框架,成功完成DeepSeek-V4的完整运行验证。该成果表明,面向新一代MoE模型
    发表于 05-02 09:01 860次阅读

    华为云首发适配DeepSeek-V4模型

    4月24日,DeepSeek-V4模型正式发布并开源,华为云首发适配。DeepSeek-V4拥有百万Token超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。其中
    的头像 发表于 04-28 17:01 694次阅读

    燧原科技L600 FP8原生适配DeepSeek-V4-Pro/Flash模型

    2026年4月24日,深度求索(DeepSeek)正式发布并开源新一代旗舰大模型DeepSeekV4,同步推出1.6T DeepSeek
    的头像 发表于 04-28 15:19 688次阅读

    OpenClaw 全面接入DeepSeek-V4系列模型

    近期,OpenClaw 2026.4.24版本全面接入DeepSeek-V4系列模型,以V4-Flash为默认大脑,V4-Pro同步上线,构
    的头像 发表于 04-28 09:29 833次阅读

    荣耀YOYO首搭DeepSeek-V4大模型 重塑安卓端侧AI新标杆

    近日,荣耀YOYO接入DeepSeek-V4大模型,标志着安卓阵营在AI智能助理领域实现重大突破
    的头像 发表于 04-28 09:17 2166次阅读

    长江计算G940K V2超节点服务器完成对DeepSeek V4模型极速适配

      4月24日,备受行业关注的大模型产品DeepSeek V4正式发布。烽火通信旗下长江计算凭借深厚的技术积累与前瞻布局,以G940K V2超节点服务器为核心载体,同步完成对
    的头像 发表于 04-24 17:40 2067次阅读

    大规模专家并行模型在TensorRT-LLM的设计

    DeepSeek-V3 / R1 等模型采用大规模细粒度混合专家模型 (MoE) 架构,大幅提升了开源模型的质量。Llama 4 和 Qwe
    的头像 发表于 09-06 15:21 1575次阅读
    大规模专家并行<b class='flag-5'>模型</b>在TensorRT-LLM的设计

    【「DeepSeek 核心技术揭秘」阅读体验】基于MOE混合专家模型的学习和思考-2

    )# [batch] return weighted_mse.mean()# 批次平均 在 MoE 模型中使用 class MoE(nn.Module): def __init__(self
    发表于 08-23 17:00

    【「DeepSeek 核心技术揭秘」阅读体验】+混合专家

    逻辑,硬件性能的成本选择,达到的效果, 最后是对人工智能的影响。 Deepseek在技术思路上,采用混合专家系统MoE架构(思维模块),MoE则由多个专家模型组成,在处理任务时,它能够
    发表于 07-22 22:14

    【「DeepSeek 核心技术揭秘」阅读体验】第三章:探索 DeepSeek - V3 技术架构的奥秘

    一、模型架构 在阅读第三章关于 DeepSeek模型架构部分时,我仿佛打开了一扇通往人工智能核心构造的大门。从架构图中,能清晰看到 Transformer 块、前馈神经网络、注意力机制等模块
    发表于 07-20 15:07

    【「DeepSeek 核心技术揭秘」阅读体验】书籍介绍+第一章读后心得

    token(模型处理文本的基本单位)激活370亿个参数。该模型在14.8万亿个高质量token上进行预训练,采用MLA和MoE架构。这些架构在DeepSeek-V2中已经得到验证,并在
    发表于 07-17 11:59

    【书籍评测活动NO.62】一本书读懂 DeepSeek 全家桶核心技术:DeepSeek 核心技术揭秘

    DeepSeek-V3技术突破 DeepSeek-V3 的模型架构整体上基于 Transformer 的 MoE 架构,并在细节实现上做了大量的创新和优化,如大量小专家
    发表于 06-09 14:38

    智多晶FPGA设计工具HqFpga接入DeepSeek模型

    在 AI 赋能工程设计的时代浪潮中,智多晶率先迈出关键一步——智多晶正式宣布旗下 FPGA 设计工具 HqFpga 接入 DeepSeek模型,并推出 FPGA 设计专属 AI 助手——晶小助!这是 FPGA 领域首次引入大
    的头像 发表于 06-06 17:06 1879次阅读

    讯飞星辰MaaS平台实现高性能DeepSeek V3上线

    DeepSeek模型为代表的MoE技术路线,正不断突破通用大模型的效果上限。其创新的PD优化与大EP推理方案,推动大模型迈向“高性能、低成
    的头像 发表于 06-04 10:15 1606次阅读