0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为OceanStor A800支持DeepSeek

华为数字中国 来源:华为数字中国 2025-02-18 10:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能技术迅猛发展的当下,大模型的低成本与高性能成为各大科技企业竞相追逐的焦点。

近期火爆的DeepSeek-R1模型凭借低成本、高性能优势引发市场波动,DeepSeek-R1实力惊人,拥有6710亿参数,推理能力表现卓越,采用了慢思考+思维链,能对复杂问题深入分析和推理,得出准确且有逻辑的结论,这使其在处理数学计算、代码编写、自然语言处理等各种任务时都游刃有余。

但是复杂推理的多轮对话和长序列需要缓存更多的KV Cache,导致GPU高带宽内存容量成为瓶颈,而通过增加DRAM解决问题又会让推理成本激增。为了应对上下文KV Cache缓存的问题,DeepSeek采用创新性的硬盘缓存技术,将GPU、DRAM中的缓存数据Offload到存储阵列中,成功将大模型使用成本降低一个数量级。

在大模型推理过程中通过高性能分布式文件存储以存代算,可以提升用户体验与推理效率,同时有效降低推理成本。这一技术趋势在DeepSeek API服务中大范围应用,其上下文硬盘缓存技术不仅能降低服务延迟,还可大幅削减最终的使用成本。

a222f38e-ed2a-11ef-9310-92fbcf53809c.png

DeepSeek API 模型&价格

(数据来源:https://api-docs.deepseek.com/zh-cn/quick_start/pricing)

从技术角度来看,在大模型API使用场景中,用户输入存在相当比例的重复内容,比如用户的提问中常有重复引用部分,多轮对话中每一轮都需重复输入前几轮内容。同时,在很多面向企业(ToB)的专业领域里,业务信息又多又复杂,常常是一长串地输入。推理时需要从这些长上下文的内容里找出有用的信息和关键主题,这就需要计算和存储相互配合。为此,采用以存代算技术,将预计未来会重复使用的内容缓存在存储中,当输入有重复时,重复部分只需从缓存读取,无需重新计算。这一技术不仅显著降低服务延迟,还大幅削减最终使用成本。

以多轮对话场景为例,下一轮对话会命中上一轮对话生成的上下文缓存:

a23fa70e-ed2a-11ef-9310-92fbcf53809c.jpg

华为数据存储OceanStor A800针对大模型推理具备Unified Cache多级缓存技术,与DeepSeek硬盘缓存技术采用相同的技术路线,简单来说,就是提前把和你相关的历史信息,比如你们之前聊过的内容、你的喜好这些“记忆”,存到的存储设备里。等你要用的时候,它能快速找到这些相关信息(相关KV Cache片段),不用每次都从头开始推理计算。这样一来,不仅能快速准确地处理长对话内容(长序列),成本也能降下来,而且还能根据你的独特需求提供更贴心的个性化服务,让模型就像专门为你定制的一样。

a2563910-ed2a-11ef-9310-92fbcf53809c.png

华为OceanStor A800是基于数控分离全交换架构的原生AI存储,Unified Cache多级缓存技术可应用于:

具有长预设提示词的问答助手类应用,如智能客服、智能运维;

具有角色设定与多轮对话的角色扮演类应用,如电商&教培、英语口语陪练;

超长文本行业总结分析以及复杂推理等场景,如金融投研分析、法律卷宗分析;

针对固定文本集合进行频繁询问的数据分析类应用;

代码仓库级别的代码分析与排障工具。

为推理系统提供TB级性能、PB级容量、大规模共享的全局内存扩展池,实现高效的上下文KV Cache保存、管理与加载策略,有效提升KV Cache加载效率,可支持的序列长度从百K扩展到无限长,实现推理首Token时延4+倍降低,E2E推理成本2+倍降低,为大模型提供终身记忆和无限上下文能力。

a26a275e-ed2a-11ef-9310-92fbcf53809c.png

大模型推理使用华为OceanStor A800高性能分布式文件存储,能够实现PB级容量的DRAM性能,进一步降低大模型推理服务的延迟,大幅削减最终使用成本,重新定义了AI服务的性价比,为大模型在各行业的广泛普及与应用注入强大动力,加速大模型普惠时代的到来。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    218

    文章

    36190

    浏览量

    262694
  • 硬盘
    +关注

    关注

    3

    文章

    1367

    浏览量

    60072
  • DeepSeek
    +关注

    关注

    2

    文章

    839

    浏览量

    3406

原文标题:华为OceanStor A800支持DeepSeek硬盘缓存技术,重新定义AI性价比

文章出处:【微信号:HWS_yunfuwu,微信公众号:华为数字中国】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    阿里神秘AI芯片曝光:多项参数超越英伟达A800

    ,并交由中国大陆代工厂生产,已经进入测试阶段。   然而在9月16日晚,央视《新闻联播》节目中,阿里平头哥AI算力卡PPU在新闻背景画面里被曝光,在“国产卡与NV卡重要参数对比”表格中显示,PPU在显存、片间带宽等多项硬件参数均超越英伟达A800
    的头像 发表于 09-18 09:46 8913次阅读
    阿里神秘AI芯片曝光:多项参数超越英伟达<b class='flag-5'>A800</b>

    IP6860支持qi 认证的无线充电发射控制SOC

    IP6860支持qi认证的无线充电发射控制SOC简介IP6860是一款高集成度,符合WPCqi标准的无线充电发射控制芯片。芯片内部集成H桥驱动模块、ASK通讯解调模块、适配器快充Sink协议等必要
    发表于 03-18 19:22 0次下载

    IP2345支持PD3.0等多种快充协议 支持4~6节串联电池最大充电功率30W异步升降压充电IC

    IP2345支持PD3.0等多种快充协议支持4~6节串联电池最大充电功率30W异步升降压充电IC简介IP2345是一款外置MOS管,采用异步开关架构,支持4~6节锂电池升降压充电IC。开关频率
    发表于 03-18 18:49 0次下载

    广汽昊铂A800上市发布会定档3月4日

    3月4日,“昊铂品牌惊蛰之夜暨昊铂A800上市发布会”将在广汽集团番禺总部盛大举行。作为昊铂埃安BU组建后的战略力作,昊铂A800以美学与功能兼具的设计语言,融合全球领先的智慧科技,重新定义新时代豪华标准。
    的头像 发表于 02-28 14:36 553次阅读

    如何让S32K396支持FreeRTOS的多核运行?

    如何让S32K396支持FreeRTOS的多核运行
    发表于 02-26 10:03

    广汽昊铂A800展开冰雪试驾体验活动

    近日,广汽昊铂A800在呼伦贝尔诺干湖冰雪测试场,展开了一场“冰雪试炼·稳如磐石”冰雪试驾体验活动。在零下35℃的严苛环境下,昊铂A800通过麋鹿测试、连续绕桩等一系列项目,全面验证其在极端气候条件下的卓越操稳能力与综合性能实力。
    的头像 发表于 01-27 10:35 684次阅读

    CW32F030支持哪些协议及功能?

    CW32F030支持哪些协议及功能
    发表于 12-22 06:18

    请问CW32F003支持printf函数吗?

    CW32F003支持printf函数吗?
    发表于 11-21 07:48

    CW32L011支持哪些实时操作系统?

    CW32L011支持哪些实时操作系统?
    发表于 11-17 06:51

    stm32支持canfd和dma结合使用吗?

    stm32支持canfd和dma结合使用吗
    发表于 08-01 07:15

    华为Mate 80支持eSIM 华为重回世界500强前100

    给大家带来华为的最新消息: 曝华为Mate 80支持eSIM 华为Mate 80一直备受关注,据数码博主“智慧皮卡丘”微博爆料称:“低轨卫星通讯+eSIM,新的通讯架构”,并带上了“
    的头像 发表于 07-30 14:40 1561次阅读

    【润开鸿HH-SCDAYU800A开发板试用体验】开箱评测报告

    、Type-C数据线、快速入门指南、星闪技术模块(DAYU800A新增)。 接口布局 :正面可见4个USB 3.0 Type-A、双千兆网口(支持PoE扩展)、HDMI 2.0、MIPI-CSI摄像头
    发表于 07-16 20:28

    CS57066支持22A 4.5V~24V输入,单节锂电池适用低静态电流,兼容同步和异步外围应用,DC-DC升压IC

    CS57066支持22A 4.5V~24V输入,单节锂电池适用低静态电流,兼容同步和异步外围应用,DC-DC升压IC
    的头像 发表于 07-14 20:50 692次阅读
    CS57066<b class='flag-5'>支持</b>22<b class='flag-5'>A</b> 4.5V~24V输入,单节锂电池适用低静态电流,兼容同步和异步外围应用,DC-DC升压IC

    华为OceanStor Dorado全闪存再获殊荣

    全球著名技术分析机构DCIG(Data Center Intelligence Group)发布报告《DCIG 2025-26安全NAS存储(容量10PB以上)TOP5》(以下简称“报告”),华为OceanStor Dorado全闪存凭借领先的数据安全和NAS能力,荣登T
    的头像 发表于 06-24 15:44 1209次阅读

    K230支持ONVIF上传视频吗?

    K230支持ONVIF上传视频吗
    发表于 06-20 07:11