0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

超低延时重构AI推理体验!白山云发布“大模型API”产品

爱云资讯 2025-07-02 17:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

白山云科技正式发布“大模型API”产品,首发上线DeepSeek-R1-0528、DeepSeek-R1-0528-Qwen3-8B、Qwen3-32B-FP8等大语言模型。基于白山全球边缘云架构优势,打造超低延时、超稳定、简单易用的API接口服务,降低大模型应用成本和开发门槛,助力企业和个人用户快速开启AI创新之旅。

专注边缘推理,构建“云边端”算力协同新范式

随着多模态交互、多轮会话、Agentic AI自主决策等复杂场景爆发,传统集中式数据中心的算力供给模式下,用户面临网络时延的线性增长、算力成本的指数上升,更低延时、更优成本的边缘算力推理成为必需。边缘推理通过分布式算力下沉与智能调度,能够为高实时、高隐私、高性价比场景提供关键支撑,驱动AI从集中式智能迈向“云-边-端”全域协同智能。

聚焦边缘推理场景,白山云基于全球1700+边缘节点构成的算力网络基座,于今年3月推出“边缘算力云平台”并持续完善升级,覆盖从GPU算力资源到MaaS模型服务的一站式AI算力基础设施,为用户提供高性能、低成本的AI Infra解决方案。

·模型服务:提供预构建、开箱即用的LLM和多模态模型服务(陆续上线),只需一行代码用户即可完成模型切换与集成;基于边缘节点的就近推理,为用户带来<300ms的超低延时推理体验。

·GPU算力服务:包含GPU容器、弹性容器、裸金属三大产品,灵活满足客户从专属算力到轻量级弹性算力的不同选择,为用户高并发场景下的推理请求提供动态扩缩容+按需付费的高性价比分布式异构算力服务。

重构“低延时、高稳定、强安全”性能上限

1、服务网关全网调度技术

根据实时网络状况、节点负载和模型需求,将推理任务动态分发至离用户最近、最优的边缘节点,用户就近计算,推理响应效率翻倍。

2、异构算力弹性调度技术

结合全球虚拟网络分层管理和区域自治能力,实现算力资源的多级弹性扩缩容,支持百万级并发,推理实例启动时间缩短到5秒内。

3、大文件加载优化技术

利用多区域管理的分布式缓存,通过对大模型文件进行数据集编排与亲和性调度,大幅提升服务调度效率,模型文件全链路加载冷启动时长从10分钟缩短到20秒。

4、算力服务单元推理优化技术

在单节点上对推理任务进行PD分离和并行计算,同时通过多卡多模型混跑,GPU利用率提升至56%,单节点模型推理效率提升2.04倍。

5、边缘云原生安全技术

融合白山全球边缘云平台安全防护能力,基于安全网关、云WAF、抗D、零信任安全等安全产品与服务,保障AI业务连续性与数据安全性。

白山云CEO霍涛表示:“大模型推理的实时性需求与成本压力,正推动边缘算力从‘流量节点’向‘智能计算单元’进化——这种深度融合正是下一代AI基础设施的核心范式。白山云依托覆盖全球60多个国家与地区、核心城市节点密度业界TOP 5的边缘网络,正构建‘日均万亿Token级推理处理’的边缘智能平台。我们正通过‘本地推理+云端协同’的混合架构,让边缘算力价值穿透工业质检、智能驾驶等20+垂直场景,切实破解企业智能化转型中的‘实时性鸿沟’与‘算力成本墙’。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • API
    API
    +关注

    关注

    2

    文章

    2147

    浏览量

    66232
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296567
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4964
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AMD Vitis AI 5.1测试版发布

    AMD Vitis AI 5.1全新发布——新增了对 AMD Versal AI Edge 系列神经网络处理单元 (NPU) 的支持。Vitis AI 包含优化的 NPU IP、
    的头像 发表于 10-31 12:46 492次阅读

    什么是AI模型推理能力

    NVIDIA 的数据工厂团队为 NVIDIA Cosmos Reason 等 AI 模型奠定了基础,该模型近日在 Hugging Face 的物理推理模型排行榜中位列榜首。
    的头像 发表于 09-23 15:19 832次阅读

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    DeepSeek-R1:强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI模型。其核心优势在于强大的
    发表于 07-16 15:29

    Nordic收购 Neuton.AI 关于产品技术的分析

    生成比传统框架(如 TensorFlow、PyTorch 等)小 10 倍的模型模型体积可低至个位数 KB,并且推理速度更快、功耗更低。此次收购将 Neuton 的自动化 TinyML 平台
    发表于 06-28 14:18

    GAITC2025|张科:端一体大模型推理应用实战

    出席并在《行业大模型应用与发展》论坛发表演讲,首次深入介绍京东零售在端一体大模型推理架构的实战经验与技术探索,并分享AI
    的头像 发表于 06-26 09:33 401次阅读

    基于RAKsmart服务器的AI模型实时推理方案设计

    面对高并发请求、严格的响应延迟要求及波动的业务负载,传统本地化部署的算力瓶颈愈发显著。RAKsmart服务器凭借其弹性计算资源池、分布式网络架构与全栈AI加速能力,为AI模型实时
    的头像 发表于 05-13 10:33 464次阅读

    中科驭数高性能网卡产品 成就DeepSeek推理模型网络底座

    2025年初,DeepSeek-V3与DeepSeek-R1推理模型的开源引爆了AI社区,这两款产品作为通用千亿级模型与专用推理优化
    的头像 发表于 03-31 11:56 520次阅读
    中科驭数高性能网卡<b class='flag-5'>产品</b> 成就DeepSeek<b class='flag-5'>推理模型</b>网络底座

    英伟达GTC25亮点:NVIDIA Dynamo开源库加速并扩展AI推理模型

    DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 发布了开源推理软件 NVIDIA Dynamo,旨在以高效率、低成本加速并扩展 AI 工厂中的 AI
    的头像 发表于 03-20 15:03 1075次阅读

    IBM发布全新Granite 3.2 AI模型

    Granite 3.2 是小型的 AI 模型,通过对开发人员友好的授权条款,提供推理、视觉和护栏功能。
    的头像 发表于 03-06 16:47 905次阅读

    AI模型在汽车应用中的推理、降本与可解释性研究

    佐思汽研发布《2024-2025年AI模型及其在汽车领域的应用研究报告》。 推理能力成为大模型性能提升的驱动引擎 2024下半年以来,国内
    的头像 发表于 02-18 15:02 1825次阅读
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>在汽车应用中的<b class='flag-5'>推理</b>、降本与可解释性研究

    Qwen大模型助力开发低成本AI推理方案

    阿里巴巴的开源Qwen2.5模型近期在AI领域引发了广泛关注。这一大模型的推出,为斯坦福大学与伯克利大学的研究人员提供了强大的技术支持,使他们能够成功开发出低成本的AI
    的头像 发表于 02-12 09:19 983次阅读

    科技AI芯片CAISA 430成功适配DeepSeek R1模型

    科技全新一代的可重构数据流 AI 芯片 CAISA 430 成功适配 DeepSeek R1 蒸馏模型推理,这一创新举措为大
    的头像 发表于 02-07 09:57 2346次阅读
    鲲<b class='flag-5'>云</b>科技<b class='flag-5'>AI</b>芯片CAISA 430成功适配DeepSeek R1<b class='flag-5'>模型</b>

    科大讯飞即将发布讯飞星火深度推理模型X1

    近日,科大讯飞在1月7日成功举办的办公智能体产品升级发布会上,宣布了一项令人振奋的新进展。据科大讯飞官方透露,公司将于1月15日正式对外发布其最新的“讯飞星火深度推理模型X1”。 这一
    的头像 发表于 01-08 10:30 1025次阅读

    阿里发布开源多模态推理模型QVQ-72B-Preview

    近日,阿里宣布了一项重大技术突破,正式发布了业界首个开源多模态推理模型——QVQ-72B-Preview。这一模型的问世,标志着阿里
    的头像 发表于 12-27 10:28 858次阅读

    Amazon Bedrock推出多个新模型和全新强大的推理和数据处理功能

    :Invent全球大会上,宣布推出Amazon Bedrock的多项创新功能。Amazon Bedrock是亚马逊科技一项完全托管的服务,旨在利用高性能基础模型构建和扩展生成式人工智能(AI)应用程序。此次
    的头像 发表于 12-07 19:31 1446次阅读
    Amazon Bedrock推出多个新<b class='flag-5'>模型</b>和全新强大的<b class='flag-5'>推理</b>和数据处理功能