0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何冲破大模型时代的算力关卡?天翼云给出答案

脑极体 来源:脑极体 作者:脑极体 2024-07-18 09:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

wKgaomaXr3mAISqTAAkB2jLwekM045.jpg

IDC最新发布的《中国智算服务市场(2023 下半年)跟踪》报告显示,2023 下半年中国智算服务市场整体规模达到 114.1 亿元人民币,同比增长 85.8%;方正证券发布的《2023年AI算力行业报告》显示,目前智能算力渗透率达到22.78%,而未来“天花板”有望超80%。可以看出,智算市场正处于加速增量阶段,面向人工智能时代的智算需求也将迎来爆发增长。

而无论是当下炙手可热的大模型技术,还是面向行业场景化的创新AI研发,都建立在一种资源的充分利用上,那就是算力。在复杂多样的需求之下,不仅要求算力资源更加充沛和灵活,还要求算力基础设施向智能和一体化的方向发展,以更高效率和性能来支持更大规模计算,助力我国智能产业加速“翱翔”。

那么,谁来承担这一使命呢?

勇担科技自立自强的使命,正是天翼云的特点。

在不久前的2024世界人工智能大会上,天翼云科技有限公司董事长、总经理胡志强表示,天翼云作为国家云,已具备丰富的智算资源储备、强大的智算平台能力和开放的模型应用生态。面向人工智能新一轮科技革命浪潮,天翼云坚持以科技创新驱动高质量发展,为数字经济发展注入新动能。

拥抱人工智能技术趋势、发挥云化算力底座作用,天翼云不仅自建了丰富的智算资源,同时汇聚了大量的社会智算资源,为千行百业向智发展,打造了坚实的云化算力底座。

wKgaomaXr3qAVaxeAAHMTX6zvoY232.jpg

近年来,我国在多个战略规划中提到了算力建设的重要性,比如国务院印发的《数字中国建设整体布局规划》提出,要系统优化算力基础设施布局,促进东西部算力高效互补和协同联动,引导通用数据中心、超算中心、智能计算中心、边缘数据中心等合理梯次布局。随着当下AI和大模型的行业渗透率不断提高,对于多层次智算资源需求愈发凸显。

要保障算力充沛供给与高效利用,我们还需要攻破这些关卡:

第一关是“智算资源的供给紧张”。针对大模型和AI任务的专项算力,供给持续紧缺,海外高端算力芯片供不应求,供应链风险也越来越大。面对海外算力封锁的严峻形势,我们必须构建自主可控的算力资源体系,确保算力的安全性和稳定性,为各行各业提供坚实可靠的算力支撑。

第二关是“已有算力的利用率不高、区域算力差异大”。 在数字经济时代,算力水平制约产业和经济发展,很多地区、企业都开始建设数据中心,算力总规模持续增长,但不同地区、不同行业之间的算力资源分配也存在不均衡现象,已有算力资源的配置效率有待提升。

目前来看,通过云化的方式对算力资源进行集中化和高效调度、促进算力资源的跨地区跨行业共享,是提高算力利用率的可行方案,让算力可以如同水、电等公共基础设施一样,被用户便捷、低成本地获取。

面向云智融合的时代趋势,作为云服务国家队的天翼云勇担时代重任,通过科技创新进行攻关、进行多层次的算力布局,实现了丰富的智算资源供给,为客户提供强大的算力支持。

wKgaomaXr3uAH49aAAHBkvzPR-I852.jpg

兵马未动,粮草先行。于AI产业而言,智算资源便是“粮草”。

面向智算,天翼云自建了大规模、多样化的算力资源,可以满足各个区域、各种行业场景的不同需求。目前,天翼云在全国范围内构建了“2+4+31+X”的资源池,织就全国算力“一张网”,构建了“中心-省-边缘-端”的四级算力布局体系。通过针对性优化,解决了AI在云上的大量工程化挑战。

首先,针对性解决大模型训练推理需要大规模算力问题。天翼云超前构建智能算力布局,针对 AI 产业集聚区,规划建设了北京、上海、广东、浙江、安徽人工智能公共算力中心,并先后在上海、北京建成万卡池,这也是全国最早建成并真正投产运行的两个国产化、全液冷、单集群万卡公共智算中心。

其次,针对能耗问题打造绿色高效算力。计算也是耗能大头,提高能效、节能减碳势在必行。天翼云通过领先技术降低能耗,如在公共智算中心采用液冷技术,实现能效和算效“双效合一”。此外还在内蒙、贵州、宁夏等清洁能源集聚地建设智算中心,提供绿色低碳的算力。

再次,为了提高算力响应速度和计算效率,天翼云已在31省预部署AI云电脑和推理池,在280多个地市的一城一池节点和1000多个边缘节点,按需下沉AI云电脑算力和推理算力。

最后聚焦技术自主可控,天翼云支持“一云多态”,提供国内外主流的GPU、NPU算力方案,面向不同场景为用户提供公有云、私有云、边缘云多种形态服务。

可用、可信、可持续的算力才能让中国AI持续前行,天翼云通过“建内功”,已储备了分布广泛、安全可靠、技术先进、绿色节能的大规模智算“粮仓”,并以云服务的形式,实现灵活便捷、低成本地获取,为各行各业智能演进提供充沛普惠的算力保障。

wKgaomaXr32AC9d2AAHYUhp5uSs427.jpg

于智算资源而言,患寡亦患不均,有了算力粮储,进而要考虑高效调度分配。

为了保障我国算力资源高效运营,目前全国正加快形成一体化算力网络。但多地多方的算力联网,让算力互联、跨域调度管理等工作在实际运行中面临一系列挑战,亟需一张“算力网”平衡区域资源、实现供需匹配。

为此,天翼云重点研发算力分发网络平台“息壤”,从算力统一接入、算数网一体化调度、算力简便易用三方面进行技术突破:

在算力统一接入方面,“息壤”平台预置了算力插件,可高效接入平台化算力,此外还通过算力网关,将裸算力云化接入。

在算数网一体化调度方面,通过算数协同,实现数随算走、算随数动,让调度策略更全面,调度方案更精准,同时构建了多级算力互联调度,让调度区域更广、算力更泛在。

在提升算力简便易用性上,“息壤”借助了大模型认知能力,为行业与客户智能匹配合适的算力选择,让应用部署更简单。通过业务调度,还能实现跨地域跨服务商的故障自动恢复和负载均衡,提升应用可靠性。

天翼云通过“息壤”平台,大规模汇聚社会各方算力,解决了跨域、跨服务商异构算力的统一调度管理、并网交易等需求,实现促进算力互联互通、高效利用、供需匹配,也促进全国一体化算力体系加速形成。目前,“息壤”主要服务于三大算力场景:

一是自营的公共算力服务平台。目前已接入多家算力伙伴,显著扩大了天翼云的算力规模和品类,满足公有云客户的多元算力需求。

二是行业算力互联网。比如福建多所大学组成的高校算力联盟,通过多方资源共享、优势互补,提升算力利用水平。

三是城市算力互联网。通过整合区域内多方算力,结合产业政策,一体化统筹调度算力,目前已在多个区域成功实践。

通过技术创新与合作,天翼云以“息壤”为算力资源底座逐步推动构建起一张全国“算力网”,以多样且灵活的算力调度能力,打破算力分布不均衡、已有算力资源利用率低的瓶颈。

wKgaomaXr36AAxnjAAG3FpXFPqw459.jpg

AI的渗透率将持续增长,重塑社会经济的每一个角落。随着AI应用场景的不断拓展,算力需求也将呈现出多样化的特点,算力基础设施由通算向通智超一体化发展,算力建设也向更丰富、更多层次的智算发展。

无论需求如何变迁,天翼云始终勇立时代潮头创新技术、演进实力。我们可以看到“国云”的独特气质:

纵向有高度。无论是全栈自研的万卡集群解决方案,还是跨域调度的“息壤”平台,天翼云以极高的技术实力,创新性地解决智算供给难题。

横向有广度。作为“国家队”,天翼云致力于推动算力的普惠化,息壤平台加快形成全国一体化算力体系,让充沛、可靠、持续的算力成为千行百业用得到、用得起的资源。

站在AI黄金期的起点上,跨越算力瓶颈,天翼云给出的答案,是将自建算力和社会算力汇聚起来,AI将像水、电、网络一样无处不在,把普惠算力送往更加广阔的天地,送到社会的每一个角落,为数字经济发展注入磅礴动能。

既已越过了向智能云发展的拐点,便是开启新一轮智算征程。作为AI加速渗透的强大后盾,天翼云在智能时代的壮丽征程才刚刚拉开序幕。

wKgaomaXr3-ATxo-AAHAjCl-uFA699.jpg

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41067

    浏览量

    302572
  • 算力
    +关注

    关注

    2

    文章

    1670

    浏览量

    16832
  • 大模型
    +关注

    关注

    2

    文章

    3765

    浏览量

    5269
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    科技报到:AI革命,终结计算20年降价史

    跟进,AI、高端存储等核心产品价格大幅上调,一场由人工智能驱动的定价革命,正在彻底重塑计算产业的底层逻辑与商业格局。 这场涨价并非
    的头像 发表于 04-03 17:05 2976次阅读

    监控的下半场:从基础设施报警到精算师

    摘要: 在十万卡集群与万亿参数模型时代,基础设施的稳定性直接决定了模型训练的边际成本。当单次训练成本高达千万美元时,监控系统不再是简单的报警,而是衡量
    的头像 发表于 03-18 11:13 392次阅读

    知声山海知音大模型2.0重磅发布

    随着智能体时代到来,知声在“山海·Atlas”通用智基座持续演进基础上,年前实现了“山海·知医”5.0医疗大模型升级,今天迎来了“山海·知音”2.0的重磅发布,正在完成“一基两
    的头像 发表于 01-27 14:08 326次阅读
    <b class='flag-5'>云</b>知声山海知音大<b class='flag-5'>模型</b>2.0重磅发布

    GPU 利用率<30%?这款开源智平台让不浪费 1%

    一套 AI 服务要折腾几天,环境配置、依赖处理耗尽心力;运维告警凌晨轰炸,集群故障诊断如同大海捞针,MTTR(平均修复时间)高得离谱…… AI 时代浪费,早已成为制约企业 AI 落地的核心痛点。而秒如科技开源的 Lnjoy
    的头像 发表于 01-26 14:20 280次阅读

    知声荣膺2025年上海产业典型案例

    12月17日,“在第四届网络与数字经济论坛暨2025年“浦江”大会上,2025年度上海
    的头像 发表于 12-24 18:16 1336次阅读

    应对端侧AI、内存、功耗“三堵墙”困境,安谋科技Arm China “周易”X3给出技术锦囊

    AI大模型正加速从云端向边缘与端侧渗透,然而,、内存、功耗等却成了制约其规模化落地的“高墙”。专为AI计算而生的神经网络处理器(NPU),成为破墙关键。安谋科技Arm China“周易”X3
    的头像 发表于 12-18 13:45 527次阅读
    应对端侧AI<b class='flag-5'>算</b><b class='flag-5'>力</b>、内存、功耗“三堵墙”困境,安谋科技Arm China “周易”X3<b class='flag-5'>给出</b>技术锦囊

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    玑9500 性能大爆发!NPU AI或达100TOPS

    电子发烧友网综合报道,据博主数码闲聊站独家爆料,联发科玑9500 NPU用上全新IP硬件,AI对比前代直接翻倍。此外,玑9500将推出类似“存
    的头像 发表于 08-21 11:12 4317次阅读
    <b class='flag-5'>天</b>玑9500 性能大爆发!NPU AI<b class='flag-5'>算</b><b class='flag-5'>力</b>或达100TOPS

    联发科野心不小,玑9500 AI直接翻倍

    手机不仅可以运行更聪明的大模型,响应速度也更加迅速,让手机的 AI 有了更强的“活人感”。继去年玑 9400 创造 AI 性能第一的记录后,即将到来的玑 9500 NPU眼看着又来了波更狠的。手机 AI
    的头像 发表于 08-20 13:33 1046次阅读
    联发科野心不小,<b class='flag-5'>天</b>玑9500 AI<b class='flag-5'>算</b><b class='flag-5'>力</b>直接翻倍

    龙芯中科亮相第二届之都开发者大会

    近日,以“开源·开放 融合·服务”为主题的第二届之都开发者大会暨AI生态合作大会在银川召开。大会由中国电信宁夏公司携手龙芯中科等业
    的头像 发表于 08-16 13:52 1893次阅读

    睿海光电领航AI光模块:超快交付与全场景兼容赋能智时代——以创新实力助力全球客户构建高效底座

    一、AI革命催生光模块新需求,睿海光电以技术优势抢占制高点 人工智能、超大规模数据中心和计算的高速发展,对光模块的传输效率、兼容性及交付周期提出更高要求。作为全球AI光模块领域的领军企业
    发表于 08-13 19:03

    板卡:驱动智能时代的核心引擎

    在人工智能、大数据和计算高速发展的今天,已成为推动技术进步的关键资源。作为的物理载体,
    的头像 发表于 08-01 10:25 1713次阅读

    科技上线赤兔推理引擎服务,创新解锁FP8大模型

    模型轻量化部署方案。用户通过远程平台预置的模型镜像与AI工具,仅需50%的GPU即可解
    的头像 发表于 07-30 21:44 1038次阅读

    成都汇阳投资关于太空打破传统地观,重构基智能版图

         轨道突破地面瓶颈 ,重构基智能生态 ,市场空间巨大 太空正引领基计算体系从
    的头像 发表于 07-24 09:17 1511次阅读

    即国力,比克电池如何为AI时代“蓄能

    引擎》中明确提出,“是数字经济时代的新质生产,更是国家竞争的重要指标。”随着AI大模型
    的头像 发表于 06-04 14:22 1261次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>即国力,比克电池如何为AI<b class='flag-5'>时代</b>“蓄能