0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

利用高密度内存显著优化人工智能欺诈检测的基础设施成本

三星半导体和显示官方 来源:三星半导体和显示官方 2026-03-10 09:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

利用高密度内存显著优化人工智能欺诈检测的基础设施成本

人工智能欺诈检测是金融科技公司的一项关键工作。欺诈监控涉及多种机制,例如采用自然语言处理技术筛选通信中的可疑内容、利用机器学习区分欺诈交易和合法交易,以及运用分析技术区分正常用户行为和异常行为,并基于历史数据预测未来趋势。

就关键计算活动而言,持续进行的实时推理工作核心在于处理交易、生成欺诈评分以及采取诸如阻止违规交易等操作。这项工作负载涉及大量KB级的小型交易数据,这些交易需要以正确的格式存储并实时处理。

内存数据库(IMDB)可以满足这种工作负载的需求,它以适合此类工作的格式提供存储,同时与典型的块访问存储相比,还能实现更快的加载/存储I/0性能。

此类数据库所需的内存容量巨大,由于每台服务器的实际内存有限,因此实现起来极具挑战性。对于需要服务器集群的大型工作负载,必须考虑多项总体拥有成本(TCO)因素。

·需要更多服务器:为了应对工作负载,必须部署更多服务器,而这往往仅是为了满足IMDB对内存的增量需求。这导致客户最终要为额外的计算、存储、安全和系统软件付费,而这些实际上并非必要,根本自的是为了获得额外的内存。

·网络复杂性增加:网络复杂性的提升不仅体现在数据中心内部的物理基础设施上,也体现在IMDB软件的复杂性上一一这增加了电力需求,并损害了性能和成本。

·可靠性问题:鉴于客户数据的敏感性和隐私性,金融科技公司通常会维护自己的数据中心。因此,底层基础设施的可靠性对数据完整性至关重要。由余节点和复杂网络构成的臃肿基础设施,需要通过更多的系统复制来减轻故障的影响。

添加DRAM的成本

解决这个问题的一个看似简单的方案是增加每个服务器节点的内存容量,但实际实施起来却并非易事。金融科技基础设施中典型的内存金字塔结构如下所示。

内存需求主要由DRAM满足,而DRAM的每GB价格通常是SSD的10倍。通过DRAM增加节点内存容量成本很高。除了成本因素外,DRAM的容量扩展在技术上无法达到SSD的水平:插槽数量有限,单张内存卡的容量也有限。即使是最昂贵的企业级系统,目前DRAM总容量也无法超过20TB,而SSD的容量可以达到PB级。

使用CXL进行内存扩展

为了展示一种更高效的方法,下图使用CXL设备增加了两个内存层。CXL支持更符合AI工作负载需求的内存语义(如一致性、小容量加载/存储/O),使客户能够构建高密度内存系统,在无需额外服务器的情况下提供更大容量,从而优化总体拥有成本(TCO)。与SSD相比,CXL提供更快的性能;与DRAM相比,其容量也更高。

用于直连或远程存储的CXL协议预计将成为面向人工智能、高性能计算和云数据中心工作负载的高端服务器的标准功能。它将在内存扩展、内存共享和内存池化等应用场景中发挥重要作用。除了可扩展性之外,它还提供满足人工智能欺诈检测工作负载需求的带宽和延迟性能。

RAS,SLAS,可观测性

除了性能和总体拥有成本(TCO)的节省之外,金融科技提供商还迫切需要确保其数据中心服务器集群中所有系统内存的可靠性、可维护性、可用性(RAS)和可观测性。他们必须持续监控设备故障,其发生频率往往高于预期。能够快速、及时地检测和干预这些设备的问题,是金融科技提供商履行关键服务级别协议(SLA)的基础。

因此,该数据的可靠性、可用性和基础架构就显得至关重要。如果基础架构变得臃肿不堪,金融科技支持机构将不得不应对持续不断的故障,从而需要维护多个数据副本才能满足其对客户承诺的服务级别协议(SLA)。

三星Cognos解决方案

CXL内存解决方案的部署可以通过三星的人工智能增强型内存管理与协调软件Samsung Cognos来实现。Cognos为实现直连内存提供了关键支持,其特性包括:

·管理高密度、多设备内存池,并具备易于扩展性,以解决内存滞留问题。

·实现应用感知的内存编排,以最大化分层内存的性能。

·基于欺诈检测服务级别协议(SLA)指标的自动数据分层,结合本地化和热点数据模式管理,以及三星设备中的设备级接口,实现数据分层。

·直观的控制台,方便进行设备和应用程序级别的可观测性分析。

·对应用程序而言具有透明性,因此应用程序无需修改即可使用

Cognoso

Cognos通过RAS和可观测性功能,简化了服务器集群的监控和维护。它为客户提供了一种无需人工干预的可扩展内存管理方法,并能与欺诈检测应用程序所需的IMDB实现无缝集成。通过在实际运行环境中采用Cognos和CXL,用户成功实现了总体拥有成本提升4倍的成效,同时满足了其在延迟和吞吐量方面的服务等级协议目标。

由于无需进行任何应用程序层面的更改,因此该解决方案不仅适用于本文讨论的AI欺诈检测负载,对许多其他IMDB负载也同样具有吸引力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 内存
    +关注

    关注

    9

    文章

    3255

    浏览量

    76589
  • AI
    AI
    +关注

    关注

    91

    文章

    41964

    浏览量

    303057
  • 三星
    +关注

    关注

    1

    文章

    1788

    浏览量

    34557

原文标题:科技之心|高密度存储:AI风控基础设施降本增效新路径

文章出处:【微信号:sdschina_2021,微信公众号:三星半导体和显示官方】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Bamtone K系列盲孔显微镜:一种PCB板高密度盲孔的孔径检测方案

    高密度互连(HDI)印制电路板(PCB)已成为5G通信、人工智能芯片及先进封装技术的核心载体,这类电路板大量采用不贯穿板体的“盲孔”来实现层间的高密度电气连接。这些盲孔的孔径微小(≤50μm),数量
    的头像 发表于 05-14 09:58 180次阅读
    Bamtone K系列盲孔显微镜:一种PCB板<b class='flag-5'>高密度</b>盲孔的孔径<b class='flag-5'>检测</b>方案

    高密度配线架面板

    高密度光纤配线架面板规格书一、产品概述高密度光纤配线架面板(ODF 单元 / 熔接盘)是专为数据中心、运营商机房、企业网络设计的光纤管理单元,用于实现光纤的熔接、端接、分配与保护,具备高集成度
    发表于 04-17 22:29 1次下载

    高密度布线在数据中心建设中的挑战与应对策略

    数据中心作为信息时代的核心基础设施,承担着数据存储、处理和传输的重要任务。随着云计算、大数据、人工智能等技术的快速发展,数据中心的数据量呈现出爆炸式增长,对数据中心的性能和可靠性提出了更高的要求
    的头像 发表于 04-16 09:51 483次阅读

    顶部冷却(TOLT)封装:重塑高密度AI机柜的导热路径与电学架构

    顶部冷却(TOLT)封装:重塑高密度AI机柜的导热路径与电学架构 1. 引言:2026年人工智能算力硬件的功率密度悖论与破局 随着全球技术基础设施深度迈入超大规模生成式
    的头像 发表于 03-22 16:37 179次阅读
    顶部冷却(TOLT)封装:重塑<b class='flag-5'>高密度</b>AI机柜的导热路径与电学架构

    MACOM公司推出高密度铜互连解决方案

    领先的半导体解决方案供应商MACOM公司,于近日宣布推出其最新的铜缆连接解决方案——MACD-41804 带均衡器的电缆驱动器。该产品旨在为下一代扩容应用提供低功耗、高密度的铜缆互连。MACOM
    的头像 发表于 03-20 16:54 969次阅读

    MPO分支光缆:高密度光纤布线的核心组件

    在数据中心、通信网络和工业控制等高密度光纤布线场景中,MPO分支光缆凭借其模块化设计、高密度集成和灵活部署能力,已成为提升网络效率的关键组件。其通过单接口实现多芯光纤并行传输,显著简化了布线结构
    的头像 发表于 03-16 10:30 363次阅读

    高密度配线架特殊场景与前沿趋势

    高密度场景(>100端口/机柜) AI训练集群和超融合基础设施推动机柜端口密度突破传统极限。应对方案包括角型配线架、线缆通道集成和光背板互连三种技术。 角型配线架将端口呈45°角倾斜,跳线自然下垂
    的头像 发表于 03-04 09:53 234次阅读

    烧结银:3D封装中高功率密度高密度互连的核心材料

    烧结银:3D封装中高功率密度高密度互连的核心材料
    的头像 发表于 12-29 11:16 902次阅读

    高密度光纤布线:未来的数据通信解决方案

    数据中心、电信基础设施和大型网络每天都面临着不断增长的数据处理和存储需求。需要更快、更可靠和更高效的解决方案来满足这些需求,这就是高密度光纤布线技术发挥作用的地方。这些布线解决方案节省了网络基础设施
    的头像 发表于 12-02 10:28 668次阅读

    高密度配线架和中密度的区别有哪些

    高密度配线架和中密度配线架的核心区别在于端口密度、空间利用率、应用场景及管理效率,具体对比如下: 一、核心区别:端口密度与空间占用 示例:
    的头像 发表于 10-11 09:56 647次阅读
    <b class='flag-5'>高密度</b>配线架和中<b class='flag-5'>密度</b>的区别有哪些

    液冷算力新标杆!科华数据联合沐曦股份在世界人工智能大会首发高密度液冷算力POD

    ,科华数据与沐曦股份联合推出的高密度液冷算力POD首次亮相,吸引了大量参会者驻足交流。该产品是科华数据专为沐曦高性能GPU服务器集群自主研发的新一代基础设施微环境
    的头像 发表于 07-29 15:57 1301次阅读
    液冷算力新标杆!科华数据联合沐曦股份在世界<b class='flag-5'>人工智能</b>大会首发<b class='flag-5'>高密度</b>液冷算力POD

    白城LP-SCADA工业产线高密度数据采集 实时响应无滞后

    感器2000次/秒的超高速采样,支持多台设备同时接入。 实时性、低延时:平台数据采集、分析、控制实时性。实现采样数据无卡顿、无丢失,微秒级转发、既时存储、实时呈现。 高密度数据采集的突破性能力 海量数据
    发表于 06-19 14:51

    高密度配线架和中密度的区别

    高密度配线架与中密度配线架的核心区别体现在端口密度、空间利用率、应用场景适配性、成本结构及扩展能力等方面,以下为具体分析: 一、端口
    的头像 发表于 06-13 10:18 1178次阅读

    如何构建边缘人工智能基础设施

    随着人工智能的不断发展,其争议性也越来越大;而在企业和消费者的眼中,人工智能价值显著。如同许多新兴科技一样,目前人工智能的应用主要聚焦于大规模、基础
    的头像 发表于 06-09 09:48 1283次阅读

    高密度ARM服务器的散热设计

    高密度ARM服务器的散热设计融合了硬件创新与系统级优化技术,以应对高集成度下的散热挑战,具体方案如下: 一、核心散热技术方案 高效散热架构‌ 液冷技术主导‌:冷板式液冷方案通过直接接触CPU/GPU
    的头像 发表于 06-09 09:19 1133次阅读
    <b class='flag-5'>高密度</b>ARM服务器的散热设计