0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

在零售技术做AI的95后:我们这样搞定技术难题

京东云 来源:jf_75140285 作者:jf_75140285 2025-05-26 16:22 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群



在京东零售技术团队中,有很多年轻的算法工程师,他们大多是95后,在加入京东的短短几年内,用实力“啃”下了一个个硬骨头。

从大模型训练的效率优化、生成效果的极致调优,到算法落地的工程难题、业务场景的创新应用,他们用行动证明——做难而正确的事,才是技术人最快的成长路径

每个技术突破的背后,是数百次实验的坚持,是推翻重来的勇气,更是对技术极致的追求。

一起看看这群技术年轻人解决技术难题的故事。

wKgZO2g0JKCAftFcAAUTcsUAhnw588.jpg

技术难题:

判断广告图片合不合格就像评价"这幅画美不美",涉及大量主观标准,人类一眼能看出的商品变形、错位等问题,AI评委经常"看不懂"。

现有的奖励模型给出的决策常常无法精准指导AI调整,如何让AI像人类一样精准理解图片中复杂的审美和商业要求,并给出具体改进方向的评判指引?



我的解题思路:

拿到这道题时,我在思考:是否可以用多个奖励小模型的组合来替代单一奖励大模型呢?让每个小模型专注评判图片的某一类问题,如商品形状、摆放位置、色彩搭配等,降低单一模型的学习难度,同时提升评判的精细度;另一方面多奖励模型意味着更灵活的业务规则嵌入和更丰富的模型组合方式,提高了奖励信号质量的上限。

我和团队一起完成了一套基于人类反馈的可信赖广告图像生成的训练和推理框架,这个框架的运作流程可以分为训练阶段和推理阶段。训练阶段,生成模型根据商品透底图产出广告图后,由多个专注细分任务的小奖励模型生成多维质量信号,通过强化学习微调生成模型,使其逐步修正问题;在推理阶段,生成模型输出的广告图经同一组奖励模型联合决策,自动判断生成的广告图能否直接上线,无需人工审核。

基于这套框架,生成图片可用率98%的情况下,召回率提升了近30%,可以高效、批量化制作商品的AIGC广告图片。

wKgZPGg0JKKAOZqaAA-ivgZrc2o604.png

我的成长笔记:

成长的最佳途径在于不断反思和复盘。在每次项目结束后,我都会总结成功的经验和需要改进的地方,将这些经验和教训形成可复用的方法论,不仅帮助自己成长,也能帮助团队中的其他成员提高工作效率。

入职前我的研究方向并非图像生成,而是图像分割、目标检测等任务。虽然应用的算法有差异,但是同为深度学习相关任务,提升模型性能时的优化思路、训练技巧乃至模块实现方式都有很多共通之处,其技术迭代的方向和角度,也往往能带给我很多启发,跨领域的知识迁移,往往能碰撞出意想不到的创新火花。

wKgZO2g0JKOAM4U2AAS0f9-v0ho202.jpg

技术难题:

query扩展是一种有助于缩小用户搜索词与商品描述之间差距的好方法。

想象一下,你在京东APP搜索"养生神器",理想情况下希望出现保温杯、颈椎按摩仪等商品,但传统的神经网络机器翻译模型在遇到新颖的用户搜索意图时,可能无法生成有效的扩展query,无法召回很多相关商品。

如何突破传统query扩展的局限性,让AI学会举一反三,让搜索引擎召回更多相关且优质的商品?



我的解题思路:

大模型的盛行启发了我和团队,query扩展本身就可以是一个生成任务,而大模型的大参数量又可以提升泛化性,正好可以解决我们所遇到的问题。同时,InstructGPT论文中提出的利用PPO提升LLM效果的思路,不仅能够克服传统“死记硬背”训练数据的问题,还能让模型在实际应用中更加灵活和智能,就这样,我们坚定了大模型+强化学习的技术路线。

基于这一思路,我和团队研究了一种基于大语言模型的query扩展框架,该框架分为三个训练阶段:电商领域的预训练、任务驱动的微调和基于搜索引擎的强化学习

首先,我们利用消费者行为数据和京东商品数据对LLM进行预训练,这一阶段为大模型装备了一个强大的“知识库”,让它具备深入理解电商领域知识和用户购物行为的能力。接下来,基于搜索日志筛选出高质量的query扩展数据,对模型进行了任务驱动的微调,在大模型已经具备电商知识的基础上,打磨模型在query扩展特定任务上的效果,让模型能更准确理解用户的搜索意图。最后,利用强化学习进一步优化模型的目标对齐,通过模拟离线搜索引擎,设计了多粒度的奖励函数,优化扩展query所检索到的相关产品数量,在线实验的转化率提升也证明了我们方案的有效性。

wKgZO2g0JKWAeURJAAP1kfbHFgs615.png

我的成长笔记:

面对技术难题时,我认为最有效的方法是通过分析具体案例Case来准确定位问题所在,并通过实验来验证不同的解决方案。这种方法不仅能够帮助我们深入理解问题的本质,还能确保选择的解决方案是最优的。

另外,我还会定期看顶会paper、跟踪开源社区动态进行技术积累,在面对问题时能更快定位问题,高效提出解法。

wKgZPGg0JKaAHzFEAARzib18l_k690.jpg

技术难题:

优化京东商家智能助手的过程就像教一个实习生处理问题,传统方法(监督学习)就像让资深客服手把手教他每句话该怎么回。虽然能保证基本合格,但这个实习生永远无法超越师傅的水平,遇到新问题就束手无策。

如何通过有效的指导和激励,帮助这位“实习生”不断提升技能,在“教练”的指导下,突破人类经验的限制,实现自我进化?



我的解题思路:

在大模型训练过程中,如果仅基于传统监督微调手段,模型效果会以人类标签为上限,而我们的目标是助力模型从人类指导转向AI自我引导、进一步优化模型效果。于是我转向强化学习,对比了两种方案:

1、类似DPO的隐式奖励方案,像是给学生树立正面榜样和反面典型,让他自行学习优点、规避错误。

2、类似RLHF的显式奖励方案,像是先通过一系列答案和对应分数告诉教练如何打分,再由教练实时训练。这个方法效果更稳定,但训练资源消耗更大、同时十分依赖“教练”的质量。

如何培养这个高质量教练呢?我设计了一套Agent全链路评估技术,针对不同类型问题给出不同评分标准,保障局部与端到端两类视角的评估。对明确答案的问题直接判对错,并检查对应的思考过程;对开放性问题则用AI来评分。评估时区分模型生成质量与环境反馈结果,例如:当Agent正确调用API却因外部故障失败时,系统会给出高思维分+低环境分。通过区分"AI想对了但执行出错"和"AI本身就想错了"的情况,精准定位问题来源,为后续优化指明方向。

现在,京东商家助手就像有个"AI教练团",边服务边进化。用算法解决算法的问题,正是技术最迷人的地方。

wKgZO2g0JKeANC8PAARUSqRG_4w202.png

我的成长笔记:

技术突破往往需要跳出常规思维,即使是“看似不可能”的任务也都是从实际应用场景中提炼出来的,一定存在合理性与可实现的底层逻辑。

在解决技术问题时,我首先会进行问题的框架梳理与模块拆解,明确顶层设计,然后逐步细化到具体的实施要点。首先确认要达成的目标,识别核心难点,分析技术要点是否已掌握或需要学习,此外还要寻找业界案例或替代方案,以及评估团队协作需求等。通过将问题具体化,找到解决方案,即使遇到无法完成的任务,也能提供清晰的调研结论。

wKgZPGg0JKiAW2-kAARszwI0bxc471.jpg

技术难题:

文生图大模型能够根据文本生成高质量图像的能力而备受青睐。然而这些模型往往有巨大的参数量,在电商场景下会占用大量算力资源且推理速度较慢。

如何精准识别并裁剪模型中的冗余部分,同时确保模型性能不受影响呢?这一过程就像“修剪花园”,识别珍贵的花卉与徒耗养分的杂草,让花园重焕生机。



我的解题思路:

在模型优化过程中,我发现通过FFT(快速傅里叶变换)技术进行频域分析,就像使用了显微镜来观察,更直接地捕获模型冗余和有效特征的差异。具体来说,低频和高频的图片特征在频域上的输出会有明显的变化,这意味着可以利用FFT技术来定位模型中的冗余部分。

然而,仅仅依靠频域分析还存在一个难题:很难确定一个明确的阈值来有效冗余和有效特征。为此我还引入了RDP算法(迭代端点拟合算法),这就像是一种高级的探测仪器,能够自动识别频谱变化趋势中的关键拐点。结合这两种方法,我成功定位并移除了模型中的冗余部分。结果实验显示,模型训练吞吐量提升了40%,性能效率显著提升。

这一成果不仅证明了创新方法的有效性,也是我首次在工业级项目中将基础算法理论创新与实际应用完美结合,通过技术探索,成功解决了复杂的工程问题,积累了宝贵的经验。

分享一段这个项目中重要的一段代码:通过递归的方式拟合频谱曲线,在误差尽可能小的情况下,找到频谱曲线中最重要的点,这些点即为transformer中的有效block。

def rdp(points, epsilon):
    """
    Ramer-Douglas-Peucker算法,用于曲线简化。
    points: 曲线上的点序列
    epsilon: 简化容差,越大简化越多
    """
    def perpendicular_distance(pt, line_start, line_end):
        # 计算点pt到线段(line_start, line_end)的垂直距离
        if np.array_equal(line_start, line_end):
            return np.linalg.norm(pt - line_start)
        else:
            return np.abs(np.cross(line_end - line_start, line_start - pt)) / np.linalg.norm(line_end - line_start)

    def rdp_recursion(points, epsilon):
        # 递归执行RDP算法,找出距离最远的点
        dmax = 0.0
        index = 0
        end = len(points)
        for i in range(1, end - 1):
            d = perpendicular_distance(points[i], points[0], points[-1])
            if d > dmax:
                index = i
                dmax = d
        # 若最远距离大于容差epsilon,继续分割曲线
        if dmax > epsilon:
            results1 = rdp_recursion(points[:index+1], epsilon)
            results2 = rdp_recursion(points[index:], epsilon)
            return results1[:-1] + results2
        else:
            # 距离小于容差,直接简化成端点
            return [points[0], points[-1]]

    return rdp_recursion(points, epsilon)

我的成长笔记:

AIGC与大模型的快速演进,技术更新速度加快,对算法工程师提出从单纯研发走向落地应用与创新融合的更高要求。

面对快速变化的时代和复杂的业务,我会主动追踪前沿进展,跟进顶会、开源社区的动态,保持对领域趋势的敏锐性,同时提升的跨领域技能与知识,深入理解用户需求与市场趋势,结合算法能力提供真正有商业价值的方案,掌握良好的代码工程实践、持续集成和自动化部署,提高算法从实验到生产的效率。

wKgZO2g0JKmAX50-AASIRaSMzsU261.jpg



技术难题:

在智能导购场景中,用户常提出包含具体场景参数的需求,如"我家的桌子长130cm,宽60cm,推荐一个大小合适的置物架"。

如何让大模型准确理解用户需求,并将其精准映射到商品库的结构化参数?



我的解题思路:

这一技术难点在于语义复杂性和商品描述与用户需求的精准匹配,一方面需要理解用户语言中的隐含条件,比如“大小合适"需转换为"长度≤130cm且宽度≤60cm”,另一方面要准确匹配商品库的结构化参数,如货架尺寸、承重等,这需要突破语义理解、多意图混杂等难题。

过程中,我进行了模型训练,使用通用强化学习方法提升语义理解能力,通过数据闭环持续优化用户意图识别。并筛选高质量数据训练模型,确保处理新需求时仍保持高准确率。此外,我还将京言的多个模型整合成一个统一的系统,每个功能对应一个独立的代理。通过让单个智能体处理多种任务,在需要时进行人工干预,进一步提升大模型的效果,确保系统既高效又灵活,能够更好地服务于用户。

通过大模型语义推理多轮对话引导用户完善需求,将技术参数转化为用户语言,结合电商知识,动态生成易懂的解释。京言上线以来,活跃用户平均对话次数增加,购买转化率持续攀升,实现了"越用越懂你"的智能导购体验。

这是我在进行多任务训练的时候,通过探针观察模型训练状态:

def get_token_prob(prompt, target_token):
    # 编码输入并定位预测位置
    inputs = tokenizer(prompt, return_tensors="pt")
    input_ids = inputs.input_ids
    target_len = len(tokenizer.encode(target_token, add_special_tokens=False))
    
    # 获取模型输出logits
    with torch.no_grad():
        outputs = model(**inputs)
    next_token_logits = outputs.logits[:, -1, :]  # 取最后一个位置的预测
    
    # 转换概率分布
    probs = F.softmax(next_token_logits, dim=-1)
    
    # 获取目标token的id(处理多token情况)
    target_ids = tokenizer.encode(target_token, add_special_tokens=False)

    # 返回改token的概率
    return probs[0, target_ids[0]].item()

我的成长笔记:

在模型训练过程中,数据清洗和过滤是关键,但过程往往充满挑战。有时候,花整整一周时间合成数据、清洗数据、再到数据配比,最终训练出的模型却表现不佳,难免让人沮丧。但我始终相信,每一次失败都有价值。历史数据不仅能帮助分析问题,还能用于构建更优质的训练样本,支撑下一次尝试。当方向不对时,就果断调整策略,带着经验重新出发。

这就是技术人的成长——在不断试错中积累经验,在失败中寻找突破,最终一步步实现更好的结果。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38346

    浏览量

    297479
  • 大模型
    +关注

    关注

    2

    文章

    3485

    浏览量

    5024
  • LLM
    LLM
    +关注

    关注

    1

    文章

    341

    浏览量

    1268
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    微软科技通过AI技术和云创新驱动零售业的未来

    Levi's正与微软展开深度合作,共同描绘AI技术驱动的零售业未来。作为拥有175年历史的全球服装品牌,Levi's正在以智能Microsoft 365 Copilot副驾驶
    的头像 发表于 12-09 17:39 983次阅读

    拆解零售商部署 SD-WAN 四大障礙

    前言一场库存同步延迟48小时导致数百万美元损失的事故,让一家跨国零售企业毅然放弃了传统网络架构。在数字化转型浪潮中,这样的案例正变得愈发常见。近年来,随着零售业线上线下融合加速,SD-WAN
    的头像 发表于 10-11 14:20 471次阅读
    拆解<b class='flag-5'>零售</b>商部署 SD-WAN 四大障礙

    京东零售智能供应链领域的前沿探索与技术实践

    受邀出席并担任《AI+智慧物流与供应链分享会》联席主席,联合发表《AI科技助力供应链产业升级》主题演讲,深入介绍了京东零售智能供应链领域的前沿探索与
    的头像 发表于 08-04 16:10 866次阅读
    京东<b class='flag-5'>零售</b><b class='flag-5'>在</b>智能供应链领域的前沿探索与<b class='flag-5'>技术</b>实践

    阿里展厅同款无人超市技术解析:RFID与AI视觉如何颠覆零售

    阿里展厅的未来零售场景中,由深圳市远景达物联网技术有限公司打造的无人超市正以颠覆性姿态重构行业逻辑。这项融合RFID射频识别与AI视觉技术
    的头像 发表于 07-03 13:50 608次阅读
    阿里展厅同款无人超市<b class='flag-5'>技术</b>解析:RFID与<b class='flag-5'>AI</b>视觉如何颠覆<b class='flag-5'>零售</b>?

    AI驱动零售变革!英特尔AI方案助力中国厂商海外破局

    商用副总经理李昊旻、中科英泰副总经理管建鹏和吉方工控副总经理李晓涛给我们带来了精彩的介绍和零售技术方案分析。
    的头像 发表于 05-15 18:19 6599次阅读
    <b class='flag-5'>AI</b>驱动<b class='flag-5'>零售</b>变革!英特尔<b class='flag-5'>AI</b>方案助力中国厂商海外破局

    吉方工控携手英特尔推动零售行业高质量发展

    第二十五届中国零售业博览会同期举办的英特尔“从芯到质,AI重塑新零售”创新论坛上,英特尔中国网络与边缘技术产品总监王景佳和中国连锁经营协会(CCFA)副秘书长杨雯发表致辞,英特尔
    的头像 发表于 05-12 14:24 739次阅读

    微软邀您相约2025全零售AI火花大会

    零售AI转型已进入深水区,碎片化尝试难破困局。5月8日至9日,由中国连锁经营协会主办的“全零售AI火花大会”将在深圳召开。微软携手中国移动、海尔、玛氏、嘉士伯等
    的头像 发表于 04-28 11:19 989次阅读

    聚焦“AI+零售”,涂鸦智能携手行业巨头破解AI硬件商业化难题

    深度剖析AI技术与硬件产品融合趋势,挖掘AI硬件零售场景的价值潜力,助力全球开发者把握AI时代
    的头像 发表于 04-25 09:41 532次阅读
    聚焦“<b class='flag-5'>AI</b>+<b class='flag-5'>零售</b>”,涂鸦智能携手行业巨头破解<b class='flag-5'>AI</b>硬件商业化<b class='flag-5'>难题</b>

    MWC 2025 | 移远通信推出AI智能无人零售解决方案,以“动态视觉+边缘计算”引领智能零售新潮流

    无人零售市场蓬勃发展的浪潮中,自动售货机正经历着从传统机械式操作向AI视觉技术的重大跨越。   移远通信作为全球领先的物联网整体解决方案供应商,精准把握行业趋势,
    发表于 03-05 13:42 339次阅读
    MWC 2025 | 移远通信推出<b class='flag-5'>AI</b>智能无人<b class='flag-5'>零售</b>解决方案,以“动态视觉+边缘计算”引领智能<b class='flag-5'>零售</b>新潮流

    MWC 2025 | 移远通信推出AI智能无人零售解决方案,以“动态视觉+边缘计算”引领智能零售新潮流

    无人零售市场蓬勃发展的浪潮中,自动售货机正经历着从传统机械式操作向AI视觉技术的重大跨越。移远通信作为全球领先的物联网整体解决方案供应商,精准把握行业趋势,
    的头像 发表于 03-04 19:02 791次阅读
    MWC 2025 | 移远通信推出<b class='flag-5'>AI</b>智能无人<b class='flag-5'>零售</b>解决方案,以“动态视觉+边缘计算”引领智能<b class='flag-5'>零售</b>新潮流

    杰和科技GAM-AI视觉识别管理系统,让AI走进零售营销

    在数字化浪潮席卷全球零售业的今天,如何精准触达顾客需求、优化运营效率、提升门店业绩,成为实体商业破局的关键。GAM-AI视觉识别管理系统杰和科技智能零售管理系统:GAM-AI视觉识别管
    的头像 发表于 02-20 11:32 897次阅读
    杰和科技GAM-<b class='flag-5'>AI</b>视觉识别管理系统,让<b class='flag-5'>AI</b>走进<b class='flag-5'>零售</b>营销

    NVIDIA推出AI零售购物助手蓝图

    NVIDIA 于近日发布了用于零售购物助手的 NVIDIA AI Blueprint,这个生成式 AI 参考工作流旨在变革网购和实体店购物的体验。
    的头像 发表于 01-14 11:17 1044次阅读

    物联网如何改变零售行业

    零售商深知,节日的热闹气氛让顾客们忙着寻找完美的礼物和抓住年终优惠。这一直是公司最繁忙的时期之一,客流量和销售额大幅增加。为应对激增的需求,零售商正转向引入物联网(IoT)技术,以通过智能零售
    的头像 发表于 01-14 09:27 1248次阅读

    AI技术重塑零售行业新格局

    在数字化浪潮中,AI以其强大的数据处理、分析和预测能力,正逐渐成为推动各行业转型升级的关键力量。AI赋能零售领域,重新打通“人货场”的任督二脉,智慧门店、无人便利店、 AI 购物体验等
    的头像 发表于 01-13 13:38 1312次阅读

    如何使用蓝牙技术优化零售空间的运营方式

    近日,蓝牙技术联盟高级营销项目经理Mindy Dolan有机会采访到了高通技术公司副总裁兼零售物联网全球负责人Art Miller,探讨了如何使用蓝牙技术优化
    的头像 发表于 12-30 10:32 1402次阅读