0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

专栏发布 | LLM圈走马换将?微软广告“黑五”来袭 !

微软科技 来源:未知 2023-11-27 08:15 次阅读

去一年并不平凡从去年11月至今,LLM大型语言模型持续破圈、始终盘踞热点话题之列。根据Adobe Analytics的最新在线购物预测,感恩节本土市场假日季的在线收入,或将有望创达2218亿美元。年度机遇近在眼前,跨境出海企业如何抓住机遇、突破销售记录?

wKgZomVj4LKAIEdnAAAxBTCakOI998.png

对此,LLM或许能够给出答案。微软首席执行官萨提亚·纳德拉在刚刚结束的全球Ignite技术大会上曾表示,“生成式AI模型的参数范围很广,从需要 Azure 中最强大 GPU 的数万亿参数的 LLM,到数十亿参数的特定任务SLM(小语言模型)。我们都提供了最佳的前沿模型选择,用户、客户及合作伙伴可以使用这些模型构建自己的AI应用,并满足对成本、延迟和性能的特定需求。

wKgZomVj4LKAG_2qAAAZo8Up2kE488.png  

关于“黑五”的创意图 Getty

无疑,以LLM为代表的AI新浪潮正在为广告营销行业带来巨大变革与飞跃。本月起,“微软全球营销”将通过一系列专栏文章,为读者进行前沿技术解读。今天为大家奉上的是对LLM大型语言模型的技术原理详解及科研视角前瞻。

wKgZomVj4LKATWg_AACcCYaMXxw889.png

专栏导读

“由大型语言模型驱动的 AI 系统,正加速改变着每个人的工作与生活。作为全球领先的科技企业,微软始终致力于推动前沿技术创新、应用与普及,为世界赋能。我们以丰富的 AI 经验和资源,秉承责任、可靠、可信原则,将 AI 融入微软现有生态,从提供 AI 工具到构筑 AI 平台,与合作伙伴全方位携手、拥抱技术潮流,予力用户、惠及行业、创造社会价值。”

张祺

微软全球资深副总裁

wKgZomVj4LKATWg_AACcCYaMXxw889.png

LLM的技术原理

wKgZomVj4LKAG_2qAAAZo8Up2kE488.pngwKgZomVj4LOAbEWNAAIlRkUX7Qg954.png

图注:LLM训练全景图

LLM 作为一种具有强大功能的模型,研究人员通过预训练、微调、提示工程和插件等技术手段,使其备了理解自然语言并进行推理的能力。

预练习(Pre-training)

谈到LLM的预训练,我们指的是一种训练方法。预训练时,LLM学习大规模数据,从中提取出尽可能多的共性特征,从而减轻模型对特定任务的学习负担。预训练模型的发展经历了从BERT双向变换器模型,到GPT 自回归变换器模型的转变。其中的典型代表即 OpenAI 的 GPT 系列。今年11月,OpenAI正式推出最新的GPT-4 Turbo。主要提升包括:上下文对话长度达到128k,采用全新模型控制技术优化输出,以及GPT-4 Turbo的知识库更新到2023年4月等。

wKgZomVj4LKAG_2qAAAZo8Up2kE488.png  

关于 ChatGPT 的创意图 Getty

此外,Meta 创建的开源模型 LLaMA,也备受外界关注。今年7月,Meta在微软的Inspire合作伙伴大会上宣布,与微软合作推出LLaMA2,并获得Azure 和 Windows的支持。10月,LLaMA2的延伸版本LLaMA Long 上线,上下文长度达到32k。

wKgZomVj4LKAG_2qAAAZo8Up2kE488.png  

Meta 开源模型 LLaMA 创意图 Getty

微调(Fine-tuning)

微调,是在已有的预训练基础上,通过少量的数据对LLM进行训练,按要求实现修改和优化,使之在特定任务上表现出更优性能。微调减少了训练新模型所需的时间和资源,同时减轻了标注数据的压力,是一种快速迁移学习的方法。

wKgZomVj4LKAG_2qAAAZo8Up2kE488.png  

关于信息数据的创意图 Getty

最新的GPT-4 Turbo又一大升级,就是允许开发人员定制化微调,例如修改模型训练过程,进行额外的特定领域预训练、运行自定义强化学习后训练过程等。

提示工程(Prompt Engineering)

提示工程是指设计和构造适合LLM输入的提示文本,以引导其产生特定类型的输出。通过设计合适的提示词,可以引导LLM在特定领域或任务上表现出更好的性能。LLM 在生成文本时具有一定的创造力和自由度。有人也把它称为思维链(Tree-of-Thought),类似人类解决问题的思维方式,通过试错的方式在解决空间中进行树状搜索,并在必要时进行回溯。思维链主要包括头脑风暴(brainstorming)、评估(evaluation)、扩展(expansion)和决策(decision)四个阶段构成,形成的一整套链路,使得 LLM 能够生成多个潜在的解决方案,评估并改进它们,最终给出用户最佳的解决方案。

wKgZomVj4LKAG_2qAAAZo8Up2kE488.png  

关于 LLM 的创意图 Getty

wKgZomVj4LKATWg_AACcCYaMXxw889.png

插件和扩展(Plugin & Extension)

研究人员还会通过添加额外模块或插件,来实现对LLM的功能扩展,增强其在特定任务上的能力。例如,Auto-GPT 和 JARVIS 是LLM功能扩展的典型代表。其中,Auto-GPT 是一种基于GPT 的自动化工具,它可以利用 GPT-4 的强大功能自动完成复杂任务。用户给定一个目标,它就会将其分解为子任务,并利用互联网和其他工具自动实现。

wKgZomVj4LKAG_2qAAAZo8Up2kE488.png  

图为 Auto-GPT 的官网首页截图

JARVIS 是一个框架,它利用ChatGPT 来规划任务流程,根据 Hugging Face 的功能介绍来选择适合的模型,执行各个子任务,并根据执行结果生成反馈。JARVIS 可以实现多领域、多模态的复杂AI 任务,在语言、视觉、语音等方面都取得了令人印象深刻的结果。

wKgZomVj4LKATWg_AACcCYaMXxw889.png

LLM如何赋能广告

在解析了 LLM 的技术原理后,跨境出海企业最想了解的就是究竟如何将LLM应用到广告之中。对此,今年9月,微软全球资深副总裁张祺博士在《聚焦AI大航海时代新契机、新模式、新动能》一文中曾给出过答案——搜索引擎的商业模式,如 AdWords和竞价排名等,会随技术的进步、体验的迭代而不断推陈出新。

目前,微软广告(Microsoft Advertising)正在通过 LLM 赋能实现垂直创新,为出海企业带来崭新机遇。

以 LLM 为基础,以生成式人工智能(AIGC)技术为突破口融入了人工智能副驾 Copilot。Copilot为用户提供了全新的搜索方式,也为广告主及合作伙伴创造了接触消费者的新机会和新可能。借助生成式AI,我们创造出效果出众体感沉浸 、深度融合的广告内容,逐步将一众广受欢迎的搜索广告形式(如文字广告、购物广告、多媒体广告等)及类别(如酒店广告、旅游广告、邮轮广告、信用卡广告、汽车广告等)引入必应聊天,让用户在会话广告中精准获取商品信息,在对比广告中做出智慧决策。

wKgZomVj4LKAG_2qAAAZo8Up2kE488.pngwKgZomVj4LSAFD2bAAWG_9xC9qg032.png

图注:用户可以通过Copilot在聊天中进行商品对比。比如用户想购买一辆新车,就会去对比不同制造商和型号的车辆数据。以此情境为例,对比广告会将各型号汽车的数据整理到一份统一报告中,便于用户对比各项指标。随着搜索+聊天的全新模式日渐风靡,会话广告将愈发普及、并适用于多个场景——比如定制某个城市之旅,再比如购买特定颜色和风格的家具建议等。

专为广告主设计的微软广告平台智能副驾(Microsoft Advertising Platform Copilot),贴心的聊天机器人将在线聊天指导您洞悉趋势、制定策略、完成创建,最终帮您实现广告目标。您只需描述需求,之后的工作全部交给Copilot, 它将基于流程整体协助交付:从素材提炼产品卖点,到结合微软搜索趋势,再到提交完整广告图文方案。借助微软广告平台智能副驾,只需依据品牌及营销目标,即可定制独一无二的专属方案,几分钟内实现个性化精彩广告。

wKgZomVj4LKATWg_AACcCYaMXxw889.png

展望未来

在LLM颠覆式技术创新大潮下,微软广告致力于为全体消费者提供更便捷、更高效的个性化创意广告体验,助力垂直创新。我们期待帮助广告主及合作伙伴洞察行业先机,通过打造本土创新产品及服务,助力消费增长、推动本地品牌走向全球,在AI的黄金时代实现业务的垂直增长!

wKgZomVj4LSAWZV8AABwHvUH7c8397.jpg

LLM专栏作者:耿秀波

微软(亚洲)互联网工程院

首席应用科学家

wKgZomVj4LWASOEvAAAA7s0CTZQ011.svg

关于微软广告

wKgZomVj4LWARic4AAAA77bRYwo663.svg

微软广告(Microsoft Advertising)致力于为国内广告主提供动态广告解决方案,与合作伙伴一道,共同发掘全球商机、开拓多元市场,现已覆盖187个国家和地区、35种语言,触达全球超14亿受众,并且拥有持续增长的高价值用户。

在领先的AI技术、生产力工具和创新模式驱动下,本地行业与市场都将焕发新生。微软将通过创新产品和服务,助力本土品牌走向全球,实现高速增长。

本文为《技术赋能》专栏系列文章之一

专栏介绍:AI大航海时代,前沿技术无疑为行业革新、企业增长与创意变现提供了新机遇,一场创新模式的革命已如箭在弦,这正是我们策划此专栏系列文章的初衷。在此,来自微软(亚洲)互联网工程院的首席应用科学家以及高级、资深研究员们,将在系列专栏文章中分享他们对人工智能、大语言模型及其应用领域如何实现技术赋能的洞察及前瞻。更多专栏内容,敬请期待!


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6253

    浏览量

    103083

原文标题:专栏发布 | LLM圈走马换将?微软广告“黑五”来袭 !

文章出处:【微信号:mstech2014,微信公众号:微软科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA加速微软最新的Phi-3 Mini开源语言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库,用于优化从 PC 到云端的 NVIDIA GPU 上运行的大语言模型推理
    的头像 发表于 04-28 10:36 112次阅读

    100%在树莓派上执行的LLM项目

    ChatGPT的人性口语化回复相信许多人已体验过,也因此掀起一波大型语言模型(Large Language Model, LLM)热潮,LLM即ChatGPT背后的主运作技术,但LLM运作需要庞大运算力,因此目前多是在云端(Cl
    的头像 发表于 02-29 16:29 651次阅读
    100%在树莓派上执行的<b class='flag-5'>LLM</b>项目

    优于10倍参数模型!微软发布Orca 2 LLM

    微软发布 Orca 2 LLM,这是 Llama 2 的一个调优版本,性能与包含 10 倍参数的模型相当,甚至更好。
    的头像 发表于 12-26 14:23 296次阅读

    电梯广告机的功能?

    智能电梯广告机支持安全信息发布,物业通知发布信息,和商业广告发布信息,支持及时发布紧急信息、突发事件,插播媒体文件,插播
    的头像 发表于 09-25 11:36 357次阅读

    对比解码在LLM上的应用

    为了改进LLM的推理能力,University of California联合Meta AI实验室提出将Contrastive Decoding应用于多种任务的LLM方法。实验表明,所提方法能有效改进LLM的推理能力。让我们走进
    发表于 09-21 11:37 373次阅读
    对比解码在<b class='flag-5'>LLM</b>上的应用

    海思 PQTools 电平矫正方法

    来源:易百纳技术社区 一 什么是电平?电平:黑色的最小值,sensor感光全零数据时,对应sensor输出的最小信号值 形成的原因:1 sensor模拟信号转换到数字信号时,由于转换精度限制
    发表于 09-11 15:07

    检索增强LLM的方案全面的介绍

    OpenAI 研究科学家 Andrej Karpathy 前段时间在微软 Build 2023 大会上做过一场关于 GPT 模型现状的分享 State of GPT[3],这场演讲前半部
    的头像 发表于 09-08 16:39 875次阅读
    检索增强<b class='flag-5'>LLM</b>的方案全面的介绍

    LLM的长度外推浅谈

    苏神最早提出的扩展LLM的context方法,基于bayes启发得到的公式
    的头像 发表于 07-28 17:37 1581次阅读
    <b class='flag-5'>LLM</b>的长度外推浅谈

    微软将向美国政府客户提供OpenAI的GPT模型

    微软增加了对大型语言模型(llm)的支持。openai推出chatgpt后,llm的使用大幅增加,微软持有openai的股份,许多类型的公司争相在l
    的头像 发表于 06-08 10:35 799次阅读

    苹果发布虚假广告被罚20万

    苹果发布虚假广告被罚20万 苹果发布虚假广告被罚20万? 据北京市市场监督管理局网站的消息,日前,苹果电子产品商贸(北京)有限公司因发布虚假
    的头像 发表于 06-01 15:31 614次阅读

    LLM在各种情感分析任务中的表现如何

      最近几年,GPT-3、PaLM和GPT-4等LLM刷爆了各种NLP任务,特别是在zero-shot和few-shot方面表现出它们强大的性能。因此,情感分析(SA)领域也必然少不了LLM的影子
    的头像 发表于 05-29 17:24 1533次阅读
    <b class='flag-5'>LLM</b>在各种情感分析任务中的表现如何

    微软发布 Azure Linux 正式版

    在内部使用 Azure Linux 两年,并从 2022 年 10 月开始公开预览后,微软本周终于正式提供其 Azure Linux。Azure Linux 是 Azure Kubernetes
    发表于 05-28 08:34

    基于51单片机的走马灯Proteus仿真程序

    基于51单片机的走马灯Proteus仿真设计资料
    发表于 05-22 15:58 3次下载

    如何利用LLM做多模态任务?

    大型语言模型LLM(Large Language Model)具有很强的通用知识理解以及较强的逻辑推理能力,但其只能处理文本数据。虽然已经发布的GPT4具备图片理解能力,但目前还未开放多模态输入接口
    的头像 发表于 05-22 15:57 521次阅读
    如何利用<b class='flag-5'>LLM</b>做多模态任务?

    如何利用LLM做多模态任务?

    大型语言模型LLM(Large Language Model)具有很强的通用知识理解以及较强的逻辑推理能力,但其只能处理文本数据。虽然已经发布的GPT4具备图片理解能力,但目前还未开放多模态输入接口并且不会透露任何模型上技术细节。因此,现阶段,如何利用
    的头像 发表于 05-11 17:09 684次阅读
    如何利用<b class='flag-5'>LLM</b>做多模态任务?