0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一文看懂NLP里的模型框架 Encoder-Decoder和Seq2Seq

电子设计 来源:电子设计 作者:电子设计 2020-12-10 22:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Encoder-Decoder 和 Seq2Seq

机器翻译、对话机器人、诗词生成、代码补全、文章摘要(文本 - 文本)

「文本 - 文本」 是最典型的应用,其输入序列和输出序列的长度可能会有较大的差异。

Google 发表的用Seq2Seq做机器翻译的论文《Sequence to Sequence Learning with Neural Networks》

语音识别音频 - 文本)

语音识别也有很强的序列特征,比较适合 Encoder-Decoder 模型。

Google 发表的使用Seq2Seq做语音识别的论文《A Comparison of Sequence-to-Sequence Models for Speech Recognition》

图像描述生成(图片 - 文本)

通俗的讲就是「看图说话」,机器提取图片特征,然后用文字表达出来。这个应用是计算机视觉和 NLP 的结合。

图像描述生成的论文《Sequence to Sequence – Video to Text》

Encoder-Decoder 的缺陷

上文提到:Encoder(编码器)和 Decoder(解码器)之间只有一个「向量 c」来传递信息,且 c 的长度固定。

为了便于理解,我们类比为「压缩-解压」的过程:

将一张 800X800 像素的图片压缩成 100KB,看上去还比较清晰。再将一张 3000X3000 像素的图片也压缩到 100KB,看上去就模糊了。

Encoder-Decoder 就是类似的问题:当输入信息太长时,会丢失掉一些信息。

Attention 解决信息丢失问题

Attention 机制就是为了解决「信息过长,信息丢失」的问题。

Attention 模型的特点是 Eecoder 不再将整个输入序列编码为固定长度的「中间向量 C」 ,而是编码成一个向量的序列。

这样,在产生每一个输出的时候,都能够做到充分利用输入序列携带的信息。而且这种方法在翻译任务中取得了非常不错的成果。

审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50542

    浏览量

    267862
  • nlp
    nlp
    +关注

    关注

    1

    文章

    491

    浏览量

    23380
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    百度心大模型5.1正式发布

    代基础大模型心大模型 5.1正式发布!心 5.1采用“多维弹性预训练”技术,仅以业界同规模模型
    的头像 发表于 05-11 14:21 357次阅读
    百度<b class='flag-5'>文</b>心大<b class='flag-5'>模型</b>5.1正式发布

    UPS分类全解析:从动态到静态,看懂各种类型

    如果你以为UPS只有“后备式”和“在线式”两种,那可能错过了半个多世纪的技术演进。实际上,UPS最科学的分类方式,是从“动态”和“静态”这对根本性差异开始的。本文详细阐述UPS分类的完整知识框架——这是看懂所有后续技术细节的基
    的头像 发表于 04-27 14:40 161次阅读
    UPS分类全解析:从动态到静态,<b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>看懂</b>各种类型

    0基础看懂电阻:它到底在电路做什么?

    和专业术语,0基础也能一眼看懂,电阻究竟是什么、在电路扮演什么角色。 、用大白话讲清:电阻是什么? 电阻,顾名思义,就是阻碍电流流动的元件,符号用R表示,单位是欧姆(Ω)。 可以做个超简单的类比:把电路比作水
    的头像 发表于 04-27 14:32 476次阅读
    0基础<b class='flag-5'>看懂</b>电阻:它到底在电路<b class='flag-5'>里</b>做什么?

    无线通信的“隐形骨架”:读懂OSI七层模型

    我们每天都在用手机聊天、刷视频、远程操控设备,但海量数据究竟是如何在空中穿梭的?背后离不开套被称为“OSI七层模型”的隐形框架。本文作为WiMi-net协议栈系列的开篇,用最通俗的快递系统比喻
    的头像 发表于 03-16 09:41 510次阅读
    无线通信的“隐形骨架”:<b class='flag-5'>一</b><b class='flag-5'>文</b>读懂OSI七层<b class='flag-5'>模型</b>

    模型服务为什么总是爆显存

    模型服务报 CUDA out of memory,很多现场第反应都是“模型太大,换更大的卡”。这个结论通常过于粗糙。生产的显存问题至少有五类来源:
    的头像 发表于 03-11 09:54 652次阅读

    百度心大模型5.0正式版上线

    今天,在百度心Moment大会现场,心大模型5.0正式版上线。
    的头像 发表于 01-23 16:48 1609次阅读

    百度心大模型5.0 Preview荣登LMArena文本榜国内第

    12月23日,LMArena大模型竞技场发布最新排名,心新模型ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜,排名国内第
    的头像 发表于 12-23 15:02 747次阅读

    看懂AI大模型的并行训练方式(DP、PP、TP、EP)

    才能有效缩短计算时间。搭建并行计算框架般会用到以下几种常见的并行方式:DataParallelism,数据并行PipelineParallelism,流水线并行
    的头像 发表于 11-28 08:33 2170次阅读
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>看懂</b>AI大<b class='flag-5'>模型</b>的并行训练方式(DP、PP、TP、EP)

    摩尔线程新代大语言模型对齐框架URPO入选AAAI 2026

    近日,摩尔线程在人工智能前沿领域取得重要突破,其提出的新代大语言模型对齐框架——URPO统奖励与策略优化,相关研究论文已被人工智能领域的国际顶级学术会议AAAI 2026收录。这
    的头像 发表于 11-17 16:03 673次阅读
    摩尔线程新<b class='flag-5'>一</b>代大语言<b class='flag-5'>模型</b>对齐<b class='flag-5'>框架</b>URPO入选AAAI 2026

    百度心大模型5.0-Preview文本能力国内第

    11月8日凌晨,LMArena大模型竞技场最新排名显示,心全新模型ERNIE-5.0-Preview-1022登上文本排行榜全球并列第二、中国第
    的头像 发表于 11-11 17:15 1738次阅读

    OK3506-S12 Mini开发板开箱和基本使用(飞凌嵌入式)

    OK3506-S12 Mini开发板 图2 OK3506-S12 Mini开发板 开发板简介    RK3506J/RK3506B是款高性能的三核Cortex-A7应用处理器,专为智能语音交互、音频输入/输出
    发表于 11-03 00:57

    【六岳微LY-F335开发板试用体验】epwm启动ADC并在OLED上显示结果

    ;添加还是在C2000linker 的include中添加或用工程文件管理器添加,只要将两个CMD文件加入工程就行,Flash和RAM的CMD文件同时只能个使用(关键是不同同时编译,可以两个都添加
    发表于 09-26 17:32

    宁畅与与百度心大模型展开深度技术合作

    近日,百度正式开源心大模型4.5系列模型。作为心开源合作伙伴,宁畅在模型开源首日即实现即刻部署,做到“开源即接入、发布即可用”。据悉,
    的头像 发表于 07-07 16:26 1108次阅读

    龙芯中科与心系列模型开展深度技术合作

    ”解决方案。 强强联合!自主架构赋能大模型训练 心大模型 心4.5系列模型均使用飞桨深度学习框架
    的头像 发表于 07-02 16:53 1536次阅读

    兆芯率先展开心系列模型深度技术合作

    对文心系列大模型的快速适配、无缝衔接。   心大模型   心4.5系列开源模型共10款,均使用飞浆深度学习
    的头像 发表于 07-01 10:49 1153次阅读