0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从浅入深学习Transformer的资料汇总

深度学习自然语言处理 来源:AI公园 作者:AI公园 2021-03-05 15:56 次阅读

导读

从浅入深学习Transformer的资料汇总。

6434d47a-7c22-11eb-8b86-12bb97331649.jpg

Transformers 加速了自然语言处理(NLP)任务的新技术和模型的发展。虽然它主要用于NLP任务,但现在它被大量应用于处理计算机视觉任务。这使它成为一个非常重要的技术。

我知道很多机器学习和NLP的学生和从业者都非常热衷于学习Transformers 。因此,我保存了一份资源和学习材料的配方,帮助学生了解Transformers的世界。

首先,在这篇文章中,我准备了一些材料链接,用于更好地从头开始理解和实现transformer模型。

写这篇文章的原因是这样我就可以有一个简单的方法来继续更新学习材料。

高层次介绍

首先,关于Transformers的非常高层次的介绍。一些值得一看的参考资料:

https://theaisummer.com/transformer/

https://hannes-stark.com/assets/transformer_survey.pdf

Transformer 图解

Jay Alammar)的解释很特别。一旦你对Transformer有了高层次的理解,你就可以跳到下面这个流行的关于Transformer的图解说明:

http://jalammar.github.io/illustrated-transformer/

67785c42-7c22-11eb-8b86-12bb97331649.jpg

技术汇总

此时,你可能正在寻找Transformers的技术摘要和概述。Lilian Weng的博文是一个宝藏,提供了简洁的技术解释/总结:

https://lilianweng.github.io/lil-log/2020/04/07/the-transformer-family.html

实现

理论之后,检验知识是很重要的。我通常喜欢更详细地理解事物,所以我更喜欢从头开始实现算法。对于实现Transformers,我主要依赖于这个教程:

https://nlp.seas.harvard.edu/2018/04/03/attention.html

Attention Is All You Need

本文由Vaswani等人介绍了Transformer 的结构。在你有一个高层次的理解和想要进入细节后再读它。为了深入研究,请注意论文中的其他参考文献。

https://arxiv.org/pdf/1706.03762v5.pdf

应用 Transformers

在学习和理解Transformers背后的理论一段时间后,你可能会有兴趣将它们应用到不同的NLP项目或研究中。现在,你最好的选择是HuggingFace的Transformers库。

https://github.com/huggingface/transformers

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8109

    浏览量

    130542
  • Transformer
    +关注

    关注

    0

    文章

    130

    浏览量

    5897
  • 自然语言处理

    关注

    1

    文章

    509

    浏览量

    13099

原文标题:Transformers资料汇总,从概要到原理到应用

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    一文详解Transformer神经网络模型

    Transformer模型在强化学习领域的应用主要是应用于策略学习和值函数近似。强化学习是指让机器在与环境互动的过程中,通过试错来学习最优的
    发表于 02-20 09:55 1858次阅读
    一文详解<b class='flag-5'>Transformer</b>神经网络模型

    【年度精选】2023年度top5榜单——电机控制资料

    读懂PID控制算法(抛弃公式,原理上真正理解PID控制) 作者:ben111 下载量:360 推荐理由: 这篇资料原理上深入出地解释了PID控制算法,让读者真正理解其核心
    发表于 01-16 14:34

    更深层的理解视觉Transformer, 对视觉Transformer的剖析

    最后是在ADE20K val上的LeaderBoard,通过榜单也可以看出,在榜单的前几名中,Transformer结构依旧占据是当前的主力军。
    的头像 发表于 12-07 09:39 419次阅读
    更深层的理解视觉<b class='flag-5'>Transformer</b>, 对视觉<b class='flag-5'>Transformer</b>的剖析

    基于transformer和自监督学习的路面异常检测方法分享

    铺设异常检测可以帮助减少数据存储、传输、标记和处理的压力。本论文描述了一种基于Transformer和自监督学习的新方法,有助于定位异常区域。
    的头像 发表于 12-06 14:57 788次阅读
    基于<b class='flag-5'>transformer</b>和自监督<b class='flag-5'>学习</b>的路面异常检测方法分享

    降低Transformer复杂度O(N^2)的方法汇总

    首先来详细说明为什么Transformer的计算复杂度是 。将Transformer中标准的Attention称为Softmax Attention。令 为长度为 的序列, 其维度为 , 。 可看作Softmax Attention的输入。
    的头像 发表于 12-04 15:31 478次阅读
    降低<b class='flag-5'>Transformer</b>复杂度O(N^2)的方法<b class='flag-5'>汇总</b>

    关于深度学习模型Transformer模型的具体实现方案

    Transformer 本质上是一个 Encoder-Decoder 架构。因此中间部分的 Transformer 可以分为两个部分:编码组件和解码组件。
    发表于 11-17 10:34 305次阅读
    关于深度<b class='flag-5'>学习</b>模型<b class='flag-5'>Transformer</b>模型的具体实现方案

    求助,AD8132谐波测试电路中的transformer有没有推荐型号?

    AD8132谐波测试电路中的transformer有没有推荐型号?
    发表于 11-16 06:15

    UC3842中文资料电路汇总

    UC3842中文资料电路汇总
    发表于 10-07 10:02 17次下载

    为什么transformer性能这么好?Transformer的上下文学习能力是哪来的?

    为什么 transformer 性能这么好?它给众多大语言模型带来的上下文学习 (In-Context Learning) 能力是从何而来?在人工智能领域里,transformer 已成为深度
    的头像 发表于 09-25 12:05 792次阅读
    为什么<b class='flag-5'>transformer</b>性能这么好?<b class='flag-5'>Transformer</b>的上下文<b class='flag-5'>学习</b>能力是哪来的?

    BEV人工智能transformer

    BEV人工智能transformer  人工智能Transformer技术是一种自然语言处理领域的重要技术,广泛应用于自然语言理解、机器翻译、文本分类等任务中。它通过深度学习算法从大规模语料库中自动
    的头像 发表于 08-22 15:59 615次阅读

    机器学习算法汇总 机器学习算法分类 机器学习算法模型

    机器学习算法汇总 机器学习算法分类 机器学习算法模型 机器学习是人工智能的分支之一,它通过分析和识别数据模式,
    的头像 发表于 08-17 16:11 720次阅读

    2D Transformer 可以帮助3D表示学习吗?

    预训练的2D图像或语言Transformer:作为基础Transformer模型,具有丰富的特征表示能力。作者选择了先进的2D Transformer模型作为基础模型,例如Vision Transformers (ViTs) 或
    的头像 发表于 07-03 10:59 440次阅读
    2D <b class='flag-5'>Transformer</b> 可以帮助3D表示<b class='flag-5'>学习</b>吗?

    CVPR 2023 | 清华大学提出LiVT,用视觉Transformer学习长尾数据

    背景 在机器学习领域中,学习不平衡的标注数据一直是一个常见而具有挑战性的任务。近年来,视觉 Transformer 作为一种强大的模型,在多个视觉任务上展现出令人满意的效果。然而,视觉
    的头像 发表于 06-18 21:30 343次阅读
    CVPR 2023 | 清华大学提出LiVT,用视觉<b class='flag-5'>Transformer</b><b class='flag-5'>学习</b>长尾数据

    Transformer结构及其应用详解

    本文首先详细介绍Transformer的基本结构,然后再通过GPT、BERT、MT-DNN以及GPT-2等基于Transformer的知名应用工作的介绍并附上GitHub链接,看看Transformer是如何在各个著名的模型中大
    的头像 发表于 06-08 09:56 1445次阅读
    <b class='flag-5'>Transformer</b>结构及其应用详解

    PyTorch教程11.9之使用Transformer进行大规模预训练

    电子发烧友网站提供《PyTorch教程11.9之使用Transformer进行大规模预训练.pdf》资料免费下载
    发表于 06-05 15:07 0次下载
    PyTorch教程11.9之使用<b class='flag-5'>Transformer</b>进行大规模预训练