电子发烧友App

硬声App

0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示
电子发烧友网>电子资料下载>电子资料>PyTorch教程4.6之分类中的泛化

PyTorch教程4.6之分类中的泛化

2023-06-05 | pdf | 0.19 MB | 次下载 | 免费

资料介绍

到目前为止,我们一直专注于如何通过训练具有多个输出和 softmax 函数的(线性)神经网络来解决多类分类问题。将我们模型的输出解释为概率预测,我们激发并推导了交叉熵损失函数,它计算我们的模型(对于一组固定参数)分配给实际标签的负对数似然。最后,我们通过将我们的模型拟合到训练集来将这些工具付诸实践。然而,一如既往,我们的目标是学习一般模式,根据以前看不见的数据(测试集)进行经验评估。训练集上的高精度毫无意义。每当我们的每个输入都是唯一的(对于大多数高维数据集而言确实如此)时,我们可以通过仅记住第一个训练时期的数据集并随后在我们看到标签时查找标签来获得训练集的完美准确性一个新形象。然而,记住与确切训练示例相关联的确切标签并不能告诉我们如何对新示例进行分类。如果没有进一步的指导,每当我们遇到新的例子时,我们可能不得不求助于随机猜测。

许多紧迫的问题需要立即引起注意:

  1. 我们需要多少测试示例才能精确估计我们的分类器对基础人群的准确性?

  2. 如果我们在同一个测试中反复评估模型会发生什么?

  3. 为什么我们应该期望将我们的线性模型拟合到训练集应该比我们的朴素记忆方案更好?

虽然第 3.6 节介绍了线性回归背景下过度拟合和泛化的基础知识,但本章将更深入一些,介绍统计学习理论的一些基本思想。事实证明,我们通常可以先验地保证泛化:对于许多模型,以及泛化差距的任何期望上限ϵ,我们通常可以确定一些所需的样本数量n这样如果我们的训练集至少包含n样本,那么我们的经验误差将位于ϵ的真实错误,对于任何数据生成分布不幸的是,事实证明,虽然这些类型的保证提供了一套深刻的知识构建块,但它们对深度学习从业者的实用性有限。简而言之,这些保证表明,确保先验深度神经网络的泛化需要数量荒谬的示例(可能数万亿或更多),即使我们发现,在我们关心的任务上,深度神经网络通常可以很好地泛化远更少的例子(千)。因此,深度学习从业者通常完全放弃先验保证,而是在过去对类似问题进行了很好泛化的基础上采用方法,并证明泛化事后 通过实证评估。当我们到达 第 5 节时,我们将重新审视泛化,并简要介绍大量科学文献,这些文献如雨后春笋般涌现,试图解释为什么深度神经网络在实践中泛化。

4.6.1. 测试集

由于我们已经开始依赖测试集作为评估泛化误差的黄金标准方法,所以让我们从讨论此类误差估计的属性开始。让我们关注一个固定的分类器f,而不用担心它是如何获得的。此外,假设我们拥有一个新的示例数据集 D=(x(i),y(i))i=1n未用于训练分类器的f. 我们分类器的经验误差fD只是预测所针对的实例的一部分f(x(i))不同意真正的标签y(i), 并由以下表达式给出:

(4.6.1)ϵD(f)=1n∑i=1n1(f(x(i))≠y(i)).

相比之下,总体误差基础总体(某些分布P(X,Y) 以概率密度函数为特征p(x,y))我们的分类器不同意真实标签:

(4.6.2)ϵ(f)=E(x,y)∼P1(f(x)≠y)=∫∫1(f(x)≠y)p(x,y)dxdy.

尽管ϵ(f)是我们真正关心的量,我们不能直接观察到它,就像我们不能不测量每个人就不能直接观察到大量人群的平均身高一样。我们只能根据样品估计这个数量。因为我们的测试集D是潜在人群的统计代表,我们可以查看ϵD(f)作为总体误差的统计估计ϵ(f). 此外,因为我们感兴趣的数量ϵ(f)是(随机变量的期望1(f(X)≠Y)) 和相应的估计量ϵD(f)是样本平均值,估计总体误差只是均值估计的经典问题,您可能还记得 2.6 节

概率论的一个重要经典结果称为 中心极限定理,保证无论何时我们拥有n 随机样本a1,...,an从具有均值的任何分布中抽取μ和标准差σ, 作为样本数n接近无穷大,样本平均值


下载该资料的人也在下载 下载该资料的人还在阅读
更多 >

评论

查看更多

下载排行

本周

  1. 1山景DSP芯片AP8248A2数据手册
  2. 1.06 MB  |  532次下载  |  免费
  3. 2RK3399完整板原理图(支持平板,盒子VR)
  4. 3.28 MB  |  339次下载  |  免费
  5. 3TC358743XBG评估板参考手册
  6. 1.36 MB  |  330次下载  |  免费
  7. 4DFM软件使用教程
  8. 0.84 MB  |  295次下载  |  免费
  9. 5元宇宙深度解析—未来的未来-风口还是泡沫
  10. 6.40 MB  |  227次下载  |  免费
  11. 6迪文DGUS开发指南
  12. 31.67 MB  |  194次下载  |  免费
  13. 7元宇宙底层硬件系列报告
  14. 13.42 MB  |  182次下载  |  免费
  15. 8FP5207XR-G1中文应用手册
  16. 1.09 MB  |  178次下载  |  免费

本月

  1. 1OrCAD10.5下载OrCAD10.5中文版软件
  2. 0.00 MB  |  234315次下载  |  免费
  3. 2555集成电路应用800例(新编版)
  4. 0.00 MB  |  33566次下载  |  免费
  5. 3接口电路图大全
  6. 未知  |  30323次下载  |  免费
  7. 4开关电源设计实例指南
  8. 未知  |  21549次下载  |  免费
  9. 5电气工程师手册免费下载(新编第二版pdf电子书)
  10. 0.00 MB  |  15349次下载  |  免费
  11. 6数字电路基础pdf(下载)
  12. 未知  |  13750次下载  |  免费
  13. 7电子制作实例集锦 下载
  14. 未知  |  8113次下载  |  免费
  15. 8《LED驱动电路设计》 温德尔著
  16. 0.00 MB  |  6656次下载  |  免费

总榜

  1. 1matlab软件下载入口
  2. 未知  |  935054次下载  |  免费
  3. 2protel99se软件下载(可英文版转中文版)
  4. 78.1 MB  |  537798次下载  |  免费
  5. 3MATLAB 7.1 下载 (含软件介绍)
  6. 未知  |  420027次下载  |  免费
  7. 4OrCAD10.5下载OrCAD10.5中文版软件
  8. 0.00 MB  |  234315次下载  |  免费
  9. 5Altium DXP2002下载入口
  10. 未知  |  233046次下载  |  免费
  11. 6电路仿真软件multisim 10.0免费下载
  12. 340992  |  191187次下载  |  免费
  13. 7十天学会AVR单片机与C语言视频教程 下载
  14. 158M  |  183279次下载  |  免费
  15. 8proe5.0野火版下载(中文版免费下载)
  16. 未知  |  138040次下载  |  免费