什么是科学假设？什么是统计假设？什么又是机器学习假设呢？-电子发烧友网

什么是科学假设？什么是统计假设？什么又是机器学习假设呢？

虽然同为假说，这三个东西其实还真不太一样！

今天，就带你来区分一下“假设”三兄弟。

了解完它们的区别后，你会对假设一词在不同领域会有更深刻的认识，对于更好的使用假设会有更深入的理解。同时，对于机器学习的入门者来说，这样一篇文章对于个人今后在该领域的发展就是如虎添翼。

通常，我们所理解的监督性机器学习，是一个类似于研究从输入映射到输出的目标函数问题。

这个过程可以被分为如何选取假设空间，以及评估候选的假设空间。

作为一个机器学习领域的初学者来说，假设这个词的概念可能让他们会产生困惑，有时会产生歧义，比如在统计领域我们会有假设检验，而在科学领域我们又会有科学假说。

这些定义互有关联，却不尽相同。

所以什么是假设呢？

假设是一种对事物的解释。

它是一种凭借经验和知识所提出的猜测性想法，需要一定的评估依据。

一个好的假设是可验证的，验证结果有可能是对的，也可能是错的。

在科学界，假说一定是可以被证伪的，即通过观察检验结果，可以证实这个假说是错误的。同时，在验证结果出来之前，假说的框架结构一定要确定好。

...任何一个或一系列假说想要成为科学定理或者科学理论，一定要满足这样一个基本条件—那就是，它是可以被证伪的。

选自《What is This Thing Called Science?》1999年，第三版，第61-62页

一个好的假说既能满足现有证据，又可以用来预测新的观察或新的情况。

一个假说如果说完全满足现有证据，同时可以被验证，那么它将会成为理论或者成为理论的一部分。

小结一下，科学假说是指符合证据、同时可以被证实或者被反驳的猜测性解释。

统计学中的假设又该如何定义呢？

大多统计问题是研究观测样本之间潜在关系。

统计学上的假设检验通常是计算产生“影响”的临界值，通过计算临界值可以来判定观测样本之间是否存在某种关系。

如果似然值很小，这种影响结果就可能会是真实的，如果似然值很大，那我们可能观测到了统计波动，这种影响可能并不真实。

举例来说，通过推断两组样本之间均值所存在的关系，可以判断它们是否具有相同的统计分布，或者它们之间又有哪些差异。

举个例子，我们可以假设两组样本的均值相同。

这种假设对我们来说没什么影响，也叫作零假设。通过假设检验，我们可以得到拒绝该假设或者保留该假设。即便我们不能拒绝零假设，也不等于我们接受零假设是对的，因为结果只是一个概率。

..在社会科学研究中，我们通过建立假设、制定标准来衡量是否保留或拒绝我们的假设，通常都是零假设。

《Statistics in plain English》2010年第三版，64-65页

在我们的例子中，如果零假设被否定，其相对立的备择假设就认为均值之间存在差异。

零假设（H0）：没有影响

备择假设（H1）：存在影响

统计学中的假设检验通常不会评判影响的大小，只会近似估计被观测样本之间是否存在差异。

小结一下，统计学中的假设指的是用概率来解释样本观测值之间是否存在关系。

最后，什么是机器学习中的假设呢？

机器学习，尤其是监督性学习，是用已有数据学习得到一个最佳的函数来表示输入到输出之间的映射关系。

说的专业些，这个叫做函数逼近。就是说我们想找到一个接近于我们目标函数（我们假设它存在）的方程，可以满足在问题定义域里所有观测结果都可以从输入映射到输出结果。

在机器学习中，一个近似目标函数并且将输入映射到输出的模型被称为假设。

算法选取（比如神经网络）和算法配置（如网络拓扑和超参数）决定了模型可能表示的假设空间。

机器学习算法的学习是寻找最接近目标函数的假设，即将已选取的假设空间转化成最佳或最优的假设。

“学习”是在可能的假设空间中寻找一个表现良优的假设空间，即使在训练集之外新样本上也能适用。

选自《Artificial Intelligence: A Modern Approach》2009年第二版，第695页。

这种机器学习的框架很常见，通常可以帮助我们选取算法、理解学习和泛化问题，甚至是“偏差-方差”的权衡。举例来说，训练集通常是学习假设，而测试数据集是用来评估假设。

我们通常会用小写（h）来表示给予的特定假设，用大写（H）来表示被探索的假设空间。

假设（h）：单一假设，如一个实例或特定的候选模型，可以将输入映射到输出，同时也可以对模型进行评估和预测。

假设集（H）：一个包括所有可能的输入映射到输出之间关系的假设空间，通常受选取的问题框架、模型和模型调参所限制。

在选择算法和配置过程中，我们需要选取一个对目标函数来说是最好的逼近函数作为假设空间。这是非常具有挑战的，通常对于一系列不同的假设空间进行抽查会更为有效。

如果假设空间包含真函数，则学习问题是可实现的。不幸的是，我们不能总是判断一个给定的学习问题是否可以实现，因为真正的函数是未知的。

选自《Artificial Intelligence: A Modern Approach》2009年第二版，697页。

这是一个困难的问题。通常，我们通过限制假设空间的大小和评估假设的复杂性来简化搜索过程。

假设空间的表达性和假设搜索的复杂性之间存在一种权衡关系。

选自《Artificial Intelligence: A Modern Approach》2009年第二版，697页。

小结一下，机器学习中的假设是一个近似目标函数的候选模型，用于表示输入样本到输出样本之间的映射关系。

总结

让我们重新梳理一遍对假设的三个定义：

科学假说是一种对于观察现象的猜测性解释，并且是可以被证伪的。

统计中的假设是用概率的方式来解释数据样本之间的关系。

机器学习中的假设是一个近似目标函数的候选模型，用于表示输入样本到输出样本之间的映射关系。

机器学习的假设定义要比科学中的定义更加广泛。

和科学假说一样，机器学习也是基于现有证据，可以被证伪，并对新情况进行预测。

在机器学习中的假设：

涵盖现有证据：即训练数据集

可以被证伪：有一个测试集来评估模型表现，并且与基础模型作对比，确定训练过程是否有效。

适用于新的情况：可被用来对新数据集进行预测。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4561

浏览量
98622
函数

函数

+关注

关注
3

文章
3859

浏览量
61294
机器学习

机器学习

+关注

关注
66

文章
8092

浏览量
130510

原文标题：“假设”家族大起底！如何正确区分科学假设、统计假设和机器学习假设？

文章出处：【微信号：thejiangmen，微信公众号：将门创投】欢迎添加关注！文章转载请注明出处。

LTM4644的内部有四路0.6V基准，假设其中一路的0.6V基准值偏了，对输出的影响是什么？

LTM4644的内部有四路0.6V基准，假设其中一路的0.6V基准值偏了，对输出的影响是啥？考虑单路输出的情况、以及两个通道并联输出的情况。

发表于 01-05 06:19

去模糊算法适对发射点扩散函数（PSF）的假设要求最低

避免这些问题，通过光子强度守恒和局部线性来提高图像的分辨率。据《先进光子学》报道，创新的去模糊算法适用于各种荧光显微镜，对发射点扩散函数（PSF）的假设要求最低。它适用于一系列原始图像，甚至适用于单幅图像，可以对波动的荧光

发表于 11-02 09:15 •277次阅读

去模糊算法适对发射点扩散函数（PSF）的<b class='flag-5'>假设</b>要求最低

什么是减法合成？谐波是什么？波形又是什么？

但为什么两根绳子长度为整数关系时更悦耳呢？为了回答这一问题，让我们先假设有一根绳子，它的两端是固定起来的，中间的部分可以任意震动，该绳静止时的状态如图 1 所示。

发表于 07-11 15:46 •805次阅读

什么是减法合成？谐波是什么？波形<b class='flag-5'>又是</b>什么？

有限假设空间(2)#大数据机器人

机器人

未来加油dz

发布于 :2023年07月10日 21:18:23

有限假设空间(1)#大数据机器人

机器人

未来加油dz

发布于 :2023年07月10日 21:17:13

假设空间(2)#大数据机器人

机器人

未来加油dz

发布于 :2023年07月10日 20:40:57

假设空间(1)#大数据机器人

机器人

未来加油dz

发布于 :2023年07月10日 20:40:32

假设检验(2)#大数据机器人

机器人

未来加油dz

发布于 :2023年07月10日 20:40:03

假设检验(1)#大数据机器人

机器人

未来加油dz

发布于 :2023年07月10日 20:39:27

MySQL自增主键一定是连续的吗？

如果你的业务设计依赖于自增主键的连续性，这个设计假设自增主键是连续的。但实际上，这样的假设是错的，因为自增主键不能保证连续递增。

发表于 06-11 11:35 •340次阅读

基于模型的RT1062固件开发方法，在哪里可以找到有关修改此工具箱（我假设它需要更改）的最快方法的指导？

我正在尝试在我们的产品开发中为 RT1062 评估基于模型的 FW 开发方法（SiL、PiL）。我可以访问 NXP 提供的 Matlab 工具箱。第一个问题是我在哪里可以找到有关修改此工具箱（我假设

发表于 06-08 07:56

假设我们有QM、ASILB、ASILD三个不同安全级别的软件组件，建议使用多少个S32K CORE？

1、假设在S32K3的一个CORE中，我们使用MPU按照ASIL级别划分软件组件。是否仍然无法完全避免连锁故障等问题，原因何在？能否利用RXDC模块对S32K内部资源进行分区，解决上述问题

发表于 05-24 10:07

IMU姿态滤波算法——Mahony算法：原理与代码

首先要指出的是，Mahony算法假设加速度计测量的加速度完全由重力提供，即物体本体运动产生的加速度可忽略不计。在这一假设下，我们假设当前时刻机体的姿态为，则将重力向量的表示转到机体坐标系下，应该为：，这里表示四元数对应的旋转矩阵

发表于 05-22 09:18 •2010次阅读

为什么在信号处理中要假设噪声是高斯白噪声呢？

发表于 05-16 17:38

华为周红：建设智能世界的假设与愿景-从经验、知识到智能

和愿景，周红抛出观点，邀请大家探讨。他认为人类正在快速奔向智能社会，未来有无穷的可能性，目前的想象可能都是保守的。大家要携起手来，开创更美好的明天。以下是周红博士发言精简内容在去年的分析师大会上，我分享了迈向未来智能世界的科学假设与

发表于 04-20 07:15 •1007次阅读

搜索历史

什么是科学假设？什么是统计假设？什么又是机器学习假设呢？

评论

LTM4644的内部有四路0.6V基准，假设其中一路的0.6V基准值偏了，对输出的影响是什么？

去模糊算法适对发射点扩散函数（PSF）的假设要求最低

什么是减法合成？谐波是什么？波形又是什么？

有限假设空间(2)#大数据机器人

有限假设空间(1)#大数据机器人

假设空间(2)#大数据机器人

假设空间(1)#大数据机器人

假设检验(2)#大数据机器人

假设检验(1)#大数据机器人

MySQL自增主键一定是连续的吗？

基于模型的RT1062固件开发方法，在哪里可以找到有关修改此工具箱（我假设它需要更改）的最快方法的指导？

假设我们有QM、ASILB、ASILD三个不同安全级别的软件组件，建议使用多少个S32K CORE？

IMU姿态滤波算法——Mahony算法：原理与代码

为什么在信号处理中要假设噪声是高斯白噪声呢？

华为周红：建设智能世界的假设与愿景-从经验、知识到智能