0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据科学和机器学习所需要的基本数学技能

如意 来源:读芯术 作者:读芯术 2020-07-06 09:39 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作为一切科学的基础,数学在数据科学领域也占据着重要地位。如果你是一名数据科学爱好者,一定想过这些问题:

· 我可以在几乎没有数学背景的情况下,成为一名数据科学家吗?

· 在数据科学中,哪些基本的数学技能是重要的?

有很多好用的包可以用来构建预测模型,或生成数据可视化。一些最常用的描述性分析和预测性分析包包括:Ggplot2、Matplotlib、Seaborn、Scikit-learn、Caret、TensorFlow、PyTorch、Keras等。

有了这些包,任何人都可以构建模型或者生成数据可视化。然而,想要微调模型,使之能产生具有最佳性能的可靠模型,确实需要非常扎实的数学基础知识。

建立模型是一回事,但是解释模型,并且总结出有意义的,且可用于数据驱动的决策制定的结论是另一回事。重要的是,在使用这些包之前,读者必须要对每一个包的数学基础有所了解,不仅限将这些包作为黑盒子工具来使用。

案例研究:构建多元回归模型

假设现在要建立一个多元回归模型。在此之前,我们需要问自己几个问题:

· 数据集有多大?

· 我的特征变量和目标变量是什么?

· 哪些预测特征与目标变量最相关?

· 哪些功能很重要?

· 应该缩放特征吗?

· 如何提高模型的预测能力?

· 应该使用正则回归模型吗?

· 回归系数是多少?

· 什么是拦截?

· 如何将数据集划分为训练集和测试集?

· 什么是主成分分析(PCA)?

· 应该使用主成分分析来删除冗余的特征吗?

· 应不应该使用非参数回归模型,如k邻近回归(或支持向量回归)?

· 模型中有哪些超参数,如何对它们进行微调以获得性能最优的模型?

· 如何评估模型?是用R2-score(决定系数),MSE(均方误差),还是MAE(平均绝对误差)?

没有良好的数学背景,就无法回答上述问题。在数据科学和机器学习中,数学技能和编程技能同等重要。作为一名数据科学爱好者,一定要投入时间来研究数据科学和机器学习的理论和数学基础。

能否建立可靠而有效的模型,使其应用于现实世界的问题,取决于读者的数学技能有多好。接下来我们来讨论一下在数据科学和机器学习中所需要的一些基本数学技能。

数据科学与机器学习的基本数学技能

1. 线性代数

线性代数是机器学习中最重要的数学技能。数据集表示为矩阵,线性代数用于数据预处理、数据转换、降维和模型评估。

以下是大家需要熟悉的:向量;向量的范数;矩阵;矩阵的转置;逆矩阵;矩阵的行列式;矩阵的迹;点积;特征值;特征向量。

2. 统计与概率

统计与概率用于特征可视化、数据预处理、特征转换、数据插补、降维、特征工程、模型评价等。

以下是大家需要熟悉的:均值、中值、模式、标准差/方差、相关系数和协方差矩阵、概率分布(二项式、泊松分布、正态分布)、p值、贝叶斯定理(精度、召回率、正预测值、负预测值、混淆矩阵、ROC曲线)、中心极限定理,R-2 score,均方误差(MSE),A/B检验,蒙特卡罗模拟

3. 多变量微积分

大多数机器学习模型都是由一个具有多个特征或预测器的数据集建立的。因此,熟悉多变量微积分对于建立机器学习模型非常重要。

以下是大家需要熟悉的:多元函数;导数和梯度;阶跃函数、S形函数、Logit效用函数、ReLU(修正线性单元)函数;成本函数;函数绘图;函数的最小值和最大值。

4.优化方法

大多数机器学习算法是通过最小化目标函数进行预测建模,从而学习为获得预测标签而必须应用于测试数据的权重。

以下是大家需要熟悉的:成本函数/目标函数;似然函数;误差函数;梯度下降算法及其变体(例如随机梯度下降算法)。

本文讨论了数据科学和机器学习所需的基本数学和理论技能。互联网时代,你能很轻松找到学习资源。作为数据科学爱好者一定要记住,数据科学的理论基础对于高效可靠的模型建立至关重要。你应该花足够的时间来钻研每种机器学习算法背后的数学理论,这对于数据科学来说是必不可少的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数学建模
    +关注

    关注

    0

    文章

    50

    浏览量

    14232
  • 机器学习
    +关注

    关注

    67

    文章

    8571

    浏览量

    137447
  • 数据科学
    +关注

    关注

    0

    文章

    168

    浏览量

    10838
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    在阿里云PAI平台的机器人感知强化学习规模化实践

    物理 AI 正在迅速从基础运动控制迈向更复杂的环境理解。传统机器人强化学习(RL)长期依赖本体感知(proprioception),包括关节角度、力矩反馈和内部状态,来训练灵巧的运动技能
    的头像 发表于 05-18 10:34 415次阅读
    在阿里云PAI平台的<b class='flag-5'>机器</b>人感知强化<b class='flag-5'>学习</b>规模化实践

    机器学习中的数据质量双保障:从“验证”到“标记”

    机器学习的世界里,有句老话尤为贴切:“garbagein,garbageout”(输入垃圾,输出垃圾)。无论模型架构多先进、算法多精妙,数据的质量始终是决定模型性能的核心。本文聚焦数据
    的头像 发表于 04-24 15:48 180次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>中的<b class='flag-5'>数据</b>质量双保障:从“验证”到“标记”

    算法工程师需要具备哪些技能?

    算法工程师需要掌握一系列跨学科的技能,涵盖数学基础、编程能力、算法理论、工程实践以及业务理解等多个方面。 以下是具体技能学习建议: 线性代
    发表于 02-27 10:53

    嵌入式驱动开发,需要掌握哪些技能

    :掌握UART、SPI、I2C等接口常见通信协议,以及如何开发和调试相应的通信代码。 2、 编程技能扎实的编程基础:嵌入式驱动开发的核心是软件编程,因此至少需要掌握C语言技能。 掌握数据
    发表于 01-20 16:46

    机器学习和深度学习中需避免的 7 个常见错误与局限性

    ,并验证输出结果,就能不断提升专业技能,养成优秀数据科学家的工作习惯。需避免的机器学习和深度学习
    的头像 发表于 01-07 15:37 413次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>中需避免的 7 个常见错误与局限性

    嵌入式需要掌握哪些核心技能?

    嵌入式需要掌握哪些核心技能? 若想通过学习嵌入式技术提升就业竞争力,需重点掌握C语言、嵌入式硬件架构、RTOS/Linux开发、通信协议四大核心技能,并结合行业需求积累项目经验。
    发表于 10-21 16:25

    labview怎么读取UTF-16 LE 文本数据

    各位大佬 请问labview怎么读取UTF-16 LE 文本数据 直接读数据出来会有空格 但是空格无法删除,请问怎么获取UTF-16 LE格式数据
    发表于 10-10 11:23

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    科学发现的重要组成部分。 实验科学:通过观察和实验来验证假说 理论科学:通过构建逻辑框架来解释观察到的现象 模型科学:通过数学模型来描述和
    发表于 09-17 11:45

    量子机器学习入门:三种数据编码方法对比与应用

    在传统机器学习数据编码确实相对直观:独热编码处理类别变量,标准化调整数值范围,然后直接输入模型训练。整个过程更像是数据清洗,而非核心算法组件。量子
    的头像 发表于 09-15 10:27 1089次阅读
    量子<b class='flag-5'>机器</b><b class='flag-5'>学习</b>入门:三种<b class='flag-5'>数据</b>编码方法对比与应用

    如何在机器视觉中部署深度学习神经网络

    人士而言往往难以理解,人们也常常误以为需要扎实的编程技能才能真正掌握并合理使用这项技术。事实上,这种印象忽视了该技术为机器视觉(乃至生产自动化)带来的潜力,因为深度学习并非只属于计算机
    的头像 发表于 09-10 17:38 1135次阅读
    如何在<b class='flag-5'>机器</b>视觉中部署深度<b class='flag-5'>学习</b>神经网络

    盘点嵌入式就业所需要技能有哪些?

    良好的沟通能力和团队合作精神,能够与不同领域的工程师协作。 综上所述,嵌入式行业的就业方向丰富多样,不同行业对嵌入式技术的需求也各有侧重。因此,嵌入式工程师需要根据不同的就业方向,学习和掌握相关的技能
    发表于 08-11 15:43

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    这对开发人员意味着什么,以及使用Neuton 模型如何改进您的开发和最终应用。 ML 模型对于您所选微控制器的内存来说太大。 创建自定义ML 模型本质上是一个手动过程,需要高水平的数据科学
    发表于 07-31 11:38

    通过NVIDIA Cosmos模型增强机器人学习

    通用机器人的时代已经到来,这得益于机械电子技术和机器人 AI 基础模型的进步。但目前机器人技术的发展仍面临一个关键挑战:机器需要大量的训练
    的头像 发表于 07-14 11:49 1438次阅读
    通过NVIDIA Cosmos模型增强<b class='flag-5'>机器人学习</b>

    任正非说 AI已经确定是第四次工业革命 那么如何从容地加入进来呢?

    处理,TensorFlow、PyTorch用于构建和训练神经网络。以Python为例,通过编写简单的程序来处理数据,如读取数据集、进行数据清洗和预处理,这是进入AI领域的基本技能
    发表于 07-08 17:44

    嵌入式AI技术漫谈:怎么为训练AI模型采集样本数据

    Q 需要为嵌入式AI模型提供多少样本数据? 我在向客户介绍如何使用AI方法设计一款客户产品时,客户理解,AI嵌入式项目的开发都是围绕数据展开的,如此,我经常会被问到这样的问题:客户的工程师需要
    的头像 发表于 06-11 16:30 1689次阅读