0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

本科生怎样入门机器学习

工程师人生 来源:工程师吴畏 2019-05-05 16:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

此处我们暂且不论文科生,理科生工科生课程大多在大一会有高等数学和线性代数两门课,机器学习大约需要多少数学知识呢?个人觉得如果你是想从事机器学习算法基层工作,偏做数学学术的同学,你可以本科两年左右把高代、数分这些主干课过一遍,至于大三的一些实分析、复分析、泛函实变这些,个人觉得机器学习极少用到这些,当然也可能是我程度还不够深入,我的建议是大家不要浮躁地一开始就拿着代码开始撸项目,但是也不要读成书呆子,大家一定要明白一个观点,如果你不想成为陈景润那样的数学家,大可不必花上大把时间在各种各样的数学专业书上。那么回到我们的问题机器学习到底需要多少数学知识呢?从我个人学习经验,鄙人在学校大约学过高等数学、线性代数、离散数学、概率论与数理统计这四门主干课,平均分大约在88分左右,至于为什么平均分没上95,是因为实在是懒得复习每本书那一章背的让人头疼的公式,机器学习需要的数学大约是高数微分积分思想那块(泰勒展开可以好好复习复习)、线性代数基础书加上部分求导(矩阵的迹这些)、概率论与数理统计(贝叶斯看看,然后是分布那块),这几块内容实在在这几本书算是基本内容了,很简单。之前见过一些,有的可能会说这些操作在现在流行的平台都有许多包能用巴拉巴拉的,但是不要忘了我们虽然不是“造房子”的人,但是最基本的一些东西还是希望同学们在学习的过程中去证明证明。在已有比较好的数学基础上去看机器学习的算法会轻松很多,也解决了部分同学一心趴倒在数学坑里的问题(执着于数学的科研小伙伴请忽略我这一大段话,统计学大佬惹不起)。

好啦,以上就是机器学习在数学方面的要求。接下来我们可以愉快地学习机器学习啦。

这里我说说我的入门,一开始很荣幸一个大佬给我讲了机器学习一些思想,顺便安利了我辈楷模Andrew ng,一开始在网易云看了一遍带massac的视频,憋的不要不要,很多地方一知半解,练习也较少,看完之后懵懵懂懂吧,当时是边刷周志华老师的西瓜书(这个不必说了吧,另一个大佬,据说最近评上了ieee fellow的亚洲主席来着),当时大约是大二上学期结束后的寒假,痛并快乐着。过了一段时间,朋友圈另外一个大佬alexa哈哈,疯狂在刷coursera,抱着萌新心态一搜,不得了哇(coursera为ng所创立),然后不知不觉刷完了stanford的ml课程,并做完了所有练习。做的同时二刷周志华老师的西瓜书,痛并快乐着。

不得不说ml博大精深,看了很久很久,我发现自己还是停留在学习阶段,也就是怎么说,在有的人看来屌屌的,但是实际上让我立马接一个项目,感觉压力山大啊。这时候我打开的B乎,手动滑稽脸,发现李航老师的《统计学习方法》,这个评价不是一般的好,继续买书刷书,刷完感觉数学功底理解上升了一个层次。以上书籍都很安利的。后来alexa大佬在刷华盛顿大学的ml课程,据说也很nice,但是课程量太大加上后来国家某局狂搞vpn,没得看,算是小遗憾了。

刷完统计学习方法对不对,不得不再吹一句,机器学习也是大学科,类别是真的多。转眼到大二下学期的暑假,看大佬无聊的时候演示一波R的文本分词,着实欢喜,自学了一波R语言(ps那时的我执着于用octave处理一切问题),美滋滋。当然我继续搜淘宝,淘到一本机器学习实践,看来是harrinton大佬写的,很nice带源码,小伙伴们刷起吧,不解释,不过这本书没刷完因为其他一些项目耽误了。(python也是真滴好用,当然包这一块强推anaconda,conda指令有些坑处我自己慢慢爬出来的,有问题的同学可以留言)。

搞了一波事情,发觉无聊了,这时候来了本深度学习,还是yoshia bengio大佬,别说了,再贵都买,目前刷了五章, 一直炒现饭,我给自己本科要求是不玩深度学习,但是进来了还是看看吧,就是玩玩,没指望自己能玩转卷积这些,只是看看。近期什么状态呢,(⊙o⊙)…

其实从暑假后期开始,我重心转向托福了,打算年底刷一波分,然后再投入到令人向往的事业来hhhh,不过现在看起来又要重新进坑了。两个教授给我发出申请,给研究生讲讲我的学习方法交流交流,maybe已经走在大部分人前面,现在是想划水划不动了,每周跟着一帮研究生开组会,过起了研究生+本科生双重生活。文中如有冒犯请别跟小人一般见识,现在是大三狗了,只能划两年,出国跟着某苦逼导师消耗自己两三年的生命投身科研吧,当然就是说说,有大佬带就好,现在处于不想自己带队的状态,手上有一手资源,但是不想用23333,感谢让我再休息一阵子哈哈哈哈,劳模下线了。如果想了解细节可以留言,我有时间有想法了可以不定期更新一两波干货。鄙人爱好较多,欢迎找我打桥牌啊之类的,棋现在不想约了,小提琴处于想拉就拉的状态,为bigbang着迷的程序猿,balabala当日记写着玩哈哈。

感谢大学两年以来帮助过我的学长学姐们,感谢我最亲爱的honey,没错就是你呀!

忘了怎么打分割线了,姑且这样凑合吧。出去交换了一波准大四来补全一下。(不知道算不算画蛇添足2333)

之前说的大约是需要不是很多的数学就能开干,但是要知道很多东西看起来不难,但是越深入是越难的。对于想做机器学习(AI大类)相关的同学要明白自己有什么资源,自己想达到什么程度,自己想做什么。上学期出去交换一学期,期间零零碎碎做了网络+嵌入式的app项目,也做了一些GAN相关的东西,听了几位业界蛮有名的大牛讲座。思路太多下面慢慢整理(最近刷GRE也顺带继续刷toefl真是累)。

如果你是大一/大二同学,请好好学习数学的同时刷完李航的《统计学习方法》,(最近大家都在看,似乎是国内院校神书)这本书蛮薄的,前前后后因为实习各种事详细看了好几遍,至今也不敢说自己完全都会,甚至前两天和一个研究生学长讨论一下把我问住了,只能说这本书中许多问题需要深入思考:为什么要用这个方法、这个方法为什么好、这个方法还能用在哪里。其实在平时学习与看书这件事不冲突。

还有几本实践书,《python实践》大约是这么写,harrington写的,主要是基础算法的实例。然后是《tensorflow深度学习框架》这本是科大学长安利,出到了第二版,也挺不错。实践书,算法书都挺不错,同类型多看看也差不多了,主要提高coding和对这些问题的思考,比如这些算法背后的一些哲学思想(开玩笑2333)。

至于周老师的西瓜书,可以当作reference之类的看,里面工程内容也很多,如果有能力(看完李航老师书的前提下)跳过算法部分,专注工程的一些trick。还有一点是不管用什么方法,coding是要有的,我的blog基本上囊括了machine learning的一些基本算法。当然了,等你看完这几本,其实你还没入门。。。

哈哈,当然是骗你的,如果你弄透了,基本在ml这块就没问题,可以继续进阶啦。这里你可以有很多基础的东西要看,比如CNN对不对,CNN基础的论文大概二十篇左右,我在我的blog有详细列出了其中比较重要的条目以及阅读意见。然后是RNN呀LSTM呀RFFPGA呀GAN呀这些,当然我没罗列完,大约就是各种网络模型,再加上各种优化方法,当然还有纯convex流派,这个大大大佬应该是都会的,顶会上再厉害的东东也是有数学那么些东西的,笼统来说就是你这里哪里加了个function,然后这样optimize就很好,然后证明两页略这种。这些论文加起来大约200篇左右,最好是能实现一些,然后实操一些。

同时比赛也可以玩玩呀,ACM,阿里的,kaggle上的都不错,可以拿得出手,锻炼锻炼。(当然还有JData,TX社交网络,携程滴滴这些)还有数学建模之类,以及各种互联网+之类的比赛水水。PS数学建模玩的好真能保送北大,因为国赛是会排名的,隔壁寝就保了。(当然ACMworld final也能保,同实验室的学长15final打了世界30多吧,毅然决然放弃博,感觉他考个toefl就能上MIT,后来去了pony投奔楼教主,税后嘿嘿嘿)学校211弱渣,碰巧大牛还是有的。

还有些别类例如R, scala, swift 这些语言也是相关。whatever, 语言只是工具据,当然也有各自擅长吧,如果非要选一个当然是r了,对初学者或者是外系同学比较友好(学好英文自然懂R语言qaq),据我所知数学和经济大类一般都是用r语言做分析(在***交换的舍友一天到晚用r做高维数据的证明,coding估计比我还多)。除了计算机外,时间序列也很不错,之前做过很久的经济方面的东西,但是苦于没有学计量经济学,所以后面arma, arima, garch这些都学的很艰难,当然也发现LSTM也不是总是好用,用time series的方法也不见得就比新的方法差多少,差的是修仙调参罢了。

总之就是这么多,本科发paper还是比较难。(我指的是CVPR,emmm以及稍微比CVPR低一些的IEEE子会的一些)因为随便水水真的不好哇,虽然感觉CVPR也挺多灌水嫌疑文章,虽然我们写不出来,但是你仔细看多了,水不水难道看不出嘛,评价水不水大约就是别人用起来爽不爽(引用量)、对社会效益大不大(会不会有公司看中你请你带实验室去赚钱)。当然了做AI感觉最好还是硕士往上走,但是读硕士肯定得拿出来论文,虽然很多学校要求不高,但是你得想清楚竞争力在哪儿。paper可能你在学校更有环境发(如果能去滴滴实验室or)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    67

    文章

    8571

    浏览量

    137462
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    江苏省语言计算及应用重点实验室联合培养计划启动

    为汇聚跨模态通用语言计算智能领域优秀人才,强化产学研协同创新,由思必驰科技股份有限公司牵头,联合上海交通大学、苏州大学共建的江苏省语言计算及应用重点实验室,现面向全球启动研究联培、本科生、博士后人才招募,诚邀有志于 AI 前沿研究与工程落地的青年学者加入。
    的头像 发表于 03-23 11:12 523次阅读

    机器学习和深度学习中需避免的 7 个常见错误与局限性

    无论你是刚入门还是已经从事人工智能模型相关工作一段时间,机器学习和深度学习中都存在一些我们需要时刻关注并铭记的常见错误。如果对这些错误置之不理,日后可能会引发诸多麻烦!只要我们密切关注
    的头像 发表于 01-07 15:37 414次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>中需避免的 7 个常见错误与局限性

    嵌入式物联网毕设爆款项目学习推荐:小智AI桌宠机器狗_基于STM32F103+ESP32-S3的四足机器人(附开发教程/源码)

    毕业设计选题时,不少同学陷入两难:技术深的项目工程量大、难以按期完成;易实现的题目又同质化严重、缺创新。尤其是机械电子融合的机器人领域,机械设计、运动控制、多传感器融合、AI视觉/语音等难题让本科生
    的头像 发表于 12-30 13:42 1384次阅读
    嵌入式物联网毕设爆款项目<b class='flag-5'>学习</b>推荐:小智AI桌宠<b class='flag-5'>机器</b>狗_基于STM32F103+ESP32-S3的四足<b class='flag-5'>机器</b>人(附开发教程/源码)

    探索Xilinx Kria KR260机器入门套件:开启机器人应用开发新旅程

    探索Xilinx Kria KR260机器入门套件:开启机器人应用开发新旅程 在当今科技飞速发展的时代,机器人技术的应用越来越广泛。对于电子工程师来说,拥有一款优秀的开发套件至关重要
    的头像 发表于 12-15 14:45 704次阅读

    分享一个嵌入式开发学习路线

    特殊要求,本科生和专科均可轻松上手。 数字电路基础:掌握高低电平、与或非门、触发器、时序逻辑等基础知识,能看懂简单的电路图。 51单片机入门学习单片机的核心模块,如GPIO口、定时
    发表于 12-04 11:01

    学习物联网怎么入门?

    景等。同时,学习物联网的基本技术,如传感器技术、通信技术、云计算等,也是非常重要的。 其次,选择适合自己的学习方式也是入门学习物联网的重要一步。
    发表于 10-14 10:34

    量子机器学习入门:三种数据编码方法对比与应用

    在传统机器学习中数据编码确实相对直观:独热编码处理类别变量,标准化调整数值范围,然后直接输入模型训练。整个过程更像是数据清洗,而非核心算法组件。量子机器学习的编码完全是另一回事。传统算
    的头像 发表于 09-15 10:27 1103次阅读
    量子<b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>入门</b>:三种数据编码方法对比与应用

    2025商汤奖学金夏令营活动圆满落幕

    历时九年,商汤奖学金已成为国内AI领域顶尖本科生的代名词,令无数学生心驰神往。本届夏令营不仅汇聚了2025年度奖学金得主,还特邀了往届获奖学子共襄盛举——来自清华大学、北京大学、上海交通大学、中国科学技术大学、浙江大学等知名学府的青年们以AI为纽带,共叙成长、共探未来。
    的头像 发表于 08-19 15:49 1260次阅读

    ARM入门学习方法分享

    。 以下是一些入门学习方法的分享: 一、 理解基本概念:首先,了解ARM是什么以及它的基本概念是很重要的。ARM(Advanced RISC Machines)指的是一种精简指令集计算机(RISC
    发表于 07-23 10:21

    LED驱动电路设计

    兼顾了不同读者的需要,由浅入深,层次清晰,通俗易懂,实用性强,可作为电气工程类专业本科生及研究入门教材,也可供从事LED驱动电源设计的工程技术人员参考。获取完整文档资料可下载附件哦!!!! 如果内容有帮助可以关注、点赞、评论
    发表于 07-18 15:26

    易灵思与南京大学集成电路学院暑期课程圆满结课

    近日,由国产FPGA领军企业易灵思与南京大学集成电路学院联合举办的“深度学习与硬件加速”暑期课程圆满结课。本次课程为期5天(7月7日至7月11日),面向大三本科生,旨在通过理论与实践结合的方式,帮助学生掌握FPGA硬件加速与TinyML的前沿技术,培养集成电路与人工智能交
    的头像 发表于 07-17 11:33 3041次阅读

    FPGA在机器学习中的具体应用

    随着机器学习和人工智能技术的迅猛发展,传统的中央处理单元(CPU)和图形处理单元(GPU)已经无法满足高效处理大规模数据和复杂模型的需求。FPGA(现场可编程门阵列)作为一种灵活且高效的硬件加速平台
    的头像 发表于 07-16 15:34 3212次阅读

    硬件设计指南:从器件认知到手机基带设计

    工程师,以及本科生和硕士阅读。获取完整文档资料可下载附件哦!!!! 如果内容有帮助可以关注、点赞、评论支持一下哦~
    发表于 07-03 16:49

    机器学习赋能的智能光子学器件系统研究与应用

    腾讯会议---六月直播 1.机器学习赋能的智能光子学器件系统研究与应用 2.COMSOL声学多物理场仿真技术与应用 3.超表面逆向设计及前沿应用(从基础入门到论文复现) 4.智能光学计算成像技术
    的头像 发表于 06-04 17:59 831次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>赋能的智能光子学器件系统研究与应用

    高校宿舍为什么要改革?如何让高校宿舍收费更智能化?

    严重不足。国务院发布的《普通高等学校建筑面积指标》要求本科生、研究、博士校舍建筑面积分别为10㎡/、15㎡/、20㎡/
    的头像 发表于 06-04 16:27 727次阅读
    高校宿舍为什么要改革?如何让高校宿舍收费更智能化?