0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于机器学习的to do & not to do

倩倩 来源:lq 作者:CDA数据分析师 2019-09-20 16:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

前几天看到几篇不同的文章写关于机器学习的to do & not to do,有些观点赞同,有些不赞同,是现在算法岗位这么热门,已经不像几年前一样,可能跑过一些项目、懂点原理就可以了,现在对大家的要求更高,尤其工程能力更不可缺少,只跑过一些iris鸢尾花分类、啤酒与尿布、猫狗分类等的同学需要再提高提高,因为竞争太激烈了,我在这里结合我自己的经验总结一下吧。

To Do

做项目时,边搜集数据可以边用已经搜集好的少部分数据跑模型。不用等到所有数据都搜集好了再跑。

不知道什么算法合适,可以直接把所有的算法都跑一遍,看效果再选择,多跑几个应用场景你就知道什么算法适合什么场景,什么数据对不同的算法会有什么影响了。

不知道什么参数是最佳参数,可以用random search或者grid search自动搜索最佳参数组合,有经验以后对于每个参数的大概范围心里会有个数。

一定要练习工程能力,只会调参的demo侠现在很难找到工作啦。

模型复现和刷题是很好的锻炼工程能力的一种方式。

刷题不要追求数量,要总结不同类型的题目的经验,并结合之前的业务中,看能不能优化之前的业务逻辑。

模型复现可以给自己规定一个任务,譬如在一个月内,把某篇论文的Tensorflow实现的代码,复现成Pytorch或者PaddlePaddle等其他框架的代码,不是闲着没事做,而是模型复现可以迅速提高你对框架的熟悉度和代码能力。

模型复现的过程中,最难的是写新的op和模型效果(精度和速度)的对齐。这可能很折磨人,但是收获也很大。

如果要做新项目,可以先看看有没有预训练模型,可以快速做迁移学习的,如果有,那么整体的模型周期会快很多。

如果跑完算法,一定要有一个成品的形态,最好不要只做算法这一块,譬如跑完模型将其打包封装成服务接口(服务端和移动端等),达到让人可用的状态最好。

领导不想知道过程,只想知道结果。没有可用的东西和可视化的结果,他会觉得你啥也没做。

上条只针对部分领导。

没有人会比你更关心模型的参数调整导致模型的效果提升了0.1%还是1%,大多数人,尤其是leader、或者leader的leader,只关心它有什么用,真实场景的效果好不好。

可以多和同事、同行等互相交流,参加线下的学习会、交流会等,可能会有意想不到的收获。

学习新的算法,先把代码跑起来再说,再来看理论、数学推导、自己手写实现等。

除了调参以外,还需要关注关注部署上线、模型压缩等方面的内容。

Not To Do

训练数据不要太干净了,因为真实场景的数据往往和实验数据差很多,尝试加点噪音吧,做些数据增强和mixup等。

论文里的效果不一定能复现。可以尝试论文的思路,但是不要太过相信论文里的效果数据。

做一个项目就好好深挖,不仅仅要做出来,还要不断的优化,不然每个项目都只是跑通了,效果还行,没必要写到简历里,不如写一个做得很深入,尝试了各种优化方法并有效果提升的项目。

不要因为觉得自己数学不好就先去恶补数学,买一堆高等代数、数学分析、实变函数、复变函数等纯数学书,如果一定要看,推荐《线性代数》《信息论》《凸优化》《数值分析》。

上条推荐的四本数学书也不用全看,凸优化太厚了,其他三本可以在自己有大块时间可以刷书的时候,规定自己在一个月或者几个月的时间迅速刷完。线性代数是基础,数值分析是优化方法(也不用全看),凸优化与信息论与目标函数相关,涉及机器学习的很多理论知识。

不要觉得你训练的模型效果多好就多么厉害,除非是做科研、打比赛、工业界更关注能不能落地,能不能应用产生价值,不要自high = =

如果把你的算法封装成服务了,也要做做压测,学习下工程方面的内容。

最好的状态是,工程能力强,又懂算法,两者结合,效果更佳。不要只注重某一方面的提升,多关注下自己的代码风格,不要让你的同事code review的时候犯难。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 函数
    +关注

    关注

    3

    文章

    4408

    浏览量

    66906
  • 模型
    +关注

    关注

    1

    文章

    3656

    浏览量

    51753
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136274
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    P6KE7.5A单向 TVS瞬态抑制二极管:600W功率DO-15封装参数规格介绍

    P6KE7.5A单向 TVS瞬态抑制二极管:600W功率DO-15封装参数规格介绍
    的头像 发表于 11-22 16:28 3658次阅读
    P6KE7.5A单向 TVS瞬态抑制二极管:600W功率<b class='flag-5'>DO</b>-15封装参数规格介绍

    TC德昌DO-34封装开关二极管是过压保护的可靠选择

    电子设备日益复杂且精密的时代,电路的安全性成为了设计工程师们最为关注的焦点之一。其中,过压保护更是如同电路的“安全气囊”,能够在关键时刻防止电压异常对设备造成的致命伤害。而TC德昌DO-34封装
    的头像 发表于 11-22 16:13 469次阅读
    TC德昌<b class='flag-5'>DO</b>-34封装开关二极管是过压保护的可靠选择

    上海雷卯EMC系列器件:助力航空货运无人机零部件攻克DO-160G测试

    讲解航空货运无人机的设计中,DO-160G航空机载设备环境适应性标准是确保设备可靠性与安全性的核心门槛,核心零部件需通过严格的“电磁敏感度(EMS)”测试——这是保障无人机在高空浪涌、瞬态冲击、极端温湿度等场景下稳定工作的关键。上海雷卯EM
    的头像 发表于 10-27 19:45 340次阅读
    上海雷卯EMC系列器件:助力航空货运无人机零部件攻克<b class='flag-5'>DO</b>-160G测试

    工业级 IO 控制模块:WiFi 无线连接,轻松驾驭 1-32 路 DO 控制与 DI 采集

    在工业自动化控制系统中,工业级网络控制模块是连接上位机与现场设备的核心枢纽,而DO(数字量输出)控制输出、DI(数字量输入)采集输入是其最基础也最关键的功能组合。二者与点动控制逻辑的结合,能够实现
    的头像 发表于 08-25 17:24 662次阅读

    1DO+1DI网络控制模块:构建工业与智能领域的信号交互枢纽

    在工业自动化、智能楼宇、能源管理等领域,实现设备间精准的信号采集与指令传输,是保障系统高效运行的关键。1DO+1DI网络控制模块作为这一过程的“神经末梢”,通过一个数字量输出(DO)通道和一个数
    的头像 发表于 08-18 17:10 586次阅读

    MS4525DO-TP3AJ030APF压力传感器测量气压高度

    MS4525DO-TP3AJ030APF传感器10kHz的高频采样能力可捕捉到气压的瞬时波动,配合I²C数字输出接口,能实时传输数据至飞控系统。在气压高度的的实测中发现,其海拔高度分辨率可达0.1米。传感器经过-40℃至125℃的宽温标定,内部集成的温度传感器会动态修正温漂误差。
    的头像 发表于 06-03 10:19 688次阅读
    MS4525<b class='flag-5'>DO</b>-TP3AJ030APF压力传感器测量气压高度

    首款采用 DO-214AB 紧凑型封装的 2kA 保护晶闸管

    可持续发展、互联互通和更安全的世界提供动力。公司今日宣部推出Pxxx0S3G-A SIDACtor®保护晶闸管系列,该产品是业内首款采用DO-214AB(SMC)紧凑型封装的2 kA晶闸管
    发表于 05-15 17:43 1560次阅读
    首款采用 <b class='flag-5'>DO</b>-214AB 紧凑型封装的 2kA 保护晶闸管

    DO-218AB车载TVS管 汽车抛负载“硬核”保护器件

    在汽车“新四化”的赛道上,电子系统的稳定性直接关乎用户体验与行车安全。东沃DOWO深耕电路保护领域十余年,以DO-218AB车规级TVS二极管系列为核心,提供高可靠防护解决方案。未来,我们将持续创新,以更智能、更高效的电路保护技术,助力汽车电子迈向更高安全等级!
    的头像 发表于 05-15 12:01 618次阅读
    <b class='flag-5'>DO</b>-218AB车载TVS管 汽车抛负载“硬核”保护器件

    【电磁兼容技术案例分享】民机产品DO-160G防雷设计介绍

    【电磁兼容技术案例分享】民机产品DO-160G防雷设计介绍
    的头像 发表于 04-02 17:25 1086次阅读
    【电磁兼容技术案例分享】民机产品<b class='flag-5'>DO</b>-160G防雷设计介绍

    如何下载do on stack软件包AN3942SW.zip?

    有谁知道在哪里/如何下载 do on stack 软件包AN3942SW.zip
    发表于 03-21 06:33

    如何选择合适的MDD整流二极管封装?DIP、SMA、DO-41各有何优劣?

    在电子设计中,MDD整流二极管的封装选择直接影响电路的性能、可靠性和成本。某工业电源项目因封装选型不当,导致整流二极管温升超标,最终引发批量失效。MDD本文通过对比DIP、SMA、DO-41等常见
    的头像 发表于 03-18 11:29 1093次阅读
    如何选择合适的MDD整流二极管封装?DIP、SMA、<b class='flag-5'>DO</b>-41各有何优劣?

    ST NPI 新上架开发板 【X-NUCLEO-DO41A1】

    X-NUCLEO-DO41A1工业数位输出扩充板专为STM32 Nucleo设计,提供强大且灵活的评估环境,用于测试IPS4140HQ-1四通道高边智慧功率固态继电器在连接至≤1 A工业负载的数位输出模组中的驱动和诊断能力。
    的头像 发表于 03-12 09:00 1074次阅读
    ST NPI 新上架开发板 【X-NUCLEO-<b class='flag-5'>DO</b>41A1】

    MS4525DO-SS3AS015AS传感器:精准气压高度测量的科技利器

    MS4525DO-SS3AS015AS传感器能够同时输出压力和温度两项指标,且内置了温度补偿机制,有效降低了温度变化对测量精度的影响,确保了在不同环境条件下的稳定性能。
    的头像 发表于 02-21 14:18 648次阅读
    MS4525<b class='flag-5'>DO</b>-SS3AS015AS传感器:精准气压高度测量的科技利器

    基于MS4525DO-DS3AS015DS差压传感器的空速测量技术解析

    MS4525DO-DS3AS015DS差压传感器凭借其高精度、宽量程和数字输出特性,成为空速测量领域的理想选择。本文从原理出发,结合传感器特性,系统阐述其空速测量方案的设计与实现。
    的头像 发表于 02-21 14:17 1081次阅读
    基于MS4525<b class='flag-5'>DO</b>-DS3AS015DS差压传感器的空速测量技术解析

    在工业自动化领域AI,AO,DI,DO是什么,它有什么作用

    通过合理使用 AI、AO、DI、DO,工业自动化系统可以实现精确的监测和控制,提高生产效率和安全性。
    的头像 发表于 02-06 15:51 5281次阅读
    在工业自动化领域AI,AO,DI,<b class='flag-5'>DO</b>是什么,它有什么作用