0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

100天让你学会机器学习的项目!

算法与数据结构 来源:未知 作者:李倩 2018-09-17 16:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

机器学习是我们这个时代最具变革性的技术,它具有从太空探索到财务,医学和科学的巨大应用。据估计,未来对机器学习专家的需求将会不断增加,今年估计增长约60%。

最重要的是,该行业在过去几年中经历了巨大的变革。以前,要成为一名机器学习专家,你需要有一个博士学位(或一些高学历),但现在已经不是这样了。由于大型科技公司如Alphabet(谷歌母公司),IBM,微软等公司的参与,现在任何人都可以更轻松地开始机器学习。

这不,YouTube上的大咖Siraj Raval就发起了一个挑战赛:#100DaysOfMLCode。

什么是#100DaysOfMLCode?

这是向机器学习开发人员(专家或新手)发出的挑战,要求在接下来的100天内每天至少花一小时学习和构建机器学习模型。内容有易到难,由此也可以看得出博主Avik-Jain的用心良苦。

其中一名叫Avik Jain的机器学习爱好者,创建了一个100-Days-Of-ML-Code的项目,很快引起了大家的注意,截至今日,该项目已经获得了11570个「star」以及1993个「fork」(GitHub地址:https://github.com/Avik-Jain/100-Days-Of-ML-Code)。

更不可思议的是,他还创建了该项目的中文版

从他的GitHub主页可以看到他共创建了6个项目:

目前作者的100天计划,已经进行到第54天,已有的内容包括:

有监督学习

● 数据预处理

● 简单线性回归

● 多元线性回归

● 逻辑回归

● k近邻法(k-NN)

● 支持向量机(SVM)

● 决策树

● 随机森林

无监督学习

● K-均值聚类

● 层次聚类

这里我们通过介绍第一天的数据预处理来深入了解下这个项目

数据预处理

第一步导入库

importnumpyasnpimportpandasaspd

第2步:导入数据集

dataset=pd.read_csv('Data.csv')X=dataset.iloc[:,:-1].valuesY=dataset.iloc[:,3].values

第3步:处理丢失数据

fromsklearn.preprocessingimportImputerimputer=Imputer(missing_values="NaN",strategy="mean",axis=0)imputer=imputer.fit(X[:,1:3])X[:,1:3]=imputer.transform(X[:,1:3])

第4步:解析分类数据

fromsklearn.preprocessingimportLabelEncoder,OneHotEncoderlabelencoder_X=LabelEncoder()X[:,0]=labelencoder_X.fit_transform(X[:,0])

创建虚拟变量

onehotencoder=OneHotEncoder(categorical_features=[0])X=onehotencoder.fit_transform(X).toarray()labelencoder_Y=LabelEncoder()Y=labelencoder_Y.fit_transform(Y)

第5步:拆分数据集为训练集合和测试集合

fromsklearn.cross_validationimporttrain_test_splitX_train,X_test,Y_train,Y_test=train_test_split(X,Y,test_size=0.2,random_state=0)

第6步:特征量化

fromsklearn.preprocessingimportStandardScalersc_X=StandardScaler()X_train=sc_X.fit_transform(X_train)X_test=sc_X.fit_transform(X_test)

通过6步完成数据预处理。此例子中用到的数据地址:https://github.com/Avik-Jain/100-Days-Of-ML-Code/blob/master/datasets/Data.csv

可以看出他每天的计划都包含一张学习图片,操作补流程、相应的代码,以及用到的数据

简单线性回归 | 第2天

多元线性回归 | 第3天

逻辑回归 | 第4天

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6719

    浏览量

    107344
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136231

原文标题:爆红GitHub!有人打算用这个项目100天拿下机器学习

文章出处:【微信号:TheAlgorithm,微信公众号:算法与数据结构】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    分享一个嵌入式开发学习路线

    链”,能独立做简单硬件项目。这一阶段的学习同样对学历没有特殊要求。 STM32单片机学习:掌握STM32的核心外设使用,如GPIO、UART、SPI/I2C、ADC等,能看懂最小系统板的电路图
    发表于 12-04 11:01

    合储能助力德国Strübbel 100MWh风储融合项目

    近日,全球领先的储能产品与系统解决方案提供商合储能宣布,其供货的德国 Strübbel 风储融合项目已进入关键建设阶段。该项目采用合储能先进的储能产品与系统解决方案,位于德国北部风
    的头像 发表于 09-02 17:35 982次阅读

    如何解决开发机器学习程序时Keil项目只能在调试模式下运行,但无法正常执行的问题?

    如何解决开发机器学习程序时Keil项目只能在调试模式下运行,但无法正常执行的问题
    发表于 08-28 07:28

    合光能场景化治沙方案构建共和荒漠清洁能源矩阵

    8月13-14日,合光能携行业伙伴,实地探访了合中核汇能海南100万千万源网荷储建设项目合光能/中国联通三江源绿电智算融合智能微电网
    的头像 发表于 08-20 16:53 1123次阅读

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    的限制和调控) 本书还有很多前沿技术项目的扩展 比如神经网络识别例程,机器学习图像识别的原理,yolo图像追踪的原理 机器学习训练三大点:
    发表于 04-30 01:05

    机器人相关项目最新进展

    机器人产业发展势头迅猛,产业链企业纷纷投身扩产行列。比如埃夫特拟投入不超过19亿元资金建设机器人超级工厂及全球总部项目,拓普集团、三花智控等累计规划投入上百亿元扩充核心零部件产能,行星滚柱丝杠企业新剑传动也启动了年产
    的头像 发表于 04-17 09:58 861次阅读

    10大机器项目落地苏州

    近日,苏州市具身智能机器人产业生态大会召开,据了解,本次大会共征集了84个具身智能机器人产业项目,总投资超160亿元,其中钧舵机器人、法奥机器
    的头像 发表于 04-11 10:16 1148次阅读

    深控工业网关如何MES项目“啃下硬骨头”,实现老旧设备100%数据接入?

    深控工业网关如何MES项目“啃下硬骨头”,实现老旧设备100%数据接入
    的头像 发表于 03-11 11:20 709次阅读
    深控工业网关如何<b class='flag-5'>让</b>MES<b class='flag-5'>项目</b>“啃下硬骨头”,实现老旧设备<b class='flag-5'>100</b>%数据接入?

    SLAMTEC Aurora:把深度学习“卷”进机器人日常

    在人工智能和机器人技术飞速发展的今天,深度学习与SLAM(同步定位与地图构建)技术的结合,正引领着智能机器人行业迈向新的高度。最近科技圈顶流DeepSeek简直杀疯了!靠着逆的深度
    的头像 发表于 02-19 15:49 723次阅读

    机器学习模型市场前景如何

    当今,随着算法的不断优化、数据量的爆炸式增长以及计算能力的飞速提升,机器学习模型的市场前景愈发广阔。下面,AI部落小编将探讨机器学习模型市场的未来发展。
    的头像 发表于 02-13 09:39 619次阅读

    机器人发布全球首款防爆人形机器人“魁1号”

    近日,机器人公司正式推出了全球首款防爆人形机器人——“魁1号”。这款机器人是工业智能运维领域的一项重要创新,为构建从发现问题到解决问题
    的头像 发表于 01-17 10:18 1601次阅读

    开源项目!能够精确地行走、跳舞和执行复杂动作的机器人—Tillu

    的语音识别系统响应语音指令 为什么打造Tillu? 打造Tillu不仅是一个项目,更是一次学习体验。通过深入探索机器人技术、编程细节以及自定义动作和表情,释放的创造力。无论
    发表于 01-02 17:24

    传统机器学习方法和应用指导

    在上一篇文章中,我们介绍了机器学习的关键概念术语。在本文中,我们会介绍传统机器学习的基础知识和多种算法特征,供各位老师选择。 01 传统机器
    的头像 发表于 12-30 09:16 1980次阅读
    传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 699次阅读

    开源项目!OpenCat—— 一个全能的平价四足机器

    上种出少量庄稼。有一,一团曾为仙界私厨服务的火种从天而降。很快,刀耕火种的农业在人间繁荣起来。” 这个机器人是我学习常规树莓派初学者套件中所有组件的试验场。我从工艺棒开始,然后切换到3D 打印框架以
    发表于 12-16 11:44