0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种新颖的基于模型的机器学习方式——model based machine learning

nlfO_thejiangme 来源:未知 作者:李倩 2018-10-21 10:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,著名机器学习教材《Pattern Recognition and Machine Learning》的作者Christopher Bishop教授更新了他的机器学习新书:Model-Based Machine Learning。

Christopher Bishop

微软研究院在英国剑桥的实验室主任,爱丁堡大学教授

在这本书中介绍了一种新颖的基于模型的机器学习方式——model based machine learning,将具体问题所面临的假设精确地用模型的方式表达出来,随后利用这一模型来建立适用于特定情况的算法,从而定制化地解决问题。由于算法可以被解耦成模型和推理使得构建的算法的过程可以部分的自动化。

近年来机器学习逐渐成为技术舞台的主角,在各个广泛的领域得到了应用。然而有效的使用机器学习,特别是对于初学者来说不是一件容易的事情。很多同学在利用机器学习解决真实世界的问题时常常会遇到下面一些疑惑:

“机器学习的方法和技术常常让我感到不知所措、要学的东西实在太多啦!”

“到底该用哪个算法呀?为啥这个的结果会比哪个好呢?”

“我面对的问题不满足任何标准算法的要求啊!”

······

还有很多各式各样的疑问充满了机器学习的历程和工程实践中。但这本书为我们带来了一个对机器视觉的全新视角:model-based 机器学习。基于模型的机器学习将会给你不同的视角解答上面的问题,并将帮助你创造出更加有效的算法,当然算法也更加透明。

那么,什么是基于模型的机器学习呢?

在过去的五年里,研究人员们构建了很多机器学习算法。工程师如果希望利用机器学习解决一个问题,要么选择其中的一个或几个来尝试,要们就创造自己的新算法。而在选择算法的时候,工程师们很大程度上都会选择自己熟悉的算法,同时选择也会收到响应软硬件条件的限制,最后选择的算法并不是最适合解决问题的算法。

然而基于模型的方法则为每一个问题寻求定制化的解决方案。与其将所面对的问题转换为适配于标准算法的形式,基于模型的机器学习则会设计出一种精确匹配问题的算法。

基于模型的机器学习,其核心观点在于与问题相关的所有假设都能通过模型的形式来构成。实际上,一个模型也正是由一系列假设所构成的,并用精确的数学形式表达出来。 这些假设包含了问题中变量的个数与类型以及变量之间的相互关系。例如,在本书中将以离奇的谋杀案为例建立一个模型来寻找凶手。这一模型的假设包含了嫌疑人的名单、可以的凶器以及不同嫌疑人使用不同凶器的可能。

这一模型随后被用于解决这一特定的机器学习问题。基于模型的机器学习几乎可以被用于解决任何种类的问题,这种通用的思路意味着你无须学习种类繁多的机器学习算法和技术。

那么为什么模型中的假设起到了如此重要的作用呢?难道它会证明机器学习不能单纯从数据中得到结果么?我们需要明白的是:任何算法都建立在一系列假设之上,尽管很多时候这些假设看起来不那么明显。不同的算法对应着不同的假设,当假设不是那么清晰的时候评判算法表现的唯一方法就是通过比较来获得经验结果。

做过项目的小伙伴对于这项工作一定深有体会,会耗费大量的时间,同时也不精确。如果尝试的算法都不满足要求的话,创造一个更好的算法更是难上加难。

模型还是算法?

让我们进一步分析模型和算法。可以把标准的机器学习算法看成是一个功能模块,输入数据输出结果。算法一定需要假设来将它从数千种不同算法中区分出来,然而在算法中这种假设很多时候是隐含且朦胧的。

从基于模型的观点来看,它包含了我们对特定问题所作的一系列假设。为了从模型中进行预测,我们需要读入数据并计算我们希望得到的变量。这一计算过程通常称为推理,将模型与推理结合起来就可以定义出一个机器学习算法,如下图所示:

按照基于模型的观点,算法是有一特定的模型和推理方法组成的,而模型则又由一系列假设组成,改变假设就可以——甚至在保持推理方法不变的情况下——得到不同的机器学习算法。

虽然推理的方法很多,但这一教科书为了解耦推理方法的影响,选择使用了相同的推理方法来与不同的模型组合。

基于模型的机器学习可应用与任何标准的机器学习任务,包括分类、聚类等,同时还将帮助更好地理解和掌控算法的表现,这些都将在书的后续章节中呈现。这种方式还可以通过改变模型来拓展任务的适用范围和提高精度

此外模型的假设十分清晰,这也为模型的可解释性做出了贡献,既有利于理解性能增强的原因,有利于沟通与交流,同时还可以帮助我们在出现问题的时候更好地解决,也有利于与适应、拓展和结合他人的解决方案。

一个例子

假设我们有一个任务是预测游戏中玩家技能的变化情况,机器学习参考书会告诉你有一个称为卡尔曼滤波的算法可以用于处理这一类问题。为了使用卡尔曼滤波,首先你需要将技能预测问题转换为标准卡尔曼滤波器可以处理的形式。如果运气好的话,将转换后的结果输入到卡尔曼滤波器中就可以得到较好的结果。

但很多情况是,这种现成算法的精度往往满足不了实际要求。那么你该如何去改造算法和软件来获得更好的结果呢?也许你应该成为卡尔曼滤波器方面的专家才能更好地改进算法,并实现更好的软件来解决问题。

然而如果用基于模型的观点来看,我们会从一系列解决方案必须满足的假设开始来定义模型,随后利用这一模型来创造对应的机器学习算法。如果你的假设恰好和卡尔曼滤波中隐含的假设对应的话,你的算法很可能得到精确的卡尔曼滤波器。不过你的模型可能在假设上有所不同,在这个例子中你得到了可能是一个卡尔曼滤波器的变种来解决问题。无论这个算法是否存在是否是一个新的算法,都没关系。你的目标是为问题找到最好的解决方案。

基于这些你就能得到一个改进结果的框架,可以通过检视和改造假设来得到更好的模型,同时也得到了更好的算法。作为一个领域的专家,理解和改变问题的假设比改进机器学习算法容易多了。即使你的目标是理解卡尔曼滤波器,那么从模型的假设出发也是一条更为清晰和简单的路径来学习算法那并理解它是如何运行的。

工具

这本书和其他教材一样也提供了有力的工具供大家使用学习。由于算法被分解成了模型和相应的推理方法,只需要定义模型和选择相应的推理方法即可定义算法。这样研究人员可以聚焦于创造专业问题的模型,而不是纠结于各种推理方法和算法本身。作者在微软研究院工作期间开发了一套称为Infer.NET的工具,通过将假设表示成简洁的代码随后自动化生成复杂的算法代码。作者提供了一系列模型源码和infer模块。

http://research.microsoft.com/infernet

如何阅读?

这本书面向所有想要使用机器学习算法解决现实问题的技术人员,是一本应用导向的书。(但对于想要理解数学原理的读者,作者提供了Deep-dive章节)。书中的每一章都是对于一个案例的解决过程,对于一个真实世界的案例,作者将带领我们从数据获取、知识分析、可视化、构建模型、推理、验证、发现问题和改进系统等方面来学会如何通过基于模型的方式构建出更好的算法来解决问题。

主要分为以下几个章节的内容:

第一章:通过破解一个离奇谋杀案来介绍基于模型机器学习的基本概念;

第二章:基于测试答案来判断个人能力的例子用于介绍如何使用model-based方法;

第三章:model-based方法的真实应用,匹配在线游戏的玩家;

第四章:构建一个模型帮助人们处理杂乱的收件箱;

第五章:构建一个推荐系统,匹配用户和喜欢的电影;

第六章:通过为过敏建模来理解儿童哮喘病;

第七章:治理拥堵;

第八章:其它模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器视觉
    +关注

    关注

    166

    文章

    4829

    浏览量

    126503
  • 模型
    +关注

    关注

    1

    文章

    3818

    浏览量

    52269
  • 机器学习
    +关注

    关注

    67

    文章

    8565

    浏览量

    137226

原文标题:从Model-based独特视角看机器学习

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    一种可跨不同领域的异常检测通用模型UniOD介绍

    本研究提出了一种可跨不同领域、适用于特征维度各异且特征空间异构的数据集的异常检测通用模型
    的头像 发表于 03-18 09:09 546次阅读
    <b class='flag-5'>一种</b>可跨不同领域的异常检测通用<b class='flag-5'>模型</b>UniOD介绍

    机器学习特征工程:分类变量的数值化处理方法

    编码是机器学习流程里最容易被低估的环节之模型没办法直接处理文本形式的分类数据,尺寸(Small/Medium/Large)、颜色(Red/Blue/Green)、城市、支付
    的头像 发表于 02-10 15:58 448次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>特征工程:分类变量的数值化处理方法

    强化学习会让自动驾驶模型学习更快吗?

    一种机器通过“试错”学会决策的办法。与监督学习不同,监督学习是有人提供示范答案,让模型去模仿;而强化
    的头像 发表于 01-31 09:34 831次阅读
    强化<b class='flag-5'>学习</b>会让自动驾驶<b class='flag-5'>模型</b><b class='flag-5'>学习</b>更快吗?

    机器学习和深度学习中需避免的 7 个常见错误与局限性

    无论你是刚入门还是已经从事人工智能模型相关工作段时间,机器学习和深度学习中都存在些我们需要时
    的头像 发表于 01-07 15:37 350次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>中需避免的 7 个常见错误与局限性

    基于ETAS嵌入式AI工具链将机器学习模型部署到量产ECU

    AI在汽车行业的应用日益深化,如何将机器学习领域的先进模型(如虚拟传感器)集成到ECU软件中,已成为业界面临的核心挑战。
    的头像 发表于 12-24 10:55 6384次阅读
    基于ETAS嵌入式AI工具链将<b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>模型</b>部署到量产ECU

    在Ubuntu20.04系统中训练神经网络模型些经验

    本帖欲分享在Ubuntu20.04系统中训练神经网络模型些经验。我们采用jupyter notebook作为开发IDE,以TensorFlow2为训练框架,目标是训练个手写数字识别的神经网络
    发表于 10-22 07:03

    关于Detectron2的GenerateRCNN模型转RKNN问题

    实际模型的输入尺寸和预处理方式调整) # 例如:输入尺寸为(3, 224, 224),均值和标准差用于归化 args = { \'mean_values\': [[123.675, 116.28
    发表于 10-13 17:53

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最
    发表于 07-31 11:38

    【Sipeed MaixCAM Pro开发板试用体验】 + 04 + 机器学习YOLO体验

    机器学习YOLO体验 1.在线训练 Sipeed矽速科技拥有自研搭建的MaixHub平台,可以快速简单的完成yolo训练。 下面我将展示训练集拍摄标注和训练的相关图片 数据集有直接上传和拍摄2
    发表于 07-24 21:35

    使用nncase模拟器验证转换效果出现报错sim.load_model(kmodel) RuntimeError怎么解决?

    (model_outputs.name) # 获取模型的输入信息 model_input = ort_session.get_inputs()[0] # 第个输入(通常只有
    发表于 07-23 07:44

    FPGA在机器学习中的具体应用

    随着机器学习和人工智能技术的迅猛发展,传统的中央处理单元(CPU)和图形处理单元(GPU)已经无法满足高效处理大规模数据和复杂模型的需求。FPGA(现场可编程门阵列)作为一种灵活且高效
    的头像 发表于 07-16 15:34 3095次阅读

    通过NVIDIA Cosmos模型增强机器人学习

    通用机器人的时代已经到来,这得益于机械电子技术和机器人 AI 基础模型的进步。但目前机器人技术的发展仍面临个关键挑战:
    的头像 发表于 07-14 11:49 1275次阅读
    通过NVIDIA Cosmos<b class='flag-5'>模型</b>增强<b class='flag-5'>机器人学习</b>

    一种基于扩散模型的视频生成框架RoboTransfer

    机器人操作领域,模仿学习是推动具身智能发展的关键路径,但高度依赖大规模、高质量的真实演示数据,面临高昂采集成本与效率瓶颈。仿真器虽提供了低成本数据生成方案,但显著的“模拟到现实”(Sim2Real)鸿沟,制约了仿真数据训练策略的泛化能力与落地应用。
    的头像 发表于 07-09 14:02 954次阅读
    <b class='flag-5'>一种</b>基于扩散<b class='flag-5'>模型</b>的视频生成框架RoboTransfer

    思必驰与上海交大联合实验室两篇论文入选ICML 2025

    ICML(International Conference on Machine Learning)是机器学习领域的顶级学术会议之,由国际
    的头像 发表于 06-16 09:23 1611次阅读
    思必驰与上海交大联合实验室两篇论文入选ICML 2025

    边缘计算中的机器学习:基于 Linux 系统的实时推理模型部署与工业集成!

    你好,旅行者!欢迎来到Medium的这角落。在本文中,我们将把机器学习模型(神经网络)部署到边缘设备上,利用从ModbusTCP寄存器
    的头像 发表于 06-11 17:22 1154次阅读
    边缘计算中的<b class='flag-5'>机器</b><b class='flag-5'>学习</b>:基于 Linux 系统的实时推理<b class='flag-5'>模型</b>部署与工业集成!