0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软研究院出品《数据科学基础》,放眼未来40年

DPVg_AI_era 来源:lq 2019-05-25 10:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

微软研究院出品《数据科学基础》,放眼未来40年,PDF下载已开放。

计算机科学作为一门科学始于20世纪60年代。计算机科学的重点是编程语言、编译器、操作系统以及为这些领域提供支撑的数学理论。理论计算机科学课程涵盖有限自动机、正则表达式、无语境式语言和可计算性等。

自上世纪70年代开始,算法研究逐渐成为理论计算机科学的重要组成部分。 算法研究的重要目的是提升计算机的有用性。到了今天,计算机科学的发展正在发生根本性的变化,研究人员注意力和研究重点更多地放在了应用上。

产生这一变化的原因有很多,其中计算和通信技术的融合在这个过程中发挥了重要作用。同时,在自然科学、商业和其他领域,收集和存储数据的能力不断上升,这对数据的理解以及如何在现代环境中进行数据处理提出了更高的要求。网络和社交网络作在日常生活中核心地位的提升,也为理论计算机科学理论的发展提供了新的机遇和挑战。

虽然计算机科学的传统领域仍然非常重要,但未来将有越来越多的研究人员将使用计算机来理解和提取应用程序中出现的大量数据中的可用信息。考虑到这一点,我们写了这本书,希望本书可以涵盖我们期望在未来40年内有用的理论,本书与过去同类数据的一个主要变化是之一对概率、统计和数值方法更加重视。

目录及各章内容简介

本书更早的版本已用于本科和研究生课程教学使用。本科课程所需的背景材料在附录部分给出。包括信息处理,搜索和机器学习等各领域中的现代数据通常以具有大量组件的向量方式表示。向量表示不仅仅是用于存储记录的许多字段的簿记设备。实际上,向量的两个显着方面:几何(长度,点积,正交等)和线性代数(相关性,秩,奇异值等)结果是相关的。

第2章和第3章分别奠定了几何和线性代数的基础。更具体地说,就是当涉及到高维度时,我们对二维或三维空间的直觉可能出乎意料地出现偏差。

第2章阐述了理解这类偏差所需的基础知识。本章以及整本书的重点是多关注知识和思想以及数学基础,而不是特定的应用。

第3章重点介绍奇异值分解(SVD),这是处理矩阵数据的核心工具。本章给出了SVD的数学和算法的原理描述。奇异值分解的应用包括主成分分析,这是目前已经广泛使用的技术,以及对概率密度、离散优化等与统计学结合后的现代应用,对这类应用的描述相对详细。使用确定性方法探索web或大型系统的配置空间之类的大规模结构的成本可能会非常高。随机游走(又称马尔可夫链)经常是效率更高的处理方式。这种游走的固定分布对网络搜索物理系统模拟等应用非常重要。

随机游走的基础数学理论以及与电气网络的连接是第4章的核心内容。计算机科学在过去二十年中的一个巨大进步是,一些过去只能用在特定领域的方法,现在已经可以成功解决来自多个不同领域的问题。机器学习就是一个突出的例子。

第5章描述了机器学习的基础,示例算法都可以用于优化给定的训练样例,并能够理解并预见到这种算法优化能够在新的未知数据上获得良好性能。这其中涉及一些重要的量度,如Vapnik-Chervonenkis维度,以及一些重要的算法,如感知器算法,随机梯度下降,强化学习和深度学习,以及重要的概念,如正则化和过拟合。算法领域传统上假设问题的输入数据会呈现在随机存取存储器中,算法可以重复访问。而对于涉及大量数据的问题,这种方式是不可行的。在这种情况下,采样起着至关重要的作用,而且必须进行动态采样。

第6章主要探讨如何有效地绘制高质量样本,以及如何使用这些样本估计统计和线性代数变量。尽管第5章内容侧重监督学习,但是从标记训练数据中学习,无监督学习或从未标记数据中学习的问题同样重要。无监督学习的中心问题之一是聚类,我们将在第7章中讨论。。

在讨论了一些基本聚类方法(如k-means算法)之后,第7章重点介绍理解这些算法的现代发展过程,以及用于分析不同类型聚类问题的新算法和通用框架。对大型架构(如网络和社交网络)的理解的核心,是构建出能够获取这些架构的基本属性的有效模型。最简单的模型是由Erd¨os和Renyi制定的随机图,我们在第8章进行详细介绍。

第9章重点介绍从数据中寻求合理性的一些线性代数问题,尤其是主题建模和非负矩阵分解。除了讨论众所周知的模型之外,本章还描述了一些关于模型和算法的当前研究动态。

第10章讨论了排名和社会选择以及压缩感知等关于稀疏表示问题。此外还简要讨论了线性规划和半定规划。

微波是用于在一系列应用中表示信号的重要方法,本书第11章讨论微波一些基本数学特性。附录中给出了一系列背景材料。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6722

    浏览量

    107360
  • 数据科学
    +关注

    关注

    0

    文章

    168

    浏览量

    10751

原文标题:微软研究院出品《数据科学基础》,放眼未来40年(PDF下载)

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    广电计量与长沙三大研究院达成战略合作

    11月26-27日,广电计量与长沙北斗产业安全技术研究院集团股份有限公司(简称“长沙北斗研究院”)、长沙量子测量产业技术研究院有限公司(简称“长沙量子研究院”)、湖南大学长沙半导体技术
    的头像 发表于 12-04 14:36 164次阅读

    润和软件与中国科学院广州生物医药与健康研究院达成战略合作

    近日,江苏润和软件股份有限公司(以下简称“润和软件”)与中国科学院广州生物医药与健康研究院正式签署战略合作协议。双方强强联合,将聚焦人类细胞谱系大科学研究设施场景,在国产操作系统、智能物联、大
    的头像 发表于 11-18 17:06 710次阅读
    润和软件与中国<b class='flag-5'>科学</b>院广州生物医药与健康<b class='flag-5'>研究院</b>达成战略合作

    广电计量携手南山研究院打造大健康产业新生态

    10月19日, “南山研究院南海四周系列活动”在广东省南山医药创新研究院(简称“南山研究院”)成功举办。期间,南山研究院与广电计量等多家单
    的头像 发表于 10-23 17:42 904次阅读

    京东方首个材料研究院项目开工

    20258月20日,BOE(京东方)材料研究院项目开工仪式在山东省烟台市黄渤海新区八角片区成功举办。
    的头像 发表于 08-22 09:12 1052次阅读

    今日看点丨亚马逊上海AI研究院解散;索尼拟出售以色列芯片部门

          1、 亚马逊上海AI研究院解散! 据报道,AWS亚马逊云科技上海AI研究院的首席应用科学家王敏捷发朋友圈称,他们收到通知,AWS亚马逊云科技上海AI研究院(也是AWS最后一
    发表于 07-24 09:42 1351次阅读
    今日看点丨亚马逊上海AI<b class='flag-5'>研究院</b>解散;索尼拟出售以色列芯片部门

    合肥综合性国家科学中心能源研究院与宏微科技达成合作

    为深化产学研协同创新,推动科技创新和产业升级,近日,合肥综合性国家科学中心能源研究院与江苏宏微科技股份有限公司在智慧电力中心隆重举行“功率器件可靠性评测方法和寿命预测联合实验室”签约揭牌仪式。江苏宏
    的头像 发表于 06-14 14:22 823次阅读

    导远科技与清华大学无锡应用技术研究院达成合作

    近日,导远科技与清华大学无锡应用技术研究院(以下简称:研究院)达成合作。导远科技将提供高精度定位产品及解决方案,以支持研究院在L4级自动驾驶和人形机器人领域的技术研发及转化落地。
    的头像 发表于 06-12 16:34 815次阅读

    时钟系统推荐,时钟系统哪家好?赛思时钟系统助力中国气象科学研究院构建智慧气象网络

    时钟系统推荐,时钟系统哪家好?赛思时钟系统助力中国气象科学研究院构建智慧气象网络
    的头像 发表于 05-20 09:32 705次阅读
    时钟系统推荐,时钟系统哪家好?赛思时钟系统助力中国气象<b class='flag-5'>科学研究院</b>构建智慧气象网络

    国民技术与中国科学院深圳先进技术研究院达成战略合作

    近日,国民技术股份有限公司(简称“国民技术”)与中国科学院深圳先进技术研究院(简称“深圳先进”)电驱系统专家团队在深圳签署合作意向协议,双方将在国家重点研发项目支持下,就智能机器人及关节伺服驱
    的头像 发表于 04-25 15:45 1007次阅读

    安徽省水利科学研究院携手中科曙光完成DeepSeek大模型部署

    近日,安徽省(水利部淮河水利委员会)水利科学研究院携手中科曙光,成功完成国产大模型DeepSeek、BGE-M3嵌入模型及重排模型的本地化部署与测试,并顺利接入梅山水库运行管理矩阵平台,进行水利业务应用场景初探,取得了阶段性成果。
    的头像 发表于 03-25 11:36 870次阅读

    鲲云科技与中国工业互联网研究院成立AI+安全生产联合实验室

    在 2025 1 月 14 日举行的智算创新研究院开业盛典上,鲲云科技与中国工业互联网研究院(以下简称“工联”)正式宣布联合成立“AI+安全生产联合实验室”,工联
    的头像 发表于 01-14 18:01 1558次阅读

    加速科技荣获“浙江省企业研究院”认定

    近日,浙江省经济和信息化厅公布“2024认定(备案)省级企业研发机构名单”。经过多轮严格评审和公示,加速科技荣获“省企业研究院”认定。这是加速科技继获国家级专精特新“小巨人”企业认定荣誉后的又一
    的头像 发表于 01-07 16:32 646次阅读
    加速科技荣获“浙江省企业<b class='flag-5'>研究院</b>”认定

    浪潮信息与智源研究院携手共建大模型多元算力生态

    近日,浪潮信息与北京智源人工智能研究院正式签署战略合作协议,双方将紧密合作,共同构建大模型多元算力开源创新生态。 此次合作旨在提升大模型创新研发的算力效率,降低大模型应用开发的算力门槛,推动
    的头像 发表于 12-31 11:49 876次阅读

    清新电源研究院荣获深圳市5A级社会组织

    12月18日,2024度市级社会组织等级评估授牌仪式在深圳市福田区深科技城顺利举行。深圳市清新电源研究院作为2024度深圳市5A级社会组织接受授牌。深圳市清新电源研究院党支部书记、
    的头像 发表于 12-18 19:37 1162次阅读
    清新电源<b class='flag-5'>研究院</b>荣获深圳市5A级社会组织

    国网安徽省电力有限公司电力科学研究院选购我司差示扫描量热仪及拉力试验机

    在科技助力电力行业发展的浪潮中,和晟仪器凭借卓越的产品品质成功赢得了国网安徽省电力有限公司电力科学研究院的青睐。此次,电力科学研究院选购了我司的差示扫描量热仪及HS-3004B-S拉力试验机,开启了
    的头像 发表于 12-18 09:19 948次阅读
    国网安徽省电力有限公司电力<b class='flag-5'>科学研究院</b>选购我司差示扫描量热仪及拉力试验机