0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据获取方法有哪些

工程师 来源:未知 作者:姚远香 2018-12-19 15:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一、公开数据库

常用数据公开网站:

UCI:经典的机器学习、数据挖掘数据集,包含分类、聚类、回归等问题下的多个数据集。很经典也比较古老,但依然活跃在科研学者的视线中。

国家数据:数据来源中华人民共和国国家统计局,包含了我国经济民生等多个方面的数据,并且在月度、季度、年度都有覆盖,全面又权威。

亚马逊:来自亚马逊的跨科学云数据平台,包含化学、生物、经济等多个领域的数据集。

figshare:研究成果共享平台,在这里可以找到来自世界的大牛们的研究成果分享,获取其中的研究数据。

github:一个非常全面的数据获取渠道,包含各个细分领域的数据库资源,自然科学和社会科学的覆盖都很全面,适合做研究和数据分析的人员。

二、利用爬虫可以获得有价值数据

这里给出了一些网站平台,我们可以使用爬虫爬取网站上的数据,某些网站上也给出获取数据的API接口,但需要付费。

1.财经数据,2.网贷数据;3.公司年报;4.创投数据;5.社交平台;6.就业招聘;7.餐饮食品;8.交通旅游;9.电商平台;10.影音数据;11.房屋信息;12.购车租车;13.新媒体数据;14.分类信息。

三、数据交易平台

由于现在数据的需求很大,也催生了很多做数据交易的平台,当然,出去付费购买的数据,在这些平台,也有很多免费的数据可以获取。

优易数据:由国家信息中心发起,拥有国家级信息资源的数据平台,国内领先的数据交易平台。平台有B2B、B2C两种交易模式,包含政务、社会、社交、教育、消费、交通、能源、金融、健康等多个领域的数据资源。

数据堂:专注于互联网综合数据交易,提供数据交易、处理和数据API服务,包含语音识别、医疗健康、交通地理、电子商务、社交网络、图像识别等方面的数据。

四、网络指数

百度指数:指数查询平台,可以根据指数的变化查看某个主题在各个时间段受关注的情况,进行趋势分析、舆情预测有很好的指导作用。除了关注趋势之外,还有需求分析、人群画像等精准分析的工具,对于市场调研来说具有很好的参考意义。同样的另外两个搜索引擎搜狗、360也有类似的产品,都可以作为参考。

阿里指数:国内权威的商品交易分析工具,可以按地域、按行业查看商品搜索和交易数据,基于淘宝、天猫和1688平台的交易数据基本能够看出国内商品交易的概况,对于趋势分析、行业观察意义不小。

友盟指数:友盟在移动互联网应用数据统计和分析具有较为全面的统计和分析,对于研究移动端产品、做市场调研、用户行为分析很有帮助。除了友盟指数,友盟的互联网报告同样是了解互联网趋势的优秀读物。

五、网络采集器

网络采集器是通过软件的形式实现简单快捷地采集网络上分散的内容,具有很好的内容收集作用,而且不需要技术成本,被很多用户作为初级的采集工具。

造数:新一代智能云爬虫。爬虫工具中最快的,比其他同类产品快9倍。拥有千万IP,可以轻松发起无数请求,数据保存在云端,安全方便、简单快捷。

火车采集器:一款专业的互联网数据抓取、处理、分析,挖掘软件,可以灵活迅速地抓取网页上散乱分布的数据信息。

八爪鱼:简单实用的采集器,功能齐全,操作简单,不用写规则。特有的云采集,关机也可以在云服务器上运行采集任务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 大数据
    +关注

    关注

    64

    文章

    9029

    浏览量

    143072
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何通过API获取1688平台商品详情

    获取商品详情,包括API概述、访问方法、请求示例和代码实现。 1. API概述 1688平台提供了一系列开放API接口,允许开发者获取商品信息、订单数据等。其中,
    的头像 发表于 11-11 14:00 311次阅读
    如何通过API<b class='flag-5'>获取</b>1688平台商品详情

    微店API秘籍!轻松获取商品详情数据

    一、前言 微店商品详情API是微店开放平台提供的核心接口之一,支持通过商品ID获取商品的完整信息,包括标题、价格、库存、图片等关键数据。该接口广泛应用于电商系统开发、数据分析和供应链管理场景,相比
    的头像 发表于 11-05 10:30 267次阅读

    教你如何使用API接口获取数据

    方法:常用的HTTP请求方法GET、POST、PUT、DELETE等,不同的请求方法对应不同的操作。 API的URL:
    的头像 发表于 11-03 09:14 342次阅读

    组态大数据平台是什么?什么功能?

    组态大数据平台是融合 组态技术 与 大数据处理能力 的综合性平台,通过图形化、可配置的方式实现数据采集、存储、分析、可视化及远程控制,适用于工业自动化、能源管理、楼宇监控等领域。其核心价值在于降低
    的头像 发表于 10-30 11:29 91次阅读
    组态<b class='flag-5'>大数据</b>平台是什么?<b class='flag-5'>有</b>什么功能?

    御控工业物联网大数据解决方案:排水设备远程监控与大数据统计系统

    御控工业物联网推出排水设备远程监控与大数据统计系统,通过物联网、大数据、云计算等技术构建“感知-传输-分析-决策”闭环管理体系,助力排水行业数字化转型。
    的头像 发表于 09-12 10:04 498次阅读

    磁致式静力水准仪数据获取数据转换

    在工程结构安全监测领域,磁致式静力水准仪以其高精度、高稳定性成为大坝、隧道、边坡、建筑等沉降变形监测的首选设备。下面南京峟思将给大家解析YJL-200型磁致式静力水准仪的数据获取原理与数据转换
    的头像 发表于 09-01 14:31 423次阅读
    磁致式静力水准仪<b class='flag-5'>数据</b><b class='flag-5'>获取</b>及<b class='flag-5'>数据</b>转换

    巧用苏宁易购 API,精准分析苏宁易购家电销售大数据

    收集和处理数据,并应用统计方法实现精准分析。文章结构清晰,确保您能跟随操作,获取可靠结果。 第一步:获取和配置苏宁易购 API 要分析数据
    的头像 发表于 08-29 10:54 517次阅读
    巧用苏宁易购 API,精准分析苏宁易购家电销售<b class='flag-5'>大数据</b>

    在EZ串行的BLE“无响应写入”中, CAN一次通信中接收的最大数据包大小是多少?

    ) 能否告诉我是否有用于接收大数据数据的设置方法? 顺便说一下,在两台Windows笔记本电脑之间执行BLE通信时, CAN 接收512字节的通信没有任何问题。 谢谢
    发表于 07-07 07:33

    智慧环保大数据管理平台什么功能

    在环境污染问题日益严峻的当下,智慧环保大数据管理平台成为环境治理的重要利器。它围绕污水处理、垃圾处理、气体监测三大核心场景,深度融合大数据、物联网、人工智能等技术,构建起全方位、智能化的环境管理
    的头像 发表于 06-06 15:17 455次阅读
    智慧环保<b class='flag-5'>大数据</b>管理平台<b class='flag-5'>有</b>什么功能

    学会这些方法,轻松搞定SMT贴片加工的坐标获取与校正

    一站式PCBA加工厂家今天为大家讲讲SMT贴片加工中如何获取坐标与校正?SMT贴片加工中的坐标获取与校正方法。在SMT贴片加工过程中,精准的坐标获取与校正是确保组件精准放置、提高产品质
    的头像 发表于 05-29 10:27 619次阅读

    更改最大数据包大小时无法识别USB设备如何解决?

    将生产者 EP 端点描述符中的最大数据包大小从 1024 字节更改为 512 字节时,无法识别 USB 设备。 请告知如何解决这个问题。
    发表于 05-20 08:13

    爬虫数据获取实战指南:从入门到高效采集

    爬虫数据获取实战指南:从入门到高效采集     在数字化浪潮中,数据已成为驱动商业增长的核心引擎。无论是市场趋势洞察、竞品动态追踪,还是用户行为分析,爬虫技术都能助你快速捕获目标信息。然而,如何既
    的头像 发表于 03-24 14:08 1258次阅读

    大数据与云计算是干嘛的?

    大数据与云计算是支撑现代数字化技术的两大核心。大数据专注于海量数据的采集、存储、分析与价值挖掘;云计算通过虚拟化资源池提供弹性计算、存储及服务能力。两者结合,共同赋能企业决策、业务创新和效率提升。下面UU云小编将详细剖析
    的头像 发表于 02-20 14:48 1272次阅读

    大数据云计算都需要考什么证书?

    大数据和云计算领域包含多种专业证书,其中大数据领域涵盖数据分析类证书、大数据工程类证书、数据治理类证书。云计算领域领域涵盖云计算技术类证书、
    的头像 发表于 02-19 11:05 1194次阅读

    缓存对大数据处理的影响分析

    缓存对大数据处理的影响显著且重要,主要体现在以下几个方面: 一、提高数据访问速度 在大数据环境中,数据存储通常采用分布式存储系统,数据量庞大
    的头像 发表于 12-18 09:45 1113次阅读