Google产品分析Zlatan Kremonic分享了参加Kaggle竞赛的经验

论智 2018-08-10 09:02 次阅读

编者按:Google产品分析Zlatan Kremonic分享了参加Kaggle竞赛的经验。

问题

Kaggle房价竞赛要求参赛者预测2006年至2010年美国爱荷华州埃姆斯市的房价。数据集中包含79个变量,包括许多房屋属性。你可以在Kaggle网站上了解更多细节:https://www.kaggle.com/c/house-prices-advanced-regression-techniques

方法

由于我们的目标变量是连续值(售价),因此这是一个典型的回归问题,让人联想起波斯顿房价数据集。评估标准为预测和实际售价的接近程度(预测值的对数与观测到的售价的对数的均方根误差)。

数据集中包括大量变量,其中许多是类别变量,因此特征选取是这一问题的关键部分。特征选取的两种常用方法:

直接使用scikit-learn中的SelectKBest方法。

LASSO回归。

我在分析中尝试了这两种方法,发现LASSO回归的结果要好一些。

另外,我们将使用XGBoost,并在结果中融合LASSO的输出,以提升模型的精确度。我们的最终结果不错,位于排行榜的前10%(撰写本文时)。

探索性数据分析

因为变量很多,为了节约篇幅,我不会详细演示所有探索性数据分析(我在文末列出了GitHub仓库的链接,如果你对探索性数据分析的细节感兴趣,可以查看其中的EDA.ipynb)。相反,我将直接给出我的主要观察,这些观察给特征工程提供了信息。

我们有大量的类别属性,需要进行独热编码。

一些数值列有null值,需要填充。

许多数值列的分布比较扭曲,需要处理。

如前所述,为了节约篇幅,这里仅仅给出导入库、加载数据的代码,不包括探索性数据分析部分的代码。

import os

import pandas as pd

import numpy as np

from scipy.stats import skew

from sklearn.model_selection importGridSearchCV

from sklearn.linear_model importLasso

from sklearn.metrics import mean_squared_error

from xgboost.sklearn importXGBClassifier

import xgboost as xgb

import matplotlib.pyplot as plt

%matplotlib inline

train = pd.read_csv(os.path.join('data', 'train.csv'))

test = pd.read_csv(os.path.join('data', 'test.csv'))

y = train.iloc[:, -1]

train = train.iloc[:, 1:-1]

test = test.iloc[:, 1:]

submission = test.iloc[:, 0]

特征工程

首先,我们将MSSubClass变量(表示建筑分类编码)从数值转为字符串,因为这些编码只是无序的类别。

def mssubclass(train, test, cols=['MSSubClass']):

for i in (train, test):

for z in cols:

i[z] = i[z].apply(lambda x: str(x))

return train, test

接着,我们将对所有数值特征取对数,包括因变量。由于数值特征包含很多零值,我们使用log1p,在取对数前先加一。

def log(train, test, y):

numeric_feats = train.dtypes[train.dtypes != "object"].index

for i in (train, test):

i[numeric_feats] = np.log1p(i[numeric_feats])

y = np.log1p(y)

return train, test, y

我们将用每列的均值填充null值:

def impute_mean(train, test):

for i in (train, test):

for s in [k for k in i.dtypes[i.dtypes != "object"].index if sum(pd.isnull(i[k])>0)]:

i[s] = i[s].fillna(i[s].mean())

return train, test

独热编码时,同样需要填充null值:

def dummies(train, test):

columns = [i for i in train.columns if type(train[i].iloc[1]) == str or type(train[i].iloc[1]) == float]

for column in columns:

train[column].fillna('NULL', inplace = True)

good_cols = [column+'_'+i for i in train[column].unique()[1:] if i in test[column].unique()]

train = pd.concat((train, pd.get_dummies(train[column], prefix = column)[good_cols]), axis = 1)

test = pd.concat((test, pd.get_dummies(test[column], prefix = column)[good_cols]), axis = 1)

del train[column]

del test[column]

return train, test

整个特征工程流程:

train, test = mssubclass(train, test)

train, test, y = log(train, test, y)

train, test = lotfrontage(train, test)

train, test = garageyrblt(train, test)

train, test = impute_mean(train, test)

train, test = dummies(train, test)

LASSO回归

LASSO回归同时起到了正则化和特征选取的作用,可以改善模型的预测效果。就我们的情况而言,LASSO回归是完美的算法,因为它有助于降低特征数并缓解过拟合。

LASSO回归中需要调节的超参数主要是正则化因子alpha。我们使用GridSearchCV(网格搜索交叉验证)寻找alpha的最优值。

alpha_ridge = [1e-5, 1e-4, 1e-3, 1e-2, 1, 5, 10, 20]

coeffs = {}

for alpha in alpha_ridge:

r = Lasso(alpha=alpha, normalize=True, max_iter=1000000)

r = r.fit(train, y)

grid_search = GridSearchCV(Lasso(alpha=alpha, normalize=True), scoring='neg_mean_squared_error',

param_grid={'alpha': alpha_ridge}, cv=10, n_jobs=-1)

grid_search.fit(train, y)

最终我们得到alpha的最佳值0.0001。为了更直观地理解alpha的影响,我们可以画出所有alpha值的均方根误差:

alpha = alpha_ridge

rmse = list(np.sqrt(-grid_search.cv_results_['mean_test_score']))

plt.figure(figsize=(6,5))

lasso_cv = pd.Series(rmse, index = alpha)

lasso_cv.plot(title = "Validation - LASSO", logx=True)

plt.xlabel("alpha")

plt.ylabel("rmse")

现在用模型拟合训练数据:

lasso = Lasso(alpha=.0001, normalize=True, max_iter=1e6)

lasso = lasso.fit(train, y)

我们的模型有多少列?

coef = pd.Series(lasso.coef_, index = train.columns)

print("Lasso选中了" + str(sum(coef != 0)) + "个变量,并移除了其他" +  str(sum(coef == 0)) + "个变量")

Lasso选中了103个变量,并移除了其他142个变量

此外,我们可以看到,根据我们的模型,房龄、面积、房屋状况是最重要的变量。这很符合直觉——在创建模型时检查模型是否符合常理总是不错的。

imp_coef = pd.concat([coef.sort_values().head(10),

coef.sort_values().tail(10)])

plt.rcParams['figure.figsize'] = (5.0, 5.0)

imp_coef.plot(kind = "barh")

plt.title("Coefficients in the Lasso Model")

用LASSO模型预测测试数据,我们得到的均方根误差为0.1209,这已经足以在排行榜上取得前25%的名次了。

XGBoost模型

由于XGBoost在数据科学竞赛中的强力表现,从2016年起,这一算法变得家喻户晓了。这一算法的挑战之一是处理大数据集时,调整超参数耗时很久。然而,因为我们的数据集包含不到1500项观测,所以我觉得这是一个尝试XGBoost的好机会。为了节约篇幅,我这里不会披露超参数调整的细节。我主要使用的方法是每次交叉验证一到两个参数,以免给我的机器太大的负担,同时在调整会话的间隔重新计算n_estimators的最优值。

下面是我实现的最终模型。它的得分是0.12278,事实上这比LASSO模型要差。

regr = xgb.XGBRegressor(

colsample_bytree=0.3,

gamma=0.0,

learning_rate=0.01,

max_depth=4,

min_child_weight=1.5,

n_estimators=1668,                                                                  

reg_alpha=1,

reg_lambda=0.6,

subsample=0.2,

seed=42,

silent=1)

regr.fit(train, y)

y_pred_xgb = regr.predict(test)

融合模型结果

最后我们需要组合两个模型的结果。我对两个模型的预测取了加权平均。最终的得分是0.11765,明显比两个模型单独预测的结果要好。这确认了集成学习的首要原则,假定误差率互不相关,集成的误差率低于单个模型。

predictions = np.expm1(.6*lasso_pred + .4*y_pred_xgb)

之前在特征工程时使用了log1p,所以现在用expm1还原原数值。注意这里给LASSO更大的权重(0.6),并不是因为在测试数据上LASSO的表现优于XGBoost,而是因为在训练数据上LASSO的表现优于XGBoost(因为建模的时候不能“偷看”测试数据)。

结语

这项竞赛是一个练习标准回归技术的好机会。我只进行了最少的特征工程就取得了前10%的排名。

除了上面的模型,我也尝试了SelectKBest(搭配Pipeline和网格搜索),将列数缩减至138,并得到了0.13215的分数。然而,将其与其他模型融合时,效果不佳。后来我又试了随机森林回归,得分是0.14377,这不算差,但要在我们的集成中加入这个模型,这个分数显然还不够高。

原文标题:LASSO回归与XGBoost:融合模型预测房价

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

WearOS即将迎来新版本 着重优化了手表续航

Google旗下的智能手表操作系统Wear OS即将迎来版本“H”,未来几个月内就会发布,并进行一系....

发表于 11-18 09:56 11次 阅读
WearOS即将迎来新版本 着重优化了手表续航

The VOID宣布《无敌破坏王》VR体验将于11月21日正式推出

第一代Google Glass企业版,其中包含一个扬声器,双频802.11a / b / g / n....

的头像 VR陀螺 发表于 11-18 09:27 23次 阅读
The VOID宣布《无敌破坏王》VR体验将于11月21日正式推出

Imagination宣布正在与剑桥大学合作,开发VR可视化平台

通过实时渲染来自多维数据集的数百万个数据点,《Lume》从而令复杂且密集的数据集变得更易获取。用户可....

的头像 AR联盟 发表于 11-18 09:19 16次 阅读
Imagination宣布正在与剑桥大学合作,开发VR可视化平台

Facebook出品的时序分析库Prophet

snavie,类似naive,不过考虑了季节性因素。例如,在周季节性数据的情形下,用上周一的数据预测....

的头像 论智 发表于 11-18 09:03 51次 阅读
Facebook出品的时序分析库Prophet

下一代HTTP底层协议将以QUIC技术为核心

据据中国台湾地区消息报道,国际互联网工程任务组(Internet Engineering Task ....

发表于 11-18 07:49 4次 阅读
下一代HTTP底层协议将以QUIC技术为核心

GDPR有什么作用

早在它生效之前,欧盟的一般数据保护条例(GDPR)就在全球市场营销人员中引发了恐慌。GDPR旨在保护....

的头像 CTI论坛 发表于 11-17 09:58 135次 阅读
GDPR有什么作用

Alphabet终止了人型机器人开发公司Schaft的研发计划

据外媒报道,Google母公司Alphabet最近终止了人型机器人开发公司Schaft的研发计划,A....

发表于 11-17 09:26 48次 阅读
Alphabet终止了人型机器人开发公司Schaft的研发计划

NLP-Progress库NLP的最新数据集、论文和代码

方向是自然语言处理的同学们有福啦,为了跟踪自然语言处理(NLP)的进展,有大量仁人志士在 Githu....

的头像 中国人工智能学会 发表于 11-17 09:21 83次 阅读
NLP-Progress库NLP的最新数据集、论文和代码

如何使用语义感知来进行图像美学质量评估的方法

当前图像美学质量评估的研究主要基于图像的视觉内容来给出评价结果,忽视了美感是人的认知活动的事实,在评....

发表于 11-16 15:37 13次 阅读
如何使用语义感知来进行图像美学质量评估的方法

基于增强特征判别性的典型相关分析和分类集成的助学金预测方法

 针对高校资助管理办法效率低下、工作量大等问题,提出一种增强特征判别性的典型相关分析( EN-DCC....

发表于 11-16 11:16 12次 阅读
基于增强特征判别性的典型相关分析和分类集成的助学金预测方法

谷歌的研究人员提出了一种监督学习方法来实现语音特征的聚类

那么它具体是怎么工作的呢?假设我们有四个人同时对着这个AI说话(这是个例子,模型其实可以处理更多的人....

的头像 将门创投 发表于 11-16 11:13 305次 阅读
谷歌的研究人员提出了一种监督学习方法来实现语音特征的聚类

如何使用情感分析和深度学习实现宏观经济预测方法

现代市场经济快速发展的同时也伴随着较高的风险,通过对地区投资情况提前预测,能够提前发现投资风险,为国....

发表于 11-16 10:41 21次 阅读
如何使用情感分析和深度学习实现宏观经济预测方法

如何约束半监督分类方法的详细资料概述

不同类别的祥本严 重重疊在分类边界时,由于聚类假设不能很好地反映出数据的真实分布,基于聚类假设的半监....

发表于 11-15 11:32 13次 阅读
如何约束半监督分类方法的详细资料概述

Batch的大小、灾难性遗忘将如何影响学习速率

所以,我们该如何在限制训练速度的情况下,还可以提高batch size,同时不用维持曲率效应带来的不....

的头像 论智 发表于 11-14 08:58 130次 阅读
Batch的大小、灾难性遗忘将如何影响学习速率

深入浅出地介绍了一个有趣的概念:等待时间悖论

当乘客在随机时间点到达公交站时,他们经历的等待时间的概率既会受p(T)影响,又会受T本身影响:汽车到....

的头像 论智 发表于 11-13 09:01 620次 阅读
深入浅出地介绍了一个有趣的概念:等待时间悖论

Neurala与中国开发者社区CSDN联合宣布,正式成为战略合作伙伴

Neurala 是一家美国软件公司,所开发的深度学习软件 Neurala Brain 可以让机器人、....

的头像 电子发烧友网工程师 发表于 11-12 10:48 254次 阅读
Neurala与中国开发者社区CSDN联合宣布,正式成为战略合作伙伴

Google Home Hub智能音箱搭载触摸屏与智能助手

谷歌硬件发布会可以说是一场全球谷歌粉丝的狂欢节,用户期待已久的Pixel 3/3 XL如约发布,Go....

发表于 11-11 12:04 168次 阅读
Google Home Hub智能音箱搭载触摸屏与智能助手

如何把握设计与功能之间的平衡,创建出简洁直观的可视化图像?

这个例子告诉我们,在可视化数据之前,多问问自己可视化的目的会帮我们更好地选择图表。可视化图像不应该只....

的头像 论智 发表于 11-10 10:03 185次 阅读
如何把握设计与功能之间的平衡,创建出简洁直观的可视化图像?

Abhay Pawar总结的进入Kaggle2%的技巧

如果因变量(目标变量)是二元的,所有的点要么分布在0,要么分布在1,散点图是无法工作的。对于连续的目....

的头像 论智 发表于 11-10 09:31 300次 阅读
Abhay Pawar总结的进入Kaggle2%的技巧

GoogleHomeMini充电器拆解 做工及用料如何

2017年10月5日,谷歌发布了两款人工智能家居产品,分别是Google Home Mini和Goo....

的头像 39度创意研究所 发表于 11-09 14:35 1019次 阅读
GoogleHomeMini充电器拆解 做工及用料如何

介绍关键技术名词和Chrome的多进程架构

顾名思义,它最初是为处理图形而诞生的。这就是为什么在图形处理中,当我们说到 “使用 GPU” 或者 ....

的头像 将门创投 发表于 11-08 10:24 285次 阅读
介绍关键技术名词和Chrome的多进程架构

Ariza部署了一个WebApp利用图像分析技术诊断患者是否患有疟疾

在诸多疟疾诊断方法中,镜检法是许多医院的支柱,它的具体流程是先把患者血液涂抹在载玻片上,用造影剂染色....

的头像 论智 发表于 11-08 09:11 256次 阅读
Ariza部署了一个WebApp利用图像分析技术诊断患者是否患有疟疾

如何用Fashion-MNIST数据集搭建一个用于辨认时尚单品的机器学习模型

去年八月份,德国研究机构Zalando Research在GitHub上推出了一个全新的数据集,其中....

的头像 论智 发表于 11-08 08:59 307次 阅读
如何用Fashion-MNIST数据集搭建一个用于辨认时尚单品的机器学习模型

硅谷的“背叛文化”游离于Google和Uber之间的莱万多斯基

当年说服Google的领导层在自动驾驶汽车上投资了上百万美元的人也正是莱万多斯基和他的同事们。四年前....

的头像 电子发烧友网工程师 发表于 11-07 11:00 393次 阅读
硅谷的“背叛文化”游离于Google和Uber之间的莱万多斯基

分享多年来我眼中的Google Cloud,同时表达我在未来对它的期望

首先,作为当今最重要的领域,机器学习主要由谷歌领导,谷歌至少领先其他竞争对手几年。当然我并不是贬低其....

的头像 嵌入式资讯精选 发表于 11-06 17:11 901次 阅读
分享多年来我眼中的Google Cloud,同时表达我在未来对它的期望

一种从空中角度测量车辆数据的新方法

High D数据集记录在德国科隆附近的六个不同地点。 位置因车道数量和速度限制而异。 记录的数据中包....

的头像 将门创投 发表于 11-06 10:09 449次 阅读
一种从空中角度测量车辆数据的新方法

未进得了中国的搜索巨人Google,在自己的地盘上日子也不好过

相比国内,员工的罢工在国外的科技公司更为常见,且罢工也被视为是紧张局势缓和的结果。不过就今年而言,G....

的头像 电子发烧友网工程师 发表于 11-06 09:22 514次 阅读
未进得了中国的搜索巨人Google,在自己的地盘上日子也不好过

AI Challenger 2018比赛决赛在即!总奖金300万

随着人们生活水平的提高、生活方式的丰富,传统天气预报方式也正在遇到越来越大的挑战。AI Challe....

的头像 电子发烧友网工程师 发表于 11-06 09:11 378次 阅读
AI Challenger 2018比赛决赛在即!总奖金300万

图像分类问题为例,带你领略fastai这一高层抽象框架惊人的简洁性

现在我们回过头来,再看看from_folder这个方法,它根据路径参数获取数据集目录,然后根据目录结....

的头像 论智 发表于 11-05 15:36 307次 阅读
图像分类问题为例,带你领略fastai这一高层抽象框架惊人的简洁性

Sonos智能音箱将于明年支持Google智能助理

Sonos在一份新闻稿中表示需要“更多时间才能获得正确的体验”,并表示正在确定2019年的具体日期。....

发表于 11-02 17:20 290次 阅读
Sonos智能音箱将于明年支持Google智能助理

光模块产业链全面分析

光通信是信息网络的核心技术。光模块实现光电转换功能,产业链包括芯片(电/光)、器件(无源/有源)、模....

的头像 物联网资本论 发表于 11-02 11:03 1015次 阅读
光模块产业链全面分析

从生产层面强调了深度学习项目开发中需要更加重视数据集的构建

这看起来显而易见,但你首先最应该做的是随机浏览你将要使用的训练数据。将一些文件复制到本地计算机上,然....

的头像 人工智能 发表于 11-02 10:41 397次 阅读
从生产层面强调了深度学习项目开发中需要更加重视数据集的构建

图像分类比赛中,你可以用如下方案举一反三

在大多数机器学习任务中,我们首先要做的(也是最重要的任务)就是在使用算法之前分析数据集。这一步骤之所....

的头像 人工智能 发表于 11-02 10:36 276次 阅读
图像分类比赛中,你可以用如下方案举一反三

安卓将来有可能面向中国收费

10月29日,安卓系统正式向欧盟区域收取授权费。有媒体认为这只是开始,安卓将来还有可能面向中国收费。

的头像 MCA手机联盟 发表于 11-01 16:56 398次 阅读
安卓将来有可能面向中国收费

GooglePixelStand无线充电底座测试 支持iPhoneXS的5W普通无线充电

在前不久刚刚结束的Google新品发布会上,谷歌官方发布了两款旗舰新机Pixel 3和Pixel 3....

的头像 39度创意研究所 发表于 11-01 15:54 458次 阅读
GooglePixelStand无线充电底座测试 支持iPhoneXS的5W普通无线充电

用《圣经》做训练数据集,打造语言风格转换工具

该研究论文已发表在Royal Society Open Science 期刊上。文中表示,这不是首个....

的头像 新智元 发表于 11-01 09:24 396次 阅读
用《圣经》做训练数据集,打造语言风格转换工具

三种数据提供有歧义的结果的情况,因果关系如何帮助澄清数据的解读

尽管看起来是同一件事,两种说法,这两种回归会给出不同的最佳拟合直线。这两条线不可能都是最佳的,那么哪....

的头像 论智 发表于 10-31 09:07 773次 阅读
三种数据提供有歧义的结果的情况,因果关系如何帮助澄清数据的解读

机器学习开源项目排名前10的项目

Ngx 是一个基于神经网络的视觉生成器和混合器,能够利用神经网络进行 VJing 过程。它将 pix....

的头像 电子发烧友网工程师 发表于 10-30 09:38 576次 阅读
机器学习开源项目排名前10的项目

科学家真正信任人工智能之前,首先需要去理解机器是如何学习的

科学家正面临一个复杂的问题,就是算法公平到底意味着什么?像Vaithianathan这样正在与公共组....

的头像 全球技术地图 发表于 10-29 14:59 1506次 阅读
科学家真正信任人工智能之前,首先需要去理解机器是如何学习的

Google公司的面试题和详细的分解过程

作为一名Google的工程师和面试官,今天是我第二次发文分享科技公司面试建议了。这里先声明:本文仅代....

的头像 悟空智能科技 发表于 10-28 10:33 444次 阅读
Google公司的面试题和详细的分解过程

Google最强模型BERT出炉

在不少人看来,BERT 对自然语言处理的研究具有里程碑式的意义。

的头像 电子发烧友网工程师 发表于 10-27 10:37 1105次 阅读
Google最强模型BERT出炉

成功的团队都有这五大特征

小群聚、工作小组、委员会、自治体,无论它叫什么,身处其中,你都是 Google 的一份子,并且你无论....

的头像 工程师人生 发表于 10-26 14:32 291次 阅读
成功的团队都有这五大特征

如何基于Plotly和ipywidgets在Jupyter Notebook中创建交互可视化内容

我的Fitbit睡眠数据是一个需要可视化不同统计量(睡眠效率、睡眠得分、初次入睡时间等)、不同尺度(....

的头像 论智 发表于 10-26 09:26 541次 阅读
如何基于Plotly和ipywidgets在Jupyter Notebook中创建交互可视化内容

Google AI最新应用,成功辨识肿瘤突变影像

一直以来,许多肿瘤的分类诊断一定要仰赖专业病理学家在显微镜下耗时仔细观察来完成,而今日,一项结合训练机器学习的重大突破,...

发表于 10-24 21:24 121次 阅读
Google AI最新应用,成功辨识肿瘤突变影像

App Store的广告收入将超过5亿美元,到2020年将达到20亿美元

Sensor Tower 的报告显示,App Store 上 65% 的下载量都来自搜索,搜索下载是....

的头像 PCB开门网 发表于 10-24 15:40 721次 阅读
App Store的广告收入将超过5亿美元,到2020年将达到20亿美元

最实用也最容易被遗忘的Linux 命令行使用技巧

在写这篇文章之前,我特地搜索了一下。在 Google 上,很多人都在问如何实现命令重复执行直至成功这....

的头像 马哥Linux运维 发表于 10-23 16:58 777次 阅读
最实用也最容易被遗忘的Linux 命令行使用技巧

腾讯AI Lab宣布正式开源“Tencent ML-Images”项目

以深度神经网络为典型代表的深度学习技术已经在很多领域充分展现出其优异的能力,尤其是计算机视觉领域,包....

的头像 掌上科技频道 发表于 10-23 16:36 811次 阅读
腾讯AI Lab宣布正式开源“Tencent ML-Images”项目

Google被罚巨款后,Android免费模式即将终结

这意味着 Android 免费模式真的要寿正终寝。据外媒 The Verge 最新的报道,一份收费清....

的头像 电子发烧友网工程师 发表于 10-23 10:06 697次 阅读
Google被罚巨款后,Android免费模式即将终结

朴素贝叶斯分类算法并实现中文数据集的舆情分析案例

先验概率是由以往的数据分析得到的概率,泛指一类事物发生的概率,根据历史资料或主观判断未经证实所确定的....

的头像 电子发烧友网工程师 发表于 10-23 09:27 357次 阅读
朴素贝叶斯分类算法并实现中文数据集的舆情分析案例

数据集,网络架构和剪枝方法

过度参数化(over-parameterization)是深度神经网络的一个普遍属性,这会导致高计算....

的头像 新智元 发表于 10-23 09:15 475次 阅读
数据集,网络架构和剪枝方法

Google发布精确诊断转移性乳腺癌的医疗AI

一种能使用癌症检测算法,在转移性乳腺癌的检测中实现了99%的识别率!

的头像 机器人大讲堂 发表于 10-22 10:31 464次 阅读
Google发布精确诊断转移性乳腺癌的医疗AI

谷歌的Dataset Search开放至今,为什么还搜不到我的数据集?

本月早些时候,谷歌推出了数据集搜索专用引擎 Dataset Search,这是一个建立在元数据上的搜索引擎,可以对网络上数千个存储库...

发表于 09-28 16:22 264次 阅读
谷歌的Dataset Search开放至今,为什么还搜不到我的数据集?

基于Vuforia 5.0.5与Google Cardboard实现AR+VR的效果

AR/VR技术交流群 129340649,欢迎加入~ 一、平台准备: Cardboard Unity SDK version 0.5.0 Vufor...

发表于 09-20 16:42 276次 阅读
基于Vuforia 5.0.5与Google Cardboard实现AR+VR的效果

AR的昨天、今天和明天

ARVR技术交流群:129340649 欢迎加入! 前言 随着CES的召开和微软的HoloLens的亮相,增强...

发表于 09-19 18:14 230次 阅读
AR的昨天、今天和明天

计算机视觉/深度学习领域常用数据集汇总

深度学习领域的“Hello World!”,入门必备!MNIST是一个手写数字数据库,它有60000个训练样本集和10000个测试样本集,...

发表于 08-29 10:36 403次 阅读
计算机视觉/深度学习领域常用数据集汇总

融资大事件 | 寒武纪完成数亿美元B轮融资;Google 向京东投资 5.5 亿美元

全球最大的在线少儿英语品牌VIPKID今日确认完成5亿美金的D+轮融资、寒武纪也宣布完成数亿美元的B轮融资、这周投资界到...

发表于 06-25 11:32 358次 阅读
融资大事件 | 寒武纪完成数亿美元B轮融资;Google 向京东投资 5.5 亿美元