【四旋翼飞行器】76小时吃透四轴算法!史上最强软硬结合实战项目,👉戳此立抢👈

Airbnb使用的动态定价模型

论智 2018-10-10 09:16 次阅读

在KDD 2018上,Airbnb的研究人员们发表了一篇名为Customized Regression Model for Airbnb Dynamic Pricing的论文。这篇文章描述了Airbnb使用的动态定价模型,以下是论智对文章的大致介绍。

价格优化的目的是帮助房东制定最优价格。传统定价策略是为大量相同的产品定价,但在Airbnb没有相同的产品,因为平台所提供的房屋都有独一无二的价值和体验感受。这样的独特性就很难估计传统定价策略所需要的需求曲线。

“研究人员所提出的策略模型在Airbnb上应用了一年多的时间。第一代模型刚一使用,网站的预定量就得到大幅提升,采用了这一方法的房东们受益也随之增长。经过多次迭代后,策略模型将进一步改善定价的质量。”

想给Airbnb上所有不同的房间定价是非常有挑战性的,即使我们可以收集同一区域中的同样大小的房间,但是其他因素(例如评分星级)也会影响价格。除此之外,由于不同的季节和区域因素,需求也是随时间波动的。同样,预定的早晚也是影响价格的因素,预定的越晚,房间预订成功的机会就越小,这也会导致需求函数的变化。

为了让房东的受益最大化,Airbnb提出了“Price Tips”和“Smart Pricing”工具。Price Tips可以提供价格日历,根据房东目前的定价,显示该房间每天被预定出去的概率是多少。点击某一天,页面中会显示Airbnb推荐的价格以及其他信息。

Price Tips截图

在Smart Pricing工具中,房东可以设置一个最低值和最高值,之后Airbnb会自动生成不同日期的新价格。

Smart Pricing截图

在理想情况下,我们会估计一个需求曲线F(P), 在给定价格P的情况下估计房间的需求量,之后选择P的值,使P×F(P)的值最大。之前我们已经提到过影响价格的因素有很多,而且,由于Airbnb并不是直接控制房间价格的,而是只能给出“建议价格”,所以想要直接拿不同的定价策略做实验来观察市场反应也是不容易的。

Airbnb最终采用的定价系统有三个要素:

一个二元分类模型,预测某一晚某房间预定的概率。

这些预测之后会被输入到一个定价策略模型中,会对空闲日期提出建议价格。

策略模型会加入其他个性化逻辑,以符合房东的目标、结合特殊事件等等。

定价系统概览

这篇论文的主要目的是定价策略模型,但是我们首先要简单了解下预定概率模型的细节。

预定概率模型

想知道某件房间会有多大概率被预定,这里是用的是Gradient Boosting Machines(GBM),除此之外还有一个针对各个市场训练的模型。对于训练数据的采样率在根据各市场密度的不同有所差别:

“房屋密度高的市场能从地理位置这一因素中获益最多,这里的采样率会高于全局常量的采样率。”

模型在做决策时考虑了三个方面:

页面所列出的各项特征,例如每晚的价格、房间类型、可住人数、房间数量、洗手间数量、房间设施、地理位置、评价、历史入住率、能否立即预定等等。

时间因素,例如季节、日期、可入住时间等等。

供给因素,例如周围是否有相似房源、评价、搜索率等等。

模型在不同价格点预测预定概率,可能会得到一个需求曲线。但是,由于上述的多重影响因素,想得到精确的需求曲线进行价格设置是非常困难的。

“我们试着基于估计的需求曲线,直接应用利润最大化策略,但是在线的A/B测试结果显示这些方法在实际中通常会失败。所以,我们决定找其他的替代方法。”

替代法使用预定概率模型的输出结果作为定价策略模型的输入因素之一。

定价策略模型

首先让我们思考:在缺少最优价的基础上,训练定价策略模型时,应该用什么评估尺度呢?

深思熟虑之后,研究团队确定了两种评估尺度:价格下降查全率(PDR)和预定反悔率(BR)。我们曾统计过,某间房间是否在某天被预定出去,以及预定的价格是多少。PDR和BR都能反映出这一点。

假设如果某间房没能以价格P成功预定,那么它也一定不会在比P更高的价格上预订出去。但是如果价格低于P,那么可能有被预定的机会。PDR就表示当实际价格高于模型的建议价格时,房间未被预定的比例。在下面的图表中,PDR为0.6(5晚中有3晚没有被预定出去)。

如果我们只有PDR,那么最终我们训练出的模型最后会把指导价格变为零!如果该房间某天被成功预订,价格为P,并且P≥指导价格,那么这个指导价格就没什么用了。预订反悔率就抓住了这之中的利润。BR按以下方法计算:对于所有被成功预订的日子,取零和预定价格与指导价格之间的百分比之中的最大值。然后从这些值中取中位数。

例如:

BR就是(14,5,6,0,0)的中位数,5%。

现在我们把这些思想合到一个单一的损失函数中,看起来是这样:

给定参数xi,fθ(xi)是输出的建议价格,L是下限函数,U是上限函数。

对于预订出去的日期,下限是预定价格Pi,对于没有预定出去的日子,是c1Pi,其中c1是0到1之间的常数。

对于没有被预订出去的日子,上限是价格日历中的价格Pi。对于预订出去的日子,上限是c2Pi,其中c2是大于1的常数。

当建议价格在上下限之间时,损失是零,否则损失就是建议价格和界限之间的距离。

在论文中,作者提到:

“我们并不用相同的常数表示价格增加和减少,因为我们想让训练系统非对称地学习比率。这样一来,建议价格可以反映需求的敏感度。”

参数θ1和θ2是在Airbnb上400多万个有效房源中训练出的,训练更关注最近的预定行为,从而更好地反映季节信号。

评估

和直接从预定概率模型中的需求估计曲线定价的简单策略相比,定价策略模型显著改善了PDR和BR。

除了定量评估,论文作者还检查了2018年2月8日生成的未来120晚的价格,下图分别是针对日本东京和美国加州太浩湖的房源价格走势:

可以看到,两地房间的价格都在周末有所上升,并且东京在三月末到四月初的房价也相对较高,因为那正是赏樱的好时节。“从这两个案例中,我们看到模型的确能捕捉到时间带来的房价波动”,研究者说。

原文标题:KDD 2018 | Airbnb用机器学习实现动态定价

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

一个美国制造业的调查报告:美国在全球制造业的排名

截止2015年,美国在全球制造业排名第二,中国于2010年超越美国成为世界制造最大国。从体量上看,全....
的头像 工业4俱乐部 发表于 02-18 16:44 1000次 阅读
一个美国制造业的调查报告:美国在全球制造业的排名

研究者最近仔细估算了各种知识图谱每创建一条记录所需要的成本

把成本作为创建知识图谱的一种测量方法也能为其他评估方法铺平道路。例如,可以通过成本查验为知识图谱补充....
的头像 中国人工智能学会 发表于 02-18 16:35 207次 阅读
研究者最近仔细估算了各种知识图谱每创建一条记录所需要的成本

浪漫经济正在成为拉动GDP的一股新生力量

情人节前夕,阿里巴巴也披露了其电商平台上的十大表白神器,令人意外的是,狗粮、缝纫机、情趣用品榜上有名....
的头像 E安全 发表于 02-18 16:13 726次 阅读
浪漫经济正在成为拉动GDP的一股新生力量

图神经网络到底有多厉害?斯坦福33页PPT带你看明白!

新智元今天为大家推荐一份PPT综述,作者是斯坦福大学的多位博士后和博士生。这篇综述由基于神经网络和图....
的头像 新智元 发表于 02-18 09:04 199次 阅读
图神经网络到底有多厉害?斯坦福33页PPT带你看明白!

谷歌被曝用空壳公司参与数据中心谈判以免受干扰

2月16日消息,据外媒报道,科技公司和城市之间关于开设新办公室或数据中心的谈判,大多数都在幕后进行。....
的头像 刘某 发表于 02-16 10:44 655次 阅读
谷歌被曝用空壳公司参与数据中心谈判以免受干扰

机器人教育是如何帮孩子走出内向、爱上学习的?

导语孩子本应该是活泼开朗、爱玩爱笑,对新鲜事物总是充满好奇心,什么都想要问一问,动一动的。但是随着现....
的头像 电子发烧友网工程师 发表于 02-16 09:55 290次 阅读
机器人教育是如何帮孩子走出内向、爱上学习的?

日产有关快充功率的曲线调整

充电功率实际还有起始的SOC点关系很大,所以看到的功率是存在一定的差异的,这是Bjørn Nylan....
的头像 汽车电子设计 发表于 02-04 11:48 220次 阅读
日产有关快充功率的曲线调整

带大家一起用数据去解读其中最值得看的影片

目前预售排名前三位的都是喜剧题材,看来在春节的时候大家还是更加希望能够放松自己,看一下轻松题材的影评....
的头像 电子发烧友网工程师 发表于 01-29 10:14 331次 阅读
带大家一起用数据去解读其中最值得看的影片

多旋翼飞行器设计与控制的PPT讲义资料合集免费下载

本门课程讲授多旋翼设计、动态模型建立、状态估计、控制和决策等方面的基础知识。涉及到空气流体力学、电机....
发表于 01-28 08:00 75次 阅读
多旋翼飞行器设计与控制的PPT讲义资料合集免费下载

SCI科技型论文框架构思及其“潜规则”

对于SCI论文写作的新手来说,对如何构思与撰文会一头雾水,但其实,科技型论文是真正的格式化写作,你不....
的头像 锂电联盟会长 发表于 01-26 17:06 364次 阅读
SCI科技型论文框架构思及其“潜规则”

Humana客户的敏感信息遭黑客窃取

美国知名医疗服务提供商Humana客户信息遭泄露。
的头像 E安全 发表于 01-26 16:34 369次 阅读
Humana客户的敏感信息遭黑客窃取

STM32中的时钟

时序在数字电路中的作用,就像通信中用到的载波,载波并不起眼,但是很重要。时钟也一样,现象上只是某种频....
的头像 MCU开发加油站 发表于 01-26 15:36 228次 阅读
STM32中的时钟

刚刚,权威机构测速!联通网络最快

数据显示全国主要运营商中,移动网络平均下载网速和平均上传网速最高的都是中国联通,分别达到 23.83....
的头像 资治通信 发表于 01-26 15:24 2393次 阅读
刚刚,权威机构测速!联通网络最快

物联网的情绪

理解情绪对于新的营销策略至关重要。由于产品和营销方式的过度饱和,我们必须找到新的方式来帮助零售部门销....
的头像 物联之家网 发表于 01-26 14:30 196次 阅读
物联网的情绪

20万、50万、100万的算法工程师,到底有什么区别

随着去年AlphaGo大破李世石,大佬们在心底喊出“我操”的同时,慌不择路地把各种搞劫持、送外卖的生....
的头像 TechSugar 发表于 01-26 10:44 358次 阅读
20万、50万、100万的算法工程师,到底有什么区别

构建基于密码的物联网安全系统秩序

与会专家普遍表示,密码在物联网网络安全方面发挥着堡垒作用,是最基础的防线,正确合规地使用密码,能够系....
发表于 01-26 09:26 660次 阅读
构建基于密码的物联网安全系统秩序

互联网发展曾带来一个非常重要的“长尾效应”

不仅如此,事实上,我们面临着很多的数据孤岛。尽管每个人在互联网上产生了大量数据,但这些数据却掌握在 ....
的头像 电子发烧友网工程师 发表于 01-23 14:51 447次 阅读
互联网发展曾带来一个非常重要的“长尾效应”

如何使用会话时序相似性进行矩阵分解数据填充

针对已有数据填充方法只考虑评分信息和传统相似性,无法捕获用户间真实相似关系的问题,提出了基于会话时序....
发表于 01-23 14:50 36次 阅读
如何使用会话时序相似性进行矩阵分解数据填充

基于环上误差学习问题的新型后量子认证密钥交换协议

针对量子计算机技术的迅速发展使得传统公钥密码体制的安全性面临严重威胁的现实性问题,提出一种新型的基于....
发表于 01-23 13:46 32次 阅读
基于环上误差学习问题的新型后量子认证密钥交换协议

基于加权核非负矩阵分解的短文本聚类算法的资料说明

对互联网产生的大量短文本进行聚类分析具有重要的应用价值,但由于短文本存在特征稀疏和特征难以提取的问题....
发表于 01-23 11:05 45次 阅读
基于加权核非负矩阵分解的短文本聚类算法的资料说明

美国DARPA:借助AI的力量,发掘世界中的因果联系

接下来系统将被用于分析复杂的现实世界数据,并尝试根据创建的模式提取事件和叙述。此时需要面对的是多媒体....
的头像 将门创投 发表于 01-23 10:27 489次 阅读
美国DARPA:借助AI的力量,发掘世界中的因果联系

基于图像结构纹理分解及局部总变分最小化的图像修复模型

在基于样例的图像修复算法中,由于优先权公式的计算容易受图像局部噪声和细小纹理的干扰,导致修复顺序错乱....
发表于 01-22 16:18 47次 阅读
基于图像结构纹理分解及局部总变分最小化的图像修复模型

使用GAN进行民航陆空通话文本生成的方法说明

民航陆空通话是飞行员与管制员进行话音通信的主要方式,是管制员指令发送与飞行员指令回复的信息载体,飞行....
发表于 01-22 15:54 57次 阅读
使用GAN进行民航陆空通话文本生成的方法说明

写代码不难,难的是写高质量代码!

如果你想抽取1-4并创建一个单独的方法。常见的做法是:复制,创建一个方法,然后将复制的行粘贴到该方法....
的头像 嵌入式资讯精选 发表于 01-22 11:13 408次 阅读
写代码不难,难的是写高质量代码!

对比了近三年中国联通的成绩单,从发展数据上看看联通的变化

固网业务方面,固网宽带累计用户达到8088万户,环比2017年7653.9万户增长了434.1万户,....
的头像 通信头条 发表于 01-21 17:18 843次 阅读
对比了近三年中国联通的成绩单,从发展数据上看看联通的变化

“Collection #1”的敏感信息合集,数量远远超过了本周泄露的信息

网络安全记者Brian Krebs报道,他从某个出售这种信息合集的人那了解到,这次泄露的信息只是一小....
的头像 E安全 发表于 01-21 09:54 1132次 阅读
“Collection #1”的敏感信息合集,数量远远超过了本周泄露的信息

使用深度模型迁移进行细粒度图像分类的方法说明

针对细粒度图像分类方法中存在模型复杂度较高、难以利用较深模型等问题,提出深度模型迁移( DMT)分类....
发表于 01-18 17:01 60次 阅读
使用深度模型迁移进行细粒度图像分类的方法说明

数据挖掘在择优定兵中的应用研究

近年来,随着信息产业规模化程度的日益加深,数据量呈指数式爆炸增长,庞大数量的多源异构数据带来一系列挑....
发表于 01-18 16:23 40次 阅读
数据挖掘在择优定兵中的应用研究

如何使用融合型深度学习进行滚动轴承亚健康识别算法

抢险救灾行动的有效规划和调度在挽救人民群众生命和减轻财产损失中起着重要作用,利用数学建模方法和计算机....
发表于 01-18 14:32 178次 阅读
如何使用融合型深度学习进行滚动轴承亚健康识别算法

数据库设计的案例分析资料概述

某学校设计学生教学管理系统。学生实体包括学号、姓名、性别、生日、民族、籍贯、简历、登记照,每名学生选....
发表于 01-17 15:12 52次 阅读
数据库设计的案例分析资料概述

基于双种群协同进化遗传算法的电力仓库货位分配方法

针对电力自动化立体仓库出入库效率和高层货架稳定性问题,建立了多目标货位分配优化模型。提出了一种基于精....
发表于 01-17 10:31 30次 阅读
基于双种群协同进化遗传算法的电力仓库货位分配方法

为什么会丢数据

造成数据丢失和毁坏的原因:数据处理和访问软件平台故障。操作系统的设计漏洞或设计者出于不可告人的目的而....
的头像 发烧友学院 发表于 01-16 17:56 286次 阅读
为什么会丢数据

如何使用随机理论进行公交选择建模的详细资料说明

基于分层信息处理思想,运用随机理论框架下的公交路径选择模型,分析出行者在时空维度下的站点选择和公交车....
发表于 01-16 14:25 32次 阅读
如何使用随机理论进行公交选择建模的详细资料说明

如何使用人机社会力模型进行人群疏散算法

针对公共场合紧急情况下人群疏散困难和效果有限的问题,提出一种基于人机社会力模型的机器人疏散人群的方法....
发表于 01-15 16:48 34次 阅读
如何使用人机社会力模型进行人群疏散算法

集群的作用及搭建方法及设计方案

数据量和访问量:估算应用需要的数据量和总访问量(考虑业务发展,留有冗余),结合每个主节点的容量和能承....
的头像 电子发烧友网工程师 发表于 01-15 16:43 303次 阅读
集群的作用及搭建方法及设计方案

如何使用MS-KCF模型进行图像序列中人脸快速稳定检测

为快速稳定地检测图像序列中角度变化较大、遮挡较为严重的人脸,结合快速精确的目标检测模型MobileN....
发表于 01-15 15:44 38次 阅读
如何使用MS-KCF模型进行图像序列中人脸快速稳定检测

电梯运行方案如何使用计算机进行模拟优化设计

运用计算机模拟等模型解决了医院门诊大楼中的电梯调度方案的设计问题。针对以下的三个问题:电梯的使用、高....
发表于 01-15 15:44 40次 阅读
电梯运行方案如何使用计算机进行模拟优化设计

如何使用分层差分方程进行热防护服热量分布规律的模拟

为研究耐热服装在高温环境中的热量分布情况,降低在高温环境工作下耐热服装的制作成本,且缩短其研发周期,....
发表于 01-15 14:13 42次 阅读
如何使用分层差分方程进行热防护服热量分布规律的模拟

福特将在欧洲裁员数千人,考虑关闭工厂

近路透社报道,福特将在欧洲裁员数千人,考虑关闭工厂,并停止亏损的工厂生产线,以实现欧洲6%的营业利润....
的头像 汽车电子设计 发表于 01-15 11:36 540次 阅读
福特将在欧洲裁员数千人,考虑关闭工厂

一些关于机器学习工具在学习过程中所犯错误的问题

咨询公司Cambridge Consultants的专家级机器学习工程师Sally Epstein说....
的头像 嵌入式资讯精选 发表于 01-14 14:56 360次 阅读
一些关于机器学习工具在学习过程中所犯错误的问题

如何设计一个网络垃圾信息ILDR传播模型

针对网络垃圾信息传播研究多采用定性分析方法,难以揭示垃圾信息内在传播规律的问题,基于病毒传播的建模思....
发表于 01-11 14:14 207次 阅读
如何设计一个网络垃圾信息ILDR传播模型

基于期望最大化算法的兰姆波信号参数估计方法

在基于兰姆波技术的结构健康监测或无损检测系统中,从信号中提取的波包的准确有效特性是评估损伤的关键因素....
发表于 01-11 08:00 157次 阅读
基于期望最大化算法的兰姆波信号参数估计方法

如何恢复数据

格式化后磁盘只剩下一点格式化产生的隐藏文件。不过如果马上停止写入新的文件,那么绝大部分数据都可以恢复....
的头像 发烧友学院 发表于 01-08 16:42 498次 阅读
如何恢复数据

在30项前端技术主题中,中国在23项中占据首位

这项调查对各国于2013年至2018年期间,在爱思唯尔发行的学术杂志等的论文数据进行分析。根据阅览数....
的头像 芯论 发表于 01-07 18:04 640次 阅读
在30项前端技术主题中,中国在23项中占据首位

两亿多用户,六大业务场景,知乎AI用户模型服务性能如何优化?

知乎 AI 用户模型服务于知乎两亿多用户,主要为首页、推荐、广告、知识服务、想法、关注页等业务场景提....
的头像 电子发烧友网工程师 发表于 01-05 11:06 951次 阅读
两亿多用户,六大业务场景,知乎AI用户模型服务性能如何优化?

刘铁岩谈机器学习:随波逐流的太多

机器学习从业者在当下需要掌握哪些前沿技术?展望未来,又会有哪些技术趋势值得期待?
的头像 电子发烧友网工程师 发表于 01-05 10:58 703次 阅读
刘铁岩谈机器学习:随波逐流的太多

如何使用生成少数类技术进行深度自动睡眠分期模型设计说明

针对现阶段可用睡眠脑电数据皆为类不平衡小数据集,深度学习模型的直接迁移应用所取得的分期效果较差的问题....
发表于 01-03 16:07 55次 阅读
如何使用生成少数类技术进行深度自动睡眠分期模型设计说明

基于运动平滑约束项的快速误匹配剔除算法

针对图像拼接时用随机抽样一致性( RANSAC)算法迭代计算过程中计算量大、匹配正确率低的问题,提出....
发表于 01-03 14:50 43次 阅读
基于运动平滑约束项的快速误匹配剔除算法

matlab经典算法数字实验教程之回归分析

本文档的主要内容详细介绍的是matlab经典算法数字实验教程之回归分析主要内容包括了:1.一元线性与....
发表于 01-03 11:46 51次 阅读
matlab经典算法数字实验教程之回归分析

如何使用混合果蝇优化算法进行现场服务调度问题的解决方法

员工技能熟练程度对现场服务调度问题( FSSP)的执行效率有极大影响,现有研究中未考虑员工技能因素。....
发表于 01-03 11:11 42次 阅读
如何使用混合果蝇优化算法进行现场服务调度问题的解决方法

CY8C5步骤模型

是否会出现以下组件的步骤模型? 1。CY8C5667 LTI-LP09 2。CY8C5868 AXI-LP032 以上来自于百度翻译 ...
发表于 10-15 15:23 126次 阅读
CY8C5步骤模型

请问使用Motorware时如何备份工程防止数据丢失?

使用Motorware时,如何备份工程,防止数据丢失? 我现在从Motorware中打开了一个工程,但是大部分的文件是链接形式的,我怎么...
发表于 09-30 11:24 574次 阅读
请问使用Motorware时如何备份工程防止数据丢失?

请问为什么在我这种结构第一次收到数据是完整的一帧65位,而第二次就收到33位数据?

发表于 09-20 16:30 443次 阅读
请问为什么在我这种结构第一次收到数据是完整的一帧65位,而第二次就收到33位数据?

Vuforia开发技巧:通过手指拖拽平移模型

AR/VR技术交流群 129340649 前面文章介绍了怎么对3D模型进行缩放、平移和旋转, 《(Unity3d)Vufori...
发表于 09-20 10:20 240次 阅读
Vuforia开发技巧:通过手指拖拽平移模型

BenchVue似乎只记录了1小时的数据

当我下载并安装BenchVue时,我有点热情,我将它连接到带有3个DMM 34401的GPIB上,随着时间的推移监控3个电池。 一切都...
发表于 09-18 15:59 301次 阅读
BenchVue似乎只记录了1小时的数据

tcp通讯只有超时了发送到数据才能显示出来?

如图,,为什么只有超时了,发送到数据才能显示出来? 连线图如下。 ...
发表于 09-13 15:45 424次 阅读
tcp通讯只有超时了发送到数据才能显示出来?

请问如何打包数据

我开始发现我的特点与cyble_gattcdiscoverallcharacteristics()去cyble_evt_gattc_read_by_type_rsp事件。 charreport =(cyble...
发表于 09-12 10:01 254次 阅读
请问如何打包数据

会议预告-2019北京国际数据中心技术设备展览会

数据中心展,据中心技术展,据中心设备展,北京数据中心展,北京据中心技术展,北京据中心设备展,2019数据中心展,2019据中心技...
发表于 09-11 17:17 346次 阅读
会议预告-2019北京国际数据中心技术设备展览会

这6点帮你解决参数未知的重要问题 | AI知识科普

班主任发现,经常有许多对人工智能领域跃跃欲试的小伙伴在后台发私信问我“怎样快速入门人工智能呢?” 对于这样的问题,班主...
发表于 08-10 11:47 501次 阅读
这6点帮你解决参数未知的重要问题 | AI知识科普

i32数据和u32数据有什么区别?

i32数据和u32数据有什么区别?
发表于 07-29 15:17 896次 阅读
i32数据和u32数据有什么区别?