清明出游,你会“鸽”酒店吗?AI 早已看穿一切
来源 | Hyper超神经
作者 | 神经小兮
头图 | 下载于视觉中国
如今,大数据已经被各行各业所应用,酒店行业也不例外。充分利用大数据,使得酒店能够预测市场需求变化,进行智能化决策分析,改善经营状况。
各大 OTA(Online Travel Agency)平台极大地方便了人们的出行,酒店住宿、景点门票等,只需要动动手指就可以轻松完成预订。
为了吸引更多用户预订,这些平台会鼓励商家设定较为宽松的取消预订政策,比如可随时免费取消,或限时免费取消等。
全球客房销售量最大的网上酒店预订网站 Booking(缤客网),就凭借可免费取消的优势,深受广大驴友喜爱。
不过,对于用户来说,「免费取消」非常 nice,但对酒店来说,就很头大了。订单临时被取消,通常会给酒店带来以下损失:
被取消房间无法及时出售,酒店损失收入;
酒店降低价格出售被取消房间,减少了利润
为了尽快订出这些房间,酒店需要增加额外的宣传、分销渠道的费用;
在用户可以随时放酒店鸽子的情况下,酒店有没有什么办法,尽可能减少损失呢?
一位葡萄牙业务分析师(Business Analyst,简称 BA,这一职位相当于 IT 公司的产品经理) Manuel Banza,有超过 5 年的酒店管理从业经验。他利用公开的欧洲酒店预订平台数据,发现了更容易取消订单的用户特点,以帮助酒店及时进行止损。
从近 12 万条酒店预订数据中,发现规律
作为一名数据科学爱好者,Manuel Banza 从数据科学和机器学习入手。
他首先对一个「酒店预订需求数据集」(Hotel booking demand)进行了全面分析。该数据集包含了普通酒店和度假酒店共 32 个维度的数据,具体包括:
用户国籍、预订时间、住宿时间、成人和儿童或婴儿的数量、订单最终是否取消、用户在此次订单之前共取消订单次数等信息。
Hotel Booking Demand
酒店预订需求数据集
发布机构:葡萄牙里斯本大学
包含数量:共 119390 条数据,32 个维度
数据格式:csv
数据大小:16.9 MB(压缩文件 1.3 MB)
地址:https://hyper.ai/datasets/14866
部分数据展示
通过统计,Manuel Banza 发现一年时间里,取消酒店订单的用户真不少。
2018 年 OTA 平台 Booking 上的预订订单中,有 49.8% 的用户取消了订单;在 HRS Group 上,这一比例甚至高达 66%。整体来看,多家平台在 2018 年平均预订订单取消率达到 39.6%。
各类预订渠道被取消的订单比例
接着,作者对数据进行了探索性分析,有以下几个发现:
普通酒店和度假酒店相比,订单更容易被客人取消;
春节和夏季的取消比例更大,而冬季的取消比例最低;
各种预订渠道中,用户在 OTA 平台下单最多,同时 OTA 平台上被取消订单的也最多;
用户预订时间越早,不确定性越大,取消的概率越大
作者表示,预订时间是分析酒店收益表现时,最重要的指标之一。分析结果表明,提前 1 年以上预订的取消概率最高,为 57.14%;一周内预订取消概率最低,为 7.73%。
预订提前的天数(横轴)与取消订单概率(纵轴)成正比
看来,计划越早越赶不上变化啊
机器学习模型:预测谁最可能「放鸽子」
对数据集进行全面分析后,作者开始建立预测订单取消的模型。
第一步:数据清洗
首先,对数据集中缺失的值进行处理。如果该变量是数字变量,则必须用该特征的均值替换这些缺失值;如果该变量是分类特征,则必须用常数替换。
然后删除 reservation_status(预订状态,该变量代表订单是否被取消,0 为未取消,1 为取消),因为这是机器学习模型将要预测的值。
第二步:选择最佳模型
在开始为数据测试最佳算法之前,将数据集按 8:2 的比例分开。之后将用 80% 的数据来训练模型,并将 20% 的数据作为验证集。
在数据科学领域,预测订单取消是一个监督分类问题,也叫做二元分类。因此,作者选取了几个现有的二分类模型如 LightGBM,CatBoost、XGBoost 及 H2O 等,进行训练及对比,最终选出了实验结果最佳的模型 CatBoost。
通过 CatBoost 预测结果,发现以下几点:
如果用户的国籍是葡萄牙,则取消订单的可能性很高。不过,对于团体订票来说,酒店一般不会事先得到每个人的国籍信息。如果订单被取消,大多数酒店都会将其国籍默认为酒店所在的国家。所以,这项信息只作为参考,并不一定准确;
与至少提出一个特殊要求的用户相比,未提出任何特殊要求的用户,取消订单的可能性更高;
lead_time(预订时间与入驻时间间隔天数)值越低,预订被取消的可能性就越低(这一点预测结果与之前数据分析结果相一致)。
葡萄牙人气酒店欧洲之星博物馆,店内以考古展览为特色
上线多个 OTA 平台,支持在线预订及免费取消
CatBoost 模型在验证集上的表现:
在整个「酒店预订需求」数据集上的表现:
酒店:在取消之前,让我先抢救一波
使用这一预测模型,酒店就可以提前获知哪些用户可能取消订单,及时采取补救措施。
比如,提前联系取消可能性较大的用户,通过沟通,让他们尽可能更早地取消,给酒店预留更多的时间出售房间。
或者,也可以与有取消倾向的用户联系,向其介绍酒店的优点,给出一些入住奖励,力挽狂澜挽留他们。
参考链接:
https://www.linkedin.com/pulse/u-hotel-booking-cancellations-using-machine-learning-manuel-banza
CSDN协同行业大佬,携手打造13长热门知识图谱及IT成长路线
助力千万IT人成长,快速实现职场进阶!
更多精彩推荐
☞市值达 58 亿美元,吴恩达的在线教育平台 Coursera 正式上市☞Arm 十年重磅发布 v9 架构,不受 EAR 约束,未来将覆盖 3000 亿颗芯片☞雷军的最后一次 重 大 创 业
点分享点收藏点点赞点在看
相关文章:

ti的硬件时钟和系统时钟同步
1.hwclock -w软到硬 hwclock -s硬到软2. 通过ntp网络时钟控制同步3.etc下的localtime文件和GMT-8转载于:https://www.cnblogs.com/pengkunfan/p/3515517.html

来看看BAT在AR领域的布局,你给打几分?
所谓的AR(增强现实),就是把真实信息和虚拟世界叠加,并使两者具有交互性。换句话说,AR技术不仅让虚拟对象融入到现实世界中,用户还可以对现实世界做出响应。这是一种共生(symbiont)技术,机器与用户的共生。 而当Pokemon…

解决vim没有颜色的办法
首先打开vim,输入命令 scriptnames看看vim加载了哪些脚本。 :scriptnames 输出入下 1: /home/users/xxx/.vimrc2: /home/users/xxx/tools/share/vim/vim73/colors/darkblue.vim3: /home/users/xxx/tools/share/vim/vim73/syntax/syntax.vim4: /home/users/xxx/tools…

好多Javascript日期选择器呀--1
<script languagejavascript>var DS_x,DS_y; function dateSelector() //构造dateSelector对象,用来实现一个日历形式的日期输入框。{ var myDatenew Date(); this.yearmyDate.getFullYear(); //定义year属性,年份,默认值为当前系…

扶贫干部拍胸脯认证,AI开发者上手零门槛,百度打造 “云智一体”全栈开发杀手锏...
“我可以拍着胸脯说识别准确率很高。”扶贫干部刘乐这样评价他在使用百度EasyDL平台助力扶贫的效果,他是陕西省汉中市扶贫信息中心副主任,也是一名热爱编程的程序员。 在近期百度智能云举办的2021云智技术论坛首场活动上,刘乐介绍,…

CSS3 新特性
CSS3 是最新的 CSS 标准,并且完全向后兼容,不过目前W3C 仍然在对 CSS3 规范进行开发,虽然标准的规范还没有正式发布,但是现代浏览器已经支持相当多的 CSS3 属性了。CSS3 提供了很多可以把玩的新特性,模糊了之前只控制样…

在.net中使用GDI+来提高gif图片的保存画质
//本文章有www.blue1000.com翻译,原文地址http://codebetter.com/blogs/brendan.tompkins/archive/2004/01/26/6103.aspx //尊重他人劳动成果,转载请注明出处。 写程序的时候经常用到gdi,他可以将一幅深色32 bpp图像保存为一个gif文件&…

随记:kickstart远程批量无人值守安装linux
环境:RHEL6.2组件:dhcp tftp vsftp kickstart原理:需安装linux的客户机通过PXE方式启动;通过dhcp取得IP地址;通过TFTP下载引导进程文件pxelinux.0,内核文件vmlinuz,底层驱动initrd.img&…

第五届全国大学生计算机系统能力培养大赛 | 赠书
全国大学生计算机系统能力培养大赛是由教育部高等学校计算机类专业教学指导委员会和系统能力培养研究专家组共同发起,以学科竞赛推动专业建设和计算机领域创新人才培养体系改革、培育我国高端芯片及核心系统的技术突破与产业化后备人才为目标,面向高校大…

玉山银行的一名新员工“玉山小i随身金融顾问”
市场竞争、监管变化、客户体验一直在对金融行业发起挑战,所以无论监管、竞争、客户都会影响金融行业在成本和服务上的创新,金融行业越来越多的开始利用人工智能去满足现有发展提出的要求。 台湾玉山银行的数字化转型就是一个很好的例子。台湾有一句顺口溜…

DataGridView 密码列(显示为*号)的设置
曾经为在DataGridView中设置密码列(显示为*号)而发愁,如何把Windows 窗体 DataGridView 的某一列的数据显示为“*”。 哈哈,今天终于搞定了。需要在DataGridView的2个事件中写代码真麻烦!下面的代码把第4列设置为密码…

在Android中进行单元测试遇到的问题
问题1、Cannot connect to VM socket closed 在使用JUnit进行测试的时候,遇到这个问题。网上的解释是:使用Eclipse对Java代码进行调试,无论是远程JVM还是本地JVM都会进行Socket通讯.发生这样的错误是由于这些软件会修改winsock,还会监听和占用一些端口&…

英特尔第三代 Ice Lake 发布正面与 AMD EPYC PK,结果令人大跌眼镜!
作者 | 夕颜 出品 | AI科技大本营(ID:rgznai100) 导读:传闻已久的第三代英特尔至强可扩展处理器,终于在北京风光最美的4月份发布了。 北京时间4月7日晚,在著名的网红打卡地,百年老首钢工厂遗留下的工业建筑…

荣之联“云桥OneBridge”让IT运维事半功倍
近日,荣之联发布“云桥OneBridge”新一代的轻量级企业用户账号管理平台,为企业提供账号全生命周期管理解决方案。“云桥OneBridge”让IT运维工作效率大幅提升,并降低人为差错率,IT运维从此事半功倍。 据介绍,北京荣之联…

自定义GridView分页模板
GridView较之DataGrid提供了更加强大、更加完善的功能,而且具备了丰富的可扩展功能,可以使用GridView提供的pagertemplate自定义分页模板: 事实上,GridView默认的几中分页样式,都是将相关按钮的CommandName设为Page&a…

“雾霾”天里坐看云起时-【软件和信息服务】2014.01
2013年是中国关注雾霾的元年,中国经济高速发展了30多年后,我们终于幡然醒悟:雾霾和各种污染也开始正式进入公众和各级政府的视野。VMware在12月6日召开的VSS上海站并没有因为雾霾肆虐而降低热度,IT界在雾霾天里继续着云中漫步。20…

CSDN 给你一个薅羊毛的机会!你真的不要吗?
抢红包、集福卡、转锦鲤等等,每年过年过节,各种价值几十亿的瓜分活动,对于网络冲浪选手来说,眼花缭乱但也乐趣满满。可现实是:你抢了5毛8,人家抢了好几万!甚至前段时间,字节跳动安全…

ASP.NET TricksTip:关于Tooltip(title)的换行问题
我们知道,为了使对于普通 HTML 元素的title可以换行,至少可以有可以两种方式: 1。将title的文本分行写 <a href"#" title"helloworld">hello world</a>2。插入换行符号 <a href"#" title&q…

谷歌高管又变动:AI 研究部门元老即将离职
整理 | 寇雪芹头图 | 下载于视觉中国出品 | AI科技大本营(ID:rgznai100)本周二,谷歌研究院负责人 Samy Bengio 宣布辞职。Samy Bengio 在公司内部邮件中表示自己决定离开谷歌,并将于 4 月 28 日正式离职。目前,Samy Be…

jQuery 1.9 移除了 $.browser 的替代方法
$.browser是通过正则表达式来匹配userAgent来判断浏览器版本和种类的.jquery1.3.2版本的文档中已经声明jquery.browser及jquery.browser.version建议弃用,可以使用jquery.support来代替。jQuery 从 1.9 版开始,移除了 $.browser 和 $.browser.version &a…

异常检测算法:Isolation Forest
iForest (Isolation Forest)是由Liu et al. [1] 提出来的基于二叉树的ensemble异常检测算法,具有效果好、训练快(线性复杂度)等特点。 1. 前言 iForest为聚类算法,不需要标记数据训练。首先给出几个定义&am…

asp.net 2.0中的弹出对话框
在asp.net 1.1中,要做1个弹出的对话框的话,一般是在服务端的代码中这样写: btnClick.Attributes.Add("onclick", "return confirm(Are you sure?);"); 现在在ASP.NET 2.0中,只要使用客户端的代码就可以拉&a…

2014学习目标
学习目标 给自己定一个学习计划,省着没有目的瞎弄。 整理javascript基础,记录博客(进行中......)学习jquery源码,培养自己的实战技巧学习nodejs,充实自己,记录博客学习git的使用,记录…

2021全球最具影响力 AI 学者榜单: 中国占比11.1%,位列第二
2021 年 4 月 8 日,2021 年人工智能全球最具影响力学者——AI 2000 榜单重磅揭晓。AI 2000 榜单由清华大学 AMiner 联合北京智源人工智能研究院、清华 - 中国工程院知识智能联合研究中心共同发布,旨在通过 AMiner 学术数据在全球范围内遴选过去十年人工智…

BootStrap 模态框禁用空白处点击关闭
转自(http://www.cnblogs.com/DayDreamEveryWhere/p/4550320.html) 模态框为信息编辑窗口,涉及好多内容,填了半天,若一不小心点了空白处..... $(#myModal).modal({backdrop: static, keyboard: false}); backdrop:static时,空白处不关闭. keyboard:false…

asp.net 2.0中设定默认焦点按钮
在asp.net 1.1中,当要在page_load页面中,设置某个控件为默认的焦点按钮(也就是默认焦点是在这个控件上的),可能要用到javascript的代码,而在ASP.NET 2.0中,不用这些麻烦了,在form代码…

(送)Java 架构技术揭秘:Redis+Nginx+Dubbo精选+面试题+精选视频
最近花了很长的时间去搜罗整理Java核心技术好文,我把每个Java核心技术的优选文章都整理成了一个又一个的文档。今天就把这些东西分享给小伙伴们,也能为小伙伴们省去不少麻烦,想学什么技能了,遇到哪方面的问题了 直接打开文档学一学…

Twitter的应急预案、部署流程
2019独角兽企业重金招聘Python工程师标准>>> 《空中之城》事件 在构建Twitter的架构和系统时,我们是以周为单位来确定那些系统的性能的,我们能清楚地知道每个服务维度的系统理论容量,从而尝试去了解整个系统的理论容量。基于这些信…

新产品发布与A轮2000万美元 双喜临门后GrowingIO还要做什么
ZD至顶网CIO与应用频道 06月29日 北京消息(文/王聪彬):一个用户一天可能会打开超过12个App,但其中只有3个App的使用时间超过80%。这反映了大多数人使用手机的现状。 透过现象看本质,中国互联网、移动互联网市场既有人口…

gridview列 数字、货币和日期 显示格式
形式语法结果注释数字{0:N2}12.36 数字{0:N0}13 货币{0:c2}$12.36 货币{0:c4}$12.3656 货币"¥{0:N2}"¥12.36 科学计数法{0:E3}1.23E001 百分数{0:P}12.25%P and p present the same.日期{0:D}2006年11月25日 日期{0:d}2006-11-25 日期{0:f}200…