在线酒店用户消费分析报告-酒店客人的消费态度对酒店消费行为的影响
微信号
KTV115116
本文目录一览:
酒店客人的消费态度对酒店消费行为的影响
分为内部因素和外部因素。
内部因素的分析,动机,这个动机更多的是客人自身的需要,满足客人的住宿,餐饮等方面,个性,商务客人有紧张的旅途,更需要酒店为他们提供家一样的感觉。
酒店用户消费行为的调查报告显示,最关心客房服务的人数占大多数,另外餐饮服务,娱乐服务设施及环境占了五分之一。
旅游APP酒店功能模块竞品分析
旅游APP酒店功能模块竞品分析
1行业分析
1.1概念界定
在线酒店预订概念:指借助互联网/移动互联网,通过手机、平板、PC等设备,在酒店集团、OTA平台、专业酒店预订平台及其官方微信、客户端上进行酒店信息查询、预订、下单、评价,并在提交成功之后,通过网上支付或前台支付进行酒店预订的行为。
在线酒店预订用户概念:指通过线上进行酒店预订的用户,区别于不借助互联网媒介直接到酒店预订对的线下用户。
1.2所处行业
在线旅游行业;
行业内相关产品:携程旅行、美团酒旅、飞猪旅行、去哪儿网旅行等。
本次竞品分析报告只针对旅游APP中“预订酒店”这一功能模块进行细致的分析;
1.3行业概况
(1) 中国在线酒店市场当前处于快速成长发展走向成熟的阶段,如下图;
(2)发展前景 :中国酒店市场处于快速成长期,未来市场空间巨大,预计2018年在线酒店间夜量将达7.4亿,交易规模将超过1500亿,如下图。
(3)驱动力 :酒店行业利好政策推动、互联网+、消费升级、中国出行市场的需求旺盛;互联网技术的提升,用户上网习惯基本形成;互联网巨头积极布局,产业资本持续投入,积极地推动了在线酒店市场的整体发展。
(4)市场特征 :移动端成为在线酒店市场的新战场,渗透率不断提高;大数据、云计算等成熟的技术为在线酒店市场精准营销提供了支撑。
(5)竞争 :OTA市场依旧是市场主流,2015年OTA平台所占份额超过七成,在线酒店预订入口地位优势稳固。而团购类仅是补充,份额仅一成多。
(6)发展趋势 :OTA平台依旧将是市场主流,团购平台将只是补充;在线酒店平台逐步向一站式旅游服务平台方向发展。在线酒店预订市场产品细分化、差异化,线下产品和服务更加精深。
1.4市场份额
在线酒店预订平台主要分为3种:
(1) OTA平台模式 :这种平台整合上游酒店供应商内容及数据,实时查询、预订房间。玩家有:携程旅行、去哪儿旅行等。用户根据品牌、位置、价格等进行搜索,了解酒店基础设施之后,选择符合自己要求的酒店,进行预订,填写预订信息和个人入住信息,提交订单。
(2) 团购平台模式 :这种平台整合上游酒店供应商内容,购买前需要预约。玩家:美团、糯米等;用户根据品牌、位置、价格等进行搜索,了解酒店基础设施之后,选择优惠券在有效期内并符合自己要求的酒店,确定入住时间和房型之后抢购优惠券,输入手机后后提交订单,凭手机团购券密码即可入住。
(3) 直销平台模式 :酒店官网或者官方APP,无代理商,数据及时更新,用户直接可以查询、预订。玩家:华住、如家等。用户根据品牌、位置、价格等进行搜索,了解酒店基础设施之后,根据自己所属会员类型,选择符合自己要求的房型,预订,填写预订信息和个人入住信息,提交订单即可。
以上三种平台2015年所占市场份额,如下图:
由上图可以看出,OTA平台是市场的主流,占据七成市场份额;
携程旅行长期占据在线酒店预订市场份额第一位,原本位于第二位的去哪儿旅行被美团赶超,阿里旅行紧随其后。
现在的排序应该是:携程旅行、美团旅行、去哪儿旅行、飞猪旅行(阿里旅行)
1.5市场特征
(1)移动端成为在线酒店预订市场新战场,渗透率不断提升。
(2)大数据、云计算等技术成熟为在线酒店市场精准营销提供了支撑。
(3)OTA平台依旧是在线酒店市场主流,入口地位优势明显。
(4)高端酒店市场的发展潜力不断被85、90后等新一代消费群体挖掘。
2竞品选择
2.1竞品级别划分
核心竞品 :团购平台(百度糯米-酒店、美团酒店预订)
美团与百度糯米同属团购类型的APP,酒店模块均为其中的一个部分,处在同一个细分市场内,用户行为与使用场景相似度很高。
重要竞品 :OTA平台(携程旅行、去哪儿旅行、艺龙旅行、阿里旅行)
同一细分市场——在线酒店预订内排占有非常高的市场份额,交易额排名前4位;
一般竞品 :酒店官方APP(华住、如家等);UGC旅游服务平台:马蜂窝;
其他竞品 :非标准酒店预订:途家(公寓)、Airbnb(民宿)等;
2.2竞品选择理由
根据产品的形态和分类,美团酒店最直接最核心匹配度最高的竞品应该是糯米酒店,但是糯米酒店市场份额较低,没有太大的分析意义。
因此,选择在细分市场中占有最多市场份额的OTA平台进行分析。
选择携程旅行是因为其市场份额第一,且在行业内耕耘多年,具有丰富的资源和经验。
阿里旅行虽然市场份额不如艺龙旅行,但是阿里的电商背景使阿里旅行的用户行为和使用场景与美团更为相似。并且阿里旅行继承淘宝的C2C模式,不同于以往的OTA代理。
2.3竞品版本
3需求分析
3.1用户分析
以下是2015年对中国在线酒店预订用户的统计分析结果:
由上图可以看出,手机预订是在线酒店最主要的预订方式。29岁以下的用户是最主要的用户群体。在使用手机预订的用户中,29岁以下用户占比67%,30-39岁用户占比49%。
由上图可以看出,综合旅行预订类(OTA)平台是用户预订酒店时最常用的了解酒店信息渠道,占比48%。
由上图可以看出,酒店时体验型消费,酒店清洁度和无线上网时用户最关注的细节;
在用户入住体验方面,用户对WIFI信号好满意度最高;对酒店热情舒适度体验愉悦值最高。
由上图可以看出,用户对酒店住宿的需求一般集中在酒店的环境与服务,而预订平台由于能实时更新酒店房价及房间状态,所以能更好的满足这种需求,相应的用户满意度较高(如下图);而团购平台由于价格因素以及产品形态的限制,酒店不能提供高质量的服务,所以用户满意度低一些,仅有2.58(满分5分)。
由上图可看出,房价及房态实时更新、支付方便快捷/支付方式多样、预订方式灵活是用户对OTA平台满意的主要原因。
价格校对较高、一站式生活类服务体验较差是用户对OTA平台不满意的主要因素。
由上图可看出,价格特惠/价格低是用户对团购平台满意的最主要原因;
需要提前预约但是不一定预约上、团购房间数量相对较少、团购显示酒店图片与事实不符是用户对团购平台不满意的主要原因。
由上图可看出,门票是用户在线预订酒店时同时预订最多的产品;
在线支付和到店支付是用户最喜欢的支付方式。
3.2使用场景分析
需求分析往往需要通过分析使用场景的方式进行分析。
我们把目标用户的主要需求按照购买的不同阶段分解如下:
根据运营漏斗数据分析:
1用户最容易流失的阶段是购买之前和购买过程中,信息的内容、质量过着购买流程的便捷性等因素都会影响用户的留存,所以产品信息结构和呈现方式尤为重要。
2口碑营销的关键是分享机制和UGC社区的建设,好的分享机制可以节约大量的营销成本,而良性的UGC社区则会让浏览用户进一步转化为交易用户。
3.3用户痛点
下图为在线酒店用户对酒店预订和团购的不满意因素调研结果:
由数据可知,用户对酒店预订的痛点主要集中在价格,而对酒店团购的痛点主要集中在信息对称。为解决这两个痛点,主流酒店预订平台的做法一般是提供酒店预订和团购产品,预订产品保证信息对称但价格相对较高,团购产品无法保证信息对称但价格便宜,给了用户更多自主选择的权利。
4竞品分析
4.1基本功能对比
以上表格详细列出了最新版本的各app的功能。
4.2竞品分析
4.2.1业务类型差异
美团、携程、飞猪全部都包括国内和国外的各类型酒店;
美团在此之外选择了“钟点房”;飞猪选择了“客栈公寓”;
携程底部一栏中显示业务范围最广,包括:钟点房、会议团房、民俗客栈、特价酒店和特色酒店。
4.2.2业务模式差异
美团的业务模式是主打B2C模式。直接整合上游酒店供应商资源,这样做有利于服务质量的把控,预订数据更加可靠;而且酒店来源一致,页面结构更加清晰,浏览过程用户体验更好;但劣势就是资源丰富度会受限制(在相同的筛选条件下,携程、飞猪的酒店数远远超出美团旅行的酒店数),而且成本相对较高一些。
携程旅行采用的业务模式是代理模式,平台统一整合携程自营和代理的产品,代理负责提供产品,平台负责提供服务,用户不与代理直接接触。此模式是典型的传统的OTA模式(携程的机票业务也是遵循此模式),优势在于采用此模式可以获得数量较多的房源,容易在各个城市推广,而且成本呢较低;但是劣势在于代理对于房源质量的把控参差不齐,并且资金链在代理手中周转时间过长。
飞猪旅行是C2C模式。用户在购买除自营产品以外的产品时,可以与卖家直接联系,平台只是作为沟通买卖双方的桥梁(有点类似淘宝)。此模式与淘宝的C2C模式类似,是阿里最擅长的模式。该模式将OTA模式的优点与缺点进一步放大,对卖家更加宽松,但也对平台的质量把控更为严苛。
4.2.3推荐功能差异
目前,美团、携程和飞猪均对附近的酒店进行推荐,推荐距离用户浏览酒店距离最近的酒店,方便用户对酒店的价格和服务进行对比。这有助于用户将注意力聚焦在选择酒店上,更易于选出最理想的酒店;但是缺点是不能通过酒店的销售带动其他产品的流量和销量,用户如果需要购买其他配套产品时需要跳出酒店选择的页面。
携程旅行将旅游服务相关产品(门票等)打包成优惠套餐的形式,套餐中自动为用户推荐内容,但如果推荐不能完全符合用户的喜好,容易引起用户的反感;而且推荐的产品会存在数量不足无法购买的情况,用户体验较差。
美团在酒店的详情页面,有“酒店美世”标签,向用户推荐附近美食信息。
4.2.4支付类型差异
美团的预订和团购都只支持线上提交订单完成支付,支付模式较为单一,但是因此操作流程也更简单更具有一致性,用户体验较好。
携程的预订业务以免费预订为主,但是需要提前缴纳担保费用,担保费用可退还,担保费用只是用于锁定房源,可退还。到店之后再向酒店支付房费。用户在线上只需要花很少的钱就能够预定到酒店,但是担保后需要等待一定时间等待酒店方确认,造成预订的实时性不是很好。除此之外,携程支持游客预订,用户无需登录即可预订,这样容易造成假单,浪费商家资源,订单无法在其他设备上查询,不利于对用户的行为数据进行分析,不利于精准营销。
飞猪旅行的酒店主打“信用住”,用户线上预订后直接入住,退房之后消费金额从绑定的支付宝账户中扣除,或者从蚂蚁花呗中扣除,用户在线上提前进行担保,但是无需支付任何费用,很好的解决了额入住时付押金拿房卡的痛点,是一种在线酒店预订的新的支付方式。该模式的推动与阿里的信用评级体系密切相关,不容易被竞争对手复制。
4.3 App架构
4.3.1美团酒旅
注:图片太密集,请手动放大浏览;
总结与分析:
1美团的信息结构清晰,层级明确,结构清晰;
2美团在普通订单的基础上增加了团购模式,因此预订方式分为两种。虽然有两种预订方式,但是下单模式与流程基本一致,有利于培养用户习惯,使用操作简单。
3美团在标准国内国际全日房之外,重点突出了钟点房类型;不同类型的酒店列表页、详情页、订单页、支付页基本相同,框架一致,用户体验比较流畅;
4相较于携程和飞猪,美团地图页面有一个明显的缺陷,首先缺乏地图页面的筛选功能,也没有显示当前地图范围内商家数量,无法对当前划定范围内的酒店进行缩小范围的筛选。我觉得这是美团可以考虑改进的地方。
4.3.2携程旅行
注:图片太密集,请手动放大浏览;
总结与分析:
1携程酒店首页的底部显示的酒店业务类型是较为全面的,包括钟点房、会议.团房、民宿.客栈、特价酒店和发现五个模块。相较于美团和飞猪,这是一大优势。
2携程的会议.团队房这一模块,功能非常人性化,可以定制化需求,提高了用户体验。
3携程由于整合了优惠券、当地景点门票等,因此增加了套餐订单,需要对套餐进行选择。优点是可以一站式的满足来景点旅游的顾客的需求,缺点是系统流程相对复杂,层级较多,使用难度大大增加。
4.3.3飞猪旅行
注:图片太密集,请手动放大浏览;
总结与分析:
1由于飞猪的酒店业务定位不同,是C2C模式的,与淘宝采用的C2C销售模式相对应。因此,预订列表中会增加卖家列表。
2支付页部分,对接阿里巴巴整体信用评级,飞猪酒店模块采用信用住的方式,支持顾客入住免押金、离店免查房免排队、离店后支付宝自动结账。这种方式很独特,极大地提升了旅行住宿的便捷性,并且这种方式其他企业很难复制。
4.4交互
随着旅行市场的发展,以及各家产品不断地试错与改进,最终基本会形成较为通用的架构和模式。这也就是为什么旅行类产品同质化较严重的原因。
合理的交互范式能够使消费者形成良好的用户体验,提高用户粘性,有利于培养用户习惯。
4.4.1日期选择
以上是携程日期选择时的截图。
1点击入住时间框后,跳转页面至日历,选择入住时间后又跳出,回到主页面;
2点击离店时间框,跳转日历,选择离店时间,再次跳出回到主页面;
3入住时间月离店时间的选择是相互独立的,没有连接在一起;
4完成时间选择,共经历了4次页面跳转,4次点击,比较复杂,不是非常智能,体验稍差。
以上是美团日期选择时的截图。
1点击时间框,页面跳转至日历,选择入住时间后,页面并未跳转,而是给出“请选择离店时间”的提示;然后用户选择离店时间,点击“完成”按钮,页面跳转回主页面;
3整个过程只有2次页面跳转,4次点击,过程中有提示和流程指示,相较于携程来说交互好一些。
4最后完成离店时间选择时,需要用户手动确认完成,相较于系统自动跳出,有一丢复杂。
但是也可能是出于减少用户手抖点击失误造成跳出的情况,为了保证选择的正确性。
以上是飞猪酒店日期选择时的截图。
1点击时间框,页面跳转的同时,系统给出“请选择入住日期”提示,用户选择入住信息;
2选择入住信息之后,系统自动跳出“请选择离店日期”,用户选择离店日期后系统自动跳转;
3整个过程一共经历了3次点击,2次跳转,是竞品中流程最简洁,用户体验最流畅的一个;
综上,在尚未对日期选择交互功能进行详细分析之前,我首先对三个竞品进行了体验,确实是飞猪在选择时更流畅;在对三个app进行对比分析之后,体会到了细微的交互差异都会给用户带来不一样的用户体验。细节决定成败。
因此,在日期选择这种功能模块,应该更多的选择“自动确认”的交互方式。携程和美团都可以进一步改进。
4.4.2筛选功能
以上是携程酒店预订筛选模块的截图。
1携程的筛选功能放在页面的底部,推测是为了迎合用户日常使用社交软件的习惯,例如:微信、QQ等,习惯于在页面下方进行点击操作。但是我在使用时却反倒有一些不习惯。所以,这种方式是否真正起到作用还是要对运营数据进行分析后才能知道。
2当点击左下角“筛选”时,跳出右侧如图,占据整个页面,生成了一个全新的页面。
3做出选择之后基本都需要用户进行确认(除好评优先模块自动实现刷新)。
4筛选完成之后,会在“筛选”字样右上角标注属性数目,这一点用户体验较好。
以上是飞猪酒店预订筛选模块的截图。
1筛选功能全部放在页面上方,处于搜索框下方;这样视觉顺序和操作顺序相符,体验更流畅;
2进行筛选时,不同的筛选条件都是采用下拉框或者右侧框的方式。筛选完成后,会在页面底部显示筛选结果总数。
3除了“推荐排序”无需用户确认之外,其余的筛选条件均需要用户确认。
4筛选结束之后,筛选栏的外观不会发生变化,没有实时显示“已选的筛选条件的数量”。
1美团的筛选栏和飞猪类似,放在搜索框的下面。
2点击“全城”,从页面下方跳出新的页面,这与飞猪从上往下,从右往左不同;
3“全城”、“智能排序”自动跳转;
4“价格星级”、“筛选”需要在选择完成后进行手动点击确认。
综上,对于交互,是为了提高用户体验。
但是,并不是一味的精简或者复杂就会提升用户体验;过少的功能虽然简单易操作,但是如果没有覆盖到用户的关注点,就会降低用户体验。过多的交互造成了操作流程和视觉流程的负责化,有些交互并不是用户关注的核心信息,反而会降低用户体验。
因此,我觉得某些具体的交互功能是否起到作用,还是需要通过分析用户点击流数据、购买数据等去验证其实用性。
5讨论
通过分析以上三个旅行APP的酒店预订模块,本研究报告站在携程酒店预订的角度,说一说自己的想法和建议。
(1)由于携程拥有最多的商旅用户,因此,为了满足庞大的用户群,携程拥有最全面的功能和最丰富的产品种类,可以说是“大而全”,是在线旅行酒店预订的巨头,在资源上占有强大的优势;但是携程的产品流程需要进一步打磨,应该加大力度在提高交互体验上。
(2)对于美团来说,资源不及携程,但是专注于“普通预订”和“团购预订”这两大模块;复杂度不高,自然流程就相对清晰一些,页面也更简洁,用户体验较好。但是美团是对接了上游的供应商,商业模式相对中规中矩,缺乏创新。团购模式也很容易被复制。
(3)飞猪旅行酒店预订将阿里典型的C2C模式用到了酒店预订上,发挥了自身的优势,对于酒店预定来说也有别于传统的商业模式。而且飞猪酒店信用住的推广,贯穿阿里系产品的信用评级体系,这一亮点近期很难被同类产品复制。且飞猪旅行的用户体验做的更号,例如用户在点击至酒店详情页面时,只有飞猪会显示“还有几人也在浏览词酒店”;在筛选酒店时,只有飞猪会在页面底部显示筛选条件下共几家酒店,种种情况都说明飞猪的交互和体验做的更加细腻,细节处理更好,是三个APP中用户体验做的最好的一个。
本报告内容涉及的数据均来自与2015年比达咨询网站的统计数据。
“Z世代”青年旅行消费报告:出行首选高铁,最爱住民宿
同程旅行与中新经纬近日联合发布《“Z世代”青年在线旅行消费洞察报告2024》(下称《报告》),对“Z世代”青年群体(年龄介于14至27岁,截止2024年4月)的旅行消费行为进行了分析。《报告》认为,“Z世代”青年在旅行消费多元化方面正在发挥着越来越大的影响力,在一些细分领域正成为潮流的引领者,对旅行行业供需结构的变革发挥着越来越大的影响力。“Z世代”青年更加多元的消费需求正成为 旅游 供给“弹性化”、“碎片化”、“非标化”的重要推动力量。住宿消费领域的民宿、电竞酒店,休闲度假领域的深度游、“网红打卡地”等等,这些新消费潮流的兴起都离不开“Z世代”的贡献。
“Z世代”青年 出行消费新势力
首选高铁,最爱住民宿
《报告》中表明,“Z世代”青年在线出行在消费偏好、消费行为等方面具有一定的独特性。
长线出行大交通的选择方面,“Z世代”青年大致分出了两个偏好略有差异的年龄组,其中,14至21岁的“Z世代”青年人群首选的大交通方式是高铁(占比53.9%),这个年龄段的“Z世代”青年主要以各层次的在校学生为主,飞机是这个年龄组的第二大选择(占比42.9%)。22至27岁年龄组的第一选择是飞机(占比46.6%),第二选择为高铁(占比42.6%)。
住宿消费偏好方面,“Z世代”青年住宿消费首选是民宿(占比38.2%),第二选择是相对标准化的经济型酒店(占比34.2%),第三选择是星级酒店(占比20%),选择星级酒店和露营(含房车露营、帐篷露营等)的分别占比4%和3.1%。
与 社会 中坚的“Y世代”青年(28至41岁,截止2024年4月,下同)相比,“Z世代”青年明显更加偏好非标准住宿类型,尤其是选择民宿、露营等非标住宿的比例更高,其中,选择露营的比例是前者十倍左右。
在实际消费层面,“Z世代”青年是各种新生住宿业态的主力消费人群。18至27岁的“Z世代”青年在电竞酒店用户群中占比高达45.2%,是绝对消费主力。此外,“Z世代”青年还是剧本杀酒店、宠物酒店等住宿新业态的潮流引领者和核心消费人群。
多元度假消费的引领者
推动着 旅游 业态的创新发展
《报告》有关“Z世代”青年在度假消费偏好的数据显示,他们对主题公园的偏好程度远远高于其他类型的度假选择,其次他们对周边自驾游、综合性度假区、海洋馆、野生动物园、乡村游、博物馆、露营、徒步、骑行等也有相对较高的偏好度。
值得注意的是,处于未成年阶段的“Z世代”青年在度假消费方面虽然不具备消费选择权,但对家庭度假消费决策具有较大的影响力,他们是高年龄组亲子游消费的核心人群。另外,处于未成年阶段的“Z世代”青年也是中学阶段研学旅行的重要消费人群,这在一定程度上拉高了整个“Z世代”群体对博物馆、乡村农场等度假类型的偏好度。
最受“Z世代”青年青睐的20个国内 旅游 度假目的地依次为:北京、上海、重庆、海南、广东、江苏、云南、四川、新疆、青海、西藏、湖南、浙江、福建、山东、内蒙古、陕西、湖北、贵州、宁夏。
研究表明,大致有两类目的地相对更受“Z世代”青年的青睐,一类拥有丰富文旅资源,例如北京、上海等,另一类则是在互联网世界具有较高人气的“网红”目的地,例如重庆、四川、新疆、湖南等地。相关的研究显示,微信朋友圈、短视频平台(抖音、快手、视频号等)、新型KOC平台(小红书等)是“Z世代”青年获取 旅游 等消费资讯乃至购买相关产品的重要渠道,同时也是他们分享与表达自我的主阵地。“Z世代”青年的上述行为特征正在改变传统意义上的 旅游 目的地概念,也推动着 旅游 业态的创新发展,是多元化、碎片化度假消费的中坚力量。
如果有线索提供或服务咨询
可联系南都新文旅研究课题组。
发送邮箱:
线上酒店用户流失分析预警
本文是对某线上酒店用户流失预测分析项目的一个总结。
目录/分析思路:
01: 项目介绍
02:问题分析
03:数据探索
04:数据预处理
05:建模分析
06:用户画像分析
一、项目介绍
该项目是对某酒店预订网在一段时间内的客户预定信息数据进行分析,通过算法预测客户访问的转化结果,挖掘出影响用户流失的关键因素,并深入了解用户画像及行为偏好,从而更好地完善产品设计,进行个性化营销服务,以减少用户流失,提升用户体验。
二、问题分析
这个项目是问题诊断型,要解决的问题是关于用户流失的。在官方提供的字段和解释中,有一个label字段,这个是目标变量,也就是我们需要进行预测的值。label=1代表客户流失,label=0代表客户未流失,很显然这是个分类的预测问题。
我们的目标就是在预测准确率高的同时最大化召回率,从业务角度出发,也就是将更多原本可能会流失的客户最大概率地预测出来,以针对性进行挽留。因为通常来讲,获取新用户的成本比挽留老用户流失的成本要多得多。
三、数据探索
1、数据总体情况
本数据集合userlostprob_data.txt,为某酒店预订网2016年5月16至21日期间一周的访问数据。
本数据集总的数据共有689945行,51列,包含样本id,label以及49个变量特征。
考虑到保护用户隐私,该数据经过了数据脱敏处理,和实际的订单、浏览量、转化率有一些差距,但是并不影响问题的可解性。
2、数据指标梳理
观察数据集,里面的变量比较多。所以首先将数据字典中中文解释替换对应变量名,增强可读性,然后最好将指标进行梳理分类,然后逐个字段进行解析。
经过研究发现,指标大概可以分为三类:一类是订单相关的指标,如入住日期、订单数、取消率等;一类是与客户行为相关的指标,如星级偏好、用户偏好价格等;还有一类是与酒店相关的指标,如酒店评分均值、酒店评分人数、平均价格等。
3、相关特征描述性分析
3.1 访问日期和入住时间
入住人数和访问人数都在5月20日达到峰值,大概是“520”情人节的原因;5月21日之后入住人数大幅减少,后面的两个小波峰,表明周末会比平日人多一些。
3.2 访问时间段
可以观察到,凌晨3-5点是访问人数最少的时间段,因为大多数人这个时间都在睡觉;在晚上9-10点左右访问人数是最多的。
3.3 客户价值
“客户近1年价值”和“客户价值”两个特征非常相关,都可以用来表示客户的价值;可以看到,大部分客户的价值在0-100范围;有些客户价值高达600,后期需重点关注分析这类高价值客户。
3.4 消费能力指数
基本呈现正态分布,大部分人的消费能力在30附近。消费能力达到近100的人数也很多,说明在我们酒店的访问和入住客户中,存在不少高消费水平群体。
3.5 价格敏感指数
去掉极值,数据呈右偏分布,大部分客户对价格不是很敏感,不用太费心定价;针对价格敏感指数100的客户群体,可以采用打折的方式进行吸引。
3.6 入住酒店平均价格
大部分人选择酒店价格在1000以下,价格2000以上的酒店选择的人非常少;排除“土豪”,可以看到,消费者对酒店价格的选择,基本是一个正偏态的分布,大部分人会选择的平均价格在300元左右(大概是快捷酒店一类)。
3.7 用户年订单数
大部分用户的年订单数在40以下,同时,也存在部分频繁入住酒店的用户,需要重点维护;
3.8 订单取消率
用户一年内取消订单率最多的是100%和0,对于百分百取消订单的客户可以结合订单数了解一下原因。
3.9 一年内距离上次下单时长
可以观察出,预定间隔时间越长的人数是递减的,说明相当多的人订酒店还是比较频繁的;侧面反映出“熟客”会经常性地选择预定酒店,回头客较多。
3.10 会话ID
服务器分配给访问者的一个id,1为新的访客。
访问客户中老客户占大多数;老客的预定概率比新客的预定概率稍微高一点。
四、数据预处理
4.1 重复值处理
数据维度没有发生 变化,说明该数据集没有重复值。
4.2 生成衍生字段
基于对业务的理解,考虑到用户提前预定酒店时间这一特征可能会比较重要,将两个日期型特征转化生成一个新的特征,提高模型准确度和可解释性。
4.3 缺失值处理
查看缺失值情况
共51个字段,缺失字段:44个
缺失值处理思路及过程
查看特征分布情况:
查看所有数值型特征的分布情况,根据数据分布合理选用处理方法,包括异常值、缺失值处理,同时有助于深入了解用户行为。
共51个字段,缺失字段:44个,选择合适的方法进行缺失值处理:
缺失比例80%以上:1个,“近7天用户历史订单数”缺失88%,直接删除该字段。
趋于正态分布的字段,使用均值填充;右偏分布的字段,使用中位数填充。
检查缺失值填充情况
查看可知,缺失值数据已填充完毕。
4.4 异常值处理
极值处理:
(后面基于实际业务思考,盖帽法存在部分不合理,可能会过滤高价值用户,需要调整)
负值处理:
4.5 标准化处理
距离类模型需要提前进行数据标准化。
五、建模分析
首先拆分训练集和测试集
5.1 逻辑回归
[0.7366529216096935, 0.7016048745527705]
5.2 决策树
[0.8728884186420657, 0.8448881691422343]
5.3 随机森林
[0.8936581901455913, 0.9399374165108152]
5.4 朴素贝叶斯
[0.6224554131126394, 0.6610756921767458]
5.5 XGBOOST
[0.8886143098362913, 0.9383456626294802]
5.6 模型比较
画出ROC曲线
可以看到,朴素贝叶斯表现最差,逻辑回归的表现也不是很好,说明该数据不是线性可分的;随机森林和xgboost模型的表现差不多,二者的AUC得分都在0.9以上,分类效果很好,随机森林AUC值为0.94更高一点,固采用随机森林进行用户流失预测。
5.7 随机森林模型优化
交叉验证
学习曲线——取分类器为80
[0.9333570067179268, 0.97816699979759]
即根据这个随机森林模型召回率可以达到97.8%,流失客户预测准确率可以达到93.3%。
该模型可以直接上线用于用户流失预测。
5.8 影响客户流失的关键因素
用随机森林分析影响客户流失的因素:使用feature_importance方法,可以得到特征的重要性排序。
最重要的前10个特征:
年访问次数、一年内距上次访问时长、昨日访问当前城市同入住日期的app uv数、一年内距离上次下单时长、昨日提交当前城市同入住日期的app订单数、24小时内已访问酒店可订最低价均值、24小时内已访问酒店商务属性指数均值、24小时内已访问次数最多酒店可订最低价、24小时历史浏览次数最多酒店评分人数、客户价值 。
六、用户画像分析
接下来用K-Means聚类的方法将用户分为3类,观察不同类别客户的特征。
K-means聚类
可以看到,聚出来的3类用户有各自非常明显的特征,针对不对类用户的个性化营销建议:
0类为中等群体: 消费水平和客户价值都偏低,访问和预定频率较高,提前预定的时间是三类中最长的;花费非常多的时间进行浏览才能做出选择,比较谨慎,推测可能为出门旅行的用户。
建议:尽可能多地进行推送,因为此类客户通常比较喜欢浏览;多推荐价格相对实惠的酒店;推送当地旅游资讯,因为这类客户旅游出行的概率较大。
1类为低价值客户: 消费水平和客户价值极低,偏好价格较低,访问和预定频率很低; sid值很低,说明新客户居多。
建议:按照流失客户处理,不建议花费过多营销成本,不做特定渠道运营;推荐促销活动,价格折扣大的的低价酒店;新用户占比较大,潜在客户居多,可以维持服务推送。
2类为高价值客户: 消费水平高,客户价值大,追求高品质,价格敏感度高;登陆时间长,访问次数多,提前预定时间短,但退单次数较多。
建议:为客户提供更多差旅地酒店信息; 推荐口碑好、性价比高的商务连锁酒店房源吸引用户; 在非工作日的11点、17点等日间流量小高峰时段进行消息推送。
一些备注:
1、数据特征筛选时可以做相关性分析,因为可能某些特征之间存在高度相关,可以用相关性分析去掉和目标变量相关性小于0.01的变量,其他变量之间相关性高于0.9的可以删除,再利用主成份分析对指标进行降维整合,可能会使模型效果达到最好。
2、如果想对用户分类更加精细,可以使用RFM模型进行用户价值分析。但本项目特征包含信息较多,用RFM可能损失信息量比较大。