民航大数据:如何助力提升酒店需求预测研究

日常生活中,我们要对某件事情做出决策,总会考虑到多方面的因素。例如:我们想去心仪已久的餐厅享受一顿美食,出发之前,除了会考虑食材、服务、就餐环境等餐厅本身的因素之外,当天是否下雨、是否是节假日、抵达餐厅的路线是否会拥堵等其他因素也都会在某种程度上影响到我们的决策。世界是普遍联系的,舍恩伯格在《大数据时代》这部著作中,已经告诉了我们要更多关注事物之间的相关关系。大数据强调的4V (Volunm Velocity,Variety, Value),其中Variety-多样性,所阐述的本质就在于比以前维度更加丰富的数据。如今,我们有了更多的技术手段,将多种多样的决策参考因素(维度)进行量化,以便利用计算机的能力建模,实现更加精准的预测。

专家们已为我们指明了方向,行业应用的本领理应掌握在我们自己的手中。在业务研究中我们发现,民航大数据不仅仅与民航业本身的航空公司、机场等业务联系密切,对与民航相关的旅游产业上下游、大交通、城市管理,甚至是金融证券机构都存在着巨大的应用价值。无论是世界领先的GDS还是新型的创业公司,都在跨业应用上开发出了相关的应用。

鉴于以上发展趋势和想法,航指数与酒店大数据公司众荟(携程旗下拥有最全面的酒店在线预订数据的机构)进行合作,将民航数据(航指数)与酒店的预订数据结合起来,对酒店需求进行预测研究,收到了不错的效果。

1、相关性的验证

不难想到酒店入住和民航出行之间,应该存在着关联性,那么这种关联度如何呢?

看民航大数据如何助力提升酒店需求预测研究

图1.样本城市的民航历史出行指数和酒店入住数据之间的相关度

图1展示了民航历史出行指数和酒店入住数据之间的拟合度,用以测试两者相关性。其中计算数值越逼近于1则相关性越高。我们可以看出,以民航出行方式为主的旅游城市相关性要明显高于其他城市。

而对于相关性较弱城市的情况,我们通过特定算法将数据分解提取,民航数据一样可以与酒店数据结合起来提升预测精度。下面就以相关度比较低的北京为例验证这个观点:

看民航大数据如何助力提升酒店需求预测研究

图2.北京历史数据和趋势曲线

图2中的四条曲线由上到下依次是酒店入住量、民航成行指数、酒店入住趋势、民航成行指数趋势。图中显示了由具体数据到粗颗粒趋势因素的分解,分解后的趋势曲线使得北京对应的相关性由之前的0.13提高到了0.42。

2、民航对酒店预订的提前性

从常识角度出发,我们也基本可以判断,对于一次旅行经历来讲,民航的数据要优先于酒店数据的产生,我们将这种“天然的提前性”因素进行了量化分析。

看民航大数据如何助力提升酒店需求预测研究

看民航大数据如何助力提升酒店需求预测研究

图3.样本城市民航和酒店的20%和 80%平均提前天数对比

以图3为例,达到20%预订,民航的提前天数区间为[15,26]天,而酒店为[4,18]天。同样,想要达到80%的预订民航提前天数为[2,3]天,而酒店为[0,1]天。可以看出,客户群体对于航空工具的预订要普遍提前于对酒店的预订。

3、民航数据对酒店需求预测的提升能力

看民航大数据如何助力提升酒店需求预测研究

图4.使用深度神经网络的样本城市预测平均绝对误差对比

MAPE:Mean Absolute Percent Error平均绝对百分误差

合作中我们采用了深度神经网络模型分别以相关度高的三亚数据和相关度低的北京数据为样本进行了比对实验。结果表明,使用民航数据后,预测平均绝对百分误差下降10%左右。

上文中我们印证了民航数据与酒店需求的相关性、民航数据本身具有的天然提前性以及民航数据的可利用性。