民航旅客座位偏好建模与应用研究
1引言
1.1研究背景
如何从海量信息中挖掘出有价值的信息从而更好地服务于用户变得越来越迫切,同时也具有很大的挑战性,因此能够为用户提供更优质服务的强烈推荐系统应运而生。强烈推荐系统与传统的信息过滤技术不同,同时与搜索引擎之间存在一定区别,不仅不需要用户主动地输入用于搜索的关键词,而且可以通过分析研究用户的历史行为,进行个性化计算,挖掘用户的潜在兴趣偏好,主动为用户进行个性化的强烈推荐。因此,强烈推荐系统不但可以为用户提供针对性服务,而且可以和用户建立密切互动,让强烈推荐慢慢地成为用户的习惯。
电子商务等领域已经广泛地应用个性化强烈推荐系统,为用户带来优质服务的同时并获得了丰硕的商业利润。民航领域同样存在着个性化强烈推荐问题,民航领域下旅客座位偏好建模问题就是十分有意义且有应用价值的研究问题之一。在经济全球化、航空联盟化的趋势下,民航客运面临着激烈的竞争,民航企业千方百计地提高运营效率、降低运营成本、优化客户关系,从而提高自身的行业竞争力。对于民航企业来说,提升对旅客的理解,进而给旅客提供针对性的个性化服务成为其客户关系管理的一项重要举措;尤其是,根据旅客的偏好给航班上的旅客预分配座位、提升绝大部分旅客的出行满意度,成为航空公司竞相追求的目标。
中国民航网络信息股份有限公司在2021年启动了新一代座位管理子系统项目建设,将为航空公司提供集中式的座位管理功能,实现全流程的座位服务。新一代座位管理子系统的核心业务价值,是在目前航空业能者得优;的商业模式中,为高价值旅客提供个性化品质化的座位选择服务。现存民航航班业务场景中座位分配算法简易,座位无差异分配,没有很好的考虑旅客个体偏好和旅客间社会关系对旅客选择座位产生的影响,因而不能很好的提供个性化、差异化的服务。
民航旅客座位偏好建模研究致力于研究和解决航班中基于旅客个体和关系的座位偏好的差异化分配问题,达到旅客和航空公司双赢的目的。一方面,通过识别旅客个体及关系的偏好,满足旅客座位的个性化需求;另一方面,按照航空公司的战略合理地分配座位,提高座位附加收益。
1.2研究目的与意义
本文研究的主要目的是从民航旅客的历史出行记录中挖掘出旅客个体对座位属性的偏好及旅客关系对座位位置关系的偏好,并将其应用于座位分配算法,为旅客强烈推荐满意的座位。民航旅客座位偏好模型研究不仅具有一定的理论意义,可以为相关类似研究提供参考方法,促进偏好建模方向的研究,而且具有很强的应用意义,主要体现在以下几个方面:
(1)提高民航旅客服务质量
现存航空公司座位分配业务不能很好地利用旅客的偏好信息为不同层次的旅客提供区别、个性化的服务,暴露出一定的局限性。利用挖掘出的民航旅客对座位的偏好信息,可以服务于航空公司的座位分配过程,从而提高座位分配中的服务主动性,提高给民航旅客服务的品质和质量,提升旅客值机满意度。民航领域是服务型行业之一,在服务型行业中,用户是上帝。只有为用户提供越来越优质的服务,才能真正获得用户的认同,间接地促进自身的发展与壮大。
(2)提高值机效率
目前,人工值机仍旧是国内机场的主流值机方式。利用挖掘出的民航旅客对座位的偏好信息,通过民航航班旅客座位预分配算法,以新的技术手段为支撑,通过多渠道的值机结果主动强烈推荐,总体上提高网上值机、自动柜员、人工柜员等手段的旅客值机效率,减少空港现场柜台排队量,降低人工柜员工作强度,提高机场总体服务效率,给旅客带来便利,为航空公司节约成本。
(3)提高航空公司竞争力及效益
市场份额竞争的核心是客户资源的竞争,因此,各大航空公司对旅客数据的分析具有极高的热情,都期望能够通过提供良好的服务、优质而有吸引力的产品获得更多的市场份额,提升公司的效益。通过分析高价值旅客对座位的偏好信息,满足航空公司业务战略差异性和竞争性布局需求,提高座位分配过程的合理性、可控性和智能性,一定程度上可提高航空公司的竞争力,同时提高座位附加效益,航空公司进行收益管理的有效措施之一。
2相关理论基础
这一章主要介绍本文研究涉及的相关理论知识,为本文的研究奠定一些的理论基础,主要包括社会网络概述、用户偏好建模方法概述、相似性计算方法概述和强烈推荐系统评价指标概述。下面首先介绍社会网络概述。
2.1社会网络概述
社会网络是一种基于网络(互相连接的节点)而不是群体(边界和秩序较明确)的社会组织形式,也是西方社会学从二十世纪六十年代兴起的一种剖析角度。随着新通讯技术的盛行和工业化的进行,社会越来越向网络化发展,并发生社会网络革命,对新世纪的人类社会产生革命般重大影响。社会网络理论知识是本文进行研究的基础,下面简易介绍下社会网络相关的知识,为本文的研究做理论储备。
(1)社会网络基本概念
社会网络是指社会个体之间由于社会活动行为互动形成的比较稳定的一种关系体系。社会网络尤其关注人们之间的互动联系,社会活动行为产生互动,互动反过来也会对人们的社会活动产生影响。社会网络是由节点和边构成的一种社会结构。节点通常指个人或者组织,节点属性描述个体的自身信息;边代表各种社会关系,例如朋友关系、同学关系、合著关系等,边属性描述社会关系具有的信息。社会网络将社会生活中单独的个人以社会关系的形式紧密地联系起来,最终形成一个相对稳定的网络体系。
对社会网络进行分析,能够发现很多有意义且有价值的信息,服务于人类社会,对人类社会生活产生重要影响。社会网络分析在社会学研究中发展比较成熟稳重,有很长的历史。早期的社会网络研究往往热衷于政治意味浓厚、相对沉重的社会话题,如劳工命运、妇女权益等。前期的研究具有一些普遍的弊端:第一大部分网络规模比较小;其次是构建网络包含了较多主观因素,比如人为定义朋友的概念;此外,构建网络的数据往往不完整,导致某些结论不具有可信度。近年来,随着海量数据存储技术的发展及计算机自身计算能力的提高,社会网络的研究的发展趋势趋向于大规模化、精确化和定量化。
社会网络的分析包括对节点的分析和对关系的分析两类。对节点的研究,有助于学者更完善的了解节点的信息,从而了解整个网络的信息。在分析社会网络时,需要考虑节点对网络的影响。节点分析方法也适用于网络分析。实际上,一些研究学者都是从节点的分析方法中获得对网络研究分析的灵感。节点分析方法,是社会网络分析的主流之一。关系分析时,研究学者倾向于分析网络关系的关系类型和关系强度。社会网络中关系的类型有很多种,比如合作关系、朋友关系、信息传递关系、通信关系、社会接触关系等等。社会网络中的关系也具有不同的强度,关系的强度代表着关系的强弱。一般我们用数值表征社会网络关系上的强度,数值越大,关系越强。
2.2强烈推荐系统评价指标概述
评价强烈推荐算法最简易最直接的指标就是强烈推荐的准确率,它用来衡量强烈推荐算法在多大程度能够给用户强烈推荐符合用户偏好的产品。下面主要介绍两类指标,一类是预测用户评分的准确性指标,用来衡量用户对商品的预测评分与真实评分的接近度;另一类是衡量分类结果准确性指标。
(1)预测准确率
该类指标主要计算用户实际打分和算法预测得分的接近程度。在需要给出预测评分的强烈推荐系统中,该指标具有重要的作用。例如,MovieLens的电影强烈推荐系统会用打几颗星的方式预测用户对电影的评分。然而,即使一个强烈推荐系统能够较准确的预测出用户对产品的偏好次序,它在预测准确度上的表现可能达不到要求。所以很多强烈推荐系统给用户提供强烈推荐列表而没有给出预测得分。
本章主要介绍本文研究相关的一些理论基础。首先介绍了社会网络相关部分知识,主要介绍内容有:社会网络基本概念、社会网络具有的一些特性(包括小世界效应、无标度特性、局部结构、节点和链路的中心性以及群落结构)和一些基本的网络模型分类(简要介绍了规则网络、随机网络、小世界网络和无标度网络)。接着介绍了研究学者常用的一些用户偏好建模方法,如线性模型、基于tfidf模型、概率模型和显式决策模型。然后对常用的一些相似性计算方法进行了概述,主要包括欧式距离、余弦相似度、修正余弦相似度、Pearson相关系数和accard相关系数。最后,详细介绍了预测准确率和分类准确率两类常用的强烈推荐系统评价指标。
3基于社会网络的旅客偏好建模及应用.......24
3.1基本定义.......24
3.2构建旅客共同出行网络.....26
4实验结果及分析.......36
4.1实验数据集.......36
5结论.............47
5.1工作总结.......47
4实验结果及分析
这一章我们主要介绍针对旅客偏好模型和座位分配算法进行的一些实验及对实验结果进行了详细的分析。此外,还介绍了实验参数的选择过程。在民航真实数据集上的实验验证了我们提出的旅客偏好模型的合理性。
4.1实验数据集
中国民航网络信息股份有限公司为我们提供了一个加密的民航PNR数据集。该数据集中包含了若干旅客在2021-2021年的历史出行记录。记录中包括航班号、出发地、目的地、出发时间、值机序号以及座位号等。由于出行记录信息涉及到旅客个人隐私,因此所有这些数据均已通过某种编码方式进行了不可逆加密。我们将基于这一数据集进行旅客偏好模型及座位分配算法的实验。
4.2实验参数选择
4.2.1可达性的计算
旅客个体偏好模型中我们将某个座位属性的可达性定义(如公式(3-2))为数据集中全部旅客对该属性at的平均偏好。我们通过实验统计了不同旅客集合靠窗比例、靠过道比例平均值如表4-1所示。
从表中可以看出全部旅客、随机采样旅客、乘机次数较多的旅客的靠窗平均值、靠过道平均值相差不大。为了减少计算的复杂度,我们利用随机采样的旅客集合计算座位不同属性的可达性。
5结论
本章全面总结了本文的研究工作,概述了本文提出的旅客偏好模型、实验结果以及通过实验得出的结论。并指出了下一步的研究方向,为今后的研究工作提供了改进的思路。
5.1工作总结
在经济全球化、航空联盟化的趋势下,民航客运面临着激烈的竞争,民航企业千方百计地提高运营效率、降低运营成本、优化客户关系,从而提高自身的行业竞争力。对于民航企业来说,提升对旅客的理解,进而给旅客提供个性化服务成为其客户关系管理的一项重要举措;特殊地,根据旅客的偏好给航班上的旅客分配座位、提升绝大部分旅客的出行满意度,成为航空公司竞相追求的目标。
基于这一背景,本文主要分析了民航旅客座位偏好建模的问题,并在真实民航社会网络的数据上进行验证与分析,现总结下本文主要的工作:
(1)首先,本文较深入地研究了用户偏好建模方法、社会网络方法、强烈推荐系统中相似度计算方法等。为本文的研究工作奠定了良好的理论基础。
(2)利用旅客历史出行记录构建旅客共同出行网络,为构建旅客座位偏好模型奠定从社会网络视角研究的基础。
(3)结合现实生活,旅客出行时,不仅会考虑自身对座位的偏好,也会考虑同行的旅客距离自己的远近。提出综合考虑旅客个体偏好和旅客关系的座位偏好模型。旅客个体偏好模型基于资源的有限性,能够准确地表示旅客的个体偏好。旅客关系偏好模型从旅客历史乘行记录中推导出社会关系,探索了旅客座位间的距离与亲密程度的一种关系,能够描述旅客关系对座位位置的偏好程度。最后,我们釆用线性加权的方式将旅客个体偏好和旅客关系偏好结合起来。
(4)在民航领域的一个真实数据集上进行了旅客偏好模型和座位分配算法的一系列实验,并对实验结果进行了深入的分析与验证。
参考文献(略)