从数据仓库到商业智能,再到大数据和人工智能,各种数据技术已经在航司各个业务领域有了一定程度的实践和应用,而面对快速变化的行业现状和需求,这些技术是否可以更好的解决航司在数据治理、营销增强、决策辅助方面的难题,正成为航司这一阶段的主要探索和实践。一方面,在提直降代的行业大背景下,航司客户群体逐渐发生由to B转变为to C的改变,开始由to B转变为to C。另一方面,航司的营销预算有限,而流量红利消失殆尽,获取成本越来越高,对流量“精细化、场景化”运营管理成为大势所趋。而知识图谱技术是有能力通过融合各类数据,构建用户行为关系网,可以深入帮助航司动态预测用户潜在需求,节省营销及运营成本,提升收益,从而促进航司数字化转型。
国双航旅事业部总经理张桐先生
知识图谱将如何影响航司,又带来哪些变化呢?在8月29日的“AMC航空峰会分论坛”上,国双航旅事业部总经理张桐发表了主题为《知识驱动下的航旅数据应用》的演讲,详细介绍了国双在这一方面的探索。
知识图谱如何驱动航司数据应用?
知识图谱是利用节点和关系所组成的图谱,可以为真实世界的各个场景直观地建模。张桐表示:“简单说,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络。基于这个关系网络,我们就有了从“关系”的角度去分析问题的能力,精准洞察旅客出行的消费意图,从而助力航司业务发展。”
比如,最近《长安十二时辰》特别火,看了之后有些人特别想“去华山旅游”,基于这个意图,将衍生出机票购买、出行方式、酒店预订等各种需求,各种需求节点之间可能是顺承的关系、也有可能是因果的关系,各种关系网构成了航司对“去华山旅游”这一事件的认知,这种认知的沉淀就是知识,它可以指导航司业务发展,比如推出与华山相关的景区预订、返程机票预订、接送机服务等。
张桐提到:“知识图谱离我们并不遥远,已经大量在我们生活中落地。比如我们熟知的搜索引擎,当搜特价机票时会智能推送某家航空公司的打折机票;还有智能客服助手,可以智能推送天气情况及是否需要托运行李等;肯尼迪机场的空中流量管理等等,实际都运用了知识图谱技术。”
张桐还指出:“我们现在聊得知识图谱是传统知识图谱,也称为实体图谱,和事理图谱的结合使用,不仅能够解决‘who’‘ when’‘ what’‘ where’等静态的、变化缓慢的问题,还能运用事理过程去解决‘how’‘why’‘maybe’等动态的、需要预测的问题。” 这是因为不同于机器学习或者深度学习,知识图谱通过对数据的分析和应用,让机器具备了认知能力。它不仅有能力对当前情况、他人或者自身进行复杂的抽象和认知,而且有能力举一反三,对未来有预见性,可以做长期规划,还能进行想象,推理,抽象,假设。
航司如何构建知识图谱?
知识图谱通过融合数据科学家、行业专家的智慧和能力,全面挖掘企业的内部、外部和交互数据,形成一种基于知识体系的数据智能,然后运用各种算法模型进行分析,实现数据的落地应用,比如故障预警、原因探查、智能问答、智能推荐、产品设计、流程优化和自动营销等。在这一过程,数据科学家与行业专家之间还可以相互赋能,达成良性互动。
对航司具体来说,构建知识图谱的第一步就是数据的收集,航司可利用的内外部数据十分丰富,内部数据包括航班计划、运价管理、会员管理、GDS、呼叫中心、机务维修等,交互数据包括线上自营渠道的设备信息和事件点击数据、百度等各类广告数据,外部数据主要有文档、评论和攻略等;当航司完成数据收集之后,就可以自底向上展开数据处理,提取实体、事件、属性和关系等;然后借助行业专家和机器学习自上而下进行数据标注;再进行知识验证,完成知识的生成和更新,形成知识图谱的雏形;最后,利用机器学习完成知识推理,识别旅客意图,进行场景的落地,赋能航司业务发展。
张桐现场还举了一个形象的例子解释知识图谱的构建过程,他说:“假如,你告诉机器人你要吃土豆烧牛肉,机器人会很懵,不知道这是什么。而如果你输入土豆烧牛肉的菜谱,告诉他如何备菜、如何烧菜、怎么掌握火候,它就可以帮你搞定。知识图谱的构建过程就是菜谱的形成过程。”
在航司各领域,知识图谱的机会在哪?
目前,知识图谱已在工业互联网、金融、营销等行业有了大量的实践,在航旅领域,国双将重点发力两大领域:数据分析和营销。张桐表示,“国双希望通过整合航司多方数据,把人的信息动态关联起来,打造航司专属知识库,发挥数据聚合价值。在知识库加持下再往上延展,我们就可以做航司一直想做但没做的很多事情,比如移动端推荐引擎、产品打包整合等”。
数据分析领域
航司在数据分析领域可以基于实体图谱/事理图谱进行知识推理,通过层层剖析数据之间的关系,了解现象之后的真实原因,进而可以提高策略反馈的效率和实施效果。目前,国双已在线上运营和收益辅助方面有所尝试。
线上运营的知识库主要包括用户类型、功能、季节、来源、平台、时间、性能等七大模块,每一模块还包含多个细项。航司通过层层剖析,追根究底,可以帮助线上运营更通畅。比如,航司发现近一段时间官网查订比较低,那么就可以运用知识库查询近期的预订量和查询量发生了哪些变化,如果发现是预订量比低,那么是不是最近新用户比较多?如果是,是不是最近营销活动选择的渠道质量不太好?最终,根据数据和关系,层层推导出背后的原因。
收益辅助的知识库主要包含旅客因素、内部因素、外部因素、同业竞争、异业竞争及政治环境等六大方面数据。航司借助多方数据的联动聚合,可以见微知著,收益管理将更高效。事实上,经过国双研究发现,景点的搜索量、城市的人流、城市的搜索量、酒店的搜索量、重大活动、用户地理位置的变动等,都会对机票的预订量和票价产生影响。
营销领域
一个普通旅客的完整生命周期大概有28个节点,每一步都蕴藏着大量的销售旅行增值服务的机会。张桐表示:“我们可以基于知识图谱和深度学习,在这28个节点的动态事件基础上,结合用户群体和个体数据,动态地预测后续旅客的意图,构建航旅领域智慧大脑。”
具体来说,通过知识图谱,可以发现当一个旅客来到航司的直销渠道之后,70%的可能性是查询机票,15%的可能性是办理值机,5%的可能性是查询航班动态。在查询机票的人群中,75%的人群是单程查询,25%的人群是往返查询,最终各约15%和13%的人群实现机票的购买。购买机票之后,旅客会有去机场、值机选座、购买保险和预定酒店等需求,占比分别为40%、5%、1%和3%。基于这些可能性预测,航司可以更好地推荐相关产品和服务,提升转化率。
去年,国双就已帮助某航旅领域客户通过知识图谱预测用户的消费需求,建立聚类模型揭示客群数据中隐藏的规律,发现行为模式类似的其他客群;同时建立倾向性模型预测用户未来的行为,预测用户转化轨迹、购特卖商品或下单的可能性。通过国双航旅解决方案的应用,该用户的广告点击率(CTR)上升了162%,线上订单转化率直接上升202%。
国双知识图谱能力
作为当前人工智能研究的最前沿技术,国双早已将知识图谱中的关系抽取技术应用于多个业务场景中,如公安笔录数据中的伤害信息抽取、油气领域的知识抽取等,都取得了显著效果;学术层面,国双近期还一举获得CCKS 2019“人物关系抽取”大赛两项任务冠、亚军各一枚,该比赛由中国中文信息学会语言与知识计算专业委员会主办,是知识图谱技术领域相当权威的学术竞赛,充分验证了国双的知识图谱实力已达到国际标准和国内领先水平。
长期以来,航旅是国双重点布局的行业,作为中国领先的企业级大数据和人工智能解决方案提供商,国双研发了自主可控的产业人工智能平台,以AI科技助力中国企业数字化转型,赋能司法、油气、数字营销等领域用户提升质效,并希望将自身的技术积累和实践持续复用运用在航司等更多的业务场景,做些对行业有价值的事情。长期以来,航旅是国双在数字营销领域重点布局的行业之一,张桐也提到:“未来,国双希望能够聚焦航旅行业数据和知识体系,帮助航司更好的挖掘数据价值,能够协助航司建立真正由大数据平台支撑的行业知识库。我们也期待与更多航司在收益辅助管理、航班动态预测,甚至在机务层面一起探索,赋能行业发展。”