美团点评运营数据产品化应用与实践

背景

美团点评作为全球最大的生活服务平台,承接超过千万的POI,服务于数量庞大的活跃用户。在海量数据的前提下,定位运营业务、准确找到需要数据的位置,并快速提供正确、一致、易读的数据就变得异常困难,这些困难主要体现在以下方面:

  • 取数门槛高,找不到切合的数据,口径复杂不易计算,对运营人员有一定的技能要求,人力成本增大;
  • 数据处理非常耗时,缺少底层离线数仓模型建设和预计算支撑,Ad-hoc平台查询缓慢;
  • 数据不一致,不同渠道口径不一致,缺少对杂乱指标的统一管理;
  • 数据反馈形式不友好,缺少数据可视化的形式,无法呈现趋势,继而影响业务人员对多维、降维、对比等情况的进一步分析操作。

因此团队提出将运营专题数据产品化,首先分析面临的一些问题和挑战。

挑战

① 服务业务能力

数据模式是需求驱动导向,这就导致数据最初只支持了少数团队,而更多有个性化需求的业务团队就无法被支持。

② 存储、计算、研发成本

没有统一的规范标准管理,造成了重复计算的资源浪费;数据的层次和粒度不清晰,使得重复存储严重;同时,工程师需要了解研发流程的整个细节,对研发的时间和精力成本造成浪费。

③ 数据标准不统一

业务指标繁杂,即使同样的命名,但定义口径也会不一致。例如,支付用户数就有多种定义,由此带来的问题是,都是支付用户数,应该用哪个?为什么数据都不一样?

④ 业务分析响应能力

即使拥有健壮的数仓模型支撑,但最终能否快速响应多维计算,进行对比分析,同时做到数据可读,都是对产品交互和服务能力的一种挑战。

针对以上的问题和挑战,开始制定建设方案。

方案

首先,构建了一个针对境内旅游运营侧全域的公共底层数据,将不同平台促销系统的数据按业务整合到一起,同时划分不同活动主题,按事件再向上聚合,做专题的数据支撑,统一数据出口。然后通过多维预计算引擎对事实数据进行预计算,构建数仓与应用的管道,从而节省计算成本,并且提升了数据互通和消费的效率,最后建设统一的数据服务中台,搭配不同端的Web应用。通过丰富的可视化效果,及多样的分析对比操作,快速、全面地支撑运营业务。

以下为整个产品的功能模块图:

图1 运营专题整体功能模块图

如图所示,运营专题数据的产品化,根据需要解决的问题划分了多个不同的层次,每一层除其需要面对的核心问题外,还有其领域内其它功能模块的抽象和扩展,下面将会按照层次划分逐一介绍各个模块。

数据仓库层

数据生产和消费的基础平台,是整个数据产品化过程中最核心的角色。数据仓库的模型建设,不但影响产品化的难易程度及可行性,更是数据一致性等关键问题的直接因素,所以为降低使用门槛、统一数据标准、支撑上层更合理的架构,模型的选取就变得尤为重要。

领域内常见的建模方法

① 3NF模型

3NF模型(又叫“范式模型”)是数据仓库之父Inmon提出的,它用实体加关系的数据模型描述业务架构,在范式理论上符合3NF,是站在全局角度面向主题的抽象。它更多的是面向数据的一致性治理。

3NF模型最基本的要素是实体、属性和关系:

  • 实体:相同特征和性质的属性抽象,用抽象的实体名和属性名集合共同刻画的逻辑实体;
  • 关系:实体之间的关系;
  • 属性:实体的某种特性,一般实体具有多个属性。

② 维度模型

维度模型是Kimball提出的。维度模型多为分析和决策提供服务,因此它重点解决快速完成分析,同时提供大规模复杂查询的响

编辑于 2018-02-08 20:35