数据中台产品体系(数据中台产品规划)

数据中心上一篇实战文章讲了《数据中台实战(七):流量分析》。这一次,如何搭建一个可以支持N条产品线的标签平台。
为什么要搭建标签平台?亚马逊的CEO杰夫贝索斯曾经说过他的梦想,“如果我有一百万个用户,我会做一百万个不同的网站!」。
当然,现在亚马逊、淘宝等大型电商都实现了他的梦想,也就是我们常说的千人个性化推荐系统。
那么如何做到千人千面呢?这个基础就是先给用户贴标签。
为什么要给用户贴标签?
主要原因是让我们更了解我们的用户。他是谁?他在哪里?他用什么设备?他使用了什么服务?他的使用习惯是什么?他的偏好是什么?
当我们更了解我们的用户时,我们就能知道他们的痛点,我们就知道应该向他们推荐什么产品,他们购买的概率就会更高。
那么什么公司适合搭建标签平台呢?
一些小的创业公司不适合。现在的产品和运营都是关于住户的画像,用户标签和PPT上贴满标签的标签云画像。真正的标签平台是一个庞大的工程,需要大量的开发资源,仅仅是标签体系的建立。N个角色(数据开发工程师、数据挖掘工程师、前端工程师、后端工程师、产品经理、模型设计师)参与至少需要2-3个月,加上需要的调研时间。后期的一些深度功能,比如标签圈选择,人群画像等。也是很大的数量。
所以标签平台的建立需要大量的工作,大量的资源,前期无法得到快速的回报,这是一个大致正确的方向。创业初期或者小公司,还是不建议用户量少的公司做标签平台。当公司有了一定规模,用户数量有了一定基础,数据有了积累,再投入资源做一个标签平台也不迟。
搭建标签平台必须面对的几个问题?应该如何搭建标签平台?
如上所述,当你有了一定的用户基础和数据基础,就适合搭建标签平台。这个时候,就会出现一个问题。公司发展到这样一个搭建标签平台的阶段,一定是多产品线、多角色、数据高度分散的局面。
那么如何统一这些产品线的标签呢?
比如作者工作的公司有N条产品线,我们想打通服装批发行业的上下游。我们都是从生产端的服装印花服务到线上销售平台,再到供应链服务平台、金融服务平台等产业上下游的运营。
当我们建立标签平台时,我们遇到了以下挑战:
每个系统都会产生大量的数据,如何给这些数据贴标签?出版服务、电子商务服务、供应链服务和金融服务的客户群体完全不同。这些形形色色的角色如何进入标签平台?作为我们的电商产品,只有用户标签是不够的。商品作为电子商务系统中一个非常重要的存在,不得不分门别类的标注。那么我们如何区分用户标签和商品标签,甚至是供应商标签呢?公司所有的产品线运营都会使用一个CRM系统,所有的客户都会先去CRM系统做潜在客户,然后成为各个业务系统的成员统一进入业务系统。这就带来了一个问题,如何从注册用户中划分潜在客户?带着这些问题,我们团队已经规划了半个月左右的解决方案。
如何根据各业务线的数据给用户贴标签?首先,我们有平台的概念。用户注册后统一进入用户中心,入库时会打上注册平台的logo。这里做了一层区分。后来我们发现这并不能解决一个用户同时使用两个平台服务的问题,因为我们的用户中心是建立在手机号重复数据的基础上的。如果只拿一个平台的用户来说,我们无法给同时使用我们电商产品和我们物流快递产品的用户贴标签。
此时,我们已经扩大了给每个产品线贴标签的用户范围。举个例子,比如电商产品的用户定义是把平台当成电商产品,但是平台是非电商产品的用户,登录电商产品,也会抓取,并做相应的标签。这样,当我们看用户的标签时,可以看到这些用户同时拥有两条产品线的标签。
至于如何给各个业务线的数据贴标签,我们的想法是让它可配置。各产品线的运营可以在其业务线下建立各种标签,丰富用户的信息。至于如何实现可配置性,下面我将结合电子商务RFM的实际案例来说明标签系统的构建。
如何确定用户的角色?首先,我们针对不同的客户群体做了一层抽象。首先,他们都是人,我们称之为需求方和供给方。比如,电商产品的买家是需求方,供应商是供应方,快递物流产品的商家(需要快递或物流的商家)称为采购方,顺丰、德邦等物流快递提供商称为供应方,印刷产品的设计师是需求方,生产服装的工厂是供应方,这样就完成了一个抽象。
接下来要做的就是划分各个业务线的运营,他们的业务线有哪些角色,如何给他们产品线的人贴上角色的标签,这也倒逼我们的业务线统一目标用户的标准。很多公司都有这样的情况,大家大概都知道自己目标用户的大致长相,但是每个人描述自己目标用户的长相时,就完全不一样了。这是为什么呢?因为没有统一的标准。
比如电商产品,我们制定了一套操作的标准:一群买家,两群买家,普通终端店,C端消费者。我们对用户的类型做了详细的描述,比如他的商品价格,开店数量等。我们会根据用户填写的信息自动给这个买家一个身份。
当你抽象成一个人的时候,被埋没的数据也可以用。我们对每个产品线都做了数据掩埋。这些埋点收集了用户的潜在信息,如地理位置、设备信息等。我们把它作为基本属性放入标签系统。
用户标签和商品标签的问题我们为标签定义了一种类型。在生成标签时,我们预定义了用户标签和商品标签,每个标签必须选择一种类型。类似于用户标签,商品有一些基本属性,比如颜色、尺码、面料等。这些基本属性称为基本标签。用户的基本标签直接从用户属性字段和嵌入数据中获取,商品的基本标签直接从商品属性字段中获取。
如何区分潜在客户和注册会员?我们加了一个标签,不管是不是潜在客户。进入CRM系统的用户和不在用户中心的用户都被视为潜在客户。CRM对潜在客户有一套标签,也是漏斗关系。从销售线索、商机识别、商务谈判、签约订单,我们将直接从CRM系统中获取这些用户的状态,并标记潜在客户的状态。
如何搭建一个可以支持N条产品线的标签平台,让我们的标签平台目标明确:
我们的标签平台应该能够支持N个产品线,N个角色的标签化。如果一个用户在N个产品中产生了一个行为记录,要通过标签写下来,你可以看到用户在N个产品线中做的标签。每个产品都可以定义自己的个性化标签。标签应该支持注册用户的标签,以及潜在客户的标签。基于这一目标,我们的标签平台规划了以下四大功能:
从标签的产生到标签厂的人的圈子选择的整个过程如下:
准备数据宽表对于电商产品,你需要一个买家宽表,一个商品宽表,一个供应商宽表。事实上,宽表是单个用户(买方、供应商)和商品指标的集合。我们尽力将所有指标收集到一个表中,以便于生成下一个标签。
用户广列表包含用户的基本信息、行为信息和业务指标等。用户的基本信息包括用户自己填写的手机号、姓名、性别、注册时间、用户的角色信息、平台信息等信息,用户的行为信息包括通过埋站点获得的信息,如用户的设备信息、地理位置、用户的访问时间、追加购买次数、收藏次数和上次访问时间,以及用户的经营信息。
广义的商品列表包括商品的基本信息和商品的业务信息。在电商产品中,产品的基本信息包括产品上架时填写的一些信息,如ID、名称、类别、颜色、尺寸等。商品的业务信息包括订单金额、付款金额、追加购买金额、追加购买次数等业务指标。
创建一个标签系统。使用宽表中的数据,您可以创建标签系统,并将标签工厂制作的标签分类到标签系统中。
首先看一下标签系统是什么。标签系统的结构大致如下:
标签系统一般是多层的,每个产品线的基本信息和一级标签都由数据中心管理。我们以用户端的标签为例。无论用户是购买端还是供应端,他首先是一个人,然后我们提取了这个人的基本信息,包括:
平台信息:使用我们产品线的服务将被标记为该平台。用户类型:采购商或供应商,如果是,他是什么样的角色;如果是供给侧,他是一个什么样的角色?潜艇:他是不是潜艇,如果是,现在是什么状态。地理位置:通过埋葬地点收集的信息,他所在的城市和省份。设备:通过埋点收集的信息包括浏览器版本、设备版本、系统版本等信息。一般来说,每个产品线的第一级业务标签都是由数据中心预先定义的。比如我们有电商产品线,印刷产品线,供应链产品线。然后我们的第一层次是电商服务,印刷服务,供应链服务。每个产品线都可以定义以下特定标签。
为什么要建立标签制度?
一方面,公司所有产品线都使用这个系统,有统一的标准,降低沟通成本。另一方面,通过这个标签系统,我们可以全局地看到公司使用了哪些标签,甚至哪些用户使用了我们的服务,哪些用户有多个角色。这也是数据中心如何访问公司数据的一种体现。
接下来,定义业务标签。首先,选择平台。平台是在查看用户标签时,给操作分配不同的权限。比如产品线A的操作看不到产品线b的标签。
接下来就是选择维度,用户维度的标签还是商品维度的标签,这就决定了数据源的选择,也就是前面说的宽表的选择。
然后下一步就是选择一级标签和二级标签将新标签放入标签系统,这样所有的标签都可以在我们的标签系统中看到。
以下是核心定义标签。例如,如果我们要标记产品线A的新用户,则根据他们的注册天数来定义新用户。我们可以利用这个规则筛选出那些应该被贴上新用户标签的用户。
下一步是标签的定义。可以选择用户宽表或商品宽表的指标,进行等于、大于、小于等简单运算,完成标签的定义。
人群圈子选择一般来说,营销活动会针对特定人群,人群其实就是标签的组合。我们做了一个人群圈选择这样的功能。人群圈子选择有三种方式:第一种是基于用户客观标签的圈子选择,第二种是基于用户行为的圈子选择,第三种是基于用户主观标签的圈子选择。
先说基于用户客观标签的圈子选择。比如我们要给广州的新用户一个优惠,刺激他们下单,那么这里的广州新用户就有了两个标签组成的用户群。然后,我们先在标签工厂定义用户在广州的标签,即用户的城市是广州,其次是新用户,比如7天内注册的用户。那么接下来就是做好运营,广州用户注册时间在7天以内。我们的用户圈选择功能支持、或的简单操作,需要选择计算频率,是每天计算一次还是只计算一次。
我们对这项任务有一个固定的规则。我们想给所有在广州注册的新用户发短信提醒领取优惠券,可以选择每天计算一次。如果我们的推送平台满足每天定时给这些用户发送触控任务的要求,那么我们就完全自动化了。如果选择只计算一次,那么这个计算任务就执行一次,计算一次就固定了这群人。然后,过几天检查一下这个人群或者第一次计算的人群,方便跟踪活动效果。比如7天前,圈一群人做一个活动,然后7天后,把这些人拿出来,看他们指标的变化。
还有一种是基于用户行为的圈子选择,是基于嵌入数据的。用户行为分为浏览和点击。我们需要根据每天掩埋的数据来计算当天哪些页面和按钮可用。你浏览什么网页?电商产品有几个页面:首页、产品列表页、产品详情页、购买页、订单页、支付页。有哪些关键按钮?有:领取、追加购买、订购、支付。另外,因为我们的埋置数据是端到端收集的,所以我们也可以端到端过滤掉浏览和点击事件。
举个例子,我们想做一个H5的活动,活动中需要实时监控访问我们H5的人,H5上的按键都是那些人点的,活动一般都很短,所以需要把访问活动页面点击购买多但没有准实时下单的人圈出来。
然后,我们的第一个条件是访问H5页面的人,第二个条件是他点击了添加按钮,第三个条件是没有下单的人。一般来说,基于用户行为的标签只计算一次,是客观的标签。就这样,我们把参加这个活动但没有下单的人圈了出来。我们来研究一下为什么他们没有?对于那些价格敏感的客户,用全渠道营销平台推送一条短信,送一张优惠券来刺激。也许这个用户会下单。
当然也可以两者结合。比如我们想圈出性别为男,累计消费3000元,2019年11月21日登录点击过某个按钮的用户。
另一种选圈方式是基于主观人群。这个一般用于运营或者一线销售。他们在电话回访或上门拜访后得到的一些关键信息,可以以标签的形式记录在这个用户身上。还有一种针对人群的主观使用场景,就是运营中会有大量的用户或者商品。比如在发放优惠券的时候,你可以根据标签来发送,而不是一个一个的选择,这样你就可以给给你发优惠券的用户贴上一个主观的标签,在优惠券发放系统中选择这个标签来代替这些用户来发放优惠券。
我们设计了两个函数。第一个是我们可以任意选择单个用户来标注主观人群。该功能一般需要提供外部接口连接其他一线业务人员的系统,直接标注到数据中心标签平台。另一个功能是针对大众用户的。我们可以通过导入手机号,批量给用户贴上主观人群的标签。
无论哪种方式,都可以圈一群人,最后选出的用户如下图所示。
我们可以查看每个用户组每天统计的用户数量,也可以查看具体的用户。人群圈子选择功能一般与其他平台连接,对外一般提供以下接口:
按组名查看用户或商品列表;当用户或商品查询属于人群时。至于只计算一次的主观标签和客观标签,随着时间的增加,会产生越来越多的标签,会非常混乱,增加很多存储成本。有些标签可能n年前就被贴上了,现在已经没有用了。
举个简单的例子,我们常用的一种标签是高意向用户的复购。比如半年前我们圈了这些用户,所以这个复购高意向标签就打到了这些用户。可能这个用户已经流失了,或者现在不是复购高意向用户。
那么,我们就要想办法处理回购意向高的标签了。这里我提供三种方案:
要为每个用户的标签添加一个有效的属性,需要编写一个定时计算任务,每天检查用户标签的有效性。如果此标签在计算时有效,它将被标记为有效标签。如果标签在计算时不适用,将被标记为无效标签。然后,当我们从前端获取数据时,我们将只获取有效的标签。这个方案的问题是我们无法判断主观标签的有效性,因为主观标签没有规则。给每个标签赋予一个属性,启用和禁用,当操作认为没用的时候禁用。一旦禁用,我们会显示未禁用的标签,只显示打开的标签,让操作中的同事看到所有他们认为有效的标签。这个方案的问题是增加了操作的工作量。后期标签多的时候,工作量会比较大。选择一个到期日期,如45天,此时操作会造成拥挤。当这个标签在45天后过期,前端只显示用户的未过期标签。这种方法对于拥有大量数据的公司来说是很有必要的,比如百度,每天都有几十万甚至上百万人在使用他们的DMP人群选择功能,所以每天都会产生大量的数据,有效期还是很有必要的,这样会减少很多存储成本。
用户画像被标注后,接下来就可以应用用户画像了。用户画像分为个人用户画像和群体用户画像。
用户的个人肖像
先说个人用户的画像。这在为客户服务、销售或运营检查主要客户的信息时使用。用户的个人画像应该收集用户的所有信息。当我们更了解这个人的时候,我们会更容易刺激他购买。
个人肖像的内容分为几个部分:
用户的基本信息,他是谁,他在哪里,他使用什么设备,他的一些关键数据指标是什么,比如RFM的属性。用户的商业信息,例如电子商务产品、他的购买信息、收藏信息、优惠券信息、订单信息等。可以在这里给出他的详细数据,比如什么时候购买附加产品,什么时候购买附加产品,什么时候购买附加产品。当然,信息越详细越好。用户的标签信息,标签分为主观标签和客观标签,可以分别显示。下一步是按产品线显示每个产品线的标签。如果一个用户同时使用产品线A和产品线B,那么我们一眼就能看出用户在产品线A和产品线B都有标签,如果用户只使用产品线A,在产品线B看不到标签,用户的行为信息,这里用的是埋点数据。收集到的用户埋藏点信息可以以对话的形式拆分,以时间轴的方式显示。通过这个时间线,我们可以清楚的看到用户在什么时候做了什么动作,主要包括浏览和点击。如果更进一步,还可以输出用户浏览的细节。比如用户浏览产品详情页,是哪个产品?比如用户点击添加按钮,是哪个按钮?数据越详细,越方便分析操作。用户偏好信息,这里有很多内容,比如我们可以根据推荐算法计算出用户偏好的品类,以及未来可能购买的物品。您还可以根据隐藏的数据查看用户的访问偏好。用户总是在那个时间段来使用我们的产品。还可以看看用户搜索到的所有内容,把关键词汇总成一层。搜索内容可以直接显示用户的偏好。集体肖像
接下来,我们来说说集体照。当用户圈子选定后,简单分析就能形成群体画像。可以从用户类型(买家、供应商、未知身份等)等基本信息做一个透视。)、设备信息(IOS、Android、Windows)、地理位置(省、市)等。让你大致知道这群人是什么类型,用什么设备,在哪里使用我们的服务。
也可以选择两组人的对比,进行对比分析。目标人群是指本次分析的目标人群,即基于该目标人群计算画像;参考人群是指计算目标人群TGI的比较人群。
TGI的计算逻辑是:目标人群中有这个标签的人的比例,除以基准人群中有这个标签的人的比例,借助算法模型,通过性别、年龄、城市级别的三维交叉细分,可以找到目标人群最典型的影像特征。典型是指在一定比例基础上与参考人群相比TGI最高的特征。
标签平台实际案例接下来,我们以运营中经常用到的RFM模型为实际案例,介绍如何使用标签平台。
什么是RFM?
R(Recency):用户最后一次交易时间的间隔。f(频率):用户最近一段时间内的交易次数。M (money):用户最近一段时间的交易量。根据这些数据指标可以将用户分为8类。
我们的资源是有限的,必须把更多的资源给高价值的用户,我们会先满足他们的需求,再考虑其他用户;低价值用户不要浪费太多资源,差异化运营体现在这里。
RFM的最终目标是根据消费频率、金额和上次消费后的天数将用户分为8类。例如,重要价值客户的条件定义为R10天(最近一次消费与今天的距离小于10天)、F5次(消费次数大于5次)、M20000元(累计消费金额大于20000元)。
由于各产品线的重要值用户条件不同,需要分析数据分布来确定最终阈值(划分标准一般采用2/8或平均值的原则)。
你是怎么圈出各个平台的重要价值用户的?
其实你会发现,这些条件中有一个规律。r其实是用户的一个指标。可以计算出从今天最后一次消费算起的天数。R10其实就是一个标签,很多人都会符合这个条件。重要值用户的条件是R10和F5和M20000,属于一群人。
第一步是准备数据源。
r是距离今天最后一次消费的天数,F是消费频率,M是消费金额。这三个指标要计算出来,放到一个宽表里。这个可以交给一个数据工程师去开发,以后每个新用户的指标都要放到宽表里。
可以在这里添加一个申请流程,这样每次运营要添加新的标签,数据中心需要制定相关指标时,就需要填写指标的业务口径。我们的数据工程师根据技术口径计算指标。
数据准备完成后,下一步就是生成这些标签比如R10天。
考虑到每个产品线的RFM标签是不同的,我们希望使其可配置。
首先选择平台,在标签系统中选择一级标签产品线A和二级标签产品价值,三级标签可以给一个名字比如:从上次消费到今天的天数。接下来,您可以在宽表中选择字段R。选择字段后,您可以执行一些常规操作。我们的运算符支持简单的大于、小于、等于和不等于。这个重要价值客户需要的标签是R10,所以只要选择生成标签,点击确定就会发现标签系统中多了一个标签,产品线A-用户价值-上次消费到今天的天数-R10,这样就生成了一个标签。
标签生成后,标签平台会启动底层计算逻辑。一般对于用户属性的标签,我们采用离线计算,每晚计算一次。每天晚上系统都会找到符合条件的用户,用R10进行标注,这样标签系统显示的统计,只需要查询有多少人属于R10就可以得到数据。
标签生成后,仅仅筛选出重要价值客户是不够的,还需要几个标签的组合来配置重要价值客户,这就是所谓的人群圈层选择。按照相同的过程,配置两个标签F5和M20000。
进入我们的人群圈选择模块,选择平台和维度。维度就是用户或者商品。RFM是针对用户的,所以我们选择用户维度。接下来,您可以在标签系统中选择标签R10。我们支持简单的and和OR运算,支持括号内的运算,避免运算过程中的歧义。
那么,重要价值客户的表述就是(R10和F5和M20000)。基于这个条件,我们可以快速设置我们的人群选择条件如下:
至此,基于多产品线的标签平台已经完成。
平台通过标签系统,一方面打通了单个产品线的用户行为数据和用户业务数据,另一方面打通了各个产品线之间的数据,可以更清晰的看到我公司的用户在使用我公司的那些服务。
标签平台的用户群一般和公司里的营销平台对接,营销活动一般分为三步:圈人、做活动、看效果。标签平台主要负责圈子人的功能。
全渠道营销也是公司内部的一项基本能力。如果想搭建一个全渠道、自动化的营销平台,可以参考下篇文章《数据中台实战(九):全渠道营销平台》。
#相关阅读# 《数据中台实战(七):流量分析》
《数据中台实战(六):交易分析》
《数据中台实战(五):自助分析平台》
《数据中台实战(四):商品分析(产品设计篇)》
《数据中台实战(三):用户分析(产品设计篇)》
《数据中台实战(二):基于阿里OneData的数据指标管理体系》
《数据中台实战(一):以B2B点电商为例谈谈产品经理下的数据埋点》
数据中心实战入门:数据中心内外协作机制。
数据平台实战入门:双平台策略
作者:威尔顿(董朝华),曾在科大讯飞工作,现为R & amp全球商品交易港。微信官方账号:一个改变世界的产品经理。简单,简短,有用,原创,感动你的好文章。
本文由@华仔原创发布。每个人都是产品经理。未经许可,禁止复制。
题目来自Unsplash,基于CC0协议。

其他教程

亚马逊品牌防跟卖(亚马逊品牌保护的也能被跟卖)

2022-9-6 9:23:20

其他教程

内置声卡装在电脑什么位置(电脑声卡安装位置)

2022-9-6 9:25:25

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索