高级计算分析
1. 高级计算与分析概述
高级计算分析,是指观远数据提供的在基本的数据计算与分析的基础上,进行复杂条件下计算分析的功能,包含全局参数、动态时间宏、同环比、百分比、排名、重复率等。
2. 高级计算与分析功能介绍
2.1 同环比计算
同环比的高级计算中,需要区分“维度”含日期字段和非日期字段两种情况,具体使用如下。
2.1.1 当“维度”中有日期字段时:直接设置同环比
当“维度”中含时间/日期字段时,可在高级计算>同比/环比 中,直接选择同环比类型。系统将根据“维度”中包含时间字段的类型,自动给出相应可选项。
除此之外,还可以设置自定义的同环比,可以自定义选择同环比基准日期(所选日期)和对比日期。这里需要注意的是:
-
对比日期最大能选到和所选日期同一天,不能比所选日期更大。
-
此处选择好所选日期和对比日期之后,图表中的其他时间,会按照所选日期的时间差进行日同环比计算。如以下示例,设置2月5日环比2月3日,相差2天,从而表格中的其他日期也都会按此间隔进行环比。
2.1.2 当“维度”中没有日期字段时:基于日期筛选
当“维度”中没有日期字段时,由于其时间范围是不确定的,因此在设置同比/环比时,需要进行时间范围的设置。当前支持2种时间范围的设置方式:普通和基于日期筛选。基于日期筛选,即同环比的“基准日期”不是在编辑弹窗里设置的,而是由外部传入的,包括卡片编辑页的“筛选”区域或者页面上的其他时间筛选器。 设置项主要有3个:日期字段、对比类型和数值设置。
对比类型:环比
如果“筛选”区域里设置了时间筛选区间,则会同步到编辑弹窗中的“当前日期”。 此时,如果“对比类型”选择“环比”,则对比日期为 紧挨着当期日期 前一个相同时间跨度的 时间区间。 如图所示,当期日期是2月1日-2月10日,共10天,则2月1日往前推最近的一个10天的日期区间是 1月22日-1月31日。
周同比、月同比、年同比,和之前普通模式的一样。
对比类型:自定义
当“对比类型”设置为“自定义”时,可以选择“对比方式”和“对比日期”。用法和普通模式-自定义类似,对比方式均可选择:
-
对比相对日期
-
对比固定日期
-
对比时间宏区间
不同的是, 普通-自定义里的同环比基准日期是选择后固定的, 而基于日期筛选-自定义,基准日期是由外部传入,是可以动态变化的。
2.2 百分比计算
百分比用于快速计算百分比占比情况,可选择按列、按行或者基于不同维度层级计算该数值字段的百分比。
a. “按列”计算百分比,分母使用数值列全列总计值。
b. “按行”计算百分比,分母使用数值列当前行总计值。
c. 基于不同维度层级的计算百分比:用户可选择维度区域字段里的前N-1个字段之一作为百分比计算的层级,其中N为维度区域内字段的个数。例如:当需要对每个省/自治区下不同地级市的销售数量,与该省份所有地级市销售总数进行百分比(即该地级市的销售数量占全省/自治区的比例)计算时,可以选择按照省/自治区字段作为百分比计算的层级。
对比字段的各对比项分开计算。对比里面的小计、总计,按照原数值列的小计、总计值在相应的分组层级上进行计算。
2.3 排名计算
点击需要排名的“数值”,在下拉菜单栏中选择“高级计算-排名”,即可弹出排名设置框。
排名设置:
-
排序类型:行列排名、维度组内排名、维度项排名
-
计算维度:按列、按行
-
排序方式:RANK、DENSE_RANK、ROW_NUMBER
-
顺序:从高到低、从低到高
-
TOP N:全部数据、自定义数目
2.3.1 RANK
从1开始,按照顺序,如果排序列的值相同给相同的排名标签,但后一位会空下排名,即相等会在名次中留下空位。比如按照各省/自治区的销售数量进行从高至低排名时,吉林和安徽的销售数量相等,均为100,按照RANK类型进行排名时,吉林和安徽为第1位,但后一位(第2位)将会被空出,接下来就是陕西作为第3位。
2.3.2 DENSE_RANK
在分组中的排名,排名相等会在名次中不会留下空位。比如按照各省/自治区的销售数量进行从高至低排名时,吉林和安徽的销售数量相等,均为100,按照DENSE_RANK类型进行排名时,虽然吉林和安徽为第1位,但后一位(第2位)将不会被空出,接下来就是陕西作为第2位。
2.3.3 ROW_NUMBER
从1开始,按照顺序,生成分组内记录的序列,依次排序且不会重复(即唯一排名)。比如按照各省/自治区的销售数量进行从高至低排名时,吉林和安徽的销售数量相等,均为100,按照ROW_NUMBER类型进行排名时,虽然吉林和安徽数量相等,但吉林被排为第1位,安徽被排在第2,即同一排名不会重复出现。
计算维度可选择按行、按列或按指定维度进行排名聚合计算,类似与百分比。
2.3.4 TOP N
在卡片编辑界面,字段的“高级计算”中选择排序类型后,即可自定义设置 TOP N 数目。
注意:自定义数目范围为1-100,条数设置需为整数。
效果展示
2.4 重复率计算
重复率(重复购买率、复购率)可以用来分析消费者对品牌的忠诚度。
重复率有两种计算方法:按条件、按次数。
2.4.1 按条件
含义:
一个时间周期内,重复率=重复人数/有过消费的顾客人数。重复人数为在这个时间周期内,消费次数≥2的顾客人数。例如在2022年9月这个时间段内,共有10个顾客产生了消费,其中3个顾客的消费次数超过1次,即产生了重复购买,则重复购买率为30%。
数据源:
包含会员ID、日期字段,并做去重处理。一般配置重复率的字段为会员ID,另外需要日期字段做时间筛选。当卡片上需要在门店、商品类别等维度上做展示时,数据源中也可以包含这些字段,但同样需要做去重处理。
设置:
a. 在维度栏拖入需要分析的维度,例如门店;
b. 在数值栏拖入会员代码,选择聚合方式为去重计数;选择高级计算>重复率,设置数值为重复数,计算方式为按条件,重复条件大于等于2,计算周期为日期筛选。计算结果为复购人数,即消费次数≥2的顾客人数。
c. 重复上一步的操作,设置数值为重复率。计算结果为复购率。验证一下该计算结果,复购率=复购人数/会员人数,会员人数可通过去重计数会员代码得到。
d. 重复条件和计算周期可以按照使用需要进行设置。
结果:
2.4.2 按次数
含义:
一个时间周期内,按消费次数计算,重复率=重复消费次数/总消费次数。重复消费次数计算公式为COUNT([会员代码])-COUNT(DISTINCT([会员代码])),即总消费次数-消费人数;总消费次数计算公式为COUNT([会员代码])。例如在2022年9月这个时间段内,一共有30个顾客进行了100次消费,则重复消费次数为70次,重复率为70%。
设置:
a. 在维度栏拖入需要分析的维度,例如门店;
b. 在数值栏拖入会员代码,选择聚合方式为计数;选择高级计算>重复率,设置数值为重复数,计算方式为按次数,计算周期为日期筛选。计算结果为重复消费次数。验证一下该计算结果,重复消费次数=总消费次数-消费人数,总消费次数可通过计数会员代码得到,消费人数可通过去重计数会员代码得到。
c. 重复上一步的操作,设置数值为重复率。计算结果为复购率。复购率=重复消费次数/总消费次数。
结果: