观远 BI

高级计算分析

创建于 2022-10-27 / 最近更新于 2024-01-08 / 10013
字体: [默认] [大] [更大]

1. 高级计算与分析概述

高级计算分析,是指观远数据提供的在基本的数据计算与分析的基础上,进行复杂条件下计算分析的功能,包含全局参数、动态时间宏、同环比、百分比、排名、重复率等。

2. 高级计算与分析功能介绍

2.1 同环比计算

同环比的高级计算中,需要区分“维度”含日期字段和非日期字段两种情况,具体使用如下。

2.1.1 当“维度”中有日期字段时:直接设置同环比

当“维度”中含时间/日期字段时,可在高级计算>同比/环比 中,直接选择同环比类型。系统将根据“维度”中包含时间字段的类型,自动给出相应可选项。

image11.png

除此之外,还可以设置自定义的同环比,可以自定义选择同环比基准日期(所选日期)和对比日期。这里需要注意的是:

  • 对比日期最大能选到和所选日期同一天,不能比所选日期更大。

  • 此处选择好所选日期和对比日期之后,图表中的其他时间,会按照所选日期的时间差进行日同环比计算。如以下示例,设置2月5日环比2月3日,相差2天,从而表格中的其他日期也都会按此间隔进行环比。

2.1.2 当“维度”中没有日期字段时:基于日期筛选

当“维度”中没有日期字段时,由于其时间范围是不确定的,因此在设置同比/环比时,需要进行时间范围的设置。当前支持2种时间范围的设置方式:普通和基于日期筛选。基于日期筛选,即同环比的“基准日期”不是在编辑弹窗里设置的,而是由外部传入的,包括卡片编辑页的“筛选”区域或者页面上的其他时间筛选器。 设置项主要有3个:日期字段、对比类型和数值设置。

对比类型:环比

如果“筛选”区域里设置了时间筛选区间,则会同步到编辑弹窗中的“当前日期”。 此时,如果“对比类型”选择“环比”,则对比日期为 紧挨着当期日期 前一个相同时间跨度的 时间区间。 如图所示,当期日期是2月1日-2月10日,共10天,则2月1日往前推最近的一个10天的日期区间是 1月22日-1月31日。

周同比、月同比、年同比,和之前普通模式的一样。

对比类型:自定义

当“对比类型”设置为“自定义”时,可以选择“对比方式”和“对比日期”。用法和普通模式-自定义类似,对比方式均可选择:

  • 对比相对日期

  • 对比固定日期

  • 对比时间宏区间

不同的是, 普通-自定义里的同环比基准日期是选择后固定的, 而基于日期筛选-自定义,基准日期是由外部传入,是可以动态变化的。

2.2 期末值计算

含义:

期末值是指在一个期间结束时所持有的资产或负债的价值。

  1. 金融领域:在金融领域中,期末值通常指的是一个投资组合或账户在特定期间的结束时的价值。例如,在计算投资回报率或评估投资策略时,需要使用期末值作为参考。

  2. 会计领域:在会计领域中,期末值通常指的是一个公司在特定会计期间的结束时的资产和负债状况。期末值通常会用于编制财务报表和评估公司的财务状况。

  3. 库存管理:在库存管理中,期末值指的是在一个特定时期结束时库存物品的价值。管理人员可以通过比较期初值和期末值来评估库存的流动性和需求,从而制定更有效的库存管理策略。

总之,期末值是一个时间点上的数值,通常用于评估投资组合、公司或库存的状况或进度。

设置:

计算期末值时,会按照指定的日期层级计算。例如,时间层级为年月,计算时会取每月月末计算结果:

image.png

效果:

如下图所示,9月份的期末值为345,即9月最后一天对应的数值。

image (1).png

注意:期末值仅在数据集有日期字段的情况下可用,数据集中的日期字段可以是新建的日期字段。

2.3 百分比计算

百分比用于快速计算百分比占比情况,可选择按列、按行或者基于不同维度层级计算该数值字段的百分比。

a. “按列”计算百分比,分母使用数值列全列总计值。

b. “按行”计算百分比,分母使用数值列当前行总计值。

c. 基于不同维度层级的计算百分比:用户可选择维度区域字段里的前N-1个字段之一作为百分比计算的层级,其中N为维度区域内字段的个数。例如:当需要对每个省/自治区下不同地级市的销售数量,与该省份所有地级市销售总数进行百分比(即该地级市的销售数量占全省/自治区的比例)计算时,可以选择按照省/自治区字段作为百分比计算的层级。

对比字段的各对比项分开计算。对比里面的小计、总计,按照原数值列的小计、总计值在相应的分组层级上进行计算。

2.4 排名计算

点击需要排名的“数值”,在下拉菜单栏中选择“高级计算-排名”,即可弹出排名设置框。

2.2 1.png

2.2 2.png

排名设置:

  • 排序类型:行列排名、维度组内排名、维度项排名

  • 计算维度:按列、按行

  • 排序方式:RANK、DENSE_RANK、ROW_NUMBER

  • 顺序:从高到低、从低到高

  • TOP N:全部数据、自定义数目

2.4.1 RANK

从1开始,按照顺序,如果排序列的值相同给相同的排名标签,但后一位会空下排名,即相等会在名次中留下空位。比如按照各省/自治区的销售数量进行从高至低排名时,吉林和安徽的销售数量相等,均为100,按照RANK类型进行排名时,吉林和安徽为第1位,但后一位(第2位)将会被空出,接下来就是陕西作为第3位。 

2.4.2 DENSE_RANK

在分组中的排名,排名相等会在名次中不会留下空位。比如按照各省/自治区的销售数量进行从高至低排名时,吉林和安徽的销售数量相等,均为100,按照DENSE_RANK类型进行排名时,虽然吉林和安徽为第1位,但后一位(第2位)将不会被空出,接下来就是陕西作为第2位。 

2.4.3 ROW_NUMBER

从1开始,按照顺序,生成分组内记录的序列,依次排序且不会重复(即唯一排名)。比如按照各省/自治区的销售数量进行从高至低排名时,吉林和安徽的销售数量相等,均为100,按照ROW_NUMBER类型进行排名时,虽然吉林和安徽数量相等,但吉林被排为第1位,安徽被排在第2,即同一排名不会重复出现。 

计算维度可选择按行、按列或按指定维度进行排名聚合计算,类似与百分比。

2.4.4 TOP N

在卡片编辑界面,字段的“高级计算”中选择排序类型后,即可自定义设置 TOP N 数目。

注意:自定义数目范围为1-100,条数设置需为整数。

2.2 3.png

效果展示

2.2 4.png

2.5 重复率计算

重复率(重复购买率、复购率)可以用来分析消费者对品牌的忠诚度。

重复率有两种计算方法:按条件、按次数。

2.5.1 按条件

含义:

一个时间周期内,重复率=重复人数/有过消费的顾客人数。重复人数为在这个时间周期内,消费次数≥2的顾客人数。例如在2022年9月这个时间段内,共有10个顾客产生了消费,其中3个顾客的消费次数超过1次,即产生了重复购买,则重复购买率为30%。

数据源:

包含会员ID、日期字段,并做去重处理。一般配置重复率的字段为会员ID,另外需要日期字段做时间筛选。当卡片上需要在门店、商品类别等维度上做展示时,数据源中也可以包含这些字段,但同样需要做去重处理。

设置:

a. 在维度栏拖入需要分析的维度,例如门店;

b. 在数值栏拖入会员代码,选择聚合方式为去重计数;选择高级计算>重复率,设置数值为重复数,计算方式为按条件,重复条件大于等于2,计算周期为日期筛选。计算结果为复购人数,即消费次数≥2的顾客人数。

c. 重复上一步的操作,设置数值为重复率。计算结果为复购率。验证一下该计算结果,复购率=复购人数/会员人数,会员人数可通过去重计数会员代码得到。

d. 重复条件和计算周期可以按照使用需要进行设置。

截屏2023-01-03 11.34.10.png

结果:

2.5.2 按次数

含义:

一个时间周期内,按消费次数计算,重复率=重复消费次数/总消费次数。重复消费次数计算公式为COUNT([会员代码])-COUNT(DISTINCT([会员代码])),即总消费次数-消费人数;总消费次数计算公式为COUNT([会员代码])。例如在2022年9月这个时间段内,一共有30个顾客进行了100次消费,则重复消费次数为70次,重复率为70%。

设置:

a. 在维度栏拖入需要分析的维度,例如门店;

b. 在数值栏拖入会员代码,选择聚合方式为计数;选择高级计算>重复率,设置数值为重复数,计算方式为按次数,计算周期为日期筛选。计算结果为重复消费次数。验证一下该计算结果,重复消费次数=总消费次数-消费人数,总消费次数可通过计数会员代码得到,消费人数可通过去重计数会员代码得到。

c. 重复上一步的操作,设置数值为重复率。计算结果为复购率。复购率=重复消费次数/总消费次数。

结果:

7 人点赞过