事实表基本概念

在多维数据仓库中,保存度量值的详细值或事实的表称为“事实表”。在事实表中,每个度量值都有一个列,不同事实表将有不同的度量值。

事实表中的度量主要分为三种:可加、半可加、不可加

  • 可加的度量
    言外之意,既可以在任意维度下进行累加,例如订单中的订单金额,商品数量等;
  • 半可加的度量
    即为有的时候可以累加,有的时候不可以累加,学生成绩表中的各科目的成绩,针对每个人是可以进行累加,但是全班进行累加,是没有任何意义的;
  • 不可加的度量
    即为任何场景下均不可累加,典型的比如比例或者比率,其只针对单行记录有意义,直接累加无意义。

一致性可以有两层的理解,一是表内部的一致性,二是表与表之间的一致性

  • 表内部的一致性:
    在同一个表内部,所有记录的粒度、维度等信息均是一致的,每一列的单位,枚举值等均是一致
  • 表与表之间的一致性:
    如果我们在进行多个表的数据合并时,应该保证彼此之间的对于同一事实的计算,是在同一粒度和维度之下。统计口径一致,为了避免歧义,一个度量只有唯一的业务术语,例如一个度量是注销费用,或者退单费用。这两个业务术语可能描述的是同一个业务含义,但是只能取一个作为标准业务口径。