第 5 章 Cube 构建优化

从之前章节的介绍可以知道,在没有采取任何优化措施的情况下,Kylin 会对每一种维度的组合进行预计算,每种维度的组合的预计算结果被称为 Cuboid。假设有4个维度,我们最终会有2^4=16个 Cuboid 需要计算。

但在现实情况中,用户的维度数量一般远远大于 4 个。假设用户有 10 个维度,那么没有经过任何优化的 Cube 就会存在2^10=1024个 Cuboid;

而如果用户有 20 个维度,那么Cube中总共会存在2^20 =1048576个 Cuboid。

虽然每个 Cuboid 的大小存在很大的差异,但是单单想到 Cuboid 的数量就足以让人想象到这样的 Cube 对构建引擎、存储引擎来说压力有多么巨大。

因此,在构建维度数量较多的 Cube 时,尤其要注意 Cube 的剪枝优化(即减少 Cuboid 的生成)。

Copyright © 尚硅谷大数据 2019 all right reserved,powered by Gitbook
该文件最后修订时间: 2019-04-02 13:47:19

results matching ""

    No results matching ""