1.1 Kylin 特点

大数据 OLAP 的两个事实:

大数据查询要的一般是统计结果，是多条记录经过聚合函数计算后的统计值。原始的记录则不是必需的，或者访问频率和概率都极低。
聚合是按维度进行的，由于业务范围和分析需求是有限的，有意义的维度聚合组合也是相对有限的，一般不会随着数据的膨胀而增长。

Kylin 基于以上两点，得到一个新的思路——预计算。应尽量多地预先计算聚合结果，在查询时刻应尽量使用预算的结果得出查询结果，从而避免直接扫描可能无限增长的原始记录。

Kylin特点

Kylin 的主要特点包括支持 SQL 接口、支持超大规模数据集、亚秒级响应、可伸缩性、高吞吐率、BI 工具集成等

可扩展超快 OLAP 引擎 Kylin是为减少在 Hadoop/Spark 上百亿规模数据查询延迟而设计

On-Line Analytical Processing，简称OLAP
Hadoop ANSI SQL 接口 Kylin为Hadoop提供标准SQL支持大部分查询功能
交互式查询能力通过 Kylin，用户可以与 Hadoop 数据进行亚秒级交互，在同样的数据集上提供比Hive 更好的性能
多维立方体（MOLAP Cube) 用户能够在 Kylin 里为百亿以上数据集定义数据模型并构建立方体
与 BI 工具无缝整合 Kylin 提供与 BI 工具的整合能力，如 Tableau，PowerBI/Excel，MSTR，QlikSense，Hue 和 SuperSet

BI: Business intelligence 商业智能

results matching ""

No results matching ""