1.1 Kylin 特点
大数据 OLAP 的两个事实:
大数据查询要的一般是统计结果,是多条记录经过聚合函数计算后的统计值。原始的记录则不是必需的,或者访问频率和概率都极低。
聚合是按维度进行的,由于业务范围和分析需求是有限的,有意义的维度聚合组合也是相对有限的,一般不会随着数据的膨胀而增长。
Kylin 基于以上两点,得到一个新的思路——
Kylin特点
Kylin 的主要特点包括支持 SQL 接口、支持超大规模数据集、亚秒级响应、可伸缩性、高吞吐率、BI 工具集成等
可扩展超快 OLAP 引擎 Kylin是为减少在 Hadoop/Spark 上百亿规模数据查询延迟而设计
On-Line Analytical Processing,简称OLAP
Hadoop ANSI SQL 接口 Kylin为Hadoop提供标准SQL支持大部分查询功能
交互式查询能力 通过 Kylin,用户可以与 Hadoop 数据进行亚秒级交互,在同样的数据集上提供比Hive 更好的性能
多维立方体(MOLAP Cube) 用户能够在 Kylin 里为百亿以上数据集定义数据模型并构建立方体
与 BI 工具无缝整合 Kylin 提供与 BI 工具的整合能力,如 Tableau,PowerBI/Excel,MSTR,QlikSense,Hue 和 SuperSet
BI: Business intelligence 商业智能