大数据数仓之OLAP总结(一)
1. 背景
- 在企业生产中,由于现有商业环境和业务越来越复杂和庞大,没有准确及时的数据支撑,在做企业经营决策和分析时,是无法得到很好的现实反馈,甚至会导致企业经营失败,项目关闭,公司破产。
- 现有企业中,各个部门密切合作,运营,销售部门对接客户,技术部门做技术支撑,老板根据业务数据做企业决策。在这个过程中,如何快速,准确获取企业经营相关各类数据就显得非常重要。而随着互联网,特别是移动互联网发展,联网用户越来越多,企业业务一旦涉及到互联网,所需要处理分析的数据剧增,这时候如何从这些数据中快速准确获取所需要的信息,就轮到大数据技术登场。
2. OLAP需求
- OLAP,在传统OLAP领域,数据存储和数据分析一般都是由传统数据库承担,如Oracle,WIndows Server等集群,既可以存储数据,也可以做数据分析。注意,OLAP就是在线联机分析,这种场景对于数据存储要求是一次存入,多次查询,和业务数据库要求不太一样。
- OLAP的数据查询结果,可以分为2类,一类是直接做展示,一类是用于业务场景的优化策略的,这种场景下数据一般不做可视化。
- OLAP可以划分OLAP引擎和OLAP可视化工具,可视化工具也就是所说的BI。注意,OLAP是需要支持交互的,因为查询数据很多时候需要从各个角度对数据做分析提取。
- 因为OLAP一般都是用于商业数据分析,也就是常说的BI,商业智能。所以需要数据分析处理快,存储数据多(要从各类数据中提取出有效信息),分析结果准确。
- 分析出来的结果有时候还需要做可视化展示,给老板,客户,运营,销售等做数据的动态变化显示。这时候就需要有一个足够强大的框架,可以支持各类报表,多种维度和数据可视化框架。
3. OLAP引擎
- OLAP引擎,也就是俗话说的在线联机分析处理引擎。其

本文介绍了OLAP在大数据数仓中的重要性,详细阐述了OLAP的需求、引擎和BI框架。OLAP用于商业智能,强调快速、准确的数据分析。文章探讨了预计算、内存计算和改良派等多种加速OLAP的技术,并提到了如Kylin、Druid、Presto、Spark和Clickhouse等解决方案。最后,讨论了OLAP BI框架,包括免费和商业选项,如Superset、FineBI、Tableau和PowerBI。
3828

被折叠的 条评论
为什么被折叠?



