搭建大屏需要数据仓库吗?
答案是肯定的,因为大家对BI的第一印象就是各种酷炫的可视化图表和报表,而市面上有很多轻量级的前端可视化BI分析工具,使得大家对BI的认识停留在可视化部分。
准确地说,BI不仅包括前端可视化分析和报表呈现的能力,还包括底层数据仓库的构建过程。
Gartner在20世纪90年代已经提到了商业智能。它认为BI是一种基于数据的技术解决方案,从不同企业的众多业务系统中提取具有分析价值的数据进行清洗、转换、加载,即提取、转换、加载的ETL过程,最后合并成一个数据仓库。按照一定的建模方法,如Inmon的3NF建模、Kimball的维度建模或两者兼有,最后在此基础上,利用合适的分析和展现工具,形成各种可视化的分析报告,为企业的管理决策层提供数据决策支持。
所以我们可以看到,数据仓库数据仓库的位置在可视化报表和底层业务系统的数据源之间,在整个BI项目解决方案中起着承上启下的作用。
所以BI很难在没有数据仓库核心力量的支撑下,发挥出前端可视化分析层面的各种精彩动作。
那么你也会问,市面上不是有很多BI工具产品可以直接链接数据源进行拖拽分析,还可以做BI分析报告吗?这种独立的、单一的面向前端的BI分析工具,更多的定位为部门级和个人级的BI分析工具,无法解决很多需要复杂的数据处理、集成、建模等深层次的场景。最好的办法是在底层搭建一个完整的数据仓库,把很多分析模型标准化,然后把这些前端的BI分析工具结合起来,这样才能真正释放前端的BI分析能力。
很多企业以为买个前端BI分析工具就能解决企业级BI的所有问题,其实不可行。也许这种BI分析工具在初期分析场景比较简单,对接数据复杂度不是很高的情况下,是没有问题的。但是,企业BI项目的建设有一个特点,就是螺旋式的建设过程。因为对接的业务系统可能会越来越多,分析的深度和广度会越来越多,数据的复杂度也会越来越有挑战性。这个时候,没有一个好的数据仓库架构支撑,单纯依靠前端的BI分析工具,基本上是不行的。
就像去中药店拿药一样,之所以拿药快,是因为在你拿药之前,别人已经把各种原始中药材(原始数据源的数据)清理好,放好了,那么如何搭配中药材(维度指标组合可视化)就会快。
国内有很多这样的企业,也是因为对BI的不了解,导致BI项目建设出现一些方向性的错误,最后BI项目很难继续推进。
所以在企业中,我们需要明确我们的BI建设是面向企业还是个人和部门分析。如果你是个人数据分析师,用这样的前端BI分析工具就够了。如果需要构建企业级BI项目,不仅要关注前端可视化分析能力,还要关注底层数据架构即数据仓库的构建。