大量低频长尾取数需求解决方案
背景:
– 数据平台的报表系统满足了核心维度和指标需求,但这些都是固化口径计算好的结果,不能满足业务多样的多维度的分析需求;业务如有临时性、灵活且简单的聚合分析想获取数据,需要提需求,周期太长,如果能够基于DWD明细数据,用户直接自由分析可以很大程度提升数据分析效率,分析同学也能从琐碎的数据需求中释放;
– 自助取数分析:用户能够通过工具自助获取,可一定程度上满足多样化需求,效率相对有很大的提升,分析同学也大大减少了临时性琐碎的取数需求,把更多的精力放到业务本身和数据报告上。本质上,自助取数是面向业务的,有两项最为重要的工作,一是数据需求分析,二是功能分析。指标维度过多,运营配置困难,指标过少,不能达到多样化需求,因此在设计需要达到很高的性价比;
– BI可视化拖拽分析系统;基于宽表建设,将图表转化成SQL,在宽表上查询;不仅可供分析师使用,也可供产品运营用户同学使用,由于采用拖拽式操作,无需写SQL,即可生成图表数据,实现可以像操作Excel一样操作亿级数据量,效率和时效都能保证,可直接生成可视化图表,无需二次用excel操作,直接依据数据分析业务;
效果
数据分析需求灵活多变,用户不再满足于看固定报表,还需要分析这些数据,这些指标背后的成因。因此多维分析,灵活查询,明细查询这些需求就在爆发式的增长,高性能的进行交互式分析,用数据服务于业务;
从量化角度看:
数据报表系统解决5~10维度,5~10个度量指标需求,可解决60%的数据需求
自助取数需求系统解决了10-20个维度,10-30个度量指标需求,可解决80%的数据需求;
BI可视化拖拽分析系统,维度和度量指标将不再受到限制,由于是将图表转化成SQL语句,直接实现可视化拖拽,通过灵活配置,不仅可供分析师使用,也可供业务产品使用,直接将数据分析服务于业务,可解决85%~90%的数据需求;