跳到主要内容

专有名词

概述

WhaleBI 作为一款自助式数据分析产品,提供丰富强大的功能让企业数据分析者,通过高效自助分析,进行数据决策。
本文按照各个模块,对 WhaleBI 产品的特有概念进行解释说明,以便用户进行使用。

数据准备

数据集

定义
「数据集」是对数据进行建模后的最终结果,可被图表组件所选择使用。
分类
「数据集」是一个数据表实体,根据来源不同,分为四类:组合数据集、SQL数据集、本地文件、API。
目的
「数据集」是数据分析的依据和基础,数据分析就是对「数据集」内数据进行分析。

字段

定义
「字段」是「数据集」中的列,每个数据集都是由多个字段组成。
分类
按照形式分类分为文本、数值、浮点和日期类型的四种字段,通过字段前的标志可以识别不同种类。
目的
方便用户以数据的一列作为最小单位进行数据分析。 数据处理时,可以在自助数据集中添加指定字段(列);仪表板进行数据分析时,可以选择所需要的字段(列)进行分析。

维度

说明数据,维度是指可指定不同值的对象的描述性属性或特征。例如,地理位置的维度可以包括“纬度”、“经度”或“城市名称”。“城市名称”维度的值可以为“旧金山”、“柏林”或“新加坡”。

度量

度量就是基于某个属性对其属性的指标进行衡量。度量是业务流程节点上的一个数值。比如销售、价格、成本等等。

计算字段

当存储在数据库表中的数据不能直接满足我们的需求时,就需要我们利用已有的字段,创造出所需内容。比如:省、市、县、邮政编码存储在不同的字段中,而我们需要三者组合在一起的格式化信息;再比如订单表存储了商品的价格和数量,而我们却需要知道每类物品的总价格。

仪表板

网格布局

基于网格来定义信息区块的组件,响应式布局自适应宽度,以保证页面的每个区域能够稳健地排布起来,适用于报表制作。

绝对布局

基于像素和精确坐标 x,y 位置,以图层化的方式堆叠组件,灵活、自由,“指哪打哪”,适用于数据大屏制作

可视化组件

定义
对数据进行可视化呈现的组件。
分类
内置40+组件,目前通过组件表现形式可分为:基础类、表格类、指标类、趋势类、比较类、分布类、关系类、地图类。
目的
可视化组件制作就是将数据集中的字段拖入分析区域进行分析。

静态数据

定义
对于不需要读取库表数据时,可临时配置Json格式数据进行展示。
目的
通过解析Json格式的静态数据,达到数据呈现的目的。

聚合

定义
聚合是若干行按照一定的标准变成一行,汇总到更高类别的行级别数据。
分类
指标聚合:指标聚合表示所有指标显示在同一值轴上。
聚合函数:对一组数据进行汇总。一般都是使用聚合函数汇总后的值进行再计算。不同的聚合函数对应不同的汇总方式,汇总方式包括「求和,平均,中位数,最大值,最小值,标准差,方差,去重计数,计数」。满足用户不同的需求。且随着用户分析维度的切换,计算字段会自动跟随维度动态调整。
目的
指标聚合:方便用户在同一个维度对比不同指标的大小和趋势。

引擎

直连模式

定义
直连就是直接连接数据库取数据,使用的是直连引擎,直连不能支持多个不同数据源相互关联。
目的
1)避免数据资源冗余:目前很多企业有较为专业的大数据平台,通过直连引擎取数,可以在保障数据分析性能的同时避免数据资源冗余。
2)满足实时数据需求:直连引擎实时取数,最高实现毫秒级数据刷新,满足用户对数据实时性的要求。

ETL 抽取模式

定义
多余大批量和多数据源数据汇聚加工的场景,可通过系统内置 ETL 引擎将数据库的数据抽取并存储,可支持离线使用的数据。
目的
可支持离线以及批量的大数据清洗加工。