
数据分析师针对不同业务问题可以制作各种具体的数据模型去分析问题,运用各种分析方法去探索数据。常用的分析方法有描述性统计、方差检验和数据挖掘等。在可视化分析过程中主要应用的分析方法有描述性统计,下面将对常用的可视化分析方法进行介绍。
其中主要的分析方法有:
1.1.1.1.1. 对比分析
对比分析法(comparativeanalysisapproach),也称比较分析法,是按照特定的指标系将客观事物加以比较,以达到认识事物的本质和规律并做出正确的判断或评价。对比分析法通常是把两个(或更多)相互联系的指标数据进行比较,从数量上展示和说明研究对象规模的大小,水平的高低,速度的快慢,以及各种关系是否协调。
1.1.1.1.2. 趋势分析
趋势分析法(trendanalysisapproach)又叫比较分析法、水平分析法,它是通过对财务报表中各类相关数字资料,将两期或多期连续的相同指标或比率进行定基对比和环比对比,得出它们的增减变动方向、数额和幅度,以揭示状况、情况和量变化趋势的一种分析方法。采用趋势分析法通常要编制比较会计报表。
趋势分析法总体上分四大类:
(一)纵向分析法;
(二)横向分析法;
(三)标准分析法;
(四)综合分析法。
此外,趋势分析法还有一种趋势预测分析。
趋势预测分析运用回归分析法、指数平滑法等方法来对财务报表的数据进行分析预测,分析其发展趋势,并预测出可能的发展结果。
1.1.1.1.3. 结构/占比分析
结构分析是指将相关指标与同期相应的明细项目或特定项目数据进行对比,计算明细项目的结构百分比,分析判断项目结构构成是否合理。或者通过分析一个整体中各实体所占份额对整体结构进行分析,便于整体了解情况,对不合理的结构进行调整。可以从不同的角度分析,如:各单位占比、各产品占比、各种业务指标占比。
1.1.1.1.4. 弹性分析
统计学上的弹性分析是指两个变化率的比值,称为弹性系数。用来作弹性分析的两个指标通常有相当强的相关关系(因果关系),两个不相关的指标作弹性分析没有统计学意义。比如需求价格弹性,就是指需求的变化率相对于价格变化率的比值,用来反映价格的变化导致需求变化的强度。
1.1.1.1.5. 贡献率分析
一种经济现象可能由多种因素促成,贡献度是衡量一种因素对该经济现象总效果作用的比重。而贡献率则是衡量一种因素的变化量对该经济现象总效果的变化量影响的比重。注意,贡献度和贡献率都是针对变化的衡量(时期数),不是针对时点状态量的构成分析。
1.1.1.1.6. 景气指数分析
景气指数分析法是一种统计学分析方法。从经济意义上分析,有明确、肯定的先行关系;与基准循环峰值相比,其峰值至少领先3月以上,且在最近的连续3次周期波动中,至少有两次保持先行,领先3个月以上。景气指标通常包含三类:先行指标、同步指标、滞后指标。
1.1.1.1.7. 8020分析
8020分析又称为帕累托分析,也就是帕累托法则,是指在任何大系统中,约80%的结果是由该系统中约20%的变量产生的。
帕累托分析分析结果通常用排序后的直方图来表示,横轴是影响因素或类别分组,纵轴是影响效果或类别结果。
1.1.1.1.8. Whatif测算分析
What-if分析的原理是在充分理解了相关的业务数据后,加入自动分析的功能,使数据仓库、信息管理和商业智能系统提升到一个更高的层次。这些分析都是基于市场规律作出的,当然不会百分之百准确,但对领导层确实可以提供一些供考虑的数据。
根据what-if分析对象的不同,可以把what-if分析划分为以下3类:(1)基于假设模式更新的what-if分析;(2)基于假设维更新的what-if分析;(3)基于假设事实表或视图更新的what-if分析。
1.1.1.1.9. 离中趋势分析
离中趋势分析主要靠全距、四分差、平均差、方差(协方差:用来度量两个随机变量关系的统计量)、标准差等统计指标来研究数据的离中趋势。
1.1.1.1.10. 相关分析
相关分析探讨数据之间是否具有统计学上的关联性。这种关系既包括两个数据之间的单一相关关系,如年龄与个人领域空间之间的关系,也包括多个数据之间的多重相关关系——如年龄、抑郁症发生率、个人领域空间之间的关系;既包括A大B就大(小),A小B就小(大)的直线相关关系,也可以是复杂相关关系(A=Y-B*X);既可以是A、B变量同时增大这种正相关关系,也可以是A变量增大时B变量减小这种负相关,还包括两变量共同变化的紧密程度——即相关系数。
1.1.1.1.11. 分组分析
分组分析法是一种重要的数据分析方法,这种方法是根据数据分析对象的特征,按照一定的标志(指标),把数据分析对象划分为不同的部分和类型来进行研究,以揭示其内在的联系和规律性。分组的目的就是为了便于对比,把总体中具有不同性质的对象区分开,把性质相同的对象合并在一起,保持各组内对象属性的一致性、组与组之间属性的差异性,以便进一步运用各种数据分析方法来解构内在的数量关系,因此分组法必须与对比法结合运用。分组分析法的关键在于确定组数和组距。在数据分组中,各组之间的取值界限成为组限,一个组的最小值称为下限,最大值称为上限;上限与下限的差值称为组距;上限值和下限值的平均数称为组中值,它是一组变量值的代表值。
1.1.1.1.12. 平均分析法
平均分析法是利用平均数指标来反映某一特征数据总体的一般水平,主要靠平均数、中数、众数等统计指标来表示数据的集中趋势。它是通过特征数据的平均指标,反映事物目前所处的位置和发展水平。再对不同时期、不同类型单位的平均指标进行对比,说明事物的发展趋势和变化规律。在运用平均分析法时,对不同的特征数据所采用的平均指标有所不同。常用的平均指标如图:
1.1.1.1.13. 交叉分析法
交叉分析法是用于分析两个变量之间的相互关系的一种基本数据分析法。把统计分析数据制作成二维交叉表格,将具有一定联系的变量分别设置为行变量和列变量,两个变量在表格中的交叉结点即为变量值,通过表格体现变量之间的关系,称为交叉分析法。例如各个报纸阅读和年龄之间的关系。实际使用中我们通常把这个概念推广到行变量和列变量之间的关系,这样行变量可能有多个变量组成,列变量也可能有多个变量,甚至可以只有行变量没有列变量,或者只有列变量没有行变量。
1.1.1.1.14. 综合评价分析法
综合评价法指的是运用多个指标对多个参评单位进行评价的方法,简称综合评价方法。
综合评价分析法的特点:
l 评价过程不是逐个指标顺次完成的,而是通过一些特殊方法将多个指标的评价同时完成的;
l 在综合评价过程中,一般要根据指标的重要性进行加权处理;
l 评价结果不再是具有具体含义的统计指标,而是以指数或分值表示参评单位"综合状况"的排序
综合评价分析法常用的计算方法:
打分综合法
打分排队法
综合指数法
功效系数法
