十年前写的,从今天看起来之前的想法还是比较幼稚的。
从理论指导角度,数据分析可以划分为基于统计学的和基于数据挖掘的数据分析方法,很显然基于统计学的相对容易理解一些,而数据挖掘对高等数学要求会高一些,相信毕业十几年的同学很可能连A*X**2+B*X+C=0都快忘记了,甚至我不确定等小孩上了初中能不能教的了他数学。
从分析的出发点看,数据分析可以划分为基于业务驱动的和基于纯数学驱动的数据分析,业务驱动是建立在对业务理解的基础上,有些经验论的色彩,大多情况下是验证自己的想法,或者更方便找出业务问题和业绩;而基于纯数学驱动基本上都是通过某些挖掘算法找出数字之间的规律,然后把这种规律翻译成业务,理论上是非常可行的,但实际工作中鲜有成功案例。大多数情况下是把两者结合到一起,即通过拍脑袋的方式定义数据的输入和输出,而挖掘算法只是为了证明一下自己的决策有多高明。
从分析的输出上,数据分析可以以图表、文字、表格、业务推导过程或者一系列高深的数学公式的方式呈现,显而易见图表给人的印象是深刻的,表格次之,文字效果差,后是那些没人看得懂的过程或公式;Excel的优势恰恰就是表格和图表。
从分析工具而言,包括了入门级的Excel、近红的发紫的R语言,专业统计软件工具SPSS,强大的SAS,很显然绝大多数人只会Excel,不过Excel也有很多的自带的数据分析库,并且Excel的应用商店云化后的力量不可小觑,未来是否有能力与专业的统计软件数据挖掘工具相媲美还很难说,而且Excel的一个巨大的优势在于其庞大的客户群。
从图表的角度,Excel比不上那些专业的BI工具,从统计角度,Excel比不了那些专业的统计软件;但Excel提供的功能对于我们这些非专业人士已经足够了,通过透视表做一些多维分析,通过应用商店找一些炫的图表,通过插件做一些简单的数据分析,通过VBA和不厌其烦的调试也可以做一些”专业“的图表,这也是我们的目的。
Excel提供的图表种类包括柱形图、折线图、饼图、条形图、面积图、XY(散点图)、股价图、曲面图、雷达图、组合,实际上常用的是柱形图、折线图、饼图、条形图、组合图;较常用的是面积图、雷达图和XY(散点图);基本不用的是股价图、曲面图。
关于图表类型的选择,互联网上的大拿们说的已经够多了,在此提及有凑字数的嫌疑,不过还是要强调一点,图表类型的选择明智与否与你对业务数据的理解和你的分析思路密切相关,如果选择了不恰当的图表,恰恰表示你还没做好数据分析的准备工作。
后附上两张图表的基本类型和选择的中英文版本。