如何学习大数据?
1,理论要求和对数字的敏感度,包括统计知识,市场调研,模型原理等。
2、工具的使用,包括挖掘工具、数据库、常用办公软件(excel、PPT、word、脑图)等。
3.理解业务的能力和对业务的敏感性。对业务和产品有深刻的理解,因为数据分析的出发点是解决业务问题。只有了解业务问题,才能转化为数据分析问题,满足部门的要求。
4、报告和图表的表达能力。这是一个关键的分析模型。如果不能很好的展示给领导和客户,其有效性会大打折扣,也会影响数据分析师的职业晋升。
第二,请把数据分析作为一种能力来培养。
从广义上讲,现在大部分工作都需要分析能力,尤其是在数据运营概念深入的今天。BAT这样的公司,强调全员参与数据运营。所以,把它当成一种能力训练,会让你终身受益。
三、从数据分析的四个步骤看数据分析师需要的能力和知识:
数据分析的四个步骤(不同于数据挖掘过程:业务理解、数据理解、数据准备、模型建立、模型评估、模型部署)从更宏观的角度展示了数据分析的过程:获取数据、处理数据、分析数据、呈现数据。
(1)获取数据
获取数据的前提是对业务问题的了解。把业务问题变成数据问题,要透过现象发现本质,确定分析问题的纬度,明确问题后再收集数据。这个环节要求数据分析师对业务问题有结构化的思考和理解。
推荐书籍:《金塔原理》、《麦肯锡三部曲:麦肯锡意识》、《麦肯锡工具》、《麦肯锡方法》。
工具:思维导图、思维管理软件
(2)处理数据
一个数据分析项目通常要占用70%以上的数据处理时间,所以使用先进的工具有利于提高效率,所以要尽量学习最新最有效的处理工具。以下是最传统但有效的工具:
Excel:日常通知、报表、抽样分析中经常用到。它的图表功能非常强大,轻松处理654.38+百万级别的数据。
UltraEdit: Text工具比TXT工具更容易使用,打开和运行速度更快。
ACCESS:桌面数据库,主要用于日常的抽样分析(做全口径的统计分析要消耗大量的资源和时间,通常分析师会随机选取一些数据进行分析)。使用SQL语言,处理654.38+0万的数据还是很快的。
Orcle和SQL sever:需要这两种类型的数据库来处理数千万的数据。
当然,如果你的能力和时间允许的话,学习一下最近比较流行的分布式数据库,提高自己的编程能力,对你以后的职业发展也有很大的帮助。
分析软件主要推荐:
SPSS系列:老的统计分析软件,SPSS Statistics(部分统计功能,市场调研),SPSS Modeler(部分数据挖掘),不用编程就很容易学会。
SAS:老经典的挖矿软件,需要编程。
r:开源软件,这种新的、流行的软件,处理非结构化数据的效率更高,需要编程。
随着文本挖掘技术的进一步发展,对非结构化数据的分析需求越来越大,文本挖掘工具的使用也应得到进一步重视。
(3)数据分析
为了分析数据,我们需要使用各种模型,包括关联规则、聚类、分类、预测模型等。其中最重要的一个观点就是比较。任何数据都需要在参照系中进行比较,结论才有意义。
推荐书籍:
1,《数据挖掘与数字化运营,思路、方法、技巧与应用》,陆辉,机械出版社。这本书是近年来中国写得最好的。一定要当圣经来读。
2.《谁说菜鸟不会分析数据(入门篇)》和《谁说菜鸟不会分析数据(工具篇)》,张文林等人主编。是入门书,适合初学者。
3.统计学,第五版,贾军主编,中国人民大学出版社。一本更好的统计学书籍。
4、《数据挖掘导论》完整版,[美]庞-谭宁等著,樊明译,人民邮电出版社。
5.《数据挖掘的概念与技术》,韩家伟等译,樊明译等。,机械工业出版社。这本书相对来说比较难。
6.《市场研究的定量分析方法与应用》,简明主编,中国人民大学出版社。
7.《问卷统计分析的实践——SPSS的操作与应用》,吴·,重庆大学出版社。市场研究领域的知名书籍,详细讲解了问卷数据的分析。
(4)数据的呈现
这一部分需要对数据结果进行有效的呈现和汇报,需要运用黄金金字塔原理、图表、PPT、word,培养良好的演讲能力。