本课程专注于培养数据分析师的数据处理能力、数据分析能力和数据挖掘能力,课程内容从数据库管理、统计理论方法、数据分析主流软件的应用(包括SQL、Excel、SPSS、 Modeler、R、python等)到数据挖掘算法等,对一整套数据分析流程技术进行讲解,学完之后,学习者可以达到中级数据分析师的水平。
快速根据业务场景和需求进行数据可
视化过程,做出表达精准的数据图掌握数据清洗、数据规范化等数据预
处理的操作流程学会使用Excel、SQL、modeler 、
SPSS、R语言、 Python语言进行数
据分析和数据挖掘独立完成数据建模分析,诊断各环节
运营数据情况,支持决策、提供策略
并推动落地
30大行业经典案例呈现学即能用,快速提升
根据手机的相似度判断各自竞争力
多维尺度分析
根据具有很多维度的样本或变量之间的相似性或非相似性来对其进行分类的一种统计学研究方法,用空间和距离来体现各个点之间的关系,是研究品牌竞争力的常用分析方法。
漂族用户模型
线性回归
最基本的描述点与点之间关系的算法,描述影响某些现象的变量是怎么如何影响,是各领域最经典的分析方法,常用来预测消费支出、固定投资支出等。
用气泡图展示全国机场吞吐量数据
用户流失的影响因素及新用户预测
Logistic
逻辑回归算法是数据分析中常用的经典统计学方法,在SPSS软件中可以简单便捷实现该算法。常用于医疗、金融等业务场景的分类预测问题。
用贝叶斯网络进行建模
贝叶斯网络
在Modeler软件中进行贝叶斯网络建模,导入预测数据对用户流失率进行预测。
手写数字识别
朴素贝叶斯算法
该算法应用广泛,逻辑性简单,且较为稳定,当数据呈现不同的特点时,该算法的分类性能不会有太大差异。
此算法在现实生活中应用广泛,常用于文字识别、图像识别、文本分类、垃圾邮件分类、信用评估、钓鱼网站检测等。