一、 课程简介
大数据分析挖掘技术已经逐步地应用到新兴互联网企业(如电子商务网站、搜索引擎、社交网站、互联网广告服务提供商等)、银行金融证券企业、电信运营等行业,给这些行业带来了一定的数据价值增值作用。
本次课程面向有一定的数据分析挖掘算法基础的工程师,带大家实践大数据分析挖掘平台的项目训练,系统地讲解:
(1)数据分析与挖掘的背景、基本概念、能干什么、优势何在、方法步骤、项目思路。
(2)大数据分析挖掘和机器学习的模型、建模方法和案例,重点是决策树机器学习模型和关联规则机器学习模型及其应用;
(3)SPSS大数据建模与挖掘软件的应用实践,包括决策树,关联规则,朴素贝叶斯网络,SVM模型的实践与操作;
(4)Python朴素贝叶斯、决策树、逻辑回归机器学习模型及应用实践操作;
(5)数据建模、分析挖掘技术体系及其平台方案实现;
(6)大数据建模在电商、电信领域的用户画像应用案例。
学员需要准备的笔记本配置:i5及以上CPU,4GB及以上内存,硬盘空间预留50GB(可用移动硬盘),基本的大数据分析平台所依赖的软件包和依赖库等。
本课程基本的实践环境是操作系统:Windows或Linux。
大数据建模挖掘软件包括:SPSS Modeler 15,Python 3,Anaconda 4,Hadoop 2.7.*,Spark 2.1.*。
二、培训人群
1. 大数据分析应用开发工程师
2. 大数据分析项目的规划咨询管理人员
3. 大数据分析项目的IT项目高管人员
4. 大数据分析与挖掘处理算法应用工程师
5. 大数据分析集群运维工程师
6. 大数据分析项目的售前和售后技术支持服务人员
三、培训特色
定制授课+ 实战案例训练+ 互动咨询讨论,共2天
本课程采用技术原理与项目实战相结合的方式进行教学,在讲授原理的过程中,穿插实际的系统操作,本课程讲师也精心准备的实际的应用案例供学员动手训练。
四、培训目标
1. 让学员掌握在大数据、人工智能下的大数据建模、分析挖掘技术和机器学习算法模型的应用。
2. 让学员掌握大数据建模与分析挖掘软件的应用实践。
3. 让学员掌握SPSS Modeler,Python等大数据建模、分析、挖掘的应用实战。
五、培训大纲
时间
|
专题
|
详细内容与知识点
|
第一天
|
大数据分析、挖掘技术体系及其平台方案实现
|
1. 数据分析与挖掘基本概念、思路、方法、项目步骤
2. 数据分析与挖掘技术和模型
3. 有监督学习、无监督学习和半监督学习
4. 大数据建模和挖掘的应用场景、挖掘过程
5. 常见的大数据分析挖掘工具(SPSS Modeler和Python,以及其它)
6. 大数据分析建模的案例(运营商案例)
|
大数据决策树算法、模型、建模、挖掘和分析实践
|
7. 决策树的原理
8. 决策树的算法实现
9. 决策树用于分析挖掘的建模实现
10. 决策树的评估
11. 决策树的应用:客户流失预测
|
Python和SPSS大数据建模、分析挖掘基础
|
12. Python和SPSS Modeler大数据建模工具的部署与使用
13. Python和SPSS Modeler建模操作
14. Python和SPSS Modeler数据源、样本操作、特征选择、数据理解、可视化图表、数据审核、数据合并、数据分区等实践操作
|
第二天
|
Python和SPSS大数据建模与挖掘软件的应用案例实践
|
15. SPSS决策树建模实践操作
16. SPSS朴素贝叶斯分类实践操作
17. SPSS关联规则建模实践操作
18. Python Pandas数据分析实践
19. Python 可视化分析实践
|
大数据关联规则算法、模型、建模、挖掘和分析实践
|
20. 关联规则和频繁模式挖掘的原理
21. 关联规则的算法实现、建模
22. Apriori和FP-growth关联分析建模
23. 关联规则分析挖掘模型的评估
24. 关联规则挖掘的应用:交叉销售、个性化推荐
|
Python朴素贝叶斯、决策树、逻辑回归机器学习模型及应用实践操作
|
25. Python:大数据建模挖掘和机器学习概述
26. Python朴素贝叶斯建模与应用
27. Python决策树建模与应用
28. Python逻辑回归建模与应用
29. Python大数据建模与机器学习的实践操作
|
大数据分析项目实战案例
|
30. 金融行业市场份额争夺日趋激烈。本项目就对用户流失数据特征的提取,一方面预测用户流失场景;另一方面总结共性问题和建模经验,提供有力的理论和政策依据。
|
课程总结
|
31. 案例分享
32. 讨论、交流
|