【CDA认证简介】
CDA,即数据分析师,其岗位职责是在互联网、电信、零售、医学、金融等行业从事数据采集、清洗、处理、分析并能制作业务报告、提供决策等。CDA持证者掌握了所有的数据分析师应具备的专业技能,以推动企业快速发展,实现数字化转型。
【发证机构】工业和信息化部人才交流中心
【授权机构】中培IT学院
【授课形式】线下面授班(公开课、企业内训均可)
【配套服务】官方教材(同步讲义)、视频回放、线上题库(综合试题、模拟试卷)、微信群答疑,全流程报考服务。
【支持城市】
北京 上海 广州 深圳 成都 重庆 天津 沈阳 济南 西安 郑州 武汉 苏州 杭州 昆明
长春 大连 青岛 厦门 宁波 西宁 徐州 东莞 合肥 嘉兴 无锡 长沙 乌鲁木齐......
注:10人以上团队可申请加开当地面授,具体情况可致电:400-808-2006
【培训优势】
中培IT学院成立17年以来,先后获得20余项国内外IT培训认证资质,其中也包括与CDA的认证培训合作。专家团队拥有丰富的教学经验、技术能力和项目案例。理论与实践并重,深入浅出,课堂气氛活跃,深受广大学员好评。中培除线下面授,还提供线上教学(直播/录播)、企业内训等多种服务模式,满足不同企业及学员的需求。
【培训对象】
零基础小白或想要转行到数据分析领域的人员;
高校毕业生;
产品、运营、销售等业务部门或技术部门人员;
企业管理者、经理及各咨询类岗位从业人员。
【培训大纲】
章节
|
模块
|
培训内容
|
PART 1
数据分析概念与统计学基础
|
1、数据分析概述
|
【领会】
数据分析和数据挖掘的概念
强调商业数据分析中对业务的理解
商业数据分析和预测的本质
数据分析的8个层次
大数据对传统小数据分析的拓展
【熟知】
明确数据分析目标及意义
数据分析的过程
数据分析与数据挖掘的常用方法
CRISP-DM、SEMMA 方法论
数据分析中不同人员的角色与职责
|
2、描述性统计分析
|
【领会】
数据的计量尺度
数据的集中趋势、离中趋势和数据分布的概念
统计图的概念
各种统计图的含义和画法
【熟知】
衡量数据集中趋势、离中趋势和数据分布的常用指标及计算方法统计图形的绘制、图形元素的调整、可视化效果,主要涉及条形图、线图、直方图、盒须图、散点图、气泡图、马赛克图、玫瑰图及其多种图形整合。明确统计图形对统计指标表达上的对应关系
【应用】
根据不同数据类型选用不同的统计指标来进行数据的集中趋势、离中趋势和数据分布的衡量,不同统计图的使用场景。会写数据分析报告和结合业务需求对报告进行合理解释,对业务ᨀ出建设性意见建议。
|
3、抽样估计
|
【领会】
随机试验、随机事件、随机变量的概念
总体与样本的概念
抽样估计的理论基础
正态分布及三大分布的函数形式和图像形式
抽样的多种组织形式
确定必要样本容量的原因
【熟知】
随机事件的概率
抽样平均误差的概念与数学性质
点估计与区间估计方法的特点与优缺点
全体总体与样本总体
参数和统计量
重复抽样与不重复抽样
抽样误差的概念对总体平均数和总体成数的区间估计方法
必要样本容量的影响因素
中心极限定理的意义与应用
【应用】
随机变量及其概率分布
全部可能的样本单位数目的概念及其在不同抽样方法下的确定
抽样平均误差在实际数据分析中的计算方法
|
4、假设检验
|
【领会】
假设检验的基本概念
其基本思想在数据分析中的作用
假设检验的基本步骤
假设检验与区间估计的联系
假设检验中的两类错误
【熟知】
P值的含义及计算
如何利用P值进行检验
z检验统计量
t检验统计量
F检验统计量
c2检验统计量的函数形式和检验步骤
【应用】
实现单样本t检验
两独立样本t检验的步骤和检验中使用的统计量与原假设
两种检验应用的数据分析场景。
|
5、方差分析
|
【领会】
方差分析的相关概念
单因素方差分析的原理
统计量构造过程
【熟知】
单因素方差分析的基本步骤
总离差平方和(SST)的含义及计算
组间离差平方和(SSA)的含义及计算
组内离差平方和(SSE)的含义及计算
单因素方差分析的原假设
【应用】
实现单因素方差分析的步骤
对方差分析表的分析以及多重比较表的分析
|
6、简单线性回归分析
|
【领会】
相关图的绘制与作用
相关表的编制与作用
相关系数定义公式的字母含义
估计标准误差与相关系数的关系
【熟知】
相关关系的概念与特点
相关关系与函数关系的区别与联系
相关关系的种类
相关系数的意义以及利用相关系数的具体数值对现象相关等级的划分
回归分析的概念
回归分析的主要内容和特点
建立一元线性回归方程的条件
应用回归分析应注意的问题
估计标准误差的意义及计算
【应用】
运用简捷法公式计算相关系数
相关分析分析中应注意的问题
回归分析与相关分析的区别与联系
|
PART 2
SQL数据库基础
|
1、SQL 基础概念
|
【领会】
关系型数据库基本概念、属性
主键
外键
E-R 图
ANSI-SQL 以及不同的数据库实现的关系
【熟知】
逻辑运算符
比较运算符
算术运算符
通配符
|
2、SQL 查询语句
|
【应用】
select 语句
包括查询单列
多列,去重,前 N 列
from 语句、where 语句、group by 语句、having 语句、order by 语句、子查询
SQL 聚合函数,包括 count、sum、avg、max、min 等
|
3、SQL 连接语句
|
【领会】
表的连接类型,包括内连接(等值、不等值)、外连接(左、右、全)、交叉连接(笛卡
尔连接)
查询的集合操作,只包括并集操作
【应用】
inner join 的用法
left/right/full join 的用法
cross join 的用法
union 的用法
|
4、其它 SQL 语句
|
【领会】
表的创建
视图及索引的概念及创建
数据插入、更新、删除
【领会】
高级函数,如 Oracle 或 Hive 中的 row number over partition by、正则匹配等
|
PART 3
数据采集与处理
|
1、数据采集方法
|
【领会】
一手数据与二手数据来源渠道
优劣势分析
使用注意事项
【熟知】
一手数据采集中的概率抽样与非概率抽样的区别与优缺点
【运用】
概率抽样方法,包括简单随机抽样、分层抽样、系统抽样、分段抽样
明确每种抽样的优缺点
根据给定条件选择最可行的抽样方式
计算简单随机抽样所需的样本量
Ø 市场调研
【熟知】
市场调研的基本步骤(ᨀ出问题、调查收集材料、分析预测问题)
单选题及多项选择题的设置
数据编码及录入
Ø 数据预处理方法
【熟知】
数据预处理的基本步骤,包括数据集成(不同数据源的整合)、数据探索、数据变换(标
准化)、数据归约(维度归约技术、数值归约技术),这部分内容不需要涉及计算,只需要根
据需求明确可选的处理技术即可。
【应用】
数据清洗,包括填补遗漏的数据值(根据业务场景使用常数、中位数、众数等方法,不
涉及多重查补的方法)、平滑有噪声数据(移动平均)、识别或除去异常值(单变量根据中心
标准化值,多变量使用快速聚类),以及解决不一致问题(熟知概念即可),查重(只考核
SQL 的语句,不涉及 R、SAS 等其它语言)。
|
PART 4
数据建模分析
总体要求
领会模型基本原理,数值模型操作流程,懂得模型应用场景,能够完成数据建模分析报告。
|
1、描述性数据分析/挖掘方法——主成分分析
|
【领会】
主成分分析的计算步骤
主成分分析中对变量自身分布和多变量之间关系的假设以及模型设置
【熟知】
适用于主成分分析的变量度量类型。通过分析结果,选取合适的保留主成分的个数,注意区分两种不同的分析目的(尽量压缩变量、避免共线性情况下保留更多信息)保留主成分
个数的评判标准的差异。
【应用】
在深入理解主成分的意义的基础之上,在遇到业务问题时,有能力决定是否使用主成分分析方法;有能力决定何时采用相关系数计算方法和协方差矩阵计算方法;有能力解释主成分得分的结果;根据变量分布情况进行函数转换。
|
2、描述性数据分析/挖掘方法——因子分析
|
【领会】
了解因子分析模型设置,只需要关注主成分法的计算步骤
【熟知】
适用于因子分析的变量度量类型。通过分析结果,选取合适的因子个数;
知道最常用的因子旋转的方法。
【应用】
在遇到业务问题时,有能力决定是否使用因子分析,还是使用主成分分析方法就可以了;有能力根据原始变量在各因子上的权重明确每个因子的意义;有能力对大量变量进行维度分析,分维度打分,并比较与专家打分(德尔菲法)的区别;在聚类前对数据进行描述,发现理想的聚类方式和数量。
|
3、描述性数据分析/挖掘方法——聚类分析
|
【领会】
多种聚类算法的特点
【熟知】
聚类方法的基本逻辑
系统聚类和 K-Means 聚类的基本算法和优缺点
系统聚类的计算步骤,包括两点距离、两类合并的计算方法
系统聚类法中选择最优聚类数量的方法
K-Means 聚类的基本算法
聚类分析变量标准化的原因和计算方法
变量需要进行主成分分析的原因
变量进行函数转化的原因和计算方法
【应用】
结合客户画像、客户细分、商品聚类、离群值检验(欺诈、反洗钱)等业务运用场景,选取合适的聚类方法与步骤
聚类事后分析,根据聚类后变量分布情况获取每类的特征
|
4、描述性数据分析/挖掘方法——对应分析
|
【领会】
对应分析的算法
【熟知】
适用于对应分析的变量度量类型
对应分析与列联表分析、主成分分析的关系
这种方法优缺点及如何与其它模型结合使用
【应用】
对应分析使用的指标如何量化及其常见的量化方式
在客户满意度分析、市场绩效及产品细分等场景下的运用
双标图的可视化、解释与意义扩展
|
5、描述性数据分析/挖掘方法——多维尺度分析
|
【领会】
多维尺度分析的算法。
【熟知】
适用于多维尺度分析的变量度量类型
该分析方法和主成分分析、因子分析、对应分析的异同点,尤其是和因子分析的区别
【应用】
多维尺度分析在客户产品感知图等方面的运用
|
6、预测性数据分析方法——线性回归与模型诊断及优化
|
【领会】
线性回归系数的计算公式
【熟知】
明确线性回归的 6 个经典假设(线性模型、不存在共线性、残差期望为 0、同方差、正态性、随机抽样
明确违反前 5 个假设后出现的问题
模型是否违反前 5 个经典假设的检验方法与模型纠正的方法
变量筛选方法
离群值、指标计算方法
明晰横截面和时间序列数据在回归建模上的差异
【应用】
结合业务构建回归模型并且解释回归系数
根据业务场景与变量分布情况进行函数转换
解释变量为分类变量时的处理方法
区分预测性建模与解释性建模的关系
使用结果进行新样本预测
进行客户价值分析的基本步骤与注意事项
|
7、预测性数据分析方法——构造对二分类变量的预测模型
|
【领会】
卡方检验计算公式
二分类逻辑回归的计算公式
【熟知】
分类变量是否存在相关关系的描述方法和检验方法,涉及列联表分析、卡方检验
似然比与 Logit 转换
二分类逻辑回归模型构建与变量筛选
模型评估的方法,涉及混淆矩阵、ROC 曲线
【应用】
结合业务构建回归模型并且解释回归系数
根据业务场景与变量分布情况进行函数转换
使用结果进行新样本预测
进行客户流失预测、信用评级、精准营销等模型的基本步骤与注意事项
|
8、时间序列
|
【领会】
明确趋势分解法、ARIMA 方法、时间序列回归方法的差异和适用场景
明确每种方法的计算方法
【熟知】
趋势分解法,涉及乘法模型、加法模型
ARIMA 方法的具体步骤;时间序列回归的方法
【应用】
结合业务(业绩预测、预警),选取合适的分析方法
进行业务时间序列预测等模型的基本步骤与注意事项
|
总结交流与答疑
|
【培训讲师】
刘老师 十几年软件研发经验,十年企业培训经验,对Java、Python、区块链等技术领域有独特的研究,精通J2EE企业级开发技术。
常老师 北京大学会计学博士,ThoughtWorks中国首席金融数据科学家。具有18年数据规划、数据治理、智能算法在金融和电信行业的落地经验。协助企业逐步积累数据资产,运用数据智能工具优化业务流程,取得数字化竞争优势。著有《金融数据科学手册》系列丛书、《Python数据科学:技术详解与商业实践》、《用商业案例学R语言数据挖掘》、《胸有成竹:数据分析的SASEG进阶》等多本著作。
王老师 现任某上市公司软件产品部副总兼大数据产品线总经理,国际信息和数据质量协会(IAIDQ)会员,ITSS数据治理标准工作组成员。曾获得数据管理专业认证(CDMP)、数据治理专业认证(DGP)、信息质量专业认证(IQCP)三项国际认证。对大数据行业有着深入的研究和洞察,并对企业信息化平台建设,企业云计算及大数据平台建设有着丰富经验。
【CDA认证价值】
1、CDA考试是评判”数据标准化人才”的唯一考核途径。
2、CDA认证是数据分析领域相关岗位的一套系统化、专业化、科学化的人才技能标准。
3、考取CDA证书表明持证者具有数据分析相关的专业技能,可以提升自身在职场的竞争力。
4、持有CDA证书者薪资待遇明显高于未持证者,且在企业选拔人才时会被优先考虑。
【CDA认证考试报名】
报考条件:无条件限制,所有人员均可报考
考试方式
|
VUE线上考试,随约随考
|
考试题型
|
客观题(单选+多选)
|
考试时间
|
120分钟
|
考试成绩
|
分为 A、B、C、D 四个层次,A、B、C 为通过考试,D 为不通过
|
考试费用
|
1200元/人
|
【CDA认证有效期】
CDA认证有效期为三年,到期需进行年审。