- 数学建模狂人18727
- 开课目的 -
在众多领域中:网站建设、人工智能、机器学习、数据挖掘、数据分析、云计算、网络爬虫等都离不开python的身影。Python在编程语言中排名前5,是非常受欢迎的编程语言。
Python数据分析师人才缺口大!IT时代逐渐被DT时代取代,用理性的数据分析代人工的经验分析成为主流,数据分析人才的供给指数仅为0.05,属于高度稀缺。
本课程是Python数据分析中级课程,要求学员具有Python基础,有概率论的基础。课程将通过概率论的知识分析数据的特征,根据机器学习方法建立合适模型,最后通过kaggle竞赛实践,带领同学们学习数据分析的方法与编程实现!
某名企高管曾说:“写上参加过Kaggle比赛,我会看简历。 得过一次10%,我会给电话面试。 得过2次或者以上10%,我会给on site面试。 得过一次前10,我们会谈笑风生。”
- kaggle竞赛介绍-
Kaggle 网站的比赛根据不同人群可以分为两大类
面向初学者
Getting Started
Playground
面向竞赛者
Recruitment
Featured
Research
- 课程目录 (拟定)-
【概率论与数理统计篇】
1. 概率论的基本概念
1.1 随机试验
1.2 样本空间、随机事件
1.3 频率与概率
1.4 等可能概型(古典概型)
1.5 条件概率
1.6 独立性
1.7 案例分析及作业
2. 随机变量及其分布
2.1 随机变量
2.2 离散型随机变量及其分布律
2.3 随机变量的分布函数
2.4 连续型随机变量及其概率密度
2.5 随机变量的函数的分布
2.6 案例分析及作业
3. 多维随机变量及其分布
3.1 二维随机变量
3.2 边缘分布
3.3 条件分布
3.4 相互独立的随机变量
3.5 两个随机变量的函数的分布
3.6 案例分析及作业
4. 随机变量的数字特征
4.1 数学期望
4.2 方差
4.3 协方差及相关系数
4.4 矩、协方差矩阵
4.5 案例分析及作业
5. 大数定律及中心极限定理
5.1 大数定理
5.2 中心极限定理
5.3 案例分析及作业
6. 样本及抽样分布
6.1 随机样本
6.2 抽样分布
6.3 案例分析及作业
7. 参数估计
7.1 点估计
7.2 基于截尾样本的最大似然估计
7.3 估计量的评选标准
7.4 区间估计
7.5 正态总体的均值与方差的区间估计
7.6 0-1分布参数的区间估计
7.7 单侧置信区间
7.8 案例分析及作业
8. 假设检验
8.1 假设检验
8.2 正态总体均值的假设检验
8.3 正态总体方差的假设检验
8.4 置信区间与假设检验之间的关系
8.5 样本容量的选取
8.6 分布拟合检验
8.7 秩和检验
8.8 案例分析及作业
【机器学习篇】
9. 回归分析(Regression Analysis)
9.1 算法简介及数学原理
9.2 实训:基于回归分析预测房价及变化趋势问题
9.3 课后作业及讲解
10. 逻辑回归(Logistic Regression)
10.1 算法简介及数学原理
10.2 实训:基于逻辑回归预测泰坦尼克号乘客存活率
10.3 课后作业及讲解
11. 决策树(Decision Tree)
11.1 算法简介及数学原理
11.2 实训:基于决策树算法对男女性别进行分类
11.3 课后作业及讲解
12. 人工神经网络(Artificial Neural Network)
12.1 算法简介及数学原理
12.2实训:基于BP人工神经网络对MNIST数据集进行识别和预测
12.3 课后作业及讲解
13. k近邻分类(k Nearest Neighbor)
13.1 算法简介及数学原理
13.2 实训:基于k近邻分类对小麦种子进行分类
13.3 课后作业及讲解
14. 聚类分析(Cluster Analysis)
14.1 算法简介及数学原理
14.2 实训:基于聚类分析对鸢尾花(iris)数据集分类
14.3 课后作业及讲解
【Kaggle进阶篇】
15. Kaggle数据分析美国城市的空气质量
15.1问题背景与分析
15.2分析方法与过程
15.3编程操作
15.4课外延伸
15.5小结与课后作业
16. Kaggle数据分析美国市民收入情况
16.1问题背景与分析
16.2分析方法与过程
16.3编程操作
16.4课外延伸
16.5小结与课后作业
17. Kaggle数据分析不同国家葡萄酒质量
17.1问题背景与分析
17.2分析方法与过程
17.3编程操作
17.4课外延伸
17.5小结与课后作业
18. Kaggle数据分析华盛顿共享单车租赁情况
18.1问题背景与分析
18.2分析方法与过程
18.3编程操作
18.4课外延伸
18.5小结与课后作业
19. Kaggle数据分析电影大数据评分情况
19.1问题背景与分析
19.2分析方法与过程
19.3编程操作
19.4课外延伸
19.5小结与课后作业
20. 期末考试
20.1问题背景与分析
20.2分析方法与过程
20.3.编程操作
20.4课外延伸
20.5小结与课后作业
- 讲师简介 -
Python狂人
智能、机器学习、深度学习和数据挖掘,擅长数据可视化、软件编程、算法研发、网页开发、数值计算和仿真模拟等,擅长Python、MATLAB、C、JavaScript、R等编程语言,经常参加数学建模、Kaggle、ACM、SAS等比赛,曾荣获80多项奖项。曾作为 Python 课程讲师,有 4 年多的教学经验,教学幽默风趣,深入浅出。
2019年kaggle Data松暨清华-新南威尔士中澳国际数据科学大赛二等奖
- 报名基础 -
1、学习过基础的概率论知识
2、有Python基础编程能力
3、学习过数值计算工具及绘图工具
- 授课方式 -
1、本次课程为录播课。
2、本次课程配套习题和习题讲解课。
- 服务步骤 -
第一步扎实基础,同学们先学习完成Python基础课程,本课程学习到第8节就具备了初步打比赛的基础。
第二步小试牛刀,完成基础课程的学习以后,同学们可以自由组队,开始接触比赛题目,到Kaggle竞赛官网,浏览题目。
第三步系统到第14节课,根据课程知识点找对应的比赛开练,边打比赛边学习知识。主要做老师后面课程的题目,找到自己不懂的地方,以便上课时找到不足之处。
第四步组队打正式比赛,通过练习,组队开始打最新的比赛,成绩优秀可以获得很高额的奖金。
联系客服
微信二维码
英伽保研
英伽大英赛
客服微信