Python , 是一种面向对象的解释型计算机程序设计语言,具有丰富和强大的库,Python 已经成为继JAVA,C++之后的的第三大语言。 特点:简单易学、免费开源、高层语言、可移植性强、面向对象、可扩展性、可嵌入型、丰富的库、规范的代码等。
Python除了极少的事情不能做之外,其他基本上可以说全能,在金融领域也是大显神通,系统运维、图形处理、数学数据的处理、宏观新闻信息的整理、数据库编程、数据分析、机器学习、人工智能等等。
本次金领学堂为大家推荐6次机器学习和人工智能课程相信能够助你在量化交易领域拓展出新的空间。
6次线上直播课程+课后微信交流群
适用人群
1. 计算机、统计或相关专业本科以上学历
2. 希望学习本课程后能够胜任机器学习、数据挖掘或其他相关岗位的在校和已经工作的IT从业者。
3. 需要一定的基础: (1) 会任意一门编程语言(方便理解算法实现的代码,语言不是核心,不要陷入语言本身,机器学习班主要使用Python);(2) 一定的数学分析、线性代数、概率论和数理统计等基础;(3) 基本的问题抽象能力和算法思维;(4) 最重要的:每周至少有半天时间做复习/预习。
1. 原理阐述:进行人工智能基本知识普及
2. 核心推导:进行机器学习的推导核心内容解析
3. 代码实现:通过python实现机器学习
4. 项目实践:详细分析机器学习的大部分核心算法:Logistic/Softmax回归、BFGS拟牛顿、盲源分离BSS/独立成分分析ICA、决策树CART/随机森林、协同过滤、SVD、SVM/SVR、k-means、密度聚类、谱聚类SC、标签传递算法LPA、EM算法、GMM/DPGMM、主题模型LDA、HMM等。
5. 案例分析如: Nagel-Schreckenberg 交通流模型模拟、使用线性回归分析广告投入与收益数据、使用线性回归等手段预测Boston房价、使用决策树和随机森林做北京市犯罪率分析、环境监控数据数据清洗、电流强度数据的噪声处理、使用Logistic回归/决策树/随机森林/SVM分别对鸢尾花数据分类、使用XGBoost做葡萄酒类别分类、使用XGBoost预测泰坦尼克号海难乘客存活率等
第一场
Python开源包与数据处理初步
2017年10月17日(周二) 晚上19:30—21:30
1. 解释器Python2.7与IDE:Anaconda/Pycharm
2. Python基础:列表/元组/字典/类/文件
3. numpy/scipy/matplotlib/panda的介绍和典型使用
4. 多元高斯分布、典型图像处理
5. scikit-learn的介绍和典型使用
6. 多种数学曲线、多项式拟合
7. 快速傅里叶变换FFT、奇异值分解SVD
8. Soble/Prewitt/Laplacian算子与卷积网络
9. 卷积与(指数)移动平均线
10. 股票数据分析
11. 实际生产问题中算法和特征的关系
12. 缺失数据的处理、环境数据异常检测和分析
第二场
回归分析
2017年10月19日(周四) 晚上19:30—21:30
1. 线性回归、Logistic/Softmax回归、广义线性回归
2. L1/L2正则化
3. Ridge与LASSO、Elastic Net
4. 梯度下降算法:BGD与SGD
5. 特征选择与过拟合
6. Softmax回归的概念源头
7. 最大熵模型、K-L散度
代码和案例实践:
1.机器学习sklearn库介绍
2.回归代码实现和调参
3.Ridge回归/LASSO/Elastic Net
4.Logistic/Softmax回归
5.广告投入与销售额回归分析
6.鸢尾花数据集的分类
7.回归代码实现和调参
8.交叉验证、数据可视化
第三场
决策树和随机森林
2017年10月24日(周二) 晚上19:30—21:30
1. 熵、联合熵、条件熵、KL散度、互信息
2. 最大似然估计与最大熵模型
3. ID3、C4.5、CART详解
4. 决策树的正则化
5. 预剪枝和后剪枝
6. Bagging
7. 随机森林
8. 不平衡数据集的处理
9. 利用随机森林做特征选择
10. 使用随机森林计算样本相似度
11. 异常值检测
代码和案例实践:
1.随机森林与特征选择
2.决策树应用于回归
3.多标记的决策树回归
4.决策树和随机森林的可视化
5.葡萄酒数据集的决策树/随机森林分类
6.泰坦尼克乘客存活率估计
第四场
SVM分类器
2017年10月26日(周四) 晚上19:30—21:30
1. 线性可分支持向量机
2. 软间隔
3. 损失函数的理解
4. 核函数的原理和选择
5. SMO算法、支持向量回归SVR、多分类SVM
代码和案例实践:
1.原始数据和特征提取
2.调用开源库函数完成SVM
4.葡萄酒数据分类
5.数字图像的手写体识别
5.MNIST手写体识别
6.SVR用于时间序列曲线预测
7.SVM、Logistic回归、随机森林三者的横向比较
第五场
无监督聚类
2017年10月31日(周二) 晚上19:30—21:30
1. 各种相似度度量及其相互关系
2. Jaccard相似度和准确率、召回率
3. Pearson相关系数与余弦相似度
4. K-means与K-Medoids及变种
5. AP算法(Sci07)/LPA算法及其应用
6. 密度聚类DBSCAN/DensityPeak(Sci14)
7. 谱聚类SC
8. 聚类评价和结果指标
代码和案例实践:
1.K-Means++算法原理和实现
2.向量量化VQ及图像近似
3.并查集的实践应用
4.密度聚类的异常值检测
5.谱聚类用于图片分割
第六场
自然语言的文本分析与处理
2017年11月2日(周四) 晚上19:30—21:30
1. 隐马尔科夫模型HMM
2. 主题模型LDA
3. 词潜入和word2vec
4. 前向/后向算法
5. HMM的参数学习
6. Baum-Welch算法详解
7. Viterbi算法详解
8. 隐马尔科夫模型的应用优劣比较
9. 共轭先验分布
10. Laplace平滑
11. Gibbs采样详解
12. tropolis-Hastings算法
13. MCMC
代码和案例实践:
1.敏感话题分析
2.网络爬虫的原理和代码实现
3.LDA开源包的使用和过程分析
4.HMM用于中文分词
5.文件数据格式UFT-8、Unicode
6.发现新词和分词效果分析
7.高斯混合模型HMM
8.GMM-HMM用于股票数据特征提取
邹博
中国科学院副研究员 天津大学特聘教授
北京某气象分析科技公司首席科学家,北京某人工智能投资公司顾问;研究方向机器学习、数据挖掘、计算几何,应用于大型气象设备的图像与文本挖掘、股票交易与预测、量子化学医药路径寻优、传统农资产品价格预测和决策等领域。
您将获得
1. 详细掌握机器学习各个算法的优缺点和适用条件:包括:Logistic/Softmax回归、BFGS拟牛顿、盲源分离BSS/独立成分分析ICA、决策树CART/随机森林、协同过滤、SVD、SVM/SVR、k-means、密度聚类、谱聚类SC、标签传递算法LPA、EM算法、GMM/DPGMM、主题模型LDA、HMM等。
2. 课程结束后,有兴趣和精力的同学能够自己使用Python或C/C++自己实现一遍(非调用开源库,课程结束后提供我个人实现的版本)。
活动福利
2.该直播课程视频可永久回放
3.三场活动一起购买者,请联系金领萌妹(jlxtmm)返还现金红包
活动费用
此次活动六场总价:698元
单次第一场价格为:98元
凡报名报名六场全部课程的学员可以扫描最下方“金领萌妹”二维码进行报名,回复萌妹:Python+六场+姓名+手机号