本课程主要讲解基于Spark 2.x的ML,ML是相比MLlib更高级的机器学习库,相比MLlib更加高效、快捷;ML实现了常用的机器学习,如:聚类、分类、回归等算法。本课拒绝枯燥的讲述,将循序渐进从Spark2.x的基础知识开始,然后再透彻讲解各个算法的理论、详细展示Spark实现,最后均会通过实例进行解析实战,帮助大家真正从理论到实践全面掌握Spark ML分布式机器学习。 通过该课程的学习,同学们可以全面掌握Spark ML机器学习,进而能够在实际工作中进行ML的应用开发和定制开发。且该课程优异毕业生均可获得老师内推机会,职位:数据挖掘工程师,就职企业:久邦数码、唯品会、腾讯等。掌握技术,高薪就业,课程等待你的加入! 课程大纲: 第一课 Spark ML基础入门 1、Spark介绍 2、Spark ML介绍 3、课程的基础环境 4、Spark SparkSession 5、Spark Datasets操作 6、Datasets操作的代码实操 第二课 Spark ML Pipelines(ML管道) 1、Pipelines的主要概念 2、Pipelines实例讲解 3、ML操作的代码实操 4、使用 ML Pipeline 构建机器学习工作流案例展示 5、实例的代码实操 第三课 Spark ML数学基础 1、ML矩阵向量计算 2、分类效果评估指标及ML实现详解 3、交叉-验证方法及ML实现详解 4、实例的代码实操 第四课 Spark ML特征的提取、转换和选择 1、特征的提取及ML实现详解 2、特征的转换及ML实现详解 3、特征的选择及ML实现详解 4、实例的代码实操 第五课 Spark ML线性回归/逻辑回归算法 1、线性回归算法 2、逻辑回归算法 3、ML回归算法参数详解 4、ML实例 5、实例的代码实操 第六课 Spark ML决策树/随机森林/GBDT算法 1、决策树算法 2、随机森林算法 3、GDBT算法 4、ML树模型参数详解 5、ML实例 6、实例的代码实操 第七课 Spark ML KMeans聚类算法 1、KMeans聚类算法 2、ML KMeans模型参数详解 3、ML实例 4、实例的代码实操 第八课 Spark ML LDA主题聚类算法 1、LDA主题聚类算法 2、ML LDA主题聚类模型参数详解 3、ML实例 4、实例的代码实操 第九课 Spark ML协同过滤推荐算法 1、协同过滤推荐算法 2、ML协同过滤分布式实现逻辑 3、ML协同过滤源码开发 4、实现实例 5、实例的代码实操 第十课 大型案例:基于Spark的推荐模型开发 1、案例背景 2、架构设计 3、数据准备 4、模型训练 5、模型预测 6、脚本封装 开课时间:本期课程将于10月29日开始。课程持续时间大约为12周。 课程基础:学习者需要有一些Spark/Scala/线性代数基础知识。 授课对象:对spark有兴趣,有志从事数据分析,数据挖掘工作方向的朋友 课程环境:Spark2.0, Spark2.1, Spark2.2 预期收获: 通过该课程的学习,同学们可以全面掌握Spark2.0 ML机器学习,进而能够在实际工作中进行ML的应用开发和定制开发。该课程优异毕业生均可获得老师内推机会,职位:数据挖掘工程师,就职企业:久邦数码、唯品会、腾讯等。 讲师简介: 黄美灵,Spark爱好者,现从事移动互联网的计算广告和数据变现工作,专注Spark机器学习在计算广告中的研究和实践。现著有:《Spark MLlib机器学习:算法、源码及实战详解》 CSDN博客专家:http://blog.csdn.net/sunbow0 课程视听: |