大数据挖掘和分析技术实战-Hadoop/Mahout/MLlib/Storm/Docker-公开课-中培网企业培训官网

您的位置：首页 > 公开课 > > 大数据挖掘和分析技术实战-Hadoop/Mahout/MLlib/Storm/Docker

大数据挖掘和分析技术实战-Hadoop/Mahout/MLlib/Storm/Docker

收藏课程

课程编号：237447 时间：2022年06月23日-24日讲师：杨老师地点：北京

学习费用：5900 元/位

用手机看：

在线报名 word版下载下载报名表

课程编号

开课日期

地点

培训天数

选择报名

培训对象课程收益课程大纲讲师介绍在线报名

培训对象：

1，系统架构师、系统分析师、高级程序员、资深开发人员。 2，牵涉到大数据处理的数据中心运行、规划、设计负责人。 3，政府机关，金融保险、移动和互联网等大数据来源单位的负责人。 4，高校、科研院所牵涉到

课程收益：

课程大纲：

线下培训费：5900元/人（含教材、证书、午餐、学习用具等）。住宿协助安排，费用自理。

学员基础

1，对IT系统设计有一定的理论与实践经验。

2，数据仓库与数据挖掘处理有一定的基础知识。

3，对Hadoop/Yarn/Spark大数据技术有一定的了解。

培训目标

1, 学习云环境下大数据分析挖掘的相关基础知识。

2，学习Mahout和MLlib的核心技术方法及应用。

3，了解云环境下大数据分析的使用流程和方法。

4, 掌握Storm流处理技术和Docker等技术与大数据挖掘结合的方法。

培训内容

第一讲大数据挖掘及其背景

1) 大数据环境下的数据分析

2) 数据挖掘定义

3) Hadoop相关技术

4) 大数据挖掘知识点

第二讲 MapReduce/Spark DAG计算模式

1）分布式文件系统DFS

2）MapReduce计算模型介绍

3）使用MR进行算法设计

4）DAG及其算法设计

第三讲大数据挖掘分析工具

1）Yarn中的Mahoutb介绍

2）Spark中的Mahout/MLib介绍

3）推荐系统及其Mahout实现方法

4）信息聚类及其MLlib实现方法

5）分类技术在Mahout/MLib中的实现方法

第四讲大数据推荐及其应用开发

1）一个推荐系统的模型

2）基于内容的推荐

3）协同过滤

4）基于Mahout的电影推荐案例

第五讲大数据分类技术及其应用

1）分类的定义

2）分类主要算法

3）Mahout分类过程

4）评估指标以及评测

5）贝叶斯算法新闻分类实例

第六讲大数据聚类技术及其应用

1）聚类的定义

2）聚类的主要算法

3）K-Means、Canopy及其应用示例

4）Fuzzy K-Means、Dirichlet及其应用示例

5）基于MLlib的新闻聚类实例

第七讲大数据关联规则和相似项发现

1）购物篮模型

2）Apriori算法

3）抄袭文档发现

4）近邻搜索的应用

第八讲流数据挖掘相关技术

1）流数据挖掘及分析

2）Storm和流数据处理模型

3）流处理中的数据抽样

4）流过滤和Bloom filter

第九讲云环境下大数据挖掘应用

1）与Yarn/Spark集群应用的协作

2）与Docker等其它云工具配合

3）大数据挖掘行业应用展望

讲师介绍

杨老师

主要研究网络信息分析以及云计算相关技术，长期从事通信网管系统、网络信息处理、商务智能(BI)以及电信决策支持系统的研究开发工作，主持和参与了多个国家和省部级基金项目，具有丰富的工程实践及软件研发经验。