课程简介
本课程是专为大数据领域学习者设计的全栈就业速成指南,全面覆盖Hadoop、Spark、Scala、Hive、Kafka等核心技术栈。课程从JavaSE基础入门,逐步深入Linux系统操作、分布式计算框架原理,并通过企业级离线数仓项目实战,帮助学员掌握数据采集、存储、计算到可视化的完整大数据处理流程。学员将学习到HDFS、MapReduce、YARN核心组件,Spark RDD编程模型,以及数据仓库分层建模等关键技术。通过本课程学习,学员能够具备大数据平台搭建、数据处理分析和项目部署能力,满足企业大数据开发岗位的技术要求。
下载地址
课程目录
01 学习环境虚拟机 VMWare16
第1节:VMware安装、私钥配置等环境准备内容。
02 第1~28天-JavaSE
第2-28节:Java基础语法、面向对象、集合框架、多线程、IO流、JDBC、MySQL、Maven等核心内容。
03 第29~32天-Linux和Shell
第29-32节:Linux系统操作、Shell脚本编写、常用命令和工具使用。
04 第33~44天-Hadoop
第33-44节:Hadoop生态介绍、HDFS、YARN、MapReduce、Zookeeper等大数据基础组件。
05 第45~52天-Hive
第45-52节:Hive数据仓库工具、SQL查询、函数、分区、优化等数据处理内容。
06 第53天-Flume
第53节:Flume日志采集工具架构、部署和案例应用。
07 第54~56天-Kafka
第54-56节:Kafka消息队列原理、生产消费API、Broker配置和监控。
08 第57~60天-数仓之数据采集项目
第57-60节:数据采集项目实战、Flume、Kafka、Maxwell、DataX等工具集成。
09 第61~68天-Scala
第61-68节:Scala语言基础、面向对象、函数式编程、集合操作等。
10 第69~81天-Spark
第69-81节:Spark核心概念、RDD算子、SQL、Streaming、内核原理等。
11 第82~95天-数仓之离线数仓项目
第82-95节:离线数仓项目全流程、ODS/DWD/DWS/ADS层开发、调度和可视化。
--- 点击展开详细目录 ---
|