课程简介
本课程是2025年最新版Python大数据开发就业班,全面覆盖大数据核心技术栈,包括Hadoop、Spark、Flink、Kafka等主流框架,结合多个企业级实战项目如实时计算、用户画像、BI报表开发等。课程从数据库基础入门,逐步深入分布式计算、数据仓库构建、实时数据处理等核心领域,帮助学员掌握Python在大数据领域的全栈开发技能。通过系统学习,学员将具备独立完成大数据项目开发、数据处理与分析、系统架构设计的能力,为高薪就业打下坚实基础。课程配套完整课件、代码和实战案例,确保学以致用。
下载地址
课程目录
01 数据库基础
第1–14节:SQL查询、聚合函数、多表连接、子查询、窗口函数等数据库操作。
02 Oracle数据库
第15–28节:存储过程、触发器、游标、定时任务、数据透视等高级功能。
03 Hadoop技术栈
第29–42节:HDFS、MapReduce、Hive、Zookeeper、集群搭建与优化。
04 黑马甄选项目
第43–56节:数仓设计、ETL流程、维度建模、DataX同步、调度任务。
05 AI大模型项目
第57–60节:Git版本控制、出行数据分析、QuickBI可视化、教育数仓构建。
06 Python基础编程
第61–74节:语法基础、函数、面向对象、文件操作、正则表达式、MySQL连接。
07 BI报表开发
第75–88节:FineReport安装、数据集配置、普通报表、决策报表、大屏设计。
08 数据分析pandas
第89–102节:Series与DataFrame、数据合并、分组聚合、可视化、业务分析。
09 Spark技术栈
第103–116节:RDD算子、集群部署、Spark SQL、性能优化、项目实战。
10 Kafka及流处理
第117–130节:消息队列原理、Kafka架构、API操作、数据分发、负载均衡。
11 用户画像项目
第131–144节:标签体系、数据同步、ES集成、年龄段与性别标签开发。
12 Flink全栈开发
第145–158节:流式计算、Table API、时间语义、窗口操作、集群部署。
13 实时计算项目
第159–172节:DataWorks集成、StarRocks表设计、Flink CDC、Paimon数据湖。
--- 点击展开详细目录 ---
|