培养方向 | 技术栈 | 项目经验 |
---|---|---|
数据平台开发 | Hadoop/Spark/HBase | 电商用户行为分析系统 |
实时计算方向 | Storm/Flink/Kafka | 金融实时风控系统 |
掌握Linux系统管理核心命令,完成Hadoop集群部署与调优。重点学习YARN资源调度机制,通过日志分析项目理解MapReduce编程范式。
深入Hive数据分区与分桶机制,结合Sqoop实现关系型数据库与HDFS双向数据迁移。通过零售业销售分析项目掌握ETL全流程。
从Storm拓扑结构到Spark Streaming微批处理,完成物联网设备数据实时预警系统开发。掌握Kafka在数据管道中的应用技巧。
师资标准 | 5年以上大数据平台开发经验 |
硬件配置 | 每人独立云服务器资源 |
支持 | 签订推荐协议 |
课程设置覆盖从数据采集(Flume)、清洗(HiveQL)、存储(HBase)到计算(Spark MLlib)的全链路技术栈。通过电商推荐系统项目实战,掌握协同过滤算法在分布式环境下的实现。