- 自我介绍
- 拉链表的制作,数据量有多少,为什么不用快照表呢
- 项目有哪些表
- 数仓分层有哪些,具体做了什么,数仓分层作用
- 怎么设计表,怎么建模,DIM
- DWD层的主题分了哪些
- 如何做的可视化
- 什么是数据倾斜,数据倾斜的解决方案
- Hadoop和spark的区别
- Spark的shuffle流程是怎么样的
- 对哪些数据库了解
- Shuffle有哪几种类型
- 在shuffle的过程中会进行排序吗,有哪几种排序
- 什么是快速排序,时间复杂度是多少,手撕快排代码题
- Spark是如何划分stage阶段
- Spark SQL的执行流程,如何将一个SQL语句转换为任务
美团大数据开发实习 2025年7月
里面有一些开放性问题是我自己写的,供参考~
54 分钟阅读