- 自我介绍
- 挑一段你觉得收获最大的实习经历聊聊吧。比如当时做的业务是什么,技术用在了什么场景,最后有没有一些具体的指标来衡量效果?
- 我们来聊聊数仓吧,为什么要对数据仓库进行分层设计?
- Hive里的视图(View)用过吗?它主要是解决什么问题的?
- Hive的分区和分桶,能讲讲它俩的区别和各自的应用场景吗?
- 能详细说说Spark的shuffle过程吗?
- 在之前的工作中,有没有碰到过什么让你印象深刻的性能优化案例?
- 大数据处理中常说的数据倾斜,一般是什么原因造成的?你都知道有哪些解决方法?
- 编程语言这块,你比较熟悉哪些?
- MySQL索引的底层原理是什么?能展开讲讲吗?
- 数据库和数据仓库,它俩的核心区别是什么?分别适合用在什么样的业务场景里?
- 算法题:写一个二分查找。
- SQL题:写一条SQL,用窗口函数找出连续登录N天的用户。
来源:牛客网