一面(8.27)
- 实习内容
还在职吗
实习期间主要干什么
和你对接的同学有哪些
产运和算法同学怎么使用你产出的数据
数据集底层用什么技术栈
你写SQL任务的时候是怎么优化代码的,写代码的时候哪些地方需要注意
有自己搭建过看板吗
知道SLA基线吗,有主动了解过吗
- 大数据技术问题
一个spark任务怎么优化
发现写好的spark任务运行的很慢要怎么办
数据倾斜怎么处理
如果任务在读文件的时候运行很慢怎么办
内存利用率过低怎么办
CPU利用率过低怎么办
你经常用的spark参数还有哪些
- SQL
| 1234 | table有字段id user_id_list device_id_list app_id_list写一段SQL将三个列表中的元素展开,并且元素需要一一对应(user_id_1 对应 device_id_1 对应 app_id_1)最后的结果应该是id user_id device_id app_id的形式 |
|---|
这个SQL写完的结果数据量会变多吗
参考答案如下: