字节跳动-生活服务-大数据开发一面(2025.3.13)

第一个实习,我给出的答案是我辅导的一个姐妹~ 他说数据迁移这边总是感觉说不太好,数据迁移确实是一个容易费力不讨好的工作,所以我给他写出来了~ 也欢迎其他姐妹投稿~(适用于国内,海外求职)
字节跳动-生活服务-大数据开发一面(2025.3.13)
  1. 讲讲实习做的项目:背景、内容、你做了什么、结果
  2. "dwd、dwm、dws这三层的区别
  3. 讲下spark有哪些优化方法
  4. 小文件产生的原因和危害
  5. Sparkjoin分多少种 什么时候用hash join,什么时候得到sort merge join-------
  6. sql题:表名:流量表log(每天有百亿数据),字段:用户id:uid,设备id:devic id,城市:city,时间:time,日期:date;问题:最近7天中每天活跃的用户数和设备数是多少?(坑:百亿级的每天只有7个分区处理,可能会造成数据倾斜预聚合?)

参考答案如下:

阅读全文

注册 立即解锁全文并访问全部文章: 网站会员, 成为小万的高级会员 and 海外DE会员 tiers 专享.

订阅
已有账号? 登录

小万和大树知识成长营地

注册成功!

欢迎回来,已成功登录。

你已成功订阅 小万和大树知识成长营地。

成功!请查收登录邮件。

成功!账单信息已更新。

账单信息未更新。