数仓知识点

数仓知识点

29 篇文章 数据仓库知识点整理

阿里饿了么大数据开发2025.3.14

1. 在整个数仓模型构建中分了3个数据域,其中每个数据域对应的业务过程都是什么? dim表没开发过 2. DWD层的开发步骤 3. 维度退化 4. DWM公皇WM是在开发公用层吗、跟DWD层的区别 5. DWM是在做一些业务的串联还是基于一个业务? 6. 看板代码1000降到100,你的贡献 7. 在做DWM中间层替换时要注意的核心点 8. 做完新看板替换旧看板时要考虑什么东西,

快手大数据开发一面2025.4.2

1. 建模理论:星型模型和雪花模型的区别,优缺点 2. 刚刚说的规范化中的”规范“是什么意思 3. 你觉得目前常用的数仓体系下星型模型和雪花模型哪个更合适? 4. 雪花模型适用的场景? 5. 事实表分哪几种类型? 6. 讲一下在AI猎头项目里具体做什么?项目做什么?你做了什么? 7. 数据域是怎么划分的?

实习期间如何成功转正——从准备到答辩的全攻略

实习期间如何成功转正——从准备到答辩的全攻略

刚刚结束实习答辩,成功拿到转正offer,回想起这几个月的准备过程,有太多经验想和大家分享。很多同学私信问我转正到底看什么,答辩怎么准备,今天就把我的经验毫无保留地分享出来。 转正到底看什么?别被表面功夫迷惑 很多人以为转正就是走个过场,或者觉得平时表现好就够了。但实际上,公司考察的远比你想象的深入。 技术能力是硬指标 不是说你会用框架就行,而是要真正理解原理。我在答辩时被问到Spark为什么比MapReduce快,如果只知道"内存计算&

用AI准备面试:从简历优化到知识点掌握

用AI准备面试:从简历优化到知识点掌握

我是如何用AI刷爆技术面试的 最近发现个神器,OpenAI又搞了个学习模式,不光ChatGPT,Claude、Gemini这些都有了。说白了就是AI不再只是等你问,而是会主动抛问题,就像个面试官一样怼你。 作为一个刚经历完秋招的人,我必须说,这玩意儿真的太好用了。 先说简历这档子事 以前改简历,要么自己瞎改,要么花钱找人。现在直接把简历丢给AI: "我简历上写了Flink实时处理,你觉得面试官会问啥?

增加并行度可以解决数据倾斜吗?

增加并行度可以解决数据倾斜吗?

在大数据面试、工作中,很多人一听到“数据倾斜”就脱口而出“加并行度!”但真相到底如何?其实,加并行度只对部分情况有效,根本上还得看你的数据倾斜属于哪一种。下面我来详细拆解一下👇 分场景分析(+举例) 1. 轻度数据倾斜:并行度可以缓解 * 解释:如果只是部分 key 的数据量稍微大一些,

深入理解:ETL开发与数据开发到底有啥区别?

深入理解:ETL开发与数据开发到底有啥区别?

小结 今天咱们来好好聊聊ETL开发和数据开发这两个“兄弟”,它们听起来有点像,但其实各有各的“绝活”!简单来说,ETL(抽取、转换、加载)开发就是数据处理流水线上的一个关键环节,专门负责把数据从各种“角落”里捞出来,给它“洗洗澡,整整容”,然后送到该去的地方。而数据开发呢,

小万和大树知识成长营地

注册成功!

欢迎回来,已成功登录。

你已成功订阅 小万和大树知识成长营地。

成功!请查收登录邮件。

成功!账单信息已更新。

账单信息未更新。