数仓知识点

数仓知识点

27 篇文章 数据仓库知识点整理

实习期间如何成功转正——从准备到答辩的全攻略

实习期间如何成功转正——从准备到答辩的全攻略

刚刚结束实习答辩,成功拿到转正offer,回想起这几个月的准备过程,有太多经验想和大家分享。很多同学私信问我转正到底看什么,答辩怎么准备,今天就把我的经验毫无保留地分享出来。 转正到底看什么?别被表面功夫迷惑 很多人以为转正就是走个过场,或者觉得平时表现好就够了。但实际上,公司考察的远比你想象的深入。 技术能力是硬指标 不是说你会用框架就行,而是要真正理解原理。我在答辩时被问到Spark为什么比MapReduce快,如果只知道"内存计算&

用AI准备面试:从简历优化到知识点掌握

用AI准备面试:从简历优化到知识点掌握

我是如何用AI刷爆技术面试的 最近发现个神器,OpenAI又搞了个学习模式,不光ChatGPT,Claude、Gemini这些都有了。说白了就是AI不再只是等你问,而是会主动抛问题,就像个面试官一样怼你。 作为一个刚经历完秋招的人,我必须说,这玩意儿真的太好用了。 先说简历这档子事 以前改简历,要么自己瞎改,要么花钱找人。现在直接把简历丢给AI: "我简历上写了Flink实时处理,你觉得面试官会问啥?

增加并行度可以解决数据倾斜吗?

增加并行度可以解决数据倾斜吗?

在大数据面试、工作中,很多人一听到“数据倾斜”就脱口而出“加并行度!”但真相到底如何?其实,加并行度只对部分情况有效,根本上还得看你的数据倾斜属于哪一种。下面我来详细拆解一下👇 分场景分析(+举例) 1. 轻度数据倾斜:并行度可以缓解 * 解释:如果只是部分 key 的数据量稍微大一些,

深入理解:ETL开发与数据开发到底有啥区别?

深入理解:ETL开发与数据开发到底有啥区别?

小结 今天咱们来好好聊聊ETL开发和数据开发这两个“兄弟”,它们听起来有点像,但其实各有各的“绝活”!简单来说,ETL(抽取、转换、加载)开发就是数据处理流水线上的一个关键环节,专门负责把数据从各种“角落”里捞出来,给它“洗洗澡,整整容”,然后送到该去的地方。而数据开发呢,

数据仓库为什么要分层

数据仓库为什么要分层

概述 在企业数字化转型过程中,数据仓库作为支撑业务决策的重要基础设施,承载着海量的业务数据。然而,如果将所有数据都放在一个层级中处理,就像把生产车间、仓储区和展示厅混在一起,必然会造成混乱。因此,数据仓库需要分层设计,就像建造一栋大楼需要设计不同的楼层一样,每一层都有其特定的功能和作用。 典型的数据仓库分层架构 根据数据处理的逻辑步骤,典型的数据仓库分为以下几个层次: 1. ODS层(原始数据层) 功能定位:

小万和大树知识成长营地

注册成功!

欢迎回来,已成功登录。

你已成功订阅 小万和大树知识成长营地。

成功!请查收登录邮件。

成功!账单信息已更新。

账单信息未更新。