百度数仓面试题

百度数仓面试题

💡 Spark的提交任务流程?原理?

🚀 实习项目中你是采取的是什么模式去提交的?

⚙️ 怎么配置Executor?

📝 你了解Spark的一些配置吗?

🔄 TaskManager和Executor的区别?

💾 写入MySQL怎么做?方式?

📖 知识图谱中常见的查询命令?

🗄️ 除了Neo4j图形数据库,还了解其他数据库吗?

💻 有用Java用过UDF吗?

🧩 UDF类型? HashMap的底层结构?

🌳 链表+红黑树有了解吗?为什么需要这样设计?

⚡ Spark和MR区别?

💽 MR写磁盘会排序吗?

🔁 Map阶段到Reduce阶段发生了什么?

🧠 机器学习常见算法?

📊 支持向量机原理?使用场景?

📈 XGBoost原理?

📄 SQL中开窗函数?

▶️ 排序函数区别?

⚠️ 在写SQL数据处理的适合,遇到的数据倾斜问题?

🌐 项目中,知识图谱是怎么构建的?常见查询语句?

参考答案(会员可见)

About the author
小万来了

小万和大树知识成长营地

注册成功!

欢迎回来,已成功登录。

你已成功订阅 小万和大树知识成长营地。

成功!请查收登录邮件。

成功!账单信息已更新。

账单信息未更新。