蔚来数据开发一面面试题
这里面的最后一个问题“项目中遇到的难点”,因为不知道具体的项目,所以我根据我辅导的一个学员的项目写的,大家可以按照这篇文章的逻辑进行自己思考
34 篇文章 — 数据仓库实际项目案例
这里面的最后一个问题“项目中遇到的难点”,因为不知道具体的项目,所以我根据我辅导的一个学员的项目写的,大家可以按照这篇文章的逻辑进行自己思考
字节跨部门转正三面(适用于国内,海外求职)
京东大数据开发,社招题目,但是整体看下来其实校招也可以看,但是这里面涉及到了很多数据质量的问题,建议新手看的话从这些去考虑什么样的数据模型是质量好,多思考思考。
适用于国内,海外求职
1. 自我介绍 2. dqc怎么配的? 3. sla怎么配的? 4. mysql发生数据的增删改的时候,你怎么同步? 5. 你说用Flink cdc完成了数据同步,你讲讲具体怎么操作? 6. 了不了解redis? 7. redis为什么快 8. redis的底层结构是什么? 9.
适用于国内,海外求职
1.自我介绍 2.项目拷打穿插八股: a.你在哪些功能中引入了新的组件? b.ES相比于MySQL好在哪? c.什么场景下用MySQL查找,什么场景下用ES? d.大数据量用ES就一定更好吗? e.你知道在分布式部署下ES可能出现哪些问题吗? f.讲讲RocketMQ在你的项目中的使用逻辑? g.你认为在你的理解中RocketMQ最重要的特性是什么?(顺序性,
适用于国内,海外求职
💡 Spark的提交任务流程?原理? 🚀 实习项目中你是采取的是什么模式去提交的? ⚙️ 怎么配置Executor? 📝 你了解Spark的一些配置吗? 🔄 TaskManager和Executor的区别? 💾 写入MySQL怎么做?方式? 📖 知识图谱中常见的查询命令? 🗄️ 除了Neo4j图形数据库,还了解其他数据库吗? 💻 有用Java用过UDF吗? 🧩 UDF类型? HashMap的底层结构? 🌳 链表+红黑树有了解吗?为什么需要这样设计? ⚡ Spark和MR区别? 💽 MR写磁盘会排序吗? 🔁 Map阶段到Reduce阶段发生了什么?
🏗️ 详细说明分层架构的实现思路及原因 🔄 技术方案优化空间及具体改进措施 🔗 开链/闭链的核心判断字段设计 💾 数仓层面可做的存储/查询优化方案 👥 多团队协作时人员分工与排期管理经验 🤝 业务沟通机制的建设建议 🔍 倾斜问题的发现与定位方法 🎯 分桶/加盐之外的解决方案 🔄 Join场景与Group By场景的倾斜处理差异 📊 全链路数据治理的关键监控节点哦 🎯 项目细节问题 • 项目细节过多,涉及具体操作(如某层如何实现、原因分析、优化可能性)