HDFS面试题阅读指南(必看)

大家好,我是帅地。

为了方便大家复习,这些面试题的展示采取了右边面试题目,左边答案的方式,方便大家按需查看。

由于手机端不支持这种展示方式,当然,为了手机方便阅读,下面会贴出所有面试题答案链接,不过大家最好在 PC 电脑端阅读哈,相关面试题还会持续更新,尽量补充完善起来,建议收藏帅地的网站哦。

面试题链接汇总

1. 简述什么是HDFS,以及HDFS作用 ?

2. 简述HDFS文件写入和读取流程 ?

3. 简述HDFS的存储机制 ?

4. 简述HDFS优缺点,以及使用场景 ?

5. 简述HDFS的容错机制 ?

6. HDFS的常见数据格式,列式存储格式和行存储格式异同点,列式存储优点有哪些 ?

7. HDFS如何保证数据不丢失 ?

8. 简述HDFS的默认副本数?为什么是这个数量?如果想修改副本数怎么修改 ?

9. 简述HDFS的Block ?

10. HDFS的块默认大小,64M和128M是在哪个版本更换的?怎么修改默认块大小?

11. 简述HDFS的block为什么是128M?增大或减小有什么影响 ?

12. 简述HDFS HA怎么实现?什么架构 ?

13. 简述HDFS的数据一致性靠什么保证? ?

14. 简述HDFS 使用NameNode的好处 ?

15. HDFS为什么文件要分块进行存储管理?

16. 简述HDFS的mapper和reducer的个数如何确定?reducer的个数依据是什么 ?

17. 简述HDSF通过什么中间组件去存储数据 ?

18. 简述HDFS跨节点怎么进行数据迁移 ?

19. 简述HDFS怎么保证数据安全 ?

20. 简述HDFS中向DataNode写数据失败了怎么办 ?

21. 简述什么是Hadoop2.x HDFS快照 ?

22. 简述HDFS写数据过程,写的过程中有哪些故障,分别会怎么处理 ?

23. 简述NameNode存数据吗 ?

24. 简述HDFS中DataNode怎么存储数据的 ?

25. 简述HDFS写流程中如果DataNode突然宕机了怎么办 ?

26. 简述直接将数据文件上传到HDFS的表目录中,如何在表中查询到该数据 ?

27. 简述NameNode与SecondaryNameNode 的区别与联系 ?

28. 简述ZKFailoverController主要职责 ?

29. 简述Secondary NameNode 了解吗,它的工作机制是怎样的 ?

30. Secondary NameNode 不能恢复 NameNode 的全部数据,那如何保证NameNode 数据存储安全 ?

31. 简述fsimage 和 edit 的区别 ?

32. 简述一个文件只有一行,但是这行有 100G 大小,mr 会不会切分,我们应该怎么解决 ?

发表评论

后才能评论