Hive面试题阅读指南(必看)
大家好,我是帅地。
为了方便大家复习,这些面试题的展示采取了右边面试题目,左边答案的方式,方便大家按需查看。
由于手机端不支持这种展示方式,当然,为了手机方便阅读,下面会贴出所有面试题答案链接,不过大家最好在 PC 电脑端阅读哈,相关面试题还会持续更新,尽量补充完善起来,建议收藏帅地的网站哦。
面试题链接汇总
8. 为什么内部表的删除,就会将数据全部删除,而外部表只删除表结构? 为什么用外部表更好 ?
12. 简述row_number(),rank()和dense_rank()的区别 ?
13. 简述请说明hive中 Sort By,Order By,Cluster By,Distrbute By各代表什么意思?
14. 写出Hive中split、coalesce及collect_list函数的用法 ?
16. 简述Hive的两张表关联,使用MapReduce怎么实现 ?
18. 简述Hive 的 join 有几种方式,怎么实现 join 的? ?
19. 简述Hive 中的压缩格式 RCFile、 TextFile、 SequenceFile 各有什么区别? ?
20. 简述Hive 的 sort by 和 order by 的区别? ?
21. 简述Hive的函数:UDF、UDAF、UDTF的区别? ?
22. 简述所有的Hive任务都会有MapReduce的执行吗 ?
31. 简述Hive数据去重的两种方式 (distinct和group by) ?
32. 简述优化调优 (Count(Distinct)去重统计?
40. 简述Hive的HSQL转换为MapReduce的过程 ?
50. 简述Hive 动态分区和静态分区的区别 + 使用场景 ?
52. 简述Hive中MR(map reduce)、Tez和Spark执行引擎对比 ?
56. 简述Hive如果不用参数调优,在map和reduce端应该做什么 ?
57. 简述Hive的三种自定义函数是什么?实现步骤与流程?它们之间的区别?作用是什么 ?
60. 简述Hive的union和union all的区别 ?
66. 简述row_number,rank,dense_rank的区别 ?
67. 简述Hive count(distinct)有几个reduce,海量数据会有什么问题 ?