Hive面试题阅读指南(必看)

大家好,我是帅地。

为了方便大家复习,这些面试题的展示采取了右边面试题目,左边答案的方式,方便大家按需查看。

由于手机端不支持这种展示方式,当然,为了手机方便阅读,下面会贴出所有面试题答案链接,不过大家最好在 PC 电脑端阅读哈,相关面试题还会持续更新,尽量补充完善起来,建议收藏帅地的网站哦。

面试题链接汇总

1. 简述什么是Hive?

2. 简述Hive的优缺点 ?

3. 简述Hive的作用 ?

4. 简述Hive 架构原理 ?

5. 简述Hive和关系数据库比较 ?

6. 简述什么是Hive 管理表和外部表 ?

7. 简述Hive内部表和外部表的区别 ?

8. 为什么内部表的删除,就会将数据全部删除,而外部表只删除表结构? 为什么用外部表更好 ?

9. 简述Hive建表语句?创建表时使用什么分隔符 ?

10. 简述Hive删除语句外部表删除的是什么 ?

11. 简述Hive导入数据的五种方式是什么?举例说明 ?

12. 简述row_number(),rank()和dense_rank()的区别 ?

13. 简述请说明hive中 Sort By,Order By,Cluster By,Distrbute By各代表什么意思?

14. 写出Hive中split、coalesce及collect_list函数的用法 ?

15. 简述Hive如何实现分区 ?

16. 简述Hive的两张表关联,使用MapReduce怎么实现 ?

17. 简述Hive有哪些方式保存元数据,各有哪些特点?

18. 简述Hive 的 join 有几种方式,怎么实现 join 的? ?

19. 简述Hive 中的压缩格式 RCFile、 TextFile、 SequenceFile 各有什么区别? ?

20. 简述Hive 的 sort by 和 order by 的区别? ?

21. 简述Hive的函数:UDF、UDAF、UDTF的区别? ?

22. 简述所有的Hive任务都会有MapReduce的执行吗 ?

23. 简述Hive有索引吗 ?

24. 简述对Hive桶表的理解 ?

25. 简述Hive本地模式 ?

26. 简述Hive表关联查询,如何解决数据倾斜的问题 ?

27. 简述什么是Hive HQL之Fetch抓取 ?

28. 简述Hive并行模式 ?

29. 简述Hive中的优化分类 ?

30. 简述什么是笛卡尔乘积与小表join大表 ?

31. 简述Hive数据去重的两种方式 (distinct和group by) ?

32. 简述优化调优 (Count(Distinct)去重统计?

33. 简述Hive的介绍一下有哪些常用函数 ?

34. 简述Hive的数据组织 ?

35. 简述内部表和外部表的使用选择原则 ?

36. 简述分区表和分桶表的区别 ?

37. 简述Hive优化相关措施 ?

38. 简述Hive的数据类型 ?

39. 简述Hive的DDL操作 ?

40. 简述Hive的HSQL转换为MapReduce的过程 ?

41. 简述Hive底层与数据库交互原理 ?

42. 简述ORC、Parquet等列式存储的优点 ?

43. 简述使用过Hive解析JSON串吗 ?

44. 简述Hive导出数据有几种方式?如何导出数据 ?

45. 简述为什么要对数据仓库分层 ?

46. 简述数据建模用的哪些模型 ?

47. 简述Hive和HBase的对比区别 ?

48. 简述Hive 小文件问题及解决 ?

49. 简述 Hive的几种存储方式 ?

50. 简述Hive 动态分区和静态分区的区别 + 使用场景 ?

51. 简述Hive 语句执行顺序 ?

52. 简述Hive中MR(map reduce)、Tez和Spark执行引擎对比 ?

53. 简述为什么任务执行的时候只有一个reduce ?

54. 简述Hive为什么要分桶 ?

55. 简述如何使用分桶 ?

56. 简述Hive如果不用参数调优,在map和reduce端应该做什么 ?

57. 简述Hive的三种自定义函数是什么?实现步骤与流程?它们之间的区别?作用是什么 ?

58. 简述Hive的存储引擎和计算引擎 ?

59. 简述Hive的count的用法 ?

60. 简述Hive的union和union all的区别 ?

61. 简述Hive Join 的原理与机制 ?

62. 简述Hive如何优化join操作 ?

63. 简述什么是Hive的map join ?

64. 简述Hive的开窗函数有哪些 ?

65. 简述Hive存储数据吗 ?

66. 简述row_number,rank,dense_rank的区别 ?

67. 简述Hive count(distinct)有几个reduce,海量数据会有什么问题 ?

68. 简述一条HQL从代码到执行的过程 ?

69. 简述前后函数 lag(expr,n,defval)、lead(expr,n,defval) ?

70. 简述头尾函数:FIRST_VALUE(expr),LAST_VALUE(expr) ?

发表评论

后才能评论