简述什么是Hive 管理表和外部表 ?

Hive中的管理表和外部表是两种不同类型的表,它们在数据存储、管理和访问方式上有一些区别。

管理表(也称为内部表)是Hive中默认的表类型。当你在Hive中创建一个表,并指定一个存储位置时,Hive会为这个表创建一个管理表。管理表的数据存储在Hive默认的文件系统(通常是HDFS)中的指定目录下,元数据存储在Hive自己的元数据存储库中。管理表由Hive完全管理,这意味着当你删除一个管理表时,Hive会同时删除该表的元数据和存储的数据。管理表适合存储大量的数据,并且可以通过HiveQL进行查询和管理。

外部表是指向HDFS中现有数据的表。当你创建一个外部表时,你只需要指定HDFS中数据的路径,而不是创建新的数据文件。与内部表不同,外部表的元数据也存储在Hive的元数据存储库中,但数据存储在HDFS中的指定位置,由Hadoop而不是Hive进行管理。这意味着,当你删除一个外部表时,只会删除该表的元数据,而不会删除实际的数据。外部表适合用于访问已经在HDFS中存在的数据,并且可以通过HiveQL进行查询和管理。

总之,管理表和外部表的主要区别在于数据的存储和管理方式。管理表由Hive完全管理,适合存储大量数据,而外部表则指向现有数据,由Hadoop而不是Hive进行管理。

发表评论

后才能评论