返回顶部
首页 > 资讯 > 精选 >Hive中matadata怎么用
  • 333
分享到

Hive中matadata怎么用

2023-06-02 23:06:25 333人浏览 泡泡鱼
摘要

这篇文章将为大家详细讲解有关Hive中matadata怎么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。Hive元数据存储在MySQL库里,数据存储hdfs上;查看元数据库存放地址,查看Hive配置文件

这篇文章将为大家详细讲解有关Hive中matadata怎么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

Hive元数据存储在MySQL库里,数据存储hdfs上;查看元数据库存放地址,查看Hive配置文件路径查看:

$HIVE_HOME/conf/hive-site.xml   

        <property>                <name>javax.jdo.option.ConnectionURL</name>                <value>jdbc:Mysql://localhost:3306/hive_data?createDatabaseIfNotExist=true&amp;characterEncoding=latin1</value>        </property>

查看mysql元数据:

mysql> use hive_data

Database changed

mysql> show tables;

+---------------------------+| Tables_in_hive_data       |+---------------------------+| bucketing_cols            || cds                       || columns_v2                || database_params           || db_privs                  || dbs                       || func_ru                   || funcs                     || global_privs              || idxs                      || index_params              || part_col_privs            || part_col_stats            || part_privs                || partition_key_vals        || partition_keys            || partition_params          || partitions                || roles                     || sd_params                 || sds                       || sequence_table            || serde_params              || serdes                    || skewed_col_names          || skewed_col_value_loc_map  || skewed_string_list        || skewed_string_list_values || skewed_values             || sort_cols                 || tab_col_stats             || table_params              || tbl_col_privs             || tbl_privs                 || tbls                      || version                   |+---------------------------+

----------------------------------------------------------------

1. Hive版本version表有且只有一条数据,多一条数据Hive会无法启动

mysql> select * from version;+--------+----------------+---------------------------------------+| VER_ID | SCHEMA_VERSION | VERSION_COMMENT                       |+--------+----------------+---------------------------------------+|      1 | 1.1.0          | Set by MetaStore hadoop@192.168.0.129 |+--------+----------------+---------------------------------------+

2.Hive数据库元数据表【dbs】【database_params】

mysql> select DB_ID,DB_LOCATION_URI,NAME  from dbs

+-------+----------------------------------------------------------------+---------------+| db_id | DB_LOCATION_URI                                                | NAME          |+-------+----------------------------------------------------------------+---------------+|     1 | hdfs://192.168.0.129:9000/user/hive/warehouse                  | default       ||     3 | hdfs://192.168.0.129:9000/user/hive/warehouse/hive_data2.db    | hive_data2    ||     6 | hdfs://192.168.0.129:9000/user/hive/warehouse/ruozedata_job.db | ruozedata_job |+-------+----------------------------------------------------------------+---------------+
  • DB_ID            -- 数据库ID 【tbls】

  • DB_LOCATION_URI    -- HDFD存放路径

  • NAME               -- 数据库

3.Hive表内容、结构、属性

mysql> select TBL_ID,CREATE_TIME,DB_ID,SD_ID,TBL_NAME,TBL_TYPE from tbls; 

+--------+-------------+-------+-------+---------------+----------------+| TBL_ID | CREATE_TIME | DB_ID | SD_ID | TBL_NAME      | TBL_TYPE       |+--------+-------------+-------+-------+---------------+----------------+|      7 |  1528299941 |     3 |     7 | emp           | EXTERNAL_TABLE ||     10 |  1528311773 |     3 |    10 | emp_bak       | MANAGED_TABLE  ||     11 |  1528312267 |     3 |    11 | emp1          | EXTERNAL_TABLE ||     16 |  1528403085 |     3 |    16 | dual          | MANAGED_TABLE  ||     17 |  1528484818 |     3 |    17 | JSON          | MANAGED_TABLE  ||     22 |  1529454293 |     3 |    22 | emp_partition | MANAGED_TABLE  ||     26 |  1529459118 |     3 |    31 | emp_sqoop111  | MANAGED_TABLE  ||     34 |  1529530688 |     6 |    39 | user_click    | EXTERNAL_TABLE ||     38 |  1529537107 |     6 |    44 | product_info  | EXTERNAL_TABLE ||     39 |  1529593387 |     6 |    45 | city_info     | MANAGED_TABLE  ||     41 |  1529606647 |     6 |    46 | product_hot   | MANAGED_TABLE  |+--------+-------------+-------+-------+---------------+----------------+
  • TBL_ID     -- 表ID      【table_params】【partitions】【partition_keys】

  • DB_ID      -- 库ID   

  • SD_ID      -- 序列化ID  【sds】【partitions】

4.Hive文件存储相关元数据:【sds【serdes】【serde_params】

mysql> select * from sds;

  • CD_ID         --表列ID     【columns_v2】【cds】

  • SERDE_ID      --序列化列ID 【serdes】【serde_params】

mysql> select * from columns_v2;

+-------+---------+--------------+-----------+-------------+

| CD_ID | COMMENT | COLUMN_NAME  | TYPE_NAME | INTEGER_IDX |

+-------+---------+--------------+-----------+-------------+

|     7 | NULL    | comm         | double    |           6 |

|     7 | NULL    | deptno       | int       |           7 |

|     7 | NULL    | empno        | int       |           0 |

|     7 | NULL    | ename        | string    |           1 |

|     7 | NULL    | hiredate     | string    |           4 |

|     7 | NULL    | job          | string    |           2 |

|     7 | NULL    | mgr          | int       |           3 |

|     7 | NULL    | salary       | double    |           5 |

|    10 | NULL    | comm         | double    |           6 |

|    10 | NULL    | deptno       | int       |           7 |

|    10 | NULL    | empno        | int       |           0 |

|    10 | NULL    | ename        | string    |           1 |

|    10 | NULL    | hiredate     | string    |           4 |

|    10 | NULL    | job          | string    |           2 |

|    10 | NULL    | mgr          | int       |           3 |

|    10 | NULL    | salary       | double    |           5 |

5.Hive表分区相关的元数据表 

mysql> select * from partitions;

+---------+-------------+------------------+-----------------+-------+--------+| PART_ID | CREATE_TIME | LAST_ACCESS_TIME | PART_NAME       | SD_ID | TBL_ID |+---------+-------------+------------------+-----------------+-------+--------+|       1 |  1529456274 |                0 | pt=2018-06-19   |    26 |     22 ||       6 |  1529530704 |                0 | data=2018-06-20 |    40 |     34 |
  • PART_ID    -- 分区ID 【partition_key_vasls】【partition_params】

mysql> select * from partition_key_vals;

+---------+--------------+-------------+

| PART_ID | PART_KEY_VAL | INTEGER_IDX |

+---------+--------------+-------------+

|       1 | 2018-06-19   |           0 |

|       6 | 2018-06-20   |           0 |

+---------+--------------+-------------+

  • PART_ID          -- 分区ID

  • PART_KEY_VAL     -- 分区字段值

mysql> select * from partition_params;

+---------+-----------------------+-------------+

| PART_ID | PARAM_KEY             | PARAM_VALUE |

+---------+-----------------------+-------------+

|       1 | COLUMN_STATS_ACCURATE | true        |

|       1 | numFiles              | 2           |

|       1 | numRows               | 0           |

|       1 | rawDataSize           | 0           |

|       1 | totalSize             | 734         |

|       1 | transient_lastDdlTime | 1529456274  |

|       6 | COLUMN_STATS_ACCURATE | true        |

|       6 | numFiles              | 1           |

|       6 | numRows               | 0           |

|       6 | rawDataSize           | 0           |

|       6 | totalSize             | 725264      |

|       6 | transient_lastDdlTime | 1529530704  |

PARAM_KEY       -- 分区属性

PARAM_VALUE     -- 分区属性值

总结

Hive中matadata怎么用

关于“Hive中matadata怎么用”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。

--结束END--

本文标题: Hive中matadata怎么用

本文链接: https://lsjlt.com/news/231629.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Hive中matadata怎么用
    这篇文章将为大家详细讲解有关Hive中matadata怎么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。Hive元数据存储在MySQL库里,数据存储HDFS上;查看元数据库存放地址,查看Hive配置文件...
    99+
    2023-06-02
  • HIVE中left semi join怎么用
    这篇文章主要介绍了HIVE中left semi join怎么用,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。 实验:hive> select * f...
    99+
    2023-06-03
  • Hive中怎么使用UDF和UDAF扩展Hive功能
    在Hive中,用户可以使用UDF(User Defined Function)和UDAF(User Defined Aggregat...
    99+
    2024-03-14
    Hive
  • hive中decode函数怎么使用
    在Hive中,`decode`函数用于根据给定的条件和对应的值,将一个列的值转换为另一个值。`decode`函数的语法如下:```DECODE(col, condition1, value1, condition2, value2, ....
    99+
    2023-08-11
    hive decode
  • hive中正则表达式怎么用
    小编给大家分享一下hive中正则表达式怎么用,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧! hive中的正则表达式还是很强大的。数据工作者平时也离不开正则表达式。...
    99+
    2023-06-03
  • SQL Hive中的Select Fromsql怎么使用
    这篇“SQL Hive中的Select Fromsql怎么使用”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“SQL...
    99+
    2023-06-28
  • Hive中的索引类型怎么使用
    在Hive中,可以使用CREATE INDEX语句来创建索引。Hive支持两种类型的索引:NORMAL和BITMAP。 创建NOR...
    99+
    2024-04-02
  • Hive中怎么定义和使用表分区
    在Hive中,表分区是按照表的某个列的值进行分割和存储数据的方式,可以提高查询效率和管理数据。以下是在Hive中定义和使用表分区的步...
    99+
    2024-04-03
    Hive
  • 怎么使用DataGrip连接Hive
    这篇文章将为大家详细讲解有关怎么使用DataGrip连接Hive,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。1. 从官网下载安装包 下载网址 2. 安装第一步...
    99+
    2024-04-02
  • hive存储过程怎么用
    这篇文章主要介绍了hive存储过程怎么用,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。hive存储过程简介x版本的hive中没有提供类似存储过程的功能,使用Hive做数据开发...
    99+
    2023-06-02
  • mysql数据怎么导入hive中
    在将MySQL数据导入到Hive中之前,需要确保你已经安装了MySQL和Hive,并且配置了正确的连接信息。以下是将MySQL数据导...
    99+
    2024-05-06
    hive mysql
  • Hive怎么学习
    这篇文章主要为大家展示了“Hive怎么学习”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Hive怎么学习”这篇文章吧。Hive起源于Facebook,它使得针对Hadoop进行SQL查询成为可能...
    99+
    2023-06-03
  • Hive中怎么利用UDF实现文本分词
    Hive中怎么利用UDF实现文本分词,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。UDF 简介Hive作为一个sql查询引擎,自带了一些基本的...
    99+
    2024-04-02
  • hive的sum函数怎么使用
    在Hive中,可以使用SUM函数对某一列中的值进行求和操作。具体使用方式如下: SELECT SUM(column_name...
    99+
    2024-03-05
    hive
  • hive的collect_set函数怎么使用
    Hive中的collect_set函数用于返回指定列的唯一值集合。其语法如下: SELECT collect_set(col...
    99+
    2024-04-08
    hive
  • Hive中怎么实现动态分区
    本篇文章为大家展示了Hive中怎么实现动态分区,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。动态分区调整动态分区属性:设置为true表示开启动态分区功能(默认为fa...
    99+
    2024-04-02
  • hive中怎么设置执行引擎
    在Hive中,默认情况下使用的是Tez执行引擎。但是你可以通过以下方式来设置不同的执行引擎: 使用Hive CLI或Beeline...
    99+
    2024-04-02
  • 怎么使用Dbeaver远程连接Hive
    这篇文章给大家分享的是有关怎么使用Dbeaver远程连接Hive的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。0. Linux上Hive启动Hadoop启动Hivesh hive --service hivese...
    99+
    2023-06-14
  • Hive可视化工具squirrel怎么用
    要使用Hive可视化工具Squirrel,您需要按照以下步骤进行操作:1. 首先,您需要下载和安装Squirrel。您可以从Squi...
    99+
    2023-10-23
    Hive squirrel
  • hive使用spark引擎怎么配置
    要使用Spark引擎在Hive中进行配置,您可以按照以下步骤操作: 确保您已经正确安装了Spark并且Hive已经配置好。 ...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作