返回顶部
首页 > 资讯 > 数据库 >influxdb 基本概念和操作
  • 225
分享到

influxdb 基本概念和操作

influxdb基本概念和操作 2019-08-17 06:08:15 225人浏览 猪猪侠
摘要

数据格式 在 InfluxDB 中,我们可以粗略的将要存入的一条数据看作一个虚拟的 key 和其对应的 value(field value)。格式如下: 1 cpu_usage,host=serve

数据格式

在 InfluxDB 中,我们可以粗略的将要存入的一条数据看作一个虚拟的 key 和其对应的 value(field value)。格式如下:

1

cpu_usage,host=server01,region=us-west value=0.64 1434055562000000000

虚拟的 key 包括以下几个部分: database, retention policy, measurement, tag sets, field name, timestamp。

  • database: 数据库名,在 InfluxDB 中可以创建多个数据库,不同数据库中的数据文件是隔离存放的,存放在磁盘上的不同目录。
  • retention policy: 存储策略,用于设置数据保留的时间,每个数据库刚开始会自动创建一个默认的存储策略 autogen,数据保留时间为永久,之后用户可以自己设置,例如保留最近2小时的数据。插入和查询数据时如果不指定存储策略,则使用默认存储策略,且默认存储策略可以修改。InfluxDB 会定期清除过期的数据。
  • measurement: 测量指标名,例如 cpu_usage 表示 cpu 的使用率。
  • tag sets: tags 在 InfluxDB 中会按照字典序排序,不管是 tagk 还是 tagv,只要不一致就分别属于两个 key,例如 host=server01,region=us-west 和 host=server02,region=us-west 就是两个不同的 tag set。
  • tag--标签,在InfluxDB中,tag是一个非常重要的部分,表名+tag一起作为数据库的索引,是“key-value”的形式。
  • field name: 例如上面数据中的 value 就是 fieldName,InfluxDB 中支持一条数据中插入多个 fieldName,这其实是一个语法上的优化,在实际的底层存储中,是当作多条数据来存储。
  • timestamp: 每一条数据都需要指定一个时间戳,在 TSM 存储引擎中会特殊对待,以为了优化后续的查询操作。

与传统数据库中的名词做比较

influxDB中的名词 传统数据库中的概念
database 数据库
measurement 数据库中的表
points 表里面的一行数据

Point

Point由时间戳(time)、数据(field)、标签(tags)组成。

Point相当于传统数据库里的一行数据,如下表所示:

 

Point属性 传统数据库中的概念
time 每个数据记录时间,是数据库中的主索引(会自动生成)
fields 各种记录值(没有索引的属性)
tags 各种有索引的属性

Series

       Series 相当于是 InfluxDB 中一些数据的集合,在同一个 database 中,retention policy、measurement、tag sets 完全相同的数据同属于一个 series,同一个 series 的数据在物理上会按照时间顺序排列存储在一起。

Shard

       Shard 在 InfluxDB 中是一个比较重要的概念,它和 retention policy 相关联。每一个存储策略下会存在许多 shard,每一个 shard 存储一个指定时间段内的数据,并且不重复,例如 7点-8点 的数据落入 shard0 中,8点-9点的数据则落入 shard1 中。每一个 shard 都对应一个底层的 tsm 存储引擎,有独立的 cache、wal、tsm file。

组件

TSM 存储引擎主要由几个部分组成: cache、wal、tsm file、compactor。

1)Cache:cache 相当于是 LSM Tree 中的 memtabl。插入数据时,实际上是同时往 cache 与 wal 中写入数据,可以认为 cache 是 wal 文件中的数据在内存中的缓存。当 InfluxDB 启动时,会遍历所有的 wal 文件,重新构造 cache,这样即使系统出现故障,也不会导致数据的丢失。

cache 中的数据并不是无限增长的,有一个 maxSize 参数用于控制当 cache 中的数据占用多少内存后就会将数据写入 tsm 文件。如果不配置的话,默认上限为 25MB,每当 cache 中的数据达到阀值后,会将当前的 cache 进行一次快照,之后清空当前 cache 中的内容,再创建一个新的 wal 文件用于写入,剩下的 wal 文件最后会被删除,快照中的数据会经过排序写入一个新的 tsm 文件中。

2)WAL:wal 文件的内容与内存中的 cache 相同,其作用就是为了持久化数据,当系统崩溃后可以通过 wal 文件恢复还没有写入到 tsm 文件中的数据。

3)TSM File:单个 tsm file 大小最大为 2GB,用于存放数据。

4)Compactor:compactor 组件在后台持续运行,每隔 1 秒会检查一次是否有需要压缩合并的数据。

主要进行两种操作,一种是 cache 中的数据大小达到阀值后,进行快照,之后转存到一个新的 tsm 文件中。

另外一种就是合并当前的 tsm 文件,将多个小的 tsm 文件合并成一个,使每一个文件尽量达到单个文件的最大大小,减少文件的数量,并且一些数据的删除操作也是在这个时候完成。

目录与文件结构

InfluxDB 的数据存储主要有三个目录。默认情况下是 meta, wal 以及 data 三个目录。

meta 用于存储数据库的一些元数据,meta 目录下有一个 meta.db 文件。

wal 目录存放预写日志文件,以 .wal 结尾。

data 目录存放实际存储的数据文件,以 .tsm 结尾。

上面几张图中,_internal为数据库名,monitor为存储策略名称,再下一层目录中的以数字命名的目录是 shard 的 ID 值。

存储策略下有两个 shard,ID 分别为 1 和 2,shard 存储了某一个时间段范围内的数据。再下一级的目录则为具体的文件,分别是 .wal 和 .tsm 结尾的文件。

 

InfluxDB基本操作

InfluxDB提供多种操作方式:

1)客户端命令行方式

2)Http api接口

3)各语言API库

4)基于WEB管理页面操作

 

客户端命令行方式操作

进入命令行

1

influx -precision rfc3339

 

InfluxDB数据库操作

  • 显示数据库

1

show databases

  • 新建数据库

1

create database shhnwangjian

  • 删除数据库

1

drop database shhnwangjian

  • 使用指定数据库

1

use shhnwangjian

 

InfluxDB数据表操作

在InfluxDB当中,并没有表(table)这个概念,取而代之的是MEASUREMENTS,MEASUREMENTS的功能与传统数据库中的表一致,因此我们也可以将MEASUREMENTS称为InfluxDB中的表。

  • 显示所有表

1

SHOW MEASUREMENTS

  • 新建表

InfluxDB中没有显式的新建表的语句,只能通过insert数据的方式来建立新表。

1

insert disk_free,hostname=server01 value=442221834240i

其中 disk_free 就是表名,hostname是索引(tag),value=xx是记录值(field),记录值可以有多个,系统自带追加时间戳

 

或者添加数据时,自己写入时间戳

1

insert disk_free,hostname=server01 value=442221834240i 1435362189575692182

  • 删除表

1

drop measurement disk_free

 

数据保存策略(Retention Policies)

influxDB是没有提供直接删除数据记录的方法,但是提供数据保存策略,主要用于指定数据保留时间,超过指定时间,就删除这部分数据。

  • 查看当前数据库Retention Policies

1

show retention policies on "db_name"

  • 创建新的Retention Policies

1

create retention policy "rp_name" on "db_name" duration 3w replication 1 default

rp_name:策略名;

db_name:具体的数据库名;

3w:保存3周,3周之前的数据将被删除,influxdb具有各种事件参数,比如:h(小时),d(天),w(星期);

replication 1:副本个数,一般为1就可以了;

default:设置为默认策略

  • 修改Retention Policies

1

alter retention policy "rp_name" on "db_name" duration 30d default

  • 删除Retention Policies

1

drop retention policy "rp_name" on "db_name"

 

连续查询(Continuous Queries)

InfluxDB的连续查询是在数据库中自动定时启动的一组语句,语句中必须包含 SELECT 关键词和 GROUP BY time() 关键词。

InfluxDB会将查询结果放在指定的数据表中。

目的:使用连续查询是最优的降低采样率的方式,连续查询和存储策略搭配使用将会大大降低InfluxDB的系统占用量。而且使用连续查询后,数据会存放到指定的数据表中,这样就为以后统计不同精度的数据提供了方便。

  • 新建连续查询

1

2

3

4

5

CREATE CONTINUOUS QUERY ON

[RESAMPLE [EVERY ] [FOR ]]

BEGIN SELECT ()[,()] INTO

FROM [WHERE ] GROUP BY time()[,]

END

 样例:

1

CREATE CONTINUOUS QUERY wj_30m ON shhnwangjian BEGIN SELECT mean(connected_clients), MEDIAN(connected_clients), MAX(connected_clients), MIN(connected_clients) INTO Redis_clients_30m FROM redis_clients GROUP BY ip,port,time(30m) END

在shhnwangjian库中新建了一个名为 wj_30m 的连续查询,每三十分钟取一个connected_clients字段的平均值、中位值、最大值、最小值 redis_clients_30m 表中。使用的数据保留策略都是 default。

不同database样例:

1

CREATE CONTINUOUS QUERY wj_30m ON shhnwangjian_30 BEGIN SELECT mean(connected_clients), MEDIAN(connected_clients), MAX(connected_clients), MIN(connected_clients) INTO shhnwangjian_30.autogen.redis_clients_30m FROM shhnwangjian.autogen.redis_clients GROUP BY ip,port,time(30m) END

 

  • 显示所有已存在的连续查询

1

SHOW CONTINUOUS QUERIES

  • 删除Continuous Queries

1

DROP CONTINUOUS QUERY ON

您可能感兴趣的文档:

--结束END--

本文标题: influxdb 基本概念和操作

本文链接: https://lsjlt.com/news/2199.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • influxdb 基本概念和操作
    数据格式 在 InfluxDB 中,我们可以粗略的将要存入的一条数据看作一个虚拟的 key 和其对应的 value(field value)。格式如下: 1 cpu_usage,host=serve...
    99+
    2019-08-17
    influxdb 基本概念和操作
  • InfluxDB学习之InfluxDB的基本概念
    一、与传统数据库中的名词做比较nfluxDB中的名词传统数据库中的概念database数据库measurement数据库中的表points表里面的一行数据 二、InfluxDB中独有的概念1)da...
    99+
    2024-04-02
  • Git基本概念及操作(3)
    如果使用传统的如CC开发的话,刚开始进行GIT开发可能不是太适应。这个主要是有些概念不一样。比喻在CC中,我们一般是围绕一个主分支进行开发,对一个文件来说,在主分支上会生成不同的版本。同样,我们在每一个版本下面创立新的次分支,在次分支上也会...
    99+
    2023-01-31
    基本概念 操作 Git
  • InfluxDB学习之InfluxDB的基本操作
    InfluxDB 是一个开源分布式时序、事件和指标数据库。使用 Go 语言编写,无需外部依赖。其设计目标是实现分布式和水平伸缩扩展。它有三大特性:1. Time Series (时间序列):你可以使用与时间...
    99+
    2024-04-02
  • 详解OpenCV图像的概念和基本操作
    前言: opencv最主要的的功能是用于图像处理,所以图像的概念贯穿了整个opencv,与其相关的核心类就是Mat。 像素: 图片尺寸以像素为单位时,每一厘米等于28像素,如15...
    99+
    2024-04-02
  • MySQL的基本概念和作用
     下面一起来了解下MySQL的基本概念和作用,相信大家看完肯定会受益匪浅,文字在精不在多,希望MySQL的基本概念和作用这篇短内容是你想要的。       ...
    99+
    2024-04-02
  • linux下vi编辑器的基本概念和操作
    这篇文章主要讲解了“linux下vi编辑器的基本概念和操作”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“linux下vi编辑器的基本概念和操作”吧! vi的基本概念   基本上vi...
    99+
    2023-06-13
  • SpringBoot零基础入门之基本操作与概念
    目录1.什么是Spring Boot2.Spring Boot优点3.Spring Boot 项目创建3.1 使用Idea 创建3.2 Spring Boot 项目3.3 启动并验证...
    99+
    2024-04-02
  • Oracle RAC之:ASM概念及基本操作维护
    Oracle RAC系列之:ASM基本操作维护 ASM(自动存储管理)是一个专门为Oracle数据库服务的数据文件存储机制,通过ASM管理数据文件,DBA不用再担心I/O性能问题,也不需要知道文件的名称...
    99+
    2024-04-02
  • RBO和CBO的基本概念
    转自潇湘隐者 出处:http://www.cnblogs.com/kerrycode/p/3842215.html Oracle数据库中的优化器又叫查询优化器(Query Optimizer)。它是S...
    99+
    2024-04-02
  • Aerospike基本概念
    简介 Aerospike 是一个分布式、可扩展的数据库,其架构有三个关键目标: 为 web 规模的应用程序创建一个灵活的、可扩展的平台 提供传统数据库所期望的健壮性和可靠性(如 ACID) 以最少的人工参与提供操作效率 T级别大数...
    99+
    2022-04-04
    Aerospike基本概念
  • 1、基本概念
    ...
    99+
    2018-01-29
    1 基本概念
  • Python基本概念
    一 基本概念1 字面意义上的常量,如2、‘This is ok'这样的字符串>>> print('a,2,3')a,2,32 字符串单引号(‘)使用单引号指示字符串,类似shell中的强引用,所有的空格、制表符照原样保留。...
    99+
    2023-01-31
    基本概念 Python
  • Nginx的基本概念和原理
    目录一、Nginx基本概念二、反向代理三、负载均衡四、动静分离五、原理六、worker如何工作一、Nginx基本概念 (engine x)是一个高性能的HTTP和反向代理web服务器...
    99+
    2024-04-02
  • c++类和对象基本概念
    目录什么是类?什么是对象?类的定义创建对象成员访问(初始化)总结什么是类? 一系列事物的抽象,对于c++而言,万事万物都可以是类。 类包括:属性+行为 属性:事物特征->数据类...
    99+
    2024-04-02
  • MongoDB学习(二) --- 概念解析、命令行基本操作
    1、基础概念 下表将帮助您更容易理解Mongo中的一些概念: SQL术语/概念 MongoDB术语/概念 解释/说明 database database 数据库 table collection 数据库表/集合 row...
    99+
    2016-12-11
    MongoDB学习(二) --- 概念解析 命令行基本操作
  • Hive的基本概念
    这篇文章主要介绍“Hive的基本概念”,在日常操作中,相信很多人在Hive的基本概念问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Hive的基本概念”的疑惑有所帮助!接下来,...
    99+
    2024-04-02
  • Spring AOP基本概念
    目录举个栗子给大家讲一下代理:什么是AOP?基本术语(1)切面(Aspect)(2) 目标对象(Target)(3) 连接点(JoinPoint)(4) 切入点(PointCut)(...
    99+
    2024-04-02
  • Mysql的基本概念
    一 . Mysql 的基本概念 1、数据(data) 描述事物的符号记录包括数字文字图形图像声音档案记录等以记录形式按同意的格式进行存储 2、表 将不同的记录组织在一起用来存储具体数据 3、数据库 ...
    99+
    2023-09-20
    mysql 数据库
  • MQ的基本概念
    本篇内容介绍了“MQ的基本概念”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!对象(objects)   &nb...
    99+
    2023-06-04
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作