python 统计MySQL大于100万的表

python MySQL 2023-01-31 02:01:21 151人浏览薄情痞子

摘要

线上的Mysql服务器，最近有很多慢查询。需要统计出行数大于100万的表，进行统一优化。需要筛选出符合条件的表，统计到excel中，格式如下：库名表名行数db1users1234567 统计表的行数，有2中

线上的Mysql服务器，最近有很多慢查询。需要统计出行数大于100万的表，进行统一优化。

需要筛选出符合条件的表，统计到excel中，格式如下：

库名	表名	行数
db1	users	1234567

统计表的行数，有2中方法：

1. 通过查询mysql的infORMation_schema数据库中INFODB_SYS_TABLESTATS表,它记录了innodb类型每个表大致的数据行数

2. select count(1) from 库名.表名

下面来分析一下这2种方案。

第一种方案，不是精确记录的。虽然效率快，但是表会有遗漏！

第二钟方案，才是准确的。虽然慢，但是表不会遗漏。

备注：

count(1)其实这个1，并不是表示第一个字段，而是表示一个固定值。

count(1)，其实就是计算一共有多少符合条件的行。
1并不是表示第一个字段，而是表示一个固定值。
其实就可以想成表中有这么一个字段，这个字段就是固定值1，count(1)，就是计算一共有多少个1.

写入JSON文件

下面这段代码，是参考我之前写的一篇文章：

https://www.cnblogs.com/xiao987334176/p/9901692.html

在此基础上，做了部分修改，完整代码如下：

#!/usr/bin/env python3
# coding: utf-8
import pymysql
import json
conn = pymysql.connect(
    host="192.168.91.128",  # mysql ip地址
    user="root",
    passwd="root",
    port=3306,  # mysql 端口号,注意：必须是int类型
    connect_timeout = 3  # 超时时间
)
cur = conn.cursor()  # 创建游标
# 获取mysql中所有数据库
cur.execute('SHOW DATABASES')
data_all = cur.fetchall()  # 获取执行的返回结果
# print(data_all)
dic = {}  # 大字典，第一层
for i in data_all:
    if i[0] not in dic:  # 判断库名不在dic中时
        # 排序列表,排除mysql自带的数据库
        exclude_list = ["sys", "information_schema", "mysql", "performance_schema"]
        if i[0] not in exclude_list:  # 判断不在列表中时
            # 写入第二层数据
            dic[i[0]] = {'name': i[0], 'table_list': []}
            conn.select_db(i[0])  # 切换到指定的库中
            cur.execute('SHOW TABLES')  # 查看库中所有的表
            ret = cur.fetchall()  # 获取执行结果
            for j in ret:
                # 查询表的行数
                cur.execute('select count(1) from `%s`;'% j[0])
                ret = cur.fetchall()
                # print(ret)
                for k in ret:
                    print({'tname': j[0], 'rows': k[0]})
                    dic[i[0]]['table_list'].append({'tname': j[0], 'rows': k[0]})

with open('tj.json','w',encoding='utf-8') as f:
    f.write(json.dumps(dic))

直接读取tj.json文件，进行写入，完整代码如下：

#!/usr/bin/env python3
# coding: utf-8
import xlwt
import json
from collections import OrderedDict
f = xlwt.Workbook()
sheet1 = f.add_sheet('统计', cell_overwrite_ok=True)
row0 = ["库名", "表名", "行数"]
# 写第一行
for i in range(0, len(row0)):
    sheet1.write(0, i, row0[i])
# 加载json文件
with open("tj.json", 'r') as load_f:
    load_dict = json.load(load_f)  # 反序列化文件
    order_dic = OrderedDict()  # 有序字典
    for key in sorted(load_dict):  # 先对普通字典key做排序
        order_dic[key] = load_dict[key]  # 再写入key
    num = 0  # 计数器
    for i in order_dic:
        # 遍历所有表
        for j in order_dic[i]["table_list"]:
            # 判断行数大于100万时
            if j['rows'] > 1000000:
                # 写入库名
                sheet1.write(num + 1, 0, i)
                # 写入表名
                sheet1.write(num + 1, 1, j['tname'])
                # 写入行数
                sheet1.write(num + 1, 2, j['rows'])
                num += 1  # 自增1
    f.save('test1.xls')

执行程序，打开excel文件，效果如下：

您可能感兴趣的文档:

--结束END--

本文标题: python 统计MySQL大于100万的表

本文链接: https://lsjlt.com/news/185310.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

猜你喜欢

python 统计MySQL大于100万的表

线上的MySQL服务器，最近有很多慢查询。需要统计出行数大于100万的表，进行统一优化。需要筛选出符合条件的表，统计到excel中，格式如下：库名表名行数db1users1234567 统计表的行数，有2中...

99+

2023-01-31

python MySQL
MySQL 对于千万级的大表要怎么优化？

首先采用Mysql存储千亿级的数据，确实是一项非常大的挑战。Mysql单表确实可以存储10亿级的数据，只是这个时候性能非常差，项目中大量的实验证明，Mysql单表容量在500万左右，性能处于最佳状态。针对大表的优化，主要是通过数据库...

99+

2015-09-18

MySQL 对于千万级的大表要怎么优化？
mysql千万级大表的优化

...

99+

2016-05-12

mysql千万级大表的优化
python 统计MySQL表信息

线上有一台MySQL服务器，里面有几十个数据库，每个库有N多表。现在需要将每个表的信息，统计到excel中，格式如下：库名表名表说明建表语句db1users用户表CREATE TABLE `users` (...)怎么做呢？1. 手动录入(...

99+

2023-01-30

信息 python MySQL
python怎么统计大于阈值的个数

要统计大于阈值的个数，可以使用循环遍历列表或数组，然后通过判断每个元素是否大于阈值来计数。以下是一个使用循环统计大于阈值的个数的示例...

99+

2023-08-15

python
实例讲解MySQL统计库表大小

统计每个库每个表的大小是数据治理的其中最简单的一个要求，本文将从抽样统计结果及精确统计结果两方面来统计MySQL的每个库每个表的数据量情况。 1、统计预估数据量 mysql数据字典库information_schem...

99+

2022-05-30

mysql 统计 MySQL 库表 MySQL 统计库表
mysql查询优化之100万条数据的一张表优化方案

1.两种查询引擎查询速度（myIsam 引擎） InnoDB 中不保存表的具体行数，也就是说，执行select count(*) from table时，InnoDB要扫...

99+

2024-04-02
MySQL千万级数据的大表优化解决方案

目录1.数据库设计和表创建时就要考虑性能设计表时要注意：索引简言之就是使用合适的数据类型，选择合适的索引引擎2.sql的编写需要注意优化3.分区分区的好处是：分区的限制和缺点：分区的类型：4.分表5.分库mysql数据库...

99+

2022-11-20

mysql千万级数据 mysql优化
基于PHP+MySQL大学宿舍管理系统的设计与实现

高等学校的住宿宿舍是住宿的第二个家,是住宿进行学习与工作的重要场地。其管理水平的高低将直接影响着住宿人才培养的质量和住宿素质教育的成效。为住宿提供一个良好的管理体系,对学校和住宿而言至关重要,因此高校...

99+

2023-09-02

php 开发语言
phper使用MySQL 针对千万级的大表要怎么优化？

有需要学习交流的友人请加入交流群的咱们一起，有问题一起交流，一起进步！前提是你是学技术的。感谢阅读！点此加入该群jq.qq.com 首先采用Mysql存储千亿级的数据，确实是一项非常大的挑战。Mysql单表确实可以存储10亿级的数据，...

99+

2020-09-12

phper使用MySQL 针对千万级的大表要怎么优化？
oracle怎么统计表的数据量大小

要统计Oracle表的数据量大小，可以使用以下方法： 1、使用Oracle提供的dba_segments视图查询表占用的空间大小。例...

99+

2024-04-09

oracle
基于Python的汽车行业大数据分析系统的设计与实现

摘要汽车行业是一个竞争激烈的行业，数据分析在该行业中扮演着越来越重要的角色。因此，基于Python的汽车行业大数据分析系统拥有着广阔的应用前景和市场需求。在这个系统中，我们利用Python语言的高效性和易用性，结合数据挖掘和机器学...

99+

2023-10-22

python django pygame 汽车
python如何统计列表中的个数

可以使用`count()`函数统计列表中某个元素出现的次数。假设有一个列表`my_list = [1, 2, 3, 2, 1, 2...

99+

2023-10-25

python
mySql关于统计数量的SQL查询操作

我就废话不多说了，大家还是直接看代码吧~ select project_no, sum(case when device_state=0 then 1 else 0 end)as offTotal , ...

99+

2022-05-26

mySql 统计数量 SQL查询
基于radius的Mysql计费系统数据迁移

radius计费系统向蓝海计费系统数据迁移技术总结本文仅供参考，在实际环境中测试成功。欢迎大家提出问题。1. 首先要有一个清晰的思路和明确的目标。本次计费迁移主...

99+

2024-04-02
100天精通Python（数据分析篇）——第62天：pandas常用统计方法大全（含案例）

文章目录一、常用统计方法与案例 1. 求和（sum） 2. 求平均值（mean） 3. 求最小值（min） 4. 求最大值（max） 5. 求中...

99+

2023-10-09

python pandas 数据分析
MySQL如何统计多张表的数据量

要统计多张表的数据量，可以使用以下MySQL语句： SELECT TABLE_NAME, TABLE_ROW...

99+

2024-04-17

MySQL
mysql 关于大数据量日志表的优化过程

我们知道很多网站都会有关于记录网站搜索的日志表，用于记录会员的基本登录信息，用于后期数据分析或者防攻击使用，现在我们有一张表logs，每天产生大概60万的数据。 ...

99+

2024-04-02
如何理解MySQL关于表名大小写的参数

今天就跟大家聊聊有关如何理解MySQL关于表名大小写的参数，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。查看现有的大小...

99+

2024-04-02
python怎么统计列表某区间的个数

要统计列表中某个区间的个数，可以使用列表推导式和条件判断来实现。假设要统计列表中大于等于a小于等于b的元素个数，可以按照以下步骤进行...

99+

2023-08-15

python