返回顶部
首页 > 资讯 > 数据库 > 如何搭建数据库自动化运维体系
  • 283
分享到

如何搭建数据库自动化运维体系

摘要

需求背景: 随着业务的增长、对运维效率和质量的要求不断提高,对自动化运维体系的需求也不断增强。 目前笔者服务的很多中大型企业客户,运维其实还停留在“刀耕火种”的原始状态。 这里所说的“刀”和“火”就是运维人员的远程客户端,例如 xshell


	如何搭建数据库自动化运维体系
[数据库教程]

需求背景:

随着业务的增长、对运维效率和质量的要求不断提高,对自动化运维体系的需求也不断增强。

目前笔者服务的很多中大型企业客户,运维其实还停留在“刀耕火种”的原始状态。

这里所说的“刀”和“火”就是运维人员的远程客户端,例如 xshellwindows 远程桌面。

这种工作模式有很多局限性,

比如服务器数据库中间件等的安装、初始化,应用软件部署、服务发布和监控都是通过手动方式来完成的。

这就需要运维人员登录到服务器上,一台一台去管理和维护。

如果有个几十上百台,累就累死人了。

笔者曾运维过超过4000千台服务器,团队二十多个人,仔细想想这活靠人力能干吗?

另外人工操作方式过于依赖运维人员的执行顺序和操作步骤,稍有不慎即可能导致生产事故,即便是变更前double check也很难保证不出事故。

常在河边走哪有不湿鞋。

这时候运维人员开始探索使用使用脚本和批量管理工具

这种方式确实提升了效率和质量,但是不具有普适性。

第一是脚本的非标准化的问题。
每个运维人员都有自己的解决问题的风格,不同的人员之间存在巨大差异,那么不同的人开发这些脚本的版本管理就是一个挑战。

第二是脚本的交接问题,公司人员的架构不是一成不变的,有人来就有人离开。离职和工作交接,都会导致脚本无法很好地在运维人员之间传承和再利用。
因此,构建自动化运维体系成了唯一的选择。

那么如何建设自动化运维体系呢?本文研究分为三个大的方面:

第一个是为什么要建设自动化运维体系?
第二个是根据笔者经验介绍运维系统是怎样设计、运行和处理问题的。
第三个是笔者在自动化运维过程中遇到的一些问题的思考,做一个总结

本文针对数据库自动化运维系统
核心内容如下:

技术图片

一、建设自动化运维体系的原因
为什么要建设一个自动化运维体系。

肯定是运维过程中遇到的一些挑战。
第一个是变更的需求。

它表现为三个方面:

一是变更数量多,目前我们服务的客户达到3万家企业,这个体量是很大的。
二是变更种类多,不同的客户需求是不一样的,包含但不限于扩容、性能优化、故障处理、DG切换迁移、RAC搭建等。
三是变更风险大,有些变更都是一些高危操作,自动化处理更安全等。

第二个是运维环境方面,主要表现为服务器数量多、数据库类型多。我们的客户可以自由选择使用哪种数据库,分别对应不同的环境。
第三是人的因素。

在建设自动化运维体系过程中,有一个比较重要的考虑点是人的因素。
正是因为每个运维人员的能力不一样,技术水平参差不齐,甚至是运维习惯和工具也不一样。

导致我们必须要创建一套规范的自动化运维体系,来提升工作效率。

二、如何搭建自动化运维体系
下面我们来看一下每个模块是如何设计和工作的。

自动化安装系统
安装数据库是比较繁琐但数据又多的工作之一。

操作系统多,但是人少,可用时间也比较少,自动化安装省时省力。整个自动化流程采用通用的框架,主要是针对linux下的oracle安装和Mysql安装。

交付用户之前,会进行基本的安全设置,这在一定程度上提高了安全性,也减少了需要人工做的一些操作。

自动化运维平台
当服务器由自动化安装完数据库以后,就会被自动化运维平台接管。

自动化运维平台是运维人员的操作平台,它主要解决安全、高效、快速等因数量特别多而带来的管理问题。

在设计的过程中要考虑了以下几个因素:把整个运维系统的操作界面设计成基于堡垒机的架构。

运维工程师无论何时何地都可以登录管理系统进行运维操作,这样的话就比较方便,由SecureCRT对被操作的机器发布指令。
充分利用现有协议和工具。这个平台的特点是所有的系统使用ssh管理,而不是自己开发一些Agent,这也体现了自动化运维的观点。

自动化巡检系统
由于我们的客户系统比较多,业务也比较多,怎样设计一套系统去巡检它们的运行情况呢?

我们采用了两种方式:自我开发的中控系统和第三方管理平台先看自己开发的中控系统:

单独使用一台服务器巡检其他的数据库节点,脚本可以选用shell或者python

设定遍历时间间隔,遇到故障情况可以采用打电话或者发短信的方式及时通知运维人员。

第二是把所有的数据库节点纳管到第三方监控平台。

自动化性能分析系统
系统并不用永远都稳定运行,性能问题是无法逃避的问题。性能分析系统是重中之重。

这里笔者单独再写一篇文章。

自动化监控预警系统
通常客户的系统都是7*24小时运行的,这就要求必须有预警监控。

预警监控系统+值班人员是标准配置。

预警监控系统的搭建方式参考巡检系统,只不过采集的指标不一样。
6、自动化备份系统

两地三中心+DG+NBU

三、建设自动化运维体系的思考
笔者将自动化运维体系的建设目标总结为四个词。

第一个是完备,这个系统要能涵盖所有的运维需求。
第二个是简洁,简单好用。运维人员的学习成本不要高,越复杂难用的系统越不容易发挥系统本身的能力和效率。
第三个是高效,特别是在批量处理或者执行特定任务时要高效。
第四个是安全,如果一个运维系统不安全,可能导致很快就被黑客接管了。
总结

笔者目前也在从数据库的架构、优化和故障处理慢慢转型做自动化运维体系。

对过去进行总结,我觉得有3个方面可以供大家参考。
第一是循序渐进的原则:

聚焦当前的问题,把当前的问题处理好,后面的问题也就迎刃而解。

如果一开始设计的系统很庞大、功能特别丰富,会导致一些无法控制的局面。但是如果一开始的目标是解决一些特定的问题,有针对性,那么推进起来也会比较简单。在笔者参与的自动化运维体系建设过程中,我们的初始目标是构建的是一个基础的变更批量操作平台,先把一部分需要重复执行的工作搬到平台上来。

再依据运维的需求丰富这个操作平台的功能和提升效率,最后把周边的系统打通,相互对接,形成完整的自动化运维体系。第二是考虑可扩展性:

设计系统的时候,功能或者设计方面可能不用考虑那么多,但是要考虑当服务器数量发生比较大的扩张时,系统是否还能支撑。第三是以实用为目的:

使用不方便,运维人员第一个就放弃了,何谈推广?

如何搭建数据库自动化运维体系

原文地址:https://www.cnblogs.com/gdjgs/p/13997909.html

您可能感兴趣的文档:

--结束END--

本文标题: 如何搭建数据库自动化运维体系

本文链接: https://lsjlt.com/news/7976.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 如何搭建数据库自动化运维体系
    需求背景: 随着业务的增长、对运维效率和质量的要求不断提高,对自动化运维体系的需求也不断增强。 目前笔者服务的很多中大型企业客户,运维其实还停留在“刀耕火种”的原始状态。 这里所说的“刀”和“火”就是运维人员的远程客户端,例如 xshell...
    99+
    2014-05-21
    如何搭建数据库自动化运维体系 数据库入门 数据库基础教程 数据库 mysql
  • 京东数据库运维自动化体系建设之路
    运维自动化来源于工作中的痛点,京东数据库团队面对的是商城成千上万的研发工程师,这种压力推动我们不断变革,然而变革不是一蹴而就,也经历过从手工到脚本化、自动化、平台化、智能化的艰难转变,所以说是需求在驱动运维...
    99+
    2024-04-02
  • 如何理解ansible自动化运维数据库
    这期内容当中小编将会给大家带来有关如何理解ansible自动化运维数据库,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。   &nb...
    99+
    2024-04-02
  • 数据库自动化运维的奇观:自动化之手,运维无忧
    自动化部署 部署数据库往往是一项耗时且容易出错的任务。自动化部署工具使这一过程变得简单快捷。它们可以自动创建数据库实例、设置配置并应用必要的补丁,从而节省大量时间和精力。 自动化配置管理 数据库配置管理至关重要,但手动执行这一任务往往费时...
    99+
    2024-04-02
  • 数据库自动化运维的未来:自动化引擎,运维无忧
    自动化引擎:数据库运维的革命 自动化引擎是数据库自动化运维的关键技术。它通过预定义的规则和策略,自动执行复杂的运维任务,包括: 性能监控和优化:实时监控数据库性能,并自动调整配置以优化性能。 备份和恢复:创建和管理备份,并在发生故障时自...
    99+
    2024-04-02
  • SQL Server 数据自动化运维
    SQL Server 数据自动化运维说到当前的数据库类型,当前主要流行Mysql、Sql Server、Oracle等三种,区别相信大家都已经非常熟悉了,所以在此就不多介绍了,今天我们主要介绍一下我近期工作...
    99+
    2024-04-02
  • 使用Powershell实现数据库自动化运维
    使用Powershell实现数据库自动化运维目前市场上针对SQLServer的图书,好的原创图书屈指可数,翻译的图书较多,但只限于专门针对SQL Server数据库本身的开发、管理和商业智能。而针对Powe...
    99+
    2024-04-02
  • 数据库自动化运维魔法棒:挥洒智慧,掌控运维
    在快速发展的数字时代,数据库已成为企业网络基础设施的核心支柱。自动化运维的兴起为数据库管理带来了革命性的转变,使企业能够提高效率、降低成本并增强安全性。本文探讨了数据库自动化运维的强大优势,以及如何利用它来掌控数据库运维,释放人力资源潜力...
    99+
    2024-04-02
  • 解锁数据库自动化运维之谜:开启运维新境界
    数据库自动化运维是通过技术手段,自动执行数据库运维任务,以提高运维效率、降低运维成本和风险。其核心思想是利用脚本、工具和平台,将手动运维流程转变为自动化流程。 自动化运维的优势 提升效率:自动化运维可以显著提高数据库运维效率,释放运维...
    99+
    2024-04-02
  • 数据库自动化运维的机遇:拥抱科技,共赢运维
    机遇与挑战 数据库自动化运维带来了以下机遇: 提高效率:自动化脚本和工具可以自动执行耗时的手动任务,从而释放 IT 人员专注于更具战略性的工作。 降低成本:通过减少对人工运维的依赖,自动化可以显著降低运营费用。 提高性能:自动化可以确保...
    99+
    2024-04-02
  • 数据库自动化运维的奥秘:解锁高效运维的密码
    自动化数据库管理任务: 自动化运维的主要优势之一是自动化任务,包括: 备份和恢复:自动执行定期备份以确保数据安全,并简化恢复过程。 性能监控:持续监控数据库性能,检测异常情况并触发警报。 软件更新:管理数据库软件更新,包括补丁程序和新版...
    99+
    2024-04-02
  • 数据库自动化运维的变革:让运维从繁琐中解放
    自动化运维的变革 数据库自动化运维通过自动化技术,涵盖了数据库运维的各个方面,包括但不限于: 数据库部署和配置:自动执行数据库的安装、配置和更新,节省大量时间和精力。 性能监控和调优:持续监测数据库性能并自动调整参数,确保数据库的最佳运...
    99+
    2024-04-02
  • 数据库自动化运维的蓝图:描绘运维的未来图景
    现状及挑战 当前,数据库运维工作繁杂且耗时,主要包括: 基础设施管理和监控 数据库配置和调优 数据备份、恢复和灾难恢复 安全管理和审计 故障诊断和修复 这些任务大多依赖于手工操作,导致效率低下、错误率高,难以满足快速变化的业务需求。 ...
    99+
    2024-04-02
  • 数据库自动化运维的艺术:在便捷中探寻运维真谛
    数据库自动化运维是现代化数据库管理的关键,它通过自动化繁琐的任务和流程,提升运维效率、降低成本并增强可靠性。本文将探索数据库自动化运维的艺术,探讨如何利用便捷性释放运维的真正潜力。 监控自动化:实时洞察 监控自动化是数据库自动化运维的基础...
    99+
    2024-04-02
  • python如何实现自动化运维
    1、安装pip install paramiko2、导入模块import paramiko3、使用def initSshClinet(): ''' 初始化,SSH连接账号密码登录服务器 :return: sshCli...
    99+
    2023-05-17
    Python
  • 阿里云服务器自动关闭数据库实现自动化运维
    随着云计算的发展,越来越多的企业开始将其业务部署到云端,以获得更大的灵活性和可扩展性。在云计算环境中,自动关闭数据库是非常重要的一步,可以帮助企业节省资源,提高运维效率。本文将详细说明如何在阿里云服务器上实现自动关闭数据库的功能。 自动关闭...
    99+
    2023-11-15
    阿里 自动关闭 服务器
  • 数据库自动化运维的崛起:颠覆传统,开创运维新格局
    在当今快速发展的数字时代,数据库的自动化运维已成为颠覆传统运维模式的关键驱动力,开创了运维新格局。通过自动化技术,企业可以显著提高效率、降低成本并加强数据库的可靠性。 自动化工具和技术 数据库自动化运维依赖于一系列工具和技术,包括: 配...
    99+
    2024-04-02
  • 数据库自动化运维的秘密武器:揭秘优化之道
    数据库自动化运维已成为现代数据管理的关键,它通过自动化任务和流程,大幅提升数据库效率和可靠性。掌握以下秘密武器,企业可以优化自动化运维,释放数据库的全部潜力。 1. 监控和告警 实时监控数据库指标至关重要,可及时发现并解决问题。利用自动化...
    99+
    2024-04-02
  • 驾驭数据库自动化之术:运维效率大飞跃
    自动化数据库管理任务 配置管理:自动化数据库配置的创建、更新和维护,确保一致性。 备份和恢复:定期备份和恢复数据库,保障数据安全。 性能监控:持续监控数据库性能,识别瓶颈并采取优化措施。 故障排除:自动化故障检测和响应,快速解决数据库...
    99+
    2024-04-02
  • 数据库自动化运维揭秘:让运维成为一件轻而易举的事
    随着数据量激增和数据库环境日益复杂,数据库运维已成为一项艰巨的任务,需要耗费大量时间和精力。但是,通过自动化关键运维任务,企业可以减轻运维负担,提高效率和可靠性。 自动化运维的好处 节省时间和成本:自动化可以执行繁琐、耗时的任务,释放...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作