返回顶部
首页 > 资讯 > 精选 >立体运维架构与定位
  • 790
分享到

立体运维架构与定位

2023-06-04 16:06:49 790人浏览 安东尼
摘要

写在前面随着越来越多企业应用上云,云上应用的规模与复杂度日趋增长,对云上应用的运维,也提出了新的挑战。华为云AOM服务面向大规模企业应用的运维,在实践中演进并构建了一套完整的面向云上应用的立体化运维系统。一、常见云上应用的架构云上应用早期较

写在前面

随着越来越多企业应用上云,云上应用的规模与复杂度日趋增长,对云上应用的运维,也提出了新的挑战。华为云AOM服务面向大规模企业应用的运维,在实践中演进并构建了一套完整的面向云上应用的立体化运维系统。

一、常见云上应用的架构

云上应用早期较多的是购买云服务I层资源(多为基础设施如主机等计算资源)自建各种集群,运维人员多以主机监控为中心进行运维,同时自己搭建应用及数据库等监控系统进行应用层和业务层运维。随着容器技术的普及,越来越多的企业转向CaaS和PaaS来管理应用,通过微服务框架开发,业务的实现也更多的使用云上服务,如分布式中间件,函数服务,ai服务等,同时运维也转向云上的运维服务。

立体运维架构与定位

一个典型的现代云上应用架构

 立体运维架构与定位

经过域名解析阶段后,静态资源命中CDN后直接返回,无命中时会回源去拉取,动态请求直接访问WEB服务,在请求到达四层和七层ELB之前,多数企业应用也会选择WAF来清洗异常流量。

经过ELB后,请求到达业务应用服务器,业务实例多为分布式构架,微服务之间相互调用,一般情况下企业运维人员较多的关注点是应用实例这一层,多为企业自行开发的服务。

持久化层当前各CSP提供的中间件不一样,华为云上用户使用较多的如分布式缓存,分布式数据库等。由于提供动态扩容及较高级别的SLA,越来越多的企业不再需要专业的DBA,转而使用云上的服务,开发上也更加敏捷。

如此多的云服务和各种资源,任何一个环节出现问题,都将导致应用KPI异常,用户体验下降,进而导致企业运营受到影响,而每个使用公有云服务的企业,如果投入大量人力去自建运维系统并且将整个请求的各个环节关联起来,成本会非常高。因此华为云AOM在帮助企业对应用运维的过程中,通过实践构建了一套立体运维体系,帮助企业更好的进行一站式运维。下面章节将为您介绍立体运维的定位及架构。

二、立体运维的定位及架构

立体运维定位

立体化运维主要是围绕用户应用进行监控,一站式完成用户体验监控,应用性能监控,基础设施监控。

参考以上典型云应用架构,通过将业务请求路径上经过的不同资源进行分层,围绕分层设计不同的专业运维服务子系统,将不同数据在不同子系统上串联协同、关联分析,构筑一个云上的运维平台,从而最大化的实现数据价值,为运维人员提供一个统一的运维中心,达到一站式立体化运维的目的。如下为立体运维分层:

 

立体运维架构与定位

                                              立体运维分层

构建立体运维,除了要覆盖应用的端到端资源以外,重点还要通过多种运维数据进行数据分析,通过多种可视化手段进行友好的界面展示。因此立体运维体系建设包括以下工作:

 

资源模型化

其实就是将应用依赖的资源接入CMDB,但是云上业务的CMDB与自建数据中心运维有所区别,后者多对应的是SRE(网站可靠性工程师)层面的CMDB,而应用运维管理所需要的CMDB是面向云资源的量身打造的CMDB。主要有以下特征

·          分离业务模型与存量资源模型(后续文章后详细解读)

·          存量模型能表述不同的云服务下的不同云资源

·          支持对云服务内云资源建立映射关系

·          支持对跨云服务的资源建立映射关系

·          支持云资源标签管理(打标签,同步标签,按标签查询)

·          支持历史资源快照

资源模型化这一步是所有数据关联及运维平台化的基础,通过统一的模型将不同资源关联起来后,可以帮助用户快速的找到故障的根因,也能通过关联关系对大量告警进行分析,抑制重复告警等。

数据可视

良好的可视化界面不但能提高运维人员运维效率,还可以通过直观的展示查看各种资源消耗趋势,帮助企业分析运营走势,预测未来资源使用情况等。应用运维管理数据可视化遵从以下原则进行设计

·          建立左右逢源的资源拓扑图

资源拓扑是指一个资源与其他资源的关联关系,如云主机与ELB及VPC,CDN的关系,通过一个资源拓扑图进行展示。如下

立体运维架构与定位

所谓左右逢源是指以一个资源为中心,拓扑图展示其上下各一层的关联资源即可,避免拓扑过大,但又能通过一个资源找到上层或者下层资源。

·          关联资源下钻

建立拓扑后,通过图上的资源链接,可以跳转到选中的另一个资源的拓扑图中去,而新的拓扑图是以新的资源为中心,如此来达到通过关联资源不断下钻的目标,方便运维人员查找问题。

·          云资源快速跳转

一个云资源可能涉及到多个云服务,如ELB实例,涉及ELB服务本身,VPC,CDN,ECS,而各个云服务入口较分散,需要在资源名称增加超链接快速跳转到云服务console。

·          视图模板化

各资源监控数据的展示,由AOM默认提供模板,但同时要支持用户自定义模板,由于运维人员关注的指标或其他数据侧重点不一样,因此要能通过模板支持同一个资源不同视角的查看方式。

·          功能向导化

复杂功能需要通过向导快速指导用户进行设置或配置,以减少用户学习文档或者视频的时间成本。

 

服务平台

平台化目标要支持用户通过各子系统通过开放api实现自动化运维。指标,日志,事件告警等数据要支持用户通过接口订阅,转发到外部系统供用户运维平台进行分析,分析结果通过API输入立体运维平台并通过事件驱动平台业务持续分析。

也就是通过数据流,实现平台与用户运维系统的协同,实现流程化自动化

自动化将会协助用户实现故障自动恢复,如通过数据分析后发现需要扩容,可以通过事件触发或者API调用弹性伸缩子系统进行实例扩容。还可以在资源空闲时缩容以节省企业运营成本。

分析智能

针对指标数据提供动态阈值计算能力,无需用户设置阈值,通过机器学习进行异常检测,对于大型系统的运维可以有效的降低人工配置成本。同时也避免静态阈值设置不合理需要不断调整的重复工作。

针对日志数据,智能提取模板,分析可变参数与静态文本,通过日志关键字监控,实时掌握应用异常情况。

 

应用运维管理的整体架构

以下为应用运维管理整体的架构,主要分为五个子系统,每个子系统通过多个微服务提供不同功能,整体协同实现立体运维目标。

立体运维架构与定位

 

ALM模块负责事件告警的管理及相关性分析,支持用户配置通知策略以及时将告警发送给运维人员。

ALS模块负责分析日志。

INV模块即CMDB模块,实现资源的管理及资源的映射及查询等能力。

AMS模块主要负责指标数据的管理,提供阈值配置能力。

DPA模块主要负责大数据计算及智能化能力,在线和离线分析数据,以事件驱动各子系统运行。

更多信息可查看: https://www.huaweicloud.com/product/aom.html

另外架构图中的底座环境,展示了AOM运维范围,从基础设施到PaaS层应用及容器和VM应用,覆盖了应用运行所依赖各层资源。

--结束END--

本文标题: 立体运维架构与定位

本文链接: https://lsjlt.com/news/238503.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 立体运维架构与定位
    写在前面随着越来越多企业应用上云,云上应用的规模与复杂度日趋增长,对云上应用的运维,也提出了新的挑战。华为云AOM服务面向大规模企业应用的运维,在实践中演进并构建了一套完整的面向云上应用的立体化运维系统。一、常见云上应用的架构云上应用早期较...
    99+
    2023-06-04
  • 如何建立架构师的立体化思维?
    从程序员往架构师转型的路上,蔡学镛老师总结的“四维架构设计方法论”对我颇有帮助,让我对架构设计有了更立体化、系统化的认知,现将学习心得分享出来供需要的小伙伴参考。这套方法论通过空间(X、Y、Z)三个维度及时间T维度将问题域解构成可以轻松应对...
    99+
    2023-06-05
  • MySQL整体架构与内存结构
    一  mysql 整体框架: MySQL是由SQL接口,解析器,优化器,缓存,存储引擎等组成的。   1. Connectors指的是不同语言中与SQL的交...
    99+
    2024-04-02
  • TiDB简介与整体架构
    ---描述得很牛逼,有待验证 TiDB 简介 TiDB 是 PingCAP 公司受 Google Spanner / F1 论文启发而设计的开源分布式 NewSQL 数据库。 TiDB 具备...
    99+
    2024-04-02
  • 【第43天】sort 的复杂运用 | 对二维数组与结构体实现自定义排序
    本文已收录于专栏 🌸《Java入门一百练》🌸 学习指引 序、专栏前言 一、二维排序 二、【例题1】 1、题目描述 2、解题思路 3、模板代码 4、代码解析 三、【例题2...
    99+
    2023-08-16
    java 算法 数据结构 排序算法
  • 运维DevOps体系解析与落地实践
    引言DevOps自从2009年诞生以来,经过多年摸索开始逐步变成一种主流运维模式。网上也有很多关于DevOps的讨论,但大多数都停留在思想层面,真正可落地的方法并不多,本文作者对自身从业经验和唯品会的落地实践加以总结,希望给读者一定的思考和...
    99+
    2023-06-04
  • Mybatis整体架构及运行流程是什么
    本篇内容介绍了“Mybatis整体架构及运行流程是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!Mybatis是什么Mybatis是一个...
    99+
    2023-06-02
  • Linux主流架构运维工作的示例分析
    这篇文章将为大家详细讲解有关Linux主流架构运维工作的示例分析,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。LVS+KEEPALIVED(heartbeat)+Squid+Nginx/Apache+JA...
    99+
    2023-06-12
  • Linux主流架构运维的工作原理什么
    这篇文章将为大家详细讲解有关Linux主流架构运维的工作原理什么,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。随着IT运维的不断发展,尤其的Linux的飞速发展,越来越多的企业开始使用Lin...
    99+
    2023-06-16
  • 如何选择适合的高效固定定位架构
    如何选择适合的快速固定定位结构,需要具体代码示例在现代软件开发中,快速固定定位是一个非常重要的功能。无论是网页设计、移动应用开发还是嵌入式系统,我们都需要能够准确地定位到需要操作的元素或对象。一个好的固定定位结构不仅能提高开发效率,还能改善...
    99+
    2023-12-28
    快速 定位 固定
  • JVM架构体系与GC命令都有哪些
    这篇文章将为大家详细讲解有关JVM架构体系与GC命令都有哪些,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。JVM运行时数据区OverviewJava虚拟机Java virtual machi...
    99+
    2023-06-16
  • 架构与思维论设计容量的重要性
    目录背景概念分析过程理解一些原理峰值QPS计算:系统容量评估时机评估的步骤 1、分析日总访问量2、评估平均访问量QPS3、评估高峰区间的QPS3.1 业务流量监控的曲线3....
    99+
    2024-04-02
  • MySQL运行原理与基础架构是什么
    本篇内容主要讲解“MySQL运行原理与基础架构是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“MySQL运行原理与基础架构是什么”吧!下面是关于上述部件的介...
    99+
    2024-04-02
  • 解析与应用绝对定位运动指令
    绝对定位运动指令解析及应用,需要具体代码示例 一、引言在现代工业生产中,自动化生产设备起到了至关重要的作用。而在自动化设备中,运动控制是其中之一。绝对定位运动指令是运动控制中的一种常见指令,本文将探讨其解析和应用,并通过具体的代...
    99+
    2024-01-23
    绝对定位 运动指令 解析及应用
  • 基于Vue2中独立构建与运行时构建的区别是什么
    这篇文章主要为大家展示了“基于Vue2中独立构建与运行时构建的区别是什么”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“基于Vue2中独立构建与运行时构建的区别是...
    99+
    2024-04-02
  • Java EJB部署与运维指南,确保系统稳定运行
    Java Enterprise Java Beans (EJB)是一种用于构建可扩展和可维护的企业应用程序的服务器端框架。正确部署和维护EJB至关重要,以确保系统的稳定性和性能。 EJB部署 EJB部署涉及将EJB组件(会话Bean、实...
    99+
    2024-02-20
    Java EJB 部署 运维 稳定性 性能
  • 研发与运维一体化,见证终极协同奥义
    家家有本难念的经,但是痛却总是惊人的相似场景1:某个软件开发公司里,所有的设计、开发、测试、运维虽然被分配了不同职能与任务,但是他们都有一个统一的称呼——工程师。实际上,他们经常会互相干一些本不属于自身职能范围的工作。公司业务拓展,业务系统...
    99+
    2023-06-04
  • C语言自定义类型详解(结构体、枚举、联合体和位段)
    目录前言一、结构体1、结构体类型的声明2、结构体的自引用3、结构体变量的定义和初始化4、结构体内存对齐5、结构体传参二、位段1、位段的定义 2、位段的内存分配3、位段的应用...
    99+
    2024-04-02
  • 云服务器的管理与运维是什么工作岗位
    云服务器的管理与运维是一个非常重要的工作岗位,主要负责管理和维护云服务器的运行和安全。这个岗位需要具备一定的技术能力和经验,能够熟练掌握云计算技术和相关工具,如AWS、Azure、Google Cloud等。 以下是云服务器管理与运维的几...
    99+
    2023-10-27
    工作岗位 服务器
  • 干货分享:容器 PaaS 新技术架构下的运维实践
    2018年11月16-17日,由 InfoQ 主办的运维&容器技术盛会 CNUTCon 全球运维技术大会在上海·光大会展中心成功举办,时速云联合创始人兼 CTO 王磊受邀参加此次大会,并发表主题演讲。王磊此次演讲的题目为《容器Paa...
    99+
    2023-06-04
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作