返回顶部
首页 > 资讯 > 操作系统 >Linux运维常见故障及处理的方法是什么
  • 733
分享到

Linux运维常见故障及处理的方法是什么

2023-06-16 05:06:59 733人浏览 独家记忆
摘要

今天就跟大家聊聊有关linux运维常见故障及处理的方法是什么,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。作为Linux运维,多多少少会碰见这样那样的问题或故障,从中总结经验,查找问

今天就跟大家聊聊有关linux运维常见故障及处理的方法是什么,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。

作为Linux运维,多多少少会碰见这样那样的问题或故障,从中总结经验,查找问题,汇总并分析故障的原因,这是一个Linux运维工程师良好的习惯。每一次技术的突破,都经历着苦闷,伴随着快乐,可我们还是执着的继续努力,从中也积累了更多的经验,这就是实践给予我们的丰厚回报。

下面汇总了我做项目过程可能出现的故障及解决方法,看看是否与你有共鸣,并对你有帮助?

第一:常见问题解决集锦

1.shell脚本不执行

问题
某天研发某同事找我说帮他看看他写的shell脚本,死活不执行,报错。我看了下,脚本很简单,也没有常规性的错误,报“:badinterpreter:Nosuchfileordirectory”错。

看这错,我就问他是不是在windows下编写的脚本,然后在上传到linux服务器的……果然。

原因
在DOS/windows里,文本文件的换行符为rn,而在nix系统里则为n,所以DOS/Windows里编辑过的文本文件到了nix里,每一行都多了个^M。

解决
1)重新在linux下编写脚本;
2)vi:%s/r//g:%s/^M//g(^M输入用Ctrl+v,Ctrl+m)
附:sh-x脚本文件名,可以单步执行并回显结果,有助于排查复杂脚本问题。

2.crontab输出结果控制

问题
/var/spool/clientMQueue目录占用空间超过100G

原因
cron中执行的程序有输出内容,输出内容会以邮件形式发给cron的用户,而sendmail没有启动所以就产生了/var/spool/clientmqueue目录下的那些文件,日积月累可能撑破磁盘。

解决
1)直接手动删除:ls|xargsrm-f;
2)彻底解决:在cron的自动执行语句后加上>/dev/2>&1

3.telnet很慢/ssh很慢

问题
某天研发某同事说10.50访问10.52memcached服务异常,让我们检查下看网络/服务/系统是否有异常。检查发现系统正常,服务正常,10.50ping10.52也正常,但10.50telnet10.52很慢。同时发现该机器的namesever是不起作用的。

原因
becauseyourpcdoesn’tdoareverseDNSlookuponyourIPthen…whenyoutelnet/ftpintoyourlinuxbox,it’lldoadnslookuponyou。

解决
1)修改/etc/hosts使hostname和ip对应;
2)在/etc/resolv.conf注释掉nameserver或者找一个“活的”nameserver。

4.Read-onlyfilesystem

问题
同事在mysql里建表建不成功,提示如下:
Mysql>createtablewosontest(colddname1char(1));
ERROR1005(HY000):Can’t create table‘wosontest’(errno:30)
经检查mysql用户权限以及相关目录权限没问题;用perror30提示信息为:OSerrorcode30:Read-onlyfilesystem

可能原因
1)文件系统损坏;
2)磁盘又坏道;
3)fstab文件配置错误,如分区格式错误错误(将ntfs写成了fat)、配置指令拼写错误等。

解决
1)由于是测试机,重启机器后恢复;
2)网上说用mount可解决。

5.文件删了磁盘空间没释放

问题
某天发现某台机器df-h已用磁盘空间为90G,而du-sh/*显示所有使用空间加起来才30G,囧。

原因
可能某人直接用rm删除某个正在写的文件,导致文件删了但磁盘空间没释放的问题

解决
1)最简单重启系统或者重启相关服务。
2)干掉进程

/usr/sbin/lsof|grepdeleted   ora25575data33uREG65,654294983680/oradata/DATAPRE/UNDOTBS009.dbf(deleted)

从lsof的输出中,我们可以发现pid为25575的进程持有着以文件描述号(fd)为33打开的文件/oradata/DATAPRE/UNDOTBS009.dbf。

在我们找到了这个文件之后可以通过结束进程的方式来释放被占用的空间:echo>/proc/25575/fd/33
3)删除正在写的文件一般用cat/dev/null>file

6.find文件提升性能

问题
在tmp目录下有大量包含picture_*的临时文件,每天晚上2:30对一天前的文件进行清理。之前在crontab下跑如下脚本,但是发现脚本效率很低,每次执行时负载猛涨,影响到其他服务。

#!/bin/sh find/tmp-name“picture_*”-mtime+1-execrm-f{};

原因
目录下有大量文件,用find很耗资源。

解决

#!/bin/sh cd/tmp time=`date-d“2dayaGo”“+%b%d”` ls-l|grep“picture”|grep“$time”|awk‘{print$NF}’|xargsrm-rf

7.获取不了网关Mac地址

问题
从2.14到3.65(映射地址2.141)网络不通,但是从3端的其他机器到3.65网络OK。

原因

#arp AddressHWtypeHWaddressFlagsMaskIface 192.168.3.254etherincompletCMbond0 表面现象是机器自动获取不了网关MAC地址,网络工程师说是网络设备的问题,具体不清。

解决
arp绑定,arp-ibond0-s192.168.3.25400:00:5e:00:01:64

8.Http服务无法启动一例

问题

某天研发某同事说网站前端环境http无法启动,我上去看了下。报如下错:

/etc/init.d/httpdstart Startinghttpd:[SatJan2917:49:002011][warn]moduleantibot_moduleisalreadyloaded,skipping Useproxyforwardasremoteip:true. Antibotexcludepattern:.*.[(js|CSS|jpg|gif|png)] Antibotseedcheckpattern:login (98)Addressalreadyinuse:make_sock:couldnotbindtoaddress[::]:7080 (98)Addressalreadyinuse:make_sock:couldnotbindtoaddress0.0.0.0:7080 nolisteningSocketsavailable,shuttingdown Unabletoopenlog[FAILED]

原因

1)端口被占用:表面看是7080端口被占用,于是netstat-npl|grep7080看了下发现7080没有占用;
2)在配置文件中重复写了端口,如果在以下两个文件同时写了Listen7080

/etc/httpd/conf/http.conf /etc/httpd/conf.d/t.10086.cn.conf

解决
注释掉/etc/httpd/conf.d/t.10086.cn.conf的Listen7080,重启,OK。

9.toomanyopenfile

问题
报toomanyopenfile错误

解决
终极解决方案

echo“”>>/etc/security/limits.conf echo“*softnproc65535″>>/etc/security/limits.conf echo“*hardnproc65535″>>/etc/security/limits.conf echo“*softnofile65535″>>/etc/security/limits.conf echo“*hardnofile65535″>>/etc/security/limits.conf echo“”>>/root/.bash_profile echo“ulimit-n65535″>>/root/.bash_profile echo“ulimit-u65535″>>/root/.bash_profile

最后重启机器或者执行:

ulimit-u655345&&ulimit-n65535

10.ibdata1和mysql-bin致磁盘空间问题

问题
2.51磁盘空间报警,经查发现ibdata1和mysql-bin日志占用空间太多(其中ibdata1超过120G,mysql-bin超过80G)

原因
bdata1是存储格式,在INNODB类型数据状态下,ibdata1用来存储文件的数据和索引,而库名的文件夹里的那些表文件只是结构而已。

innodb存储引擎有两种表空间的管理方式,分别是:
1)共享表空间(可拆分为多个小的表空间文件),这个是我们目前多数数据库使用的方法;
2)独立表空间,每一个表有一个独立的表空间(磁盘文件)

对于两种管理方式,各有优劣,具体如下:
①共享表空间:
优点
可以将表空间分成多个文件存放到不同的磁盘上(表空间文件大小不受表大小的限制,一个表可以分布在不同步的文件上)

缺点
所有数据和索引存放在一个文件中,则随着数据的增加,将会有一个很大的文件,虽然可以把一个大文件分成多个小文件,但是多个表及索引在表空间中混合存储,这样如果对于一个表做了大量删除操作后表空间中将有大量空隙。

对于共享表空间管理的方式下,一旦表空间被分配,就不能再回缩了。当出现临时建索引或是创建一个临时表的操作表空间扩大后,就是删除相关的表也没办法回缩那部分空间了。

②独立表空间:
在配置文件(my.cnf)中设置:innodb_file_per_table

特点
每个表都有自已独立的表空间;每个表的数据和索引都会存在自已的表空间中。

优点
表空间对应的磁盘空间可以被收回(Droptable操作自动回收表空间,如果对于删除大量数据后的表可以通过:altertabletbl_nameengine=innodb;回缩不用的空间。

缺点
如果单表增加过大,如超过100G,性能也会受到影响。在这种情况下,如果使用共享表空间可以把文件分开,但有同样有一个问题,如果访问的范围过大同样会访问多个文件,一样会比较慢。

如果使用独立表空间,可以考虑使用分区表的方法,在一定程度上缓解问题。此外,当启用独立表空间模式时,需要合理调整innodb_open_files参数的设置。

解决:
1)ibdata1数据太大:只能通过dump,导出建库的sql语句,再重建的方法。
2)mysql-binLog太大:

①手动删除:
删除某个日志:mysql>PURGEMASTERLOGSTO‘mysql-bin.010′;
删除某天前的日志:mysql>PURGEMASTERLOGSBEFORE’2010-12-2213:00:00′;
②在/etc/my.cnf里设置只保存N天的bin-log日志
expire_logs_days=30//BinaryLog自动删除的天数

二、故障排查汇总表

Linux运维常见故障及处理的方法是什么

看完上述内容,你们对Linux运维常见故障及处理的方法是什么有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注编程网操作系统频道,感谢大家的支持。

--结束END--

本文标题: Linux运维常见故障及处理的方法是什么

本文链接: https://lsjlt.com/news/282458.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Linux运维常见故障及处理的方法是什么
    今天就跟大家聊聊有关Linux运维常见故障及处理的方法是什么,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。作为Linux运维,多多少少会碰见这样那样的问题或故障,从中总结经验,查找问...
    99+
    2023-06-16
  • Linux运维常见问题及解决方法是什么
    Linux运维常见问题及解决方法是什么,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。作为linux运维,多多少少会碰见这样那样的问题或故障,从中总结经验,查找问题,汇总并分析故...
    99+
    2023-06-16
  • 电脑常见故障问题及处理方法是什么
    今天小编给大家分享一下电脑常见故障问题及处理方法是什么的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。电脑常见故障问题及其处理...
    99+
    2023-06-28
  • 电脑常见故障及处理方法汇总
    1. 电脑无法启动或死机:- 检查电源线是否插好并通电。- 检查电源适配器是否正常工作。- 检查电脑内存条是否插好。- 清洁电脑内部...
    99+
    2023-09-07
    电脑
  • MHA搭建及故障维护的方法是什么
    本篇内容主要讲解“MHA搭建及故障维护的方法是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“MHA搭建及故障维护的方法是什么”吧! (一)环境介绍 1....
    99+
    2024-04-02
  • Linux 运维故障排查思路是什么
    本篇文章为大家展示了Linux 运维故障排查思路是什么,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。1. 背景有时候会遇到一些疑难杂症,并且监控插件并不能一眼立马发现问题的根源。这时候就需要登录服务...
    99+
    2023-06-15
  • 常见的SpringMVC故障排查及解决方案是什么
    本篇文章给大家分享的是有关常见的SpringMVC故障排查及解决方案是什么,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。一、前言相信我们每个人在SpringMVC开发中,都遇到...
    99+
    2023-06-05
  • raid5常见故障数据恢复的方法是什么
    今天小编给大家分享一下raid5常见故障数据恢复的方法是什么的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。服务器raid阵列...
    99+
    2023-06-03
  • MySQL 常见同步复制故障处理方法
    1、在Master节点删除一条记录,Slave节点找不到该条记录而报错 采取方法: stop slave; set global sql_slave_skip_counter=1; start sl...
    99+
    2024-04-02
  • 电脑常见的故障有哪些及怎么处理
    电脑常见的故障包括以下几种:1. 电脑无法启动:可能是由于电源故障、硬件故障或软件问题导致。可以尝试检查电源线连接、更换电源适配器,...
    99+
    2023-09-07
    电脑
  • windows xp系统常见的异常故障及解决方法整理
    板载声卡发音不正常快速开机后鼠标无法移动当你遇到这些系统故障时候是不是觉得很崩溃呢今天小编就给大家盘点那些常见的Windows xp系统异常故障及解决途径,希望对那些还在坚守windows xp系统的朋友们有点帮助。 一...
    99+
    2023-06-02
    winxp 系统异常 故障 方法 解决 系统 windows xp
  • Python常见异常的处理方式是什么
    这篇文章主要介绍“Python常见异常的处理方式是什么”,在日常操作中,相信很多人在Python常见异常的处理方式是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python常见异常的处理方式是什么”的疑...
    99+
    2023-07-05
  • 常见的Python异常及处理方法总结
    目录一、错误与异常1.什么是错误2.什么是异常3.回溯信息二、常见异常常见异常类三.异常处理1.异常处理2.简单的异常处理格式3.执行顺序4.except分支可以有多个5.执行顺序6...
    99+
    2024-04-02
  • 常见的服务器故障是什么
    硬件故障:包括主板、CPU、内存、硬盘等硬件组件出现故障导致服务器无法正常工作。 网络故障:包括网络连接不稳定、交换机故障、路由器...
    99+
    2024-04-24
    服务器
  • DG搭建常见问题处理的方法是什么
    这篇文章主要讲解了“DG搭建常见问题处理的方法是什么”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“DG搭建常见问题处理的方法是什么”吧!1、ORA-0992...
    99+
    2024-04-02
  • 电脑常见的几种故障及解决方法
    电脑常见的几种故障及解决方法包括:1. 电脑无法启动:检查电源是否插好、电源线是否损坏、重启电脑、检查硬件连接是否正常。2. 蓝屏死...
    99+
    2023-09-07
    电脑
  • 电脑常见的问题应急处理方法是什么
    本篇内容主要讲解“电脑常见的问题应急处理方法是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“电脑常见的问题应急处理方法是什么”吧!1.开机系统自检现象分析:这是忽然停电或强行关机造成的。由停...
    99+
    2023-06-28
  • 常见的Linux进程通信方法是什么
    这篇文章主要为大家分析了常见的Linux进程通信方法是什么的相关知识点,内容详细易懂,操作细节合理,具有一定参考价值。如果感兴趣的话,不妨跟着跟随小编一起来看看,下面跟着小编一起深入学习“常见的Linux进程通信方法是什么”的知识吧。进程虽...
    99+
    2023-06-28
  • 大数据中对讲机使用过程中的常见故障及排除故障的解决方法是什么
    今天就跟大家聊聊有关大数据中对讲机使用过程中的常见故障及排除故障的解决方法是什么,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。  对讲机使用过程中的常见故障及排除故障的解决方法  问...
    99+
    2023-06-05
  • 开发中常见的Oracle三大故障与调优方法是什么
    本篇内容介绍了“开发中常见的Oracle三大故障与调优方法是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作