百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

7 个用于生产环境快速故障定位的Bash脚本

wptr33 2025-07-03 20:21 5 浏览

1. 检测系统资源使用情况

当我们的服务器变的卡慢时,首先要检查的是资源利用率。此脚本提供了CPU、内存和磁盘使用情况的快照。

check_resources.sh

#!/bin/bash

echo "==== System Resource Usage ===="
echo "CPU Usage:"
top -bn1 | grep "Cpu(s)" | awk '{print "CPU Load: " $2 + $4 "%"}'

echo "Memory Usage:"
free -h | awk 'NR==2{printf "Used: %s / Total: %s\n", $3, $2}'

echo "Disk Usage:"
df -h | awk '$NF=="/"{printf "Used: %s / Total: %s (%s)\n", $3, $2, $5}'
  • 使用 top 获取 CPU 使用率。
  • 使用 free -h 以可读格式显示内存使用情况
  • 使用 df -h 显示磁盘使用情况,重点关注根分区(/)

运行

chmod +x check_resources.sh
./check_resources.sh

2. 查找消耗CPU&Memory最多的进行

如果服务器运行卡慢,找到消耗最多资源的进程显得格外重要。

top_processes.sh

#!/bin/bash
echo "Top 5 CPU-Consuming Processes:"
ps -eo pid,comm,%cpu --sort=-%cpu | head -n 6
echo -e "\nTop 5 Memory-Consuming Processes:"
ps -eo pid,comm,%mem --sort=-%mem | head -n 6

ps -eo 列出所有进程及其 PID(进程 ID)、命令名称和 CPU/内存使用情况

--sort=-%cpu --sort=-%mem 选项按最高使用率排序

head -n 6 显示前 5 个进程(第一行是标题)

3. 检查网络连接与延迟

脚本有助于检查连接性和延迟,因为网络问题可能会降低性能并导致停机.

network_check.sh

#!/bin/bash

TARGET="223.5.5.5"

echo "Checking connectivity to $TARGET..."
ping -c 4 $TARGET

echo -e "\nChecking DNS resolution..."
nslookup baidu.com | grep "Address"

echo -e "\nChecking active network connections..."
netstat -ant | grep ESTABLISHED

4. 确认关键服务是否正常运行

如果关键服务(例如,Nginx、MySQL、Docker)停止,可以用此脚本进行判断。

#!/bin/bash

SERVICE="nginx"

if systemctl is-active --quiet $SERVICE; then
    echo "$SERVICE is running."
else
    echo "$SERVICE is NOT running!"
fi

5. 检测端口是否被监听

如果程序没有任何响应,可以判断端口是否被监听。

#!/bin/bash

PORT=80

if netstat -tulnp | grep ":$PORT " > /dev/null; then
    echo "Port $PORT is open and listening."
else
    echo "Port $PORT is NOT open!"
fi
# netstat 也可以更改为ss命令

6. 实时监控日志文件中的错误

monitor_logs.sh

#!/bin/bash

LOG_FILE="/var/log/syslog"

echo "Monitoring $LOG_FILE for errors..."
tail -f $LOG_FILE | grep --line-buffered -i "error"

7. 测试磁盘IO

disk_speed_test.sh

#!/bin/bash

echo "Testing disk write speed..."
dd if=/dev/zero of=/tmp/testfile bs=1M count=500 oflag=direct

echo -e "\nTesting disk read speed..."
dd if=/tmp/testfile of=/dev/null bs=1M count=500

#使用 dd 写入和读取 500MB 数据以测试磁盘速度。
#oflag=direct 验证写入操作不会被缓存

如果磁盘IO较低,会降低数据库之类的高IO应用程序的性能。

相关推荐

「网络安全」JAVA代码审计——XXE外部实体注入

一、WEB安全部分想要了解XXE,在那之前需要了解XML的相关基础二、XML基础...

Web前端面试题目及答案汇总(web前端面试题最新)

Web前端面试题目及答案汇总来源:极客头条以下是收集一些面试中经常会遇到的经典面试题以及自己面试过程中无法解决的问题,通过对知识的整理以及经验的总结,重新巩固自身的前端基础知识,如有错误或更好的答案,...

什么是脚本文件?与可执行文件有什么不同?

今天的内容是脚本文件和可执行文件是两种不同类型的计算机文件,它们在结构和执行方式上有显著区别。脚本文件:定义与特性...

20个实用Python运维脚本(收藏级)(python 运维工具)

系统环境:支持Linux(Ubuntu/CentOS/Debian)和Windows...

2026年前每个开发者都应该学习的技能

优秀开发者...

Linux 如何每 5、10、15 或 30 分钟运行一次 Cron 作业?

在Linux系统中,Cron是一个强大的工具,用于自动化重复性任务。通过合理配置...

Shell脚本编程进阶实战:从入门到高效自动化

Shell脚本编程进阶实战:从入门到高效自动化一、参数处理进阶:打造专业级CLI工具1.高级参数解析示例...

在Bash中按分隔符拆分字符串的方法

技术背景在Bash脚本编程中,经常会遇到需要按特定分隔符拆分字符串的需求,例如处理CSV文件、解析日志等。掌握字符串拆分的方法对于数据处理和脚本自动化非常重要。...

程序员用5分钟,把一个400多MB的苹果安装包削掉了187MB

丰色发自凹非寺量子位|公众号QbitAI前些日子,一个...

如何在 Windows 上编写批处理脚本

你知道如何使用命令提示符吗?如果这样做,您可以编写一个批处理文件。在最简单的形式中,批处理文件(或批处理脚本)是双击文件时执行的几个命令的列表。批处理文件一直回到DOS,但仍然适用于现代版本的Win...

一文搞懂shell脚本(shell脚本应用实战)

一文搞懂shell脚本1、shell脚本介绍什么是shell脚本...

一文讲清ShellScript脚本编程知识

摘要:本文详尽地讲述了ShellScript的基础内容,还有它在Linux系统里的运用情况,涵盖了它的基本语法、常用的命令以及高级的功能。ShellScript可是一种简单又非常实用的编...

在Bash脚本中获取自身所在目录的方法

技术背景在使用Bash脚本时,有时需要获取脚本自身所在的目录。比如,当脚本作为另一个应用程序的启动器时,需要将工作目录更改为脚本所在的目录,以便对该目录中的文件进行操作。然而,由于脚本的调用方式多样(...

shell中如何确定脚本的位置?这篇文章告诉你

我想从同一个位置读取一些配置文件,如何确定脚本的位置?。这个问题的出现主要是由两个原因引发的:一是您希望将脚本的数据或配置进行外部化,因此需要一种方式来寻找这些外部资源;二是您的脚本需要对某些捆绑资源...

bash shell 语法(bash命令用法)

下面是**Shell(Bash)语法的常用知识点总结**,适合初学者和日常脚本编写参考。内容涵盖变量、判断、循环、函数、重定向、正则、数组等常见用法。---#Shell(Bash)语法速查总结...