对于Linxu系统运维工程师来说好的系统进程管理工具,就像一把利器,无坚不摧,可以使用这些工具发现造成性能问题可能原因,提升团队的工作效率,本篇知识提及一些简单常用系统管理工具包括了pstree、ps、pgrep、top、htop、pidof、vmstat、glances、dstat的简单实用例子及常用选项,希望能帮助一些热爱Linux的朋友们。

 

 

pstree:用来显示进程数的

pstree命令的用法格式

[root@Corazon ~]# pstreeinit─┬─NetworkManager     ├─abrtd     ├─acpid     ├─atd     ├─auditd───{auditd}     ├─automount───4*[{automount}]     ├─console-kit-dae───63*[{console-kit-da}]     ├─crond     ├─cupsd     ├─dbus-daemon     ├─dhclient     ├─hald─┬─hald-runner─┬─hald-addon-acpi     │      │             └─hald-addon-inpu     │      └─{hald}     ├─irqbalance     ├─login───bash     ├─master─┬─pickup     │        └─qmgr     ├─5*[mingetty]     ├─modem-manager     ├─polkitd     ├─rpc.statd     ├─rpcbind     ├─rsyslogd───3*[{rsyslogd}]     ├─sshd───sshd───bash───pstree     ├─udevd───2*[udevd]     └─wpa_supplicant

ps [OPTION]...

选项支持组合:aux

u:以用户给为中心组织进程状态信息显示

a:与终端相关的进程

x:与终端无关的进程

 [root@Corazon ~]# ps auxUSER        PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMANDroot          1  0.0  0.0  19356  1528 ?        Ss   11:50   0:01 /sbin/initroot          2  0.0  0.0      0     0 ?        S    11:50   0:00 [kthreadd]root          3  0.0  0.0      0     0 ?        S    11:50   0:00 [migration/0]root          4  0.0  0.0      0     0 ?        S    11:50   0:00 [ksoftirqd/0]root          5  0.0  0.0      0     0 ?        S    11:50   0:00 [stopper/0]root          6  0.0  0.0      0     0 ?        S    11:50   0:00 [watchdog/0]root          7  0.0  0.0      0     0 ?        S    11:50   0:00 [migration/1]root          8  0.0  0.0      0     0 ?        S    11:50   0:00 [stopper/1]

 

#  USER:发起进程的用户

#  PID:进程的PID

#  %CPU:占用的CPU使用百分比

#  %MEM:占用的内存使用百分比

#  VSZ:虚拟内存集

#  RSS:常驻内存集

#  TTY:跟哪个终端相关

#  STAT:进程状态

R:运行中

S:interruptable sleeping 可中断睡眠

D:uninterruptable sleeping 不可中断睡眠

T:停止态

Z:僵死态

 

s:会话首进程

N:低优先级

<:高优先级

l:多线程进程

+:前台进程 

 

#  START启动时间

#  TIME:累计使用CPU时长

#  COMMADN:发起的命令

 

 

-ef组合:

-e:显示所有进程

-f:显示完整的进程信息

[root@Corazon ~]# ps -efUID         PID   PPID  C STIME TTY          TIME CMDroot          1      0  0 11:50 ?        00:00:01 /sbin/initroot          2      0  0 11:50 ?        00:00:00 [kthreadd]root          3      2  0 11:50 ?        00:00:00 [migration/0]root          4      2  0 11:50 ?        00:00:00 [ksoftirqd/0]root          5      2  0 11:50 ?        00:00:00 [stopper/0]root          6      2  0 11:50 ?        00:00:00 [watchdog/0]

# UID:发起进程的用户

# PID 进程的PID

# PPID 父进程的PID

# C:运行在哪科CPU

# STIME:启动时间

# TIME:累计使用CPU时长

# CMD发起了哪些命令

 

常用组合:-eFH

     -F: 显示完整格式的进程信息
     -H: 以进程层级格式显示进程相关信息

[root@Corazon ~]# ps -eFHUID         PID   PPID  C    SZ   RSS PSR STIME TTY          TIME CMDroot          2      0  0     0     0   0 11:50 ?        00:00:00 [kthreadd]root          3      2  0     0     0   0 11:50 ?        00:00:00   [migration/0]root          4      2  0     0     0   0 11:50 ?        00:00:00   [ksoftirqd/0]root          5      2  0     0     0   0 11:50 ?        00:00:00   [stopper/0]root          6      2  0     0     0   0 11:50 ?        00:00:00   [watchdog/0]

 

SZ:虚拟内存集

RSS:常驻内存集

PSR:优先级

常用组合:-eo, axo

  -eo pid,tid,class,rtprio,ni,pri,psr,pcpu,stat,comm
 axo stat,euid,ruid,tty,tpgid,sess,pgrp,ppid,pid,pcpu,comm

可以让用户指定显示具体信息

 

[root@Corazon ~]# ps axo pid,time,command | head   PID     TIME COMMAND     1 00:00:01 /sbin/init     2 00:00:00 [kthreadd]     3 00:00:00 [migration/0]     4 00:00:00 [ksoftirqd/0]     5 00:00:00 [stopper/0]     6 00:00:00 [watchdog/0]     7 00:00:00 [migration/1]     8 00:00:00 [stopper/1]     9 00:00:00 [ksoftirqd/1]

 

pgrep, pkill :通过过滤显示和杀死进程的

  pgrep [options] pattern
  pkill [options] pattern
 -u uid: effective user  有效用户ID
     -U uid: real user 实际用户ID
     -t terminal: 与指定终端相关的进程
     -l: 显示进程名
     -a: 显示完整格式的进程名
     -P pid: 显示其父进程为此处指定的进程的进程列表

 

[root@Corazon ~]# pgrep -u root -l | tail944 NetworkManager1423 dhclient1427 sshd2552 master2626 bash2654 sshd2658 bash2773 kworker/0:02795 kworker/0:1

 

pidof:根据进程名获取其进程PID号

pidof PROCESSNAME

 

[root@Corazon ~]# pidof sshd2654 1427[root@Corazon ~]# pidof bash2658 2626

 

 

top命令:性能分析工具,能够实时显示系统中各个进程的资源占用状况,

常用选项:

-d:指定刷新时间间隔,默认3秒刷新一次进程列表

-b:一批次进行显示

-n #:执行显示#次

  

 

 

这五行显示的是系统整体的统计信息

top - 00:24:14 up  3:16,  2 users,  load average: 0.00, 0.01, 0.05Tasks: 339 total,   2 running, 337 sleeping,   0 stopped,   0 zombie%Cpu(s):  0.3 us,  0.3 sy,  0.0 ni, 99.3 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 stKiB Mem :  1003164 total,   693700 free,   136556 used,   172908 buff/cacheKiB Swap:  2097148 total,  2097148 free,        0 used.   702336 avail Mem

 

 

 

top - 00:24:14 up  3:16,  2 users,  load average: 0.00, 0.01, 0.05

# top - 00:24:14 当前时间

# up  3:16 启动系统后运行的时间

# 2 users 当前登录的用户

# load average: 0.00, 0.01, 0.05 平局负载队列,分别是1分钟,5分钟,15分钟

 

Tasks: 339 total,   2 running, 337 sleeping,   0 stopped,   0 zombie

# Tasks: 339 total 当前系统上的任务数量

# 2 running:当前在运行状态数量

# 337 sleeping:当前在睡眠状态数量

# 0 stopped:停止状态数量

# 0 zombie:僵死状态数量

%Cpu(s):  0.3 us,  0.3 sy,  0.0 ni, 99.3 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st

# %Cpu(s):  0.3 us 用户空间占用CPU的百分比

# 0.3 sy:内核空间占用CPU的百分比

#  0.0 ni:用户进程空间内改变过优先级的进程占用CPU百分比

# 99.3 id:CPU空闲百分比

# 0.0 wa:等待输入输出的CPU时间百分比

# 0.0hi:硬件中断的时间占用的CPU百分比

# 0.0si:用来模式切换占用的CPU百分比

# 0.0st:被虚拟化偷走的CPU百分比

 

KiB Mem :  1003164 total,   693700 free,   136556 used,   172908 buff/cache

# KiB Mem :  1003164 total 内存的总大小

# 693700 free: 空间内存的大小

# 136556 used:已经使用的内存大小

# 172908 buff/cache:用于缓冲和缓存的内存大小

 

 

KiB Swap:  2097148 total,  2097148 free,        0 used.   702336 avail Mem

# KiB Swap:  2097148 total 交换分区的总大小

# 2097148 free:空间的交换分区大小

# 702336 avail:可用的交换分区大小

 

PID  USER      PR  NI    VIRT    RES    SHR S %CPU %MEM     TIME+ COMMAND                                                   2654 root      20   0  133128   4864   3684 S  0.3  0.5   0:00.47 sshd

   

 

# PID:进程PID号码

# USER:进程所有者

# PR:进程优先级

# NI:进程Nice值

# VIRT:虚拟内存集

# RES:常驻内存集

# SHR:共享内存空间的大小

# S:进程状态

# %CPU:占用CPU百分比

# %MEM:占用内存百分比

# TIME+:累计运行时长

# COMMADN:进程拥有者发起的命令

 

top里可以设置按照某一项来排序,默认的情况下,是按照CPU的使用情况来排序,也可以设定刷新时间及终止指定进程

M:按内存使用情况排序

P: 根据CPU使用百分比大小进行排序

T: 根据时间/累计时间进行排序

s: 调整刷新时间,默认是5秒

q:退出top命令

 k:终止指定进程

 

htop:互动的进程查看器,一个文本模式的应用程序(在控制台或者X终端中),需要ncurses。

与Linux传统的top相比,htop更加人性化。它可让用户交互式操作,支持颜色主题,可横向或纵向滚动浏览进程列表,并支持鼠标操作。

top相比,htop有以下优点:

· 可以横向或纵向滚动浏览进程列表,以便看到所有的进程和完整的命令行。

· 在启动上,比top 更快。

· 杀进程时不需要输入进程号。

· htop 支持鼠标操作。

· top 已经很老了

 上面左上角显示CPU、内存、交换区的使用情况,右边显示任务、负载、开机时间,下面就是进程实时状况。

 下面是 F1~F10 的功能和对应的字母快捷键

 

获取帮助

鼠标点击Help或者按F1 显示自带帮助

htop设定

鼠标点击一下Setup或按下键盘键F2

从左侧开始第一列的Setup:

表示Left Column和Right Column显示的信息和次数,如果要新增选项 可以选择Available meters进行添加 F5是添加左侧,F6是添加右侧,也可以设定显示信息的输出方式 有LED(LED灯),Bar(进度条)、Text(文本格式)

 

从左侧开始第一列的Display options:

选择要显示的内存,按空格x表示为显示,选择完后之后,需要按F10进行保存

 

为了演示我们增加了以树状格式显示进程 Tree view 这个选项

从左侧开始第一列的Colors:

用来设定界面的显示颜色

从左侧开始第一列的Colums:

作用是增加或取消要显示各项内存

  

搜索进程

鼠标点击一下Search或按下键盘键F3

 

搜索tail进程

 

  过滤器

     鼠标点击一下Filter或按下键盘键F4

    相当于模糊查找,不会区分大小写,例如:

    

树状方式

    鼠标点击一下Tree或按下键盘键F5

    开启/关闭树状显示进程

    

排序方式:

    鼠标点击一下Exapand或按下键盘键F6

    按下后左侧会出现 Sort by 列表进行选择排序规则

    

  调整nice值

    选定某个进程之后直接可以使用,F7 减小nice值(增大优先级)F8增大nice值(减小优先级)

  杀死进程

    选择某个进程之后直接可以使用F9即可杀死

  退出htop

    鼠标点击一下Quit或按下键盘键F10

 

      选项:

    -d #: 指定延迟时间;

    -u UserName: 仅显示指定用户的进程;

    -s COLOMN: 以指定字段进行排序; 

   命令:

    s: 跟踪选定进程的系统调用;

    l: 显示选定进程打开的文件列表;

    a:将选定的进程绑定至某指定CPU核心

        选定sshd这个进程按下s键会显示出进程的系统调用

    

vmstat:报告内核线程、虚拟内存、磁盘、陷阱和 CPU 活动的统计信息。

   

 [root@Corazon ~]# vmstat    procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----          r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st 2  0      0 685360    764 176748    0    0     7     1   32   41  0  1 99  0  0

 

   proc:

     r: 等待运行的进程个数

     b: 处于不可中断睡眠态的个数(被阻塞的队列的长度)

 memory:

    swpd: 交换内存的使用总量

    free: 空间物理内存总量

    buffer: 用于buffer的内存总量

    cache: 用于cache的内存总量

 swap:

   si: 数据进入wap中的数据速率(kb/s)

   si: 数据离开wap中的数据速率(kb/s)

 io:

   bi: 从块设备读入数据到系统的速率(kb/s)

   bo:保存数据至块设备的速率(kb/s)

 system:

   in: interrupts,中断速率(kb/s)

   cs: context switch 进程切换速率(kb/s)

 

 

glances:系统监视和分析性能数据的功能,其中包括:

· CPU 使用率

· 内存使用情况

· 内核统计信息和运行队列信息

· 磁盘 I/O 速度、传输和读/写比率

· 文件系统中的可用空间

· 磁盘适配器

· 网络 I/O 速度、传输和读/写比率

· 页面空间和页面速度

· 消耗资源最多的进程

· 计算机信息和系统资源

常用选项:

          -b:以Byte为单位显示网卡数据速率,默认也是以字节显示

          -d:关闭磁盘I/O模块

          -f /path/to/somefile: 设定输入文件位置

          -o {HTML|CSV}:输出的格式

          -m: 禁用mount模块,

          -n: 禁用网络模块 n

          -t # : 延迟时间间隔

          1: 每个CPU的相关数据单独显示

 

 

 

内键命令快捷键:

        

a – 对进程自动排序

c – 按 CPU 百分比对进程排序

m – 按内存百分比对进程排序

p – 按进程名字母顺序对进程排序

i – 按读写频率(I/O)对进程排序

d – 显示/隐藏磁盘 I/O 统计信息

f – 显示/隐藏文件系统统计信息

n – 显示/隐藏网络接口统计信息

s – 显示/隐藏传感器统计信息

y – 显示/隐藏硬盘温度统计信息

l – 显示/隐藏日志(log)

b – 切换网络 I/O 单位(Bytes/bits)

w – 删除警告日志

x – 删除警告和严重日志

1 – 切换全局 CPU 使用情况和每个 CPU 的使用情况

h – 显示/隐藏这个帮助画面

t – 以组合形式浏览网络 I/O

u – 以累计形式浏览网络 I/O

q – 退出(‘ESC‘ 和 ‘Ctrl&C‘ 也可以)

 

 

C/S模式下运行glances命令:

服务模式:

Glances -s -B IPADDR

IPADDR:监听于服务器端的本机哪个地址

客户端模式:

Glances -c IPADDR

IPADDR:要连接哪个服务器端的地址

 

例如:首先在192.168.99.102上服务商监听本机的这个地址,然后在通过192.168.99.104进行远程测试就看到如下:

        

   

dstat:dstat 是一个用来替换 vmstat, iostat, netstat, nfsstat 和 ifstat 这些命令的工具,是一个全能系统信息统计工具

 

格式: dstat [-afv] [options..] [delay [count]]

常用选项:

          -c: 显示CPU相关信息,默认已经开启

              -C #,# total 显示从哪个CPU到哪个CPU

          -g: 显示page相关统计数据

          -d:显示磁盘读写速率,默认已经开启

              -D total,sda,sdb...

          -m:显示memory相关统计数据

          -n:显示network相关的统计数据

          -p:显示process相关统计数据

          -r: 显示I/O请求相关的统计数据

          -s: 显示交互内存的相关统计数据

          --tcp:显示tcp协议

          --udp:显示udp协议

          --socket:显示socket相关数据

          -ipc:进程间通信相关统计数据          

          --top-cpu:显示最占用cpu的进程

          --top-io:显示最占用io的进程

          --top-mem:显示最占用内存的进程

          --top-latency:显示延迟最大的进程

    

        

total-cpu-usage:CPU使用状态

     usr:用户空间使用状态

     sys:内核空间使用状态

     idl:空闲空间状态

     wai:等待I/O操作状态

     hiq:硬中断状态

     siq:软中断状态

 

dsk/total:磁盘状态

     read:读速率

     writ:写速率

 

net/total:网络状态

     recv:收速率

     send:发速率

paging:页面状态

     in:页面换进速率

     out:页面换出速率

 

system:系统状态

     int:中断速率

 

 

只显示磁盘sda和CPU0,1的相关信息

Dstat的选项的整体演示测试结果

    

完。

 

今天Linux系统管理管理分享完毕,感谢大家,谢谢!