菜鸟笔记
提升您的技术认知

Linux性能优化实战CPU的使用率

阅读 : 1868

一、什么是CPU的使用率

1、你最常用什么指标来描述系统的CPU性能?

我想你的答案,可能不是平均负载,也不是CPU上下文切换,而是另一个更直观的指标CPU使用率

CPU使用率到底是怎么算出来的吗?

1、如何设置节拍率

[root@luoahong ~]# grep 'CONFIG_HZ=' /boot/config-$(uname -r)
CONFIG_HZ=1000

2、内核提供的用户节拍率是多少?

USER_HZ=100

为了方便用户控件程序,内核还提供了一个用户控件的节拍率,它总是固定为100,也就是1/100秒,这样,用户控件程序并需要关系内核中HZ被设置成了多少

4、如何查看用户控件系统内部状态信息

[root@luoahong ~]#  cat /proc/stat | grep ^cpu
cpu  62143 14 10857 931923 669 0 3498 0 0 0
cpu0 31506 4 5649 467020 228 0 628 0 0 0
cpu1 30637 10 5207 464903 441 0 2870 0 0 0
[root@luoahong ~]#

这里的输出结果是一个表格,其中,第一列表示的是CPU编号,如CPU0、CPU1,而第一行没有编号的CPU
表示的是所有CPU的累加

二、CPU使用率公式

我们通常所说的 CPU使用率,就是除了空闲时间外的其他时间占总CPU时间的百分比,用公式来表示就是

 

1、直接用/proc/stat 的数据,算的是什么时间段的 CPU使用率吗?

看到这里,你应该想起来了,这是开机以来的节拍数累加值,所以直接算出来的,是开机以来的平均CPU使用率,一般没啥参考价值

2、性能工具是如何计算CPU使用率的

事实上,为了计算机CPU使用率,性能能工具一般都会间隔一段时间(比如 3 秒)的两次值,做差后,再计算出这段时间的平均CPU使用率 
各种性能工具所看到的CPU使用率的实际计算方法如下

 

性能分析工具给出的都是间隔一段时间的平均CPU使用率,所以要注意间隔时间的设置,特别是用多个工具对比分析时,

你一定要保证他们用的是相同的间隔时间

三、怎么查看CPU使用率

1、top显示系统总体CPU使用情况

top显示了系统总体的CPU和内存使用情况,以及各个进程的资源使用情况

# 默认每 3 秒刷新一次
$ top
top - 11:00:25 up  1:35,  2 users,  load average: 0.00, 0.01, 0.18
Tasks: 131 total,   1 running, 130 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.0 us,  0.2 sy,  0.0 ni, 99.7 id,  0.0 wa,  0.0 hi,  0.2 si,  0.0 st
KiB Mem :  8056848 total,  5665852 free,   688220 used,  1702776 buff/cache
KiB Swap:  2097148 total,  2097148 free,        0 used.  6945016 avail Mem

   PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
 10150 polkitd   20   0 1267680 201924   9372 S   1.0  2.5   0:39.33 mysqld
  9906 mysql     20   0 1119708 184904   5824 S   0.7  2.3   0:32.89 mysqld
  8041 root      20   0  300896   6384   4956 S   0.3  0.1   0:28.40 vmtoolsd

...

2、top图解

 

3、 pidstat分析每个进程CPU使用情况

top并没有细分进程的用户态CPU和内核态CPU,那要怎么查看每个进程的详细情况呢?

# 默认每 3 秒刷新一次
$ top
top - 11:00:25 up  1:35,  2 users,  load average: 0.00, 0.01, 0.18
Tasks: 131 total,   1 running, 130 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.0 us,  0.2 sy,  0.0 ni, 99.7 id,  0.0 wa,  0.0 hi,  0.2 si,  0.0 st
KiB Mem :  8056848 total,  5665852 free,   688220 used,  1702776 buff/cache
KiB Swap:  2097148 total,  2097148 free,        0 used.  6945016 avail Mem

   PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
 10150 polkitd   20   0 1267680 201924   9372 S   1.0  2.5   0:39.33 mysqld
  9906 mysql     20   0 1119708 184904   5824 S   0.7  2.3   0:32.89 mysqld
  8041 root      20   0  300896   6384   4956 S   0.3  0.1   0:28.40 vmtoolsd

...
Average:      999     10150    0.20    0.40    0.00    0.00    0.60     -  mysqld
Average:        0     11747    0.40    1.59    0.00    0.00    1.98     -  pidstat

4、pidstat命令图解

最后的Average部分,还计算了5组数据的平均值

四、CPU使用率过高怎么办?

1、分析思路

1、如何轻松找到CPU使用率过高的进程

通过top、ps 、pidstat等工具

2、占用CPU高的到底是代码里的那个函数?

perf和GDB

3、那么哪种工具适合在第一时间分析进程的 CPU 问题呢?

perf是Linux 2.6.31 以后内置的性能分析工具,它以性能事件采样为基础,不仅可以分析系统的各种事件和内核性能,还可以用来分析制定应用程序的性能问题

2、实时显示占用CPU时钟最多的函数

实时显示占用CPU时钟最多的函数或者指令,因此可以用来查找热点函数

[root@luoahong ~]# perf top

Samples: 724 of event 'cpu-clock', Event count (approx.): 125711088
Overhead Shared Object Symbol
45.11% [kernel] [k] generic_exec_single
...

采样数需要我们特别注意,如果采样数过少(比如只有十几个),那下面的排序和百分比就没什么实际参考价值了

3、perf命令详解

 

虽然实时展示了系统的性能信息,但它的缺点并不能保存数据,也就无法离线或者后续的分析,而perf record

则提供了保存数据的功能,保存后的数据,需要你用perf report解析展示

4、离线和后续分析占用CPU时钟最多的函数

perf record # 按 Ctrl+C 终止采样

[root@luoahong ~]# perf report

Samples: 5K of event 'cpu-clock', Event count (approx.): 1332500000
Overhead Command Shared Object Symbol
97.15% swapper [kernel.kallsyms] [k] native_safe_halt
0.49% swapper [kernel.kallsyms] [k] _raw_spin_unlock_irqrestore
0.36% vmtoolsd libvmtools.so.0.0.0 [.] Backdoor_InOut
0.34% swapper [kernel.kallsyms] [k] __do_softirq
0.17% swapper [kernel.kallsyms] [k] tick_nohz_idle_exit
0.13% swapper [kernel.kallsyms] [k] tick_nohz_idle_enter
0.13% vmtoolsd [kernel.kallsyms] [k] _raw_spin_unlock_irqrestore
0.11% kworker/0:1 [kernel.kallsyms] [k] _raw_spin_unlock_irqrestore
0.11% vmtoolsd libvmtools.so.0.0.0 [.] BackdoorHbOut
0.08% dockerd [kernel.kallsyms] [k] _raw_spin_unlock_irqrestore
0.08% vmtoolsd [kernel.kallsyms] [k] __do_softirq
0.06% kworker/1:2 [kernel.kallsyms] [k] queue_delayed_work_on
0.06% vmtoolsd [kernel.kallsyms] [k] format_decode
0.04% irqbalance [kernel.kallsyms] [k] cap_mmap_file
0.04% kworker/0:0 [kernel.kallsyms] [k] ata_sff_pio_task
0.04% kworker/1:2 [kernel.kallsyms] [k] _raw_spin_unlock_irqrestore
0.04% mysqld mysqld [.] fts_optimize_words
0.04% swapper [kernel.kallsyms] [k] rcu_idle_exit
0.04% vmtoolsd libvmtools.so.0.0.0 [.] BackdoorHbIn
0.02% dockerd [kernel.kallsyms] [k] __do_softirq
0.02% in:imjournal rsyslogd [.] 0x0000000000016f90
0.02% irqbalance [kernel.kallsyms] [k] __fsnotify_parent
0.02% irqbalance [kernel.kallsyms] [k] _raw_spin_unlock_irqrestore
0.02% irqbalance [kernel.kallsyms] [k] copy_user_generic_unrolled
0.02% irqbalance [kernel.kallsyms] [k] native_flush_tlb_single
0.02% irqbalance [kernel.kallsyms] [k] unmap_page_range
Tip: For tracepoint events, try: perf report -s trace_fields

在实际使用中,我们还经常为perf top和perf record加上-g参数,开启调用关系的采样,方便我们根据调用链分析西能问题