绑定完请刷新页面
取消
刷新

分享好友

×
取消 复制
故障定位-操作系统故障定位手段
2020-01-08 15:18:34

登录操作系统后,如果执行操作时响应缓慢,需检查系统运行情况后,进行进一步处理。执行的操作包括但不限于收集系统信息,确定系统版本、硬件、参数设置及登录用户情况。

系统资源不足(如CPU或I/O资源过载)引起的机器不响应外部连接。建议重试几次。若5分钟内仍不能操作这台机器,需管理员到现场进行检查处理。

图1 操作系统故障图
GaussDB 操作系统故障图

登录成功系统反应慢,需收集以下系统信息:

  • 当前在线用户。
    --查看当前在线用户
    who
  • CPU使用状况。

    确定是否因为某个进程导致CPU使用率过高。

    top -H
  • I/O使用状况。
    iostat -x 1 3
    Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
    xvda .01 1.10 .07 1.01 .83 10.25 20.40 .03 24.88 4.04 26.36 1.38 .15
    xvde .00 .39 .13 1.62 3.47 33.83 42.78 .03 18.01 4.94 19.05 1.21 .21
    dm- .00 .00 .13 2.01 3.47 33.83 34.94 .03 15.71 4.95 16.40 .99 .21
    • rrqm/s:每秒进行merge的读操作数目。即delta(rmerge)/s
    • wrqm/s:每秒进行merge的写操作数目。即delta(wmerge)/s
    • r/s:每秒完成的读I/O设备次数。即delta(rio)/s
    • w/s:每秒完成的写I/O设备次数。即delta(wio)/s
    • rKB/s:每秒读K字节数。是rsec/s的一半,因为每扇区大小为512字节
    • wKB/s:每秒写K字节数。是wsec/s的一半
    • avgrq-sz:平均每次设备I/O操作的数据大小(扇区)。即delta(rsect+wsect)/delta(rio+wio)
    • avgqu-sz:平均I/O队列长度。即delta(aveq)/s/1000(因为aveq的单位为毫秒)
    • await:平均每次设备I/O操作的等待时间(毫秒)。即delta(ruse+wuse)/delta(rio+wio)
    • svctm:平均每次设备I/O操作的服务时间(毫秒)。即delta(use)/delta(rio+wio)
    • %util:一秒中有百分之多少的时间用于I/O操作,或者说一秒中有多少时间I/O队列是非空的。即delta(usr)/s/1000(因为usr的单位为毫秒)
  • 内存使用状况。
    结合“top”命令获得哪些进程消耗内存较多,处于超出预期的状态。
    vmstat 1 3
  • 操作系统情况。
    • 以root用户查看操作系统日志信息(/var/log/messages)或dmesg信息,检查是否操作系统发生过异常错误。
    • 以root用户执行“sysctl -a”命令和“cat /etc/sysctl.conf”命令获得系统参数信息。
    • 执行“uname -a”查询系统内核信息。
    • 执行如下命令检查系统的版本。
      • “cat /etc/SuSE-release”检查SUSE系统版本。
      • “cat /etc/redhat-release”检查Red Hat系统版本。
      • “cat /etc/euleros-release”检查欧拉系统版本。
    • “cat /proc/cpuinfo”和“cat /proc/meminfo”获得CPU和内存信息。
分享好友

分享这个小栈给你的朋友们,一起进步吧。

GaussDB_数据库
创建时间:2020-01-06 16:21:44
华为GaussDB数据库小栈
展开
订阅须知

• 所有用户可根据关注领域订阅专区或所有专区

• 付费订阅:虚拟交易,一经交易不退款;若特殊情况,可3日内客服咨询

• 专区发布评论属默认订阅所评论专区(除付费小栈外)

技术专家

查看更多
  • GaussDB_数据库
    专家
戳我,来吐槽~