检查NTPD服务
Check the time consistency status
检查是否安装并开启ntpq服务,并与ntp时钟源同步。
检查系统NTPD服务,如果服务开启且各节点时间误差在1分钟以内则检查项通过,否则检查项不通过。
os
user
all
custom
检查CPU占用率
Check CPU Idle and I/O wait
StandardCPUIdle=30;
StandardWIO=30
如果idle不足 CPU负载过高,请扩容节点,如果iowait过高,则磁盘为瓶颈,扩容磁盘
检查主机CPU占用率,如果idle 大于30%,或者 iowait 小于 30%.则检查项通过,否则检查项不通过
os
user
all
default
检查时区一致性
Check the usage of time zone
用正确的时区文件覆盖时区文件 cp /usr/share/zoneinfo/Asia/XXX /etc/localtime 再通过hwclock命令写入BIOS
检查集群内各节点时区,如果时区一致则检查通过,否则检查项不通过
os
user
all
consistent
检查编码格式
Check the unicode status
在异常节点修改/etc/profile文件,添加或修改LANG=XXX信息与其他节点相同。
通过locale | grep '^LANG='获取节点的系统编码,判断是否一致,如果编码一致则检查项通过,否则检查项不通过。
os
user
all
consistent
检查防火墙状态
Check the firewall state
关闭防火墙服务。
检查主机防火墙状态,如果防火墙关闭则检查项通过,否则检查项不通过。
os
root
all
default
检查内核版本
Check the kernel version status
确认异常节点的内核版本是否和其他节点存在差异,如果存在差异则可根据资料说明进行节点替换或温备操作(gs_replace)
检查各节点系统内核版本信息,如果版本信息一致则检查项通过,否则报warning。
os
user
all
consistent
检查句柄最大设置
Check the Open Files
设置/etc/security/limits.d/90-nofile.conf文件中的soft nofile和hard nofile参数,然后重启会话。
检查操作系统最大句柄值,如果该值大于等于1000000则检查项通过,否则检查项不通过。
os
user
root
all
default
检查系统参数
Check the system control parameters status
version=V1R7C00
编辑/etc/sysctl.conf写入正确的参数配置,通过sysctl -p生效。
检查各节点操作系统参数,判断是否等于预期值。所有参数符合预期值则检查项通过,否则检查项不通过并打印不满足预期项
os
user
root
all
default
检查操作系统版本
Check the OS version status
确认异常节点的操作系统版本是否和主节点在同一混搭列表内,如果不在同一列表内需要按照资料说明,进行节点替换或温备操作(gs_replace)
检查集群内各个节点的操作系统版本信息,如果满足版本兼容列表且全集群在同一混搭列表中则检查通过,否则检查不通过
os
user
all
custom
检查THP服务
Check the THP service status
如果THP文件存在,echo never > THPFile 并将关闭指定写入自启动文件sed -i '/^.*transparent_hugepage.*enabled.*echo
never.*$/d' initFile echo "echo never > THPFile" >> initFile
检查系统THP服务,如果服务未开启则检查项通过,否则检查项不通过。
os
user
root
all
default
检查sshd服务是否已启动
Check sshd service status
如果检查发现某项关键服务未启动,请先启动
检查系统是否存在sshd服务,若存在则检查项通过,否则检查项不通过
os
root
all
default
检查crontab服务是否已启动
Check Crond service status
如果检查发现某项关键服务未启动,请先启动
检查系统是否存在crontab服务,若存在则检查项通过,否则检查项不通过
os
root
all
default
检查crontab是否有残留Gauss相关信息
Check crontab
crontabUser=omm
如果存在,删除此定时任务
检查crontab是否残留Gauss相关信息,若无该信息则检查项通过,否则检查项不通过
os
user
all
default
检查文件目录是否有残留(/srv/BigData/ ,/opt/huawei/Bigdata/ ,/var/log/Bigdata/, /home/omm)
Check directory
directoryList=/opt/huawei/Bigdata/,/var/log/Bigdata/,/home/omm/
删除存在的目录
检查扩容新节点上是否存在(/srv/BigData/ ,/opt/huawei/Bigdata/ ,/var/log/Bigdata/, /home/omm)目录,若不存在则检查项通过,否则检查项不通过
os
user
all
default
检查进程是否有残留(检查gauss进程,omm用户进程是否残留)
Check process
检查残留的具体进程,确认后kill掉这些进程
检查扩容新节点上是否残留gaussdb和omm进程,若未残留则检查项通过,否则检查项不通过
os
user
all
default
检查栈深度
Check stack depth
设置栈大小为3072
检查各个节点栈深度是否一致,若不一致报warning,若大于等于3072则检查项通过,否则不通过
os
user
root
all
consistent
关键进程oom_adj检查
Check oom_adj value of key processes
修改关键进程omm_adj值为0
检查所有关键进程,如果所有关键进程omm_adj值为0,则通过,否则不通过
os
user
all
default
检查omm用户是否已删除
Check omm user
如果存在,删除用户(useradd -rf omm)
检查扩容新节点上是否存在omm用户,若不存在omm用户则检查项通过,否则检查项不通过s
os
root
all
default
检查DN,CN端口是否占用
Check port conflict
cooPort=0;
dataPortBase1=0;
dataPortBase2=0;
dataPortStandby1=0;
dataPortStandby2=0;
dataPortDummyStandby1=0;
dataPortDummyStandby2=0;
cmServerPortBase_mpp=0;
cmServerPortStandby_mpp=0;
gtmPortBase_mpp=0;
gtmPortStandby_mpp=0;
cooPortBase_mpp=0;
dataPortBase_mpp=0;
dataPortStandby_mpp=0;
dataPortDummyStandby_mpp=0
如果发现端口占用,确认占用进程,释放端口
检查CN端口,DN端口是否已被占用,若未占用则检查项通过,否则检查项不通过
os
root
all
default
检查ip_local_port_range设置范围
Check ip_local_port_range
修改参数范围为26000 65535
检查ip_local_port_range系统参数范围,若范围在26000 65535则检查项通过,否则检查项不通过
os
user
root
all
default
检查/etc/hosts中是否有重复地址以及localhost配置
/etc/hosts没有配置localhost检查项不通过,存在带有#Gauss200注释的映射报abnormal,相同IP不同hostname报abnormal
os
user
all
default
检查CPU核数
Check CPU count
检查CPU
CPU核心与可用CPU不符检查项不通过,相符但存在不可用信息Warning。 所有节点CPU信息不相同则检查项不通过。
os
user
all
consistent
检查超线程是否打开
Check Hyper Threading
检查超线程
检查超线程,若打开则检查项通过,否则检查项不通过
os
user
all
default
检查内存总大小
Check total memory
需要保证节点上总内存大小一致
检查各节点总内存,若内存大小一致则检查项通过,否则报warning
os
user
all
consistent
检查sshd服务配置是否正确
Check sshd config
PasswordAuthentication=yes;
MaxStartups=1000;
UseDNS=no;
ClientAliveInterval=10800
修改sshd配置
检查/etc/ssh/sshd_config文件,判断参数配置是否符合预期,若符合则检查项通过,否则检查项不通过
os
root
all
default
检查max_process_memory参数设置是否合理
Check max_process_memory setting
Threshold_NG=1048576
使用gs_guc重设max_process_memory的值
检查cn和主备dn max_process_memory值,判断参数配置是否符合预期,若符合则检查项通过,否则检查项不通过
os
root
all
default
检查是否有人为添加启动项
检查启动项
如果有人为添加特定启动项则检查不通过,否则检查通过
os
root
all
default
文件句柄检测
Threshold_Warning=800000
检查负载均衡信息
检查每个gaussdb进程打开的进程数是否超过80万,超过则检查不通过,是否有slave进程使用的句柄说超过master进程,有则检查不通过
os
root
all
default
DropCache进程检测
检查dropCache进程
检查各节点是否有dropcache进程在运行,若是则检查通过,否则检查不通过
os
root
all
default
检查内存使用是否超标
Check whether memroy usage exceed threshold or not
percent_total=0.8;
percent_max=0.9
若整体内存使用率超标,检查占用内存高的进程,清理内存空间,若gaussdb进程内存使用超标,需要分析当前高负载业务
If the overall memory usage exceeds the standard, check the processes with high memory usage and clean up the memory space. If the memory usage of gaussdb process exceeds the standard, it is necessary to analyze the current high-load business.
检查节点整体内存使用率是否超过percent_total,若超过则告警,否则继续检查各个gaussdb进程是否超过max_process_memroy的percent_max
check whether any node's memory usgae exceeded threshold,or any guassdb process's memory usage exceeded threshold
内存资源不足
No sufficent Meory
os
user
all
default
检查交换内存是否小于总内存
Check the SwapMemory
减少交换内存的大小
检查交换内存和总内存大小,若检查结果为0则检查项通过,否则检查项报Warning 大于总内存时检查项不通过
device
user
root
all
default
检查磁盘逻辑块
Check the LogicalBlock
修改磁盘逻辑块大小为512
检查磁盘逻辑块大小,若为512则检查项通过,否则检查项不通过
device
user
root
all
default
检查IO请求
Check the IO request
检查IO值,如果该值为32768则检查项通过,否则报warning
device
root
root
all
default
检查最大异步请求
Check Max Asy IO requests
检查当前异步IO值,若其大于(dn+cn)*1048576和104857600则检查项通过,否则检查项不通过
device
user
root
all
default
检查IO配置
Check IO Configure
检查IO配置,如果是deadline则检查项通过,否则检查项不通过
device
root
all
default
检查磁盘预读块
Check the pre-read block size status
BlockSize=16384
设置/sbin/blockdev --setra 16384 devname预读块大小为16384,并 echo "/sbin/blockdev --setra expecte devname" >>
initFile写入自启动文件
检查磁盘预读块大小,如果预读块大小为16384则检查项通过,否则检查项不通过
device
root
all
default
检查磁盘格式参数
Check the disk configuration status
设置/etc/fdisk文件,将xfs格式的磁盘配置为'rw,noatime,inode64,allocsize=16m',并重新mount。
检查磁盘格式信息,如果格式为ext3/ext4/xfs中的一种且xfs的配置为'rw,noatime,inode64,allocsize=16m'则检查项通过,否则报warning
device
user
all
default
检查磁盘inodes使用率
Check the usage of disk inodes
Threshold_NG=80;
Threshold_Warning=60
清理磁盘对应中的空间或更换更大的磁盘。
通过df -i检查磁盘指定目录(目录列表)inodes使用率,如果使用率超过warning阈值(默认值为60%)则报warning,超过NG阈值(默认值为80%)则报NG,inode总数少于5亿则报NG
device
user
all
default
检查磁盘使用率
Check the usage of disk
Threshold_NG=90;
Threshold_Warning=70;
DiskVailPGHOST=5;
DiskVailGPHOME=5;
DiskVailGAUSSHOME=5;
DiskVailGAUSSLOG=20;
DiskVailOS_TMP=5;
DiskVailDATA=20
清理磁盘对应中的空间或更换更大的磁盘。
"如果使用率超过warning阈值(默认为70%) 报warning,超过NG阈值(默认为90%)则检查项不通过 。集群路径下检查GAUSSHOME/PGHOST/GPHOME/GAUSSLOG/tmp/data路径的剩余空间,不满足阈值则检查项不通过"
device
user
all
default
检查磁盘空间大小一致性
Check the disk configuration consistent
检查磁盘名大小挂载点一致,不满足报warning
device
user
all
consistent
检查CheckXid数值
Check the value of CheckXid
暂无安全处理方案
如果xid的值大于10亿,抛出Warning。如果xid的值大于18亿,抛出Abnormal。
database
user
cn
default
检查每个实例的系统表容量
Check the size of system table in every instances
清理硬盘至容量足够
如果容量不足,抛出Abnormal。
database
user
all
default
检查表级别数据倾斜
知会客户手工修复
检查是否存在表级别数据倾斜,若存在则检查不通过
database
user
cn
default
检查未做analyze的表
对没有做analyze的表执行analyze。
若数据库中存在未做过analyze的表,则检查不通过
database
user
cn
default
检查DN级别的数据分布倾斜
知会客户手工修复
若dn数据分布倾斜,则报NG,否则报OK
database
user
all
custom
检查磁盘是否存在故障
通知客户手工修复
对集群中所有数据库所有表做全量查询,如果出现故障则报NG,全部查询成功报OK
database
user
cn
default
检查慢盘
Check the slow node
max=200;
high=100
更换磁盘
Replace the disk.
如果不存在磁盘的IO平均服务时间低于普遍水平则检查项通过,否则检查项不通过
If the IO average service time of the disk does not exist below the general level, the check item passes, Otherwise, the item fails the check.
数据库性能下降
Database performance degradation.
device
user
all
default
检查集群状态
Check the cluster status
查询cm_agent进程并检查集群状态
检查fenced UDF状态,如果为down则报warning;检查集群状态,如果为Normal则检查项通过,否则检查项不通过
cluster
user
local
default
检查数据库集群参数
Check database parameters
使用GUC工具配置CN、DN的参数。
"检查CN检查共享缓冲区大小和Sem参数主DN实例检查共享缓冲区大小和最大连接数共享缓冲区需要大于128kB且大于shmmax且大于shmall*PAGESIZE若存在CN,则Sem值需大于(DN最大连接数+150)/16向上取整以上项完全满足则检查项通过,否则检查项不通过"
cluster
user
cn
default
检查日志级别
Check debug switch
使用guc工具将log_min_messages设为指定值。
在各节点检查各实例的配置文件中log_min_messages参数的值,为空则认为是Warning,判断日志级别是 waring,不是则报warning
cluster
user
all
default
检查升级版本是否一致
Check the consistence of upgrade version
重新进行发包,保证各节点安装包版本一致。
检查集群各个节点上升级包的版本,如果一致则检查项通过,否则检查项不通过
cluster
user
all
consistent
检查目录权限
Check the primitive of key folders
将对应的目录权限进行修改。
检查节点目录(实例xlog路径、GAUSSHOME、GPHOME、PGHOST、GAUSSLOG)权限,如果目录有写入权限且不大于750则检查项通过,否则检查项不通过
cluster
user
root
all
default
检查环境变量
Check environment profile
在用户环境变量文件或/etc/profile中添加统一的$GAUSSHOME,并通过export $GAUSSHOME:$PATH 的方式分别添加到$LD_LIBRARY_PATH、$PATH中
检查节点环境变量($GAUSSHOME、$LD_LIBRARY_PATH、$PATH),如果环境变量存在并配置正确则检查项通过,否则检查项不通过
cluster
user
all
consistent
检查gaussdb版本
Check the gaussdb version
重新进行发包,保证各节点新gaussdb文件版本一致
"检查各个节点gaussdb版本是否一致,如果版本一致则检查项通过,否则检查项不通过
通过source env,gsql -V | awk '{print $4""_""$6}'获取新的gaussdb版本信息,判断各节点是否一致
判断两种方式获得的版本信息是否一致"
cluster
user
all
consistent
检查端口范围
Check the port range
ip_local_port_range=26000 65535
通过gs_om -t changeip 更改集群使用的端口号到合法的范围内。
若ip_local_port_range的范围在阈值范围内(默认是26000 65535),并且实例端口不在ip_local_port_range范围内则检查项通过,否则检查项不通过
cluster
user
all
default
检查只读模式
Check the readonly mode
确认磁盘空间足够,未执行其他管理操作后,使用GUC工具关闭只读模式。
检查集群中所有含CN节点上default_transaction_read_only值若为为off则检查通过,否则不通过
cluster
user
cn
default
检查Catchup(gaussdb进程堆栈应搜索不到CatchupMain函数)
Check catchup function
gaussdb进程堆栈搜索到CatchupMain函数,MPPDB重启后需要重新检查
检查gaussdb进程堆栈是否能搜索到CatchupMain函数,若搜索不到则检查项通过,否则检查项不通过
cluster
user
all
default
检查进程状态
Check the Process Status
如果存在属主不是omm的进程,则停止集群,kill掉所有残留进程,然后重启集群,再次检查进程的属主是否正确。
检查其他用户的进程中是否存在gaussdb等MPPDB进程,若无则检查项通过,否则检查项不通过
cluster
user
all
default
特殊文件检查
Check Special File
人工排除
检查tmp目录(PGHOST)、OM目录(GPHOME)、日志目录(GAUSSLOG)、data目录、程序目录(GAUSSHOME)下文件是否存在特殊字符以及非omm用户的文件,若不存在则检查项通过,否则检查项不通过
cluster
user
all
default
检查集群的信息收集
Check the information of the log collection
确认信息收集是否成功
在output目录下查看信息收集是否成功,若收集成功则检查项通过,否则检查项不通过
If the collection is successful, the check item passes, otherwise the check item does not pass.
cluster
user
cn
default
检查gaussdb数据一致性
Check the gaussdb sha256
从统一节点分发gaussdb文件
检查各个节点gaussdb的sha256值,若各节点一致则检查项通过,否则检查项不通过。
cluster
user
all
consistent
检查数据目录大文件
Check the datadir large file
size=4G
删除大文件
检查各个DN实例目录是否存在过大的文件,存在则检查项不通过,否则检查项通过。
If there is a large file in the DN instance directory, the check item does not pass. Otherwise, the check item passes.
cluster
user
all
default
系统表膨胀检查
Check Dilate System Table
Threshold_NG=100;
Threshold_Warning=50
检查系统表是否膨胀,若膨胀则不通过,否则检查通过
cluster
user
cn
default
关键进程启动时间检测
check start time of key process
检查关键进程启动时间是否间隔超过一分钟,超过则检查不通过,否则检查通过
cluster
user
all
custom
检测环境变量分离文件改动
check if there is any change on mpprc file
检查是否存在对环境变量分离文件的改动,若存在则检查不通过,否则检查通过
cluster
user
all
default
检查锁数量
Check the lock count
检查数据库锁数量,查询成功则检查项通过,否则检查项不通过
database
user
cn
default
检查归档参数
检查数据库归档参数,如果未打开或打开且在CN下则检查项通过,打开且不在CN目录下则检查项不通过
database
user
cn
default
检查当前连接数
Check the current connection count
断开不使用的连接
检查数据库连接数,如果连接数小于最大连接数的90%则检查项通过,否则检查项不通过
database
user
cn
default
检查当前游标数
Check cursor num
清理不使用的游标
检查数据库的游标数,查询成功则检查项通过,否则检查项不通过
database
user
cn
default
检查comm_max_datanode参数值范围小于DN个数
Check the parameter value of comm_max_datanode
nodeCount=90;
dnCount=5
使用guc工具将comm_max_datanode调整为更大的值(2的指数)
检查最大DN数,若最大DN数小于xml配置的节点数*DN数(默认值为90*5)报warning,否则检查项通过
database
user
cn
default
检查残留两阶段事务
Check the value of pg_prepared_xacts
检查pg_prepared_xacts参数,如果不存在二阶段事物则检查项通过,否则检查项不通过
database
user
cn
default
pgxc_group表中in_redistribution为Y的个数是否为0
Check the value of pgxc_group
version=V1R7C00
检查pgxc_group表中in_redistribution为Y的个数,如果数量为0则检查项通过,否则检查项不通过
database
user
cn
default
集群是否被锁
Check the cluster lock status
确认集群未进行其他操作后,kill掉存在的锁集群进程。
检查集群是否被锁,若集群未锁则检查通过,否则检查项不通过
database
user
cn
default
检查空闲会话
Check idle session status
kill掉存在的空会话进程。
检查空闲会话数,如果没有空闲会话则检查项通过,否则检查项不通过
database
user
cn
default
检查数据库连接
Check the database connection
检查集群状态及实例状态。
检查能否连接数据库,如果连接成功则检查项通过,否则检查项不通过
database
user
all
default
GUC参数检查
Check the GUC value
修改GUC参数
检查(max_connections + max_prepared_transactions) *
max_locks_per_transaction的值,若该值大于等于1000000则检查项通过,否则检查项不通过。
database
user
cn
default
检查PMK异常数据
Check pmk exception data
连接数据库修复异常数据
检查数据库PMK schema是否包含有异常数据,如果不存在异常数据则检查项通过,否则检查项不通过
database
user
cn
default
检查系统表
database=postgres
检查系统表,查询成功则检查项通过,否则检查项不通过。
database
user
all
default
检查表空间
表空间路径和集群路径之间不能存在嵌套且表空间路径相互不能存在嵌套,则检查项通过,否则检查项不通过
database
user
cn
default
检查sysadmin用户
Check sysadmin user
检查除集群属主外是否存在sysadmin用户,若存在则不通过,否则检查通过
Check whether there is a sysadmin user other than cluster user. If it exists, it does not pass. Otherwise, the check is passed.
database
user
cn
default
检查guc参数一致性
Check guc parameter consistency
version=V1R7C00
检查各CN/DN实例的guc参数是否一致,若全部一致则检查通过,否则检查不通过
Check whether the guc parameters of each CN/DN instance are consistent. If all parameters are the same, the check is passed. Otherwise, the check fails.
database
user
all
custom
检查Default表达式中包含nextval(sequence)
1、重建replicate table, 开始的时候就创建好所有列
2、退出session即可, 避免使用temp sequence
若Default表达式中包含nextval(sequence)则不通过
database
user
cn
default
检查是否执行过alter table drop column
1、创建新表 create table new(like old including all);
2、如原表有索引,需要禁用新表索引alter index idx_name UNUSABLE;
3、导入数据 insert into new select * from old;
4、恢复新表索引ALTER INDEX idx_name REBUILD;
5、删除老表 drop table old;
6、重命名新表 alter table new rename to old;
若执行过alter table drop column操作未消除影响则检查不通过
database
user
cn
default
检查是否存在TD模式数据库下的orc表,且包含date类型的列
删除表或改为其他类型
若存在TD模式数据库下的orc表,且包含date类型的列则检查不通过
database
user
cn
default
检查是否存在hash index
删除hash index
若存在hash index则检查不通过
database
user
cn
default
检查用户自定义函数是否包含非法返回值
Check if the user-defined function contains an illegal return value
用户自定义函数包含非法返回类型,检查不通过,否则检查通过
database
user
cn
default
检查是否存在非SQL_ASCII字符的node group名称
Check if there is a node group name with non-SQL_ASCII characters
存在非SQL_ASCII字符的node group名称,检查不通过,否则检查通过
database
user
cn
default
检查视图中,子查询是否存在隐式的重命名字段
Check if there is an implicit rename field in the subquery in the view
存在重命名字段,检查不通过,否则检查通过
database
user
cn
default
检查数据库中是否存在重分布残留的临时表pgxc_redistb
Check if there is a redistributed residual temporary table pgxc_redistb in the database
不存在则检查通过,否则检查不通过
database
user
cn
default
检查网络通畅
Check network ping
检查异常IP节点网络状况。
检查集群内所有节点的互通性,如果各节点所有IP均可ping通则检查项通过,否则检查项不通过
network
user
all
default
检查网卡RXTX值
Check the network RXTX value
到异常节点执行ethtool eth* RX/TX 4096 将指定网卡RX/TX设置为4096。
检查节点backIP对应的网卡的网卡速率,若不是万兆网卡报 warning,检查此节点backIp的RX/TX值,如果该值为4096则检查项通过,否则检查项不通过
network
root
all
default
检查网卡MTU值
Check the network care MTU
expectMTU1=8192;
expectMTU2=1500
到异常节点执行ifconfig eth* mtu 8192 将指定网卡MTU值设置为8192。
检查节点backIP对应的网卡MTU值( bond后的物理网卡要确保一致),如果该值不是8192或1500 报warning 若集群MTU值一致则检查项通过,否则检查项不通过
network
root
all
consistent
检查网络掉包率
Check network care Drop
检查各IP1分钟内网络掉包率,如果不超过1%则检查项通过,否则检查项不通过。
network
user
all
default
检查网卡绑定模式
Check the network care bond mode
到异常节点将指定网卡bond模式设置为与其他节点相同。
检查是否有配置BONDING_OPTS或BONDING_MODULE_OPTS,若没有配置则报NG。检查各节点bond模式是否一致,如果同时满足则检查项通过,否则检查项不通过
network
root
all
consistent
检查网卡多队列
Check the network care multi-queue
开启网卡多队列
检查cat /proc/interrupts,判断是否开启网卡多队列且绑定不同CPU,如果满足则检查项通过,否则检查项不通过
network
root
all
default
检查随机端口使用数量
Check port used number
增大net.ipv4.ip_local_port_range或降低并发
检查net.ipv4.ip_local_port_range,范围大于等于OS默认值通过;检查TCP协议随机端口数,小于总随机端口数的80%通过
network
user
all
default
网络带宽测试
Check net speed
检查网络组网环境
使用speed_test跑满网络带宽,带宽大于600MB通过;网络满载时,检查网络ping值,小于1秒通过;网络满载时,检查网卡丢包率,小于1%通过
network
user
all
default
网卡型号检查
Check NIC model
使用相同型号及驱动版本的网卡
检查各节点网卡的型号及驱动版本,各节点一致时通过
network
root
all
consistent
本地路由表检查
Check routing table
设置节点上只有一个业务网段IP
检查单节点上业务网段的IP个数,超过一个则不通过
network
user
all
default
检查DN磁盘使用率
Check the usage of DN disk
清理磁盘对应中的空间或更换更大的磁盘。
检查磁盘DN目录空间和索引使用率,如果使用率低于90%则检查项通过,否则检查项不通过
other
user
all
default
检查系统安装磁盘空间使用率
Check the usage of install disk
清理磁盘对应中的空间或更换更大的磁盘。
检查磁盘系统安装目录空间和索引使用率,如果使用率低于90%则检查项通过,否则检查项不通过
other
user
all
default
检查日志磁盘空间使用率
Check the usage of log disk
清理磁盘对应中的空间或更换更大的磁盘。
检查磁盘日志目录空间和索引使用率,如果使用率低于90%则检查项通过,否则检查项不通过
other
user
all
default
检查临时磁盘空间使用率
Check the usage of tmp disk
清理磁盘对应中的空间或更换更大的磁盘。
检查磁盘临时目录磁盘和索引使用率,如果使用率低于90%则检查项通过,否则检查项不通过
other
user
all
default