通过SNMP方式,监控戴尔/Dell服务器的硬件系统信息,包括:控制器信息、内存信息、网卡信息、处理器信息、硬盘信息、温度信息、电源信息和风扇信息等。
1 硬件服务器-戴尔模板概述
适用于监控硬件服务器-戴尔。硬件服务器-戴尔是通过SNMP协议进行设备纳管,指标主要包含硬件状态、CPU状态、内存状态、接口状态、风扇、电源、SNMPTrap等。
支持的Zabbix版本:5.0以上版本
支持的硬件服务器:戴尔;型号:R系列
zabbix监控模板下载:https://download.csdn.net/download/u013235026/91789869
2 模板详情
2.1 模板宏
宏名称 |
宏描述 |
默认值 |
{$EXP} |
snmptrap告警级别的运算符 |
gt |
{$SEVERITY} |
snmptrap告警级别的定义 |
1 |
{$OBJ.TYPE} |
设备类型 |
戴尔服务器 |
{$SNMP_COMMUNITY} |
SNMP团体名 |
pubilc |
2.2 监控指标
指标组 |
监控指标项 |
Item名称 |
Item键值 |
触发器 |
CPU |
品牌名称 |
{#CPU} 品牌名称 |
ProcBrandName.[{#SNMPINDEX}] |
|
线程数量 |
{#CPU} 线程数量 |
ProcThreadCount.[{#SNMPINDEX}] |
||
制造商名称 |
{#CPU} 制造商名称 |
ProcManuName.[{#SNMPINDEX}] |
||
外主频 |
{#CPU} 外主频 |
ProcExternalClockSpeed[{#SNMPINDEX}] |
||
当前主频 |
{#CPU} 当前主频 |
ProcCurrentSpeed.[{#SNMPINDEX}] |
||
最大主频 |
{#CPU} 最大主频 |
ProcCurrentMaxSpeed[{#SNMPINDEX}] |
||
核心数量 |
{#CPU} 核心数量 |
ProcCoresNum.[{#SNMPINDEX}] |
||
状态 |
{#CPU} 状态 |
ProcStatus.[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 处理器 {#CPU} 状态异常 |
|
状态 |
{#CPU} 状态 |
ProcStatus.[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 处理器 {#CPU} 状态警告 |
|
Fans |
状态 |
{#FAN} 状态 |
FanStatus[{#SNMPINDEX}] |
[硬件设备]{HOSTNAME} 风扇 {#FAN} 总体状态异常 |
状态 |
{#FAN} 状态 |
FanStatus[{#SNMPINDEX}] |
[硬件设备]{HOSTNAME} 风扇 {#FAN} 总体状态警告 |
|
转速 |
{#FAN} 转速 |
FanSpeed[{#SNMPINDEX}] |
[硬件设备]{HOSTNAME} 风扇 {#FAN} 转速低于最低阈值 |
|
ICMP |
ICMP ping状态 |
ICMP ping状态 |
icmpping[,5,,,] |
[硬件设备]{HOST.NAME} ——BMC刚才发生过重启 |
ICMP ping状态 |
ICMP ping状态 |
icmpping[,5,,,] |
[硬件设备]{HOST.NAME}——SNMP无法采集到数据 |
|
ICMP ping状态 |
ICMP ping状态 |
icmpping[,5,,,] |
[硬件设备]{HOST.NAME}——持续3分钟未响应。 |
|
ICMP 丢包率 |
ICMP 丢包率 |
icmppingloss |
||
ICMP 请求时长 |
ICMP 请求时长 |
icmppingsec |
||
SNMPTRAP |
Snmptrap原始告警 |
Snmptrap原始告警 |
snmptraps |
硬件发生SNMPTrap告警,告警内容:{ITEM.VALUE} |
Snmptrap原始告警 |
Snmptrap原始告警 |
snmptraps |
硬件发生SNMPTrap告警,告警内容:{ITEM.VALUE} |
|
Snmptrap原始告警 |
Snmptrap原始告警 |
snmptraps |
硬件发生SNMPTrap告警,告警内容:{ITEM.VALUE} |
|
Snmptrap原始告警 |
Snmptrap原始告警 |
snmptraps |
硬件发生SNMPTrap告警,告警内容:{ITEM.VALUE} |
|
Snmptrap原始告警 |
Snmptrap原始告警 |
snmptraps |
硬件发生SNMPTrap告警,告警内容:{ITEM.VALUE} |
|
Trap告警级别 |
Trap告警级别 |
snmptraps.severity |
||
内存 |
主频 |
{#MEM} 主频 |
MemSpeed[{#SNMPINDEX}] |
|
制造商 |
{#MEM} 制造商 |
MemManufacturer[{#SNMPINDEX}] |
||
大小 |
{#MEM} 大小 |
MemSize[{#SNMPINDEX}] |
||
序列号 |
{#MEM} 序列号 |
MemSerialNo[{#SNMPINDEX}] |
||
最大主频 |
{#MEM} 最大主频 |
MemMaxSpeed[{#SNMPINDEX}] |
||
状态 |
{#MEM} 状态 |
MemStatus[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 内存 {#MEM} 警告 |
|
状态 |
{#MEM} 状态 |
MemStatus[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 内存 {#MEM} 错误 |
|
零件号 |
{#MEM} 零件号 |
MemPartlNo[{#SNMPINDEX}] |
||
常规 |
BMC运行时间 |
BMC运行时间 |
sysUpTime |
[硬件设备]{HOST.NAME} ——BMC刚才发生过重启 |
BMC运行时间 |
BMC运行时间 |
sysUpTime |
[硬件设备]{HOST.NAME}——SNMP无法采集到数据 |
|
BMC运行时间 |
BMC运行时间 |
sysUpTime |
[硬件设备]{HOST.NAME}——持续3分钟未响应。 |
|
设备位置 |
设备位置 |
sysLocation |
||
设备名称 |
设备名称 |
sysName |
[硬件设备]{HOST.NAME} ——设备名称发生改变 |
|
设备描述 |
设备描述 |
sysDescr |
||
设备详细的联系方式 |
设备详细的联系方式 |
sysContact |
||
扩展总线 |
位宽 |
{#PCIE} 位宽 |
PCIeRatedWidth[{#SNMPINDEX}] |
|
厂家 |
{#PCIE} 厂家 |
PCIeMfc[{#SNMPINDEX}] |
||
描述 |
{#PCIE} 描述 |
PCIeDesc[{#SNMPINDEX}] |
||
状态 |
{#PCIE} 状态 |
PCIeStatus[{#SNMPINDEX}] |
[硬件设备]{#HOSTNAME} 扩展总线 {#PCIE} 状态异常 |
|
状态 |
{#PCIE} 状态 |
PCIeStatus[{#SNMPINDEX}] |
[硬件设备]{#HOSTNAME} 扩展总线 {#PCIE} 状态警告 |
|
槽位 |
状态 |
{#SLOT} 状态 |
SlotStatus[{#SNMPINDEX}] |
[硬件设备]{#HOSTNAME} 系统槽位 {#SLOT} 状态异常 |
状态 |
{#SLOT} 状态 |
SlotStatus[{#SNMPINDEX}] |
[硬件设备]{#HOSTNAME} 系统槽位 {#SLOT} 状态警告 |
|
温度 |
临界的上限 |
{#TEMP} 临界的上限 |
TempCritUpLimit.[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 温度 {#TEMP} 超过临界上限值 |
临界的上限 |
{#TEMP} 临界的上限 |
TempCritUpLimit.[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 温度 {#TEMP} 高于警告值 |
|
临界的下限 |
{#TEMP} 临界的下限 |
TempCritLowLimit.[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 温度 {#TEMP} 低于临界下限值 |
|
临界的下限 |
{#TEMP} 临界的下限 |
TempCritLowLimit.[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 温度 {#TEMP} 低于警告值 |
|
温度值 |
{#TEMP} 温度值 |
TempValue.[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 温度 {#TEMP} 低于临界下限值 |
|
温度值 |
{#TEMP} 温度值 |
TempValue.[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 温度 {#TEMP} 低于警告值 |
|
温度值 |
{#TEMP} 温度值 |
TempValue.[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 温度 {#TEMP} 超过临界上限值 |
|
温度值 |
{#TEMP} 温度值 |
TempValue.[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 温度 {#TEMP} 高于警告值 |
|
状态 |
{#TEMP} 状态 |
TempStatus.[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 温度传感器 {#TEMP} 状态异常 |
|
状态 |
{#TEMP} 状态 |
TempStatus.[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 温度传感器 {#TEMP} 状态警告 |
|
警告的上限 |
{#TEMP} 警告的上限 |
TempWarnUpLimit.[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 温度 {#TEMP} 高于警告值 |
|
警告的下限 |
{#TEMP} 警告的下限 |
TempWarnLowLimit.[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 温度 {#TEMP} 低于警告值 |
|
电压 |
电压状态 |
{#VOLTAGE} : 电压状态 |
VoltageStatus.[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 电压组件 {#VOLTAGE} 状态异常 |
电压状态 |
{#VOLTAGE} : 电压状态 |
VoltageStatus.[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 电压组件 {#VOLTAGE} 状态警告 |
|
电压状态 |
电压状态 |
VoltageStatusCombined |
[硬件设备]{HOST.NAME} 电压异常 |
|
电池 |
电流传感器状态 |
{#AMP} 电流传感器状态 |
AmpsStatus[{#SNMPINDEX}] |
[硬件设备]{#HOSTNAME} 电流传感器 {#AMP} 状态异常 |
电流传感器读数 |
{#AMP} 电流传感器读数 |
AmpsValue[{#SNMPINDEX}] |
||
电池状态 |
{#BAT} 电池状态 |
battery.status[{#SNMPINDEX}] |
[硬件设备]{#HOSTNAME} 电池 {#AMP} 状态异常 |
|
电池状态 |
{#BAT} 电池状态 |
battery.status[{#SNMPINDEX}] |
[硬件设备]{#HOSTNAME} 电池 {#AMP} 状态警告 |
|
电源 |
传感器状态 |
{#POWER} 传感器状态 |
PowerSupplySensorState[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 电源传感器 {#POWER} 状态异常 |
当前输入电压 |
{#POWER} 当前输入电压 |
PowerSupplyInputVoltage[{#SNMPINDEX}] |
||
最大功率 |
{#POWER} 最大功率 |
PowerSupplyMaxPower[{#SNMPINDEX}] |
||
最大输入电压 |
{#POWER} 最大输入电压 |
PowerSupplyInputMaxVoltage[{#SNMPINDEX}] |
||
状态 |
{#POWER} 状态 |
PowerSupplyStatus[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 电源 {#POWER} 状态异常 |
|
状态 |
{#POWER} 状态 |
PowerSupplyStatus[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 电源 {#POWER} 状态警告 |
|
状态设置 |
{#POWER} 状态设置 |
PowerSupplyStateSettings[{#SNMPINDEX}] |
||
额定功率 |
{#POWER} 额定功率 |
PowerSupplyPower[{#SNMPINDEX}] |
||
电源传感器状态 |
电源传感器状态 |
PowerUsageSensorStatus |
||
电源无功功率 |
电源无功功率 |
PowerUsageMinIdle |
||
系统总体电源状态 |
系统总体电源状态 |
GlobalSystemPowerState |
[硬件设备]{HOST.NAME} 系统没有运行 |
|
磁盘/存储 |
RAID 控制器名称 |
RAID 控制器名称 |
RAIDControllerName |
|
RAID 控制器固件版本 |
RAID 控制器固件版本 |
RAIDControllerFirmware |
||
RAID 控制器状态 |
RAID 控制器状态 |
RAIDControllerStatus |
[硬件设备]{HOST.NAME} raid控制器错误 |
|
卷Raid级别 |
{#VOLNAME} : 卷Raid级别 |
VolumeState[{#SNMPINDEX}] |
||
卷名称 |
{#VOLNAME} : 卷名称 |
VolumeName[{#SNMPINDEX}] |
||
卷大小 |
{#VOLNAME} : 卷大小 |
VolumeSize[{#SNMPINDEX}] |
||
卷总体状态 |
{#VOLNAME} : 卷总体状态 |
VolumeStatus[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} {#VOLNAME} 卷总体状态异常 |
|
卷总体状态 |
{#VOLNAME} : 卷总体状态 |
VolumeStatus[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} {#VOLNAME} 卷总体状态警告 |
|
卷运行状态 |
{#VOLNAME} : 卷运行状态 |
VolumeDiskState[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} {#VOLNAME} 卷运行状态异常 |
|
系统总体存储器状态 |
系统总体存储器状态 |
GlobalSystemStorageStatus |
[硬件设备]{HOST.NAME} 存储器系统状态警告 |
|
系统总体存储器状态 |
系统总体存储器状态 |
GlobalSystemStorageStatus |
[硬件设备]{HOST.NAME} 存储器系统状态错误 |
|
移动单元 |
厂商 |
{#FRU} 厂商 |
FRUMfc[{#SNMPINDEX}] |
|
序列号 |
{#FRU} 序列号 |
FRUSerial[{#SNMPINDEX}] |
||
状态 |
{#FRU} 状态 |
FRUStatus[{#SNMPINDEX}] |
[硬件设备]{#HOSTNAME} 电流传感器 {#FRU} 状态异常 |
|
状态 |
{#FRU} 状态 |
FRUStatus[{#SNMPINDEX}] |
[硬件设备]{#HOSTNAME} 电流传感器 {#FRU} 状态警告 |
|
部件号 |
{#FRU} 部件号 |
FRUPartNumber[{#SNMPINDEX}] |
||
系统信息 |
BIOS 版本 |
BIOS 版本 |
BiosVersion |
|
BIOS 状态 |
BIOS 状态 |
SystemBiosStatus |
||
BIOS 生产日期 |
BIOS 生产日期 |
BiosDate |
||
CMOS 电池状态 |
CMOS 电池状态 |
CMOSBatteryStatus |
[硬件设备]{HOST.NAME} CMOS 电池异常 |
|
iDRAC 固件版本 |
iDRAC 固件版本 |
idrac_firmwareversion |
||
iDRAC 版本 |
iDRAC 版本 |
idrac_version |
||
iDRAC 访问地址 |
iDRAC 访问地址 |
idrac_acessurl |
||
型号 |
型号 |
systemModelName |
||
标记号 |
标记号 |
idrac_assettag |
||
系统名称 |
系统名称 |
systemOSName |
||
系统整体LCD状态 |
系统整体LCD状态 |
GlobalSystemLCDStatus |
||
系统服务号 |
系统服务号 |
idrac_esc |
||
系统汇总状态 |
系统汇总状态 |
GlobalSystemRollupStatus |
[硬件设备]{HOST.NAME} iDrac 5分钟无数据 |
|
系统汇总状态 |
系统汇总状态 |
GlobalSystemRollupStatus |
[硬件设备]{HOST.NAME} 发生严重错误 |
|
系统汇总状态 |
系统汇总状态 |
GlobalSystemRollupStatus |
[硬件设备]{HOST.NAME} 发生警告错误 |
|
网卡 |
MAC地址 |
{#NETIF} : MAC地址 |
NetMAC[{#SNMPINDEX}] |
|
厂商名称 |
{#NETIF} : 厂商名称 |
NetVenName[{#SNMPINDEX}] |
||
名称 |
{#NETIF} : 名称 |
NetName[{#SNMPINDEX}] |
||
总体状态 |
{#NETIF} : 总体状态 |
NetStatus[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 网卡 {#NETIF} 总体状态异常 |
|
总体状态 |
{#NETIF} : 总体状态 |
NetStatus[{#SNMPINDEX}] |
[硬件设备]{HOST.NAME} 网卡 {#NETIF} 总体状态警告 |
|
槽位 |
{#NETIF} : 槽位 |
NetSlot[{#SNMPINDEX}] |
||
运行状态 |
{#NETIF} : 运行状态 |
NetConnStatus[{#SNMPINDEX}] |
[硬件设备]{#HOSTNAME} 网卡 {#NETIF} 运行状态变化 |
|
网卡物理连接状态 |
{#SNMPVALUE} 网卡物理连接状态 |
ifOperStatus[{#SNMPVALUE}] |
[硬件设备]{HOST.NAME}——网卡端口{#SNMPVALUE}已关闭 |
|
网卡描述 |
{#SNMPVALUE} 网卡描述 |
ifAlias[{#SNMPVALUE}] |
||
网卡每秒发送速率 |
{#SNMPVALUE} 网卡每秒发送速率 |
ifHCOutOctetsPersecond[{#SNMPVALUE}] |
||
网卡每秒接收速率 |
{#SNMPVALUE} 网卡每秒接收速率 |
ifHCInOctetsPersecond[{#SNMPVALUE}] |
||
网卡物理地址 |
{#SNMPVALUE} 网卡物理地址 |
ifPhysAddress[{#SNMPVALUE}] |
||
网卡类型 |
{#SNMPVALUE} 网卡类型 |
ifType[{#SNMPVALUE}] |
||
风扇 |
转速下限 |
{#FAN} 转速下限 |
FanLowerSpeed[{#SNMPINDEX}] |
[硬件设备]{HOSTNAME} 风扇 {#FAN} 转速低于最低阈值 |
3 模板安装说明
3.1 监控前置条件
硬件服务器-戴尔开启SNMP V2协议,如被纳管设备与硬件服务器-戴尔存在防火墙,则需要开启UDP 161的策略;
导入硬件服务器-戴尔监控模板至Zabbix Web页面。
3.2 设备监控
3.2.1 主机添加
在zabbix web上新建host并关联硬件服务器-戴尔模板
3.2.2 修改主机宏
在zabbix web上的host配置中,点击“宏 Marcos“菜单,选择“主机宏 Inheritedand host macros”,修改以下1个宏的值:
{$SNMP_COMMUNITY}:SNMP协议开启时配置的团体名,例如public (模板已存在默认路径,如与实际配置不相同,则修改)
3.2.3 查看最新数据
在zabbix web上点击“monitor”à”Latest data”,在“Hosts”选择新增的戴尔主机,最后点击“Apply”生效来查看最新数据。