了解 HPC 群集管理器中的节点指标和属性

本主题介绍 HPC 群集管理器中提供的节点属性和指标,以帮助监视群集。 可以修改 HPC 群集管理器中的节点列表和热度映射视图以显示各种节点指标和属性。 热度地图视图仅显示指标。 有关创建自定义节点视图的信息,请参阅 了解节点列表、热度映射和自定义选项卡视图。 有关添加更多指标的信息,请参阅 在 Windows HPC Server中自定义指标集合。

在本主题中:

节点属性和指标的字母顺序列表

下表描述了 HPC 群集管理器中节点属性和指标的可用值。

注意

在“属性或指标”列中,反映节点状态的指标和节点属性的名称以粗体字体表示。

属性或指标 描述 类别
亲和力 显示此节点的关联设置。 可能的值:

- Null - 根据作业计划程序相关性策略管理节点的相关性(请参阅 了解相关性
- True – HPC Node Manager 服务为在此节点上运行的所有任务设置相关性
- False - 节点上的相关性不受 HPC 服务管理,操作系统或应用程序管理物理核心上任务的位置

此值由 HPC 群集管理员设置。
Cores/memory/disk
应用程序 IP 绑定到应用程序网络的网络适配器的 IP 地址。 网络
应用程序链接速度 绑定到应用程序网络的网络适配器的链接速度。 网络
应用程序链接状态 绑定到应用程序网络的网络适配器的链接状态。 如果群集拓扑不包括应用程序网络,或者节点未连接到此网络,则该值显示为“已断开连接”。 可能的值为 Connected 和 Disconnected

此值在发现操作期间由 HPC 管理服务定期更新。
网络
Application NetworkDirect 是否为应用程序网络安装了 NetworkDirect 提供程序。 可能的值为 True 和 False。

HPC 管理服务会定期更新此值。
网络
可用物理内存(MBytes) 计算机上运行的进程的可用物理内存量(以兆字节为单位)。 AvailableMBytes 是通过在 Zeroed、Free 和 Standby 内存列表中添加空间量来计算的。 可用内存可供使用;零内存是填充了零的内存页,以防止后续进程查看上一个进程使用的数据;备用内存是从进程的工作集(其物理内存)路由到磁盘时删除的内存,但仍可供召回。 此计数器仅显示最后一个观察到的值;它不是平均值。 Cores/memory/disk
启动信息 与从 iSCSI 服务器通过网络启动相关的信息。 这指定头节点应如何响应来自节点的 PXE 请求。 部署
上下文开关/秒 计算机上的所有处理器从一个线程切换到另一个线程的组合速率。 当正在运行的线程自愿放弃处理器、被优先级较高的就绪线程抢占时,或在用户模式与特权(内核)模式之间切换以使用执行或子系统服务时,将发生上下文切换。 Cores/memory/disk
核心 计算机上的物理核心数。

此值在发现操作期间由 HPC 管理服务定期更新。 注意: 如果更改计算节点的硬件配置,请确保通过在作业计划数据库中通过使节点脱机(最好在进行硬件更改之前)来检测和更新配置更改,然后再次使节点联机。
Cores/memory/disk
使用 核心 当前分配给作业的物理核心数。 Cores/memory/disk
CPU 使用率(%) 节点上所有物理核心的用户和系统时间除以采样间隔为节点上物理核心总数。 Cores/memory/disk
描述 节点的说明。

此值由 HPC 群集管理员设置。
部署
磁盘队列长度 指示等待处理的事务数。 此计数器提供磁盘拥塞的主要度量值。 队列长度不仅代表事务数,还代表每个事务的长度和频率。 Cores/memory/disk
磁盘吞吐量(字节/秒) 指示正在传输数据的速率。 描述磁盘子系统的磁盘吞吐量性能。 Cores/memory/disk
DNS 名称 节点的完全限定 DNS 名称,包括 DNS 后缀。 例如,“myNode.myDomain.com”。 网络
域名 节点的域名规范。 网络
持久队列总字节数 中转站节点上消息队列消息的字节总数。 当 SOA 客户端使用持久会话 API 在群集上创建会话时,中转站节点使用Microsoft消息队列(MSMQ)存储消息。 代理存储的响应可以随时由客户端检索,即使在有意或无意断开连接之后也是如此。 当 SOA 客户端检索其响应并关闭会话或达到作业历史记录保留期(默认情况下,这设置为三天)时,将删除消息。

默认情况下,MSMQ 存储限制为 8 GB。 达到 MSMQ 配额后,持久会话将停止工作。
SOA
持久队列总消息数 中转站节点上的消息队列消息总数。 SOA
持久请求队列长度 本地消息队列中存储的请求总数。 SOA
持久响应队列长度 本地消息队列中存储的响应总数。 SOA
企业 IP 绑定到企业网络的网络适配器的 IP 地址。 网络
企业链接速度 绑定到企业网络的网络适配器的链接速度。 网络
企业链接状态 绑定到企业网络的网络适配器的链接状态。 如果节点未连接到此网络,则该值显示为“已断开连接”。 可能的值为 Connected 和 Disconnected

此值在发现操作期间由 HPC 管理服务定期更新。
网络
Enterprise NetworkDirect 是否为企业网络安装了 NetworkDirect 提供程序。 可能的值为 True 和 False。

HPC 管理服务会定期更新此值。
网络
可用磁盘空间(%) 本地磁盘上可用空间总数的百分比。 Cores/memory/disk
节点所属的节点组。 默认节点组中的成员身份在部署中或通过更改节点角色来确定。 自定义节点组中的成员身份由 HPC 群集管理员确定。 状态/工作负荷
HPC SOA 计算/秒 中转站节点的当前计算调用。 这是过去 N 秒的移动平均值。 由于服务主机上的缓存,此值可以明显高于核心数。

HPC SOA 指标以及内存和 CPU 指标可帮助确定如何缩放中转站节点。 例如,当代理节点上 SOA 吞吐量、内存和 CPU 使用率较高时,请添加更多中转站。 如果这些指标较低,请将某些中转站转换为计算节点。 有关详细信息,请参阅 多个角色和代理缩放
SOA
HPC SOA 故障数/秒 每秒节点上的故障调用数。 SOA
HPC SOA 请求数/秒 每秒向中转站节点发出的请求数。 SOA
HPC SOA 响应数/秒 中转站节点上的响应数。 这是过去 N 秒的移动平均值。 SOA
空闲 工作站节点是否处于空闲状态。 可能的值:

- Null – 应用于任何不是工作站节点的节点,以及不使用活动检测策略的工作站节点。
- True – 在此节点上检测到的用户活动低于工作站可用性策略中定义的阈值。 该节点可用于运行作业。
- False – 在此节点上检测到的用户活动高于工作站可用性策略中定义的阈值。 节点不能用于运行作业。
状态/工作负荷
安装路径 安装 HPC Pack 软件的路径。

Windows Azure 节点未列出此值。
部署
已安装的服务角色 安装在节点上的 HPC 节点角色。 可以通过更改节点角色(已启用的角色列在节点角色属性中)来启用或禁用已安装的节点角色。 有关详细信息,请参阅 了解 Microsoft HPC Pack中的节点角色。

专用本地节点可以安装以下节点角色:

- HeadNode (仅头节点)
- BrokerNode
- ComputeNode

Windows Azure 节点可以安装以下节点角色之一:

- Windows Azure 辅助角色节点
- Windows Azure 虚拟机节点 注意: 从 HPC Pack 2008 R2 和 Service Pack 1(SP1)开始提供 Windows Azure 工作节点角色。 从 HPC Pack 2008 R2(SP2)开始,Windows Azure 虚拟机节点角色可用。

工作站节点可以安装以下角色:

- 工作站节点

非托管服务器节点可以安装以下角色:

- 非托管服务器节点 注意: 非托管服务器节点角色从 HPC Pack 2008 R2 和 Service Pack 3(SP3)开始提供。
部署
位置 节点的主要位置、辅助位置和第三级位置的详细信息。 例如,数据中心、服务器机架、机箱。

此属性值可由 HPC 群集管理员指定。
部署
LUN 映射 标识 iSCSI 启动节点的 GUID。 部署
计算机 Guid 节点的 SMBIOS GUID。 部署
管理 IP 地址 节点的带外管理 IP 地址,可用于可编写脚本的电源控制工具,例如智能平台管理接口 (IPMI) 脚本。 例如,这可以设置为计算节点的基本管理控制器(BMC)的 IP 地址。 有关详细信息,请参阅 可编写脚本的 Power Control 工具

此属性值可由 HPC 群集管理员设置。
部署
记忆 节点上安装的内存量。 Cores/memory/disk
内存分页(硬故障/秒) 每秒硬页错误数。 当程序部分内存中的地址不再位于主内存中,但已交换到分页文件时,会发生硬故障,使系统在硬盘上查找它。 出现这种情况时,会导致硬盘活动放缓和硬盘活动增加。 当它过度发生时,硬盘的粉碎的可能性就会出现(当程序停止响应时,但硬盘驱动器会持续长时间运行)。 Cores/memory/disk
名字 节点的名称,包括域。 例如,DOMAIN\nodename。

对于 Windows Azure 节点,此名称为 AZURE\nodename。
部署
NetBoot MAC 地址 绑定到专用网络的网络适配器的 MAC 地址。 这是将操作系统映像部署到节点(PXE 启动)时使用的网络。 部署
网络使用情况(字节/秒) 指示节点上所有网络的总网络吞吐量。 这不包括 NetworkDirect 流量,因为 NetworkDirect 会绕过 TCP/IP。 网络
节点运行状况 节点运行状况的总体指示。 指示 HPC 服务在该节点上是否知道任何警告或错误,如果节点正在执行由 HPC 群集管理员启动的操作,或者节点是否已添加到群集。 有关节点运行状况值的信息,请参阅 了解节点状态、运行状况和操作 状态/工作负荷
节点名称 节点的名称。

对于从裸机部署的节点,根据 HPC 群集管理员在节点模板中定义的节点命名系列自动分配此名称。

对于 Windows Azure 节点,名称以“AzureCN-”开头,后跟数字。 例如,AzureCN-0001
部署
节点角色 为节点启用的节点角色。 专用本地节点可以启用多个角色,具体取决于已安装的角色(已安装的角色列在“已安装的服务角色”属性中)。 可能的值:

- ComputeNode
- BrokerNode
- 非托管服务器节点
- Windows Azure 辅助角色节点
- Windows Azure 虚拟机节点
- 工作站节点

头节点角色不显示在此属性中。 注意: 从 HPC Pack 2008 R2 和 Service Pack 3(SP3)开始提供非托管服务器节点角色。 注意:从 HPC Pack 2008 R2 和 Service Pack 1(SP1)开始, Windows Azure 工作节点角色可用。 从 HPC Pack 2008 R2(SP2)开始,Windows Azure 虚拟机节点角色可用。

有关详细信息,请参阅 了解 Microsoft HPC Pack中的节点角色。
状态/工作负荷
节点状态 节点的部署状态,或者管理员是否希望节点可用作群集作业的资源(联机或脱机)。 有关节点状态值的信息,请参阅 了解节点状态、运行状况和操作 状态/工作负荷
节点模板 用于部署节点或将节点加入群集的节点模板的名称。 部署
OS 体系结构 节点上的操作系统体系结构。 部署
OS 版本 节点上的操作系统版本。 部署
Primary HeadNode 对于配置为在故障转移群集中实现高可用性的头节点,安装 HPC Pack 的初始头节点计算机的值设置为 True 表示此属性。 警告: 从 HPC Pack 2012 开始删除此属性。 状态/工作负荷
专用 IP 绑定到专用网络的网络适配器的 IP 地址。 网络
专用链接速度 绑定到专用网络的网络适配器的链接速度。 网络
专用链接状态 绑定到专用网络的网络适配器的链接状态。 如果群集拓扑不包含专用网络,或者节点未连接到此网络,则该值显示为“已断开连接”。 可能的值为 Connected 和 Disconnected。

此值在发现操作期间由 HPC 管理服务定期更新。
网络
专用网络目录 是否为专用网络安装了 NetworkDirect 提供程序。 可能的值为 True 和 False。

HPC 管理服务会定期更新此值。
网络
处理器 节点上安装的处理器的名称和属性。 Cores/memory/disk
产品密钥 将用于在节点上激活操作系统的 Windows 产品密钥。

此属性值可由 HPC 群集管理员指定。
部署
进度 部署或预配操作期间的最新部署日志条目。 可以按此列进行排序,以帮助监视部署进度。 部署
供应 是否在节点上安装 HPC Pack。 可能的值为 True 和 False。 注意: 如果分配包含部署操作系统的步骤的节点模板,并且此属性为 True,则只会运行节点模板维护阶段的任务。 如果要重新安装操作系统,可以分配模板,然后运行 Reimage 操作。 部署
运行作业 当前使用此节点的作业数。 状态/工作负荷
运行任务 当前使用此节点的任务、子任务或任务进程数(如 MPI 排名)。 如果订阅的核心或套接字属性在节点上设置,则此数字可以高于物理核心数或套接字数。 状态/工作负荷
服务运行状况 HPC 服务运行状况的总体指示。 指示 HPC 服务在该节点上是否有任何警告或错误。 状态/工作负荷
插座 节点上的物理套接字数。 Cores/memory/disk
订阅的核心 HPC 作业计划程序服务在向节点分配任务时将使用的逻辑核心数。 它可以大于或小于物理核心数。 注意:“正在使用的核心”指标反映正在使用的物理核心数。 “正在运行的任务”指标可帮助你监视正在使用的已订阅核心数。

此值由 HPC 群集管理员设置。
Cores/memory/disk
订阅套接字 HPC 作业计划程序服务在向节点分配任务时将使用的逻辑套接字数。 它可以大于或小于物理套接字的数量。

此值由 HPC 群集管理员设置。
Cores/memory/disk
系统调用/秒 此计数器是对系统组件、内核模式服务发出的调用数的度量值。 这是一个衡量系统在管理应用程序和服务的繁忙程度。 与中断数/秒相比,它会指示处理器问题是否与硬件或软件相关。 Cores/memory/disk
UnattendSetup 是否 setup.exe 使用 –无人参与 标志运行。 部署
版本 安装在节点上的 HPC Pack 的版本号。 例如:

- HPC Pack 2008 R2 的值为 3.0.xxxx.x。
- 具有 SP4 的 HPC Pack 2008 R2 的值为 3.4.xxxx.x。
- HPC Pack 2012 的值为 4.0.xxxx.x。
部署
Windows Azure 实例名称 Windows Azure 角色实例的计算机名称。 此值由 Windows Azure 分配。 天蓝色
Windows Azure 节点地址 Windows Azure 节点的 IP 地址。 此值由 Windows Azure 分配。 有关公共 IP 范围的列表,请参阅 发布的 IP 范围 天蓝色
Windows Azure 节点大小 Windows Azure 节点实例的大小。 大小确定 Windows Azure定义的 CPU 核心数、内存容量和磁盘空间数。

将 Windows Azure 节点添加到群集时,HPC 群集管理员指定此值。
天蓝色
Windows Azure 服务名称 在其中部署此 Windows Azure 节点的托管服务(在 Windows Azure 订阅中)的公共名称。

此值由节点模板中的 HPC 群集管理员定义。
天蓝色
Windows Azure 存储服务名称 与 Windows Azure 节点关联的存储帐户(在 Windows Azure 订阅中)的公共名称。

此值由节点模板中的 HPC 群集管理员定义。
天蓝色
Windows Azure 订阅 ID 与 Windows Azure 节点关联的 Windows Azure 订阅帐户的唯一 ID。

此值由节点模板中的 HPC 群集管理员定义。
天蓝色

按概念类别划分的节点属性和指标

以下列表按功能类别对属性和指标进行分组,以便快速确定哪些值可用于群集的不同方面。 这些列表可以帮助你选择要在自定义节点视图中显示的值,以帮助监视群集性能的不同方面。 在以下列表中,反映节点状态的指标名称和节点属性的名称由粗体字体表示。

Cores/memory/disk

  • 处理器

  • 核心

  • 插座

  • 使用 核心

  • CPU 使用率(%)

  • 上下文开关/秒

  • 系统调用/秒

  • 亲和力

  • 订阅的核心

  • 订阅套接字

  • 记忆

  • 可用物理内存(MBytes)

  • 内存分页(硬故障/秒)

  • 可用磁盘空间(%)

  • 磁盘队列长度

  • 磁盘吞吐量(字节/秒)

状态/工作负荷

  • 节点状态

  • 节点运行状况

  • 节点角色

  • 主头节点

  • 服务运行状况

  • 空闲

  • 运行作业

  • 运行任务

SOA

  • 持久队列总字节数

  • 持久队列总消息数

  • 持久请求队列

  • 持久响应队列

  • HPC SOA 计算/秒

  • HPC SOA 故障数/秒

  • HPC SOA 请求数/秒

  • HPC SOA 响应数/秒

网络

  • DNS 名称

  • 域名

  • 企业 IP

  • 企业链接速度

  • 企业链接状态

  • Enterprise NetworkDirect

  • 专用 IP

  • 专用链接速度

  • 专用链接状态

  • 专用网络目录

  • 应用程序 IP

  • 应用程序链接速度

  • 应用程序链接状态

  • 应用程序网络直通

  • 网络使用情况(字节/秒)

部署

  • 名字

  • 节点名称

  • 节点模板

  • 描述

  • 位置

  • 计算机 Guid

  • NetBoot MAC 地址

  • 启动信息

  • 安装路径

  • 版本

  • 已安装的服务角色

  • OS 体系结构

  • OS 版本

  • 产品密钥

  • 管理 IP 地址

  • LUN 映射

  • 供应

  • UnattendSetup

  • 进度

天蓝色

  • 大小

  • Windows Azure 实例名称

  • Windows Azure 节点地址

  • Windows Azure 节点大小

  • Windows Azure 服务名称

  • Windows Azure 存储服务名称

  • Windows Azure 订阅 ID

其他注意事项

HPC Pack 2008 R2 SP1 新增功能

在 HPC Pack 2008 R2 的 Service Pack 1 中添加了以下属性或指标。 这些更改与将 Windows Azure 节点添加到群集的功能相关。 有关详细信息,请参阅 使用 Microsoft HPC Pack [已停用]部署 Azure 节点。

  • 大小

  • Windows Azure 节点地址

  • Windows Azure 服务名称

  • Windows Azure 存储服务名称

  • Windows Azure 订阅 ID

HPC Pack 2008 R2 SP2 新增功能

在 HPC Pack 2008 R2 的 Service Pack 2 中添加了以下属性或指标。 这些更改与过度订阅和订阅下订阅节点的能力相关。

  • 亲和力

  • 订阅的核心

  • 订阅套接字

其他参考