警报和消息通知

警报在 Director 的控制板和其他高级视图中显示,并带有警告和严重警报符号。警报适用于 Premium 许可的站点。警报每分钟自动更新;您也可以按需更新警报。

迪莱克特 警报

警告警报(琥珀色三角形)表示某个条件的警告阈值已达到或超出。

严重警报(红色圆形)表示某个条件的严重阈值已达到或超出。

您可以通过从侧边栏中选择警报、单击侧边栏底部的“转到警报”链接或从 Director 页面顶部选择“警报”来查看有关警报的更多详细信息。

在“警报”视图中,您可以筛选和导出警报。例如,过去一个月内特定交付组的失败多会话操作系统计算机,或特定用户的所有警报。有关详细信息,请参阅导出报告

筛选警报

思杰® 警报

Citrix 警报是在 Director 中监控的、源自 Citrix 组件的警报。您可以在 Director 的“警报 > Citrix 警报策略”中配置 Citrix 警报。作为配置的一部分,您可以设置当警报超出您设置的阈值时,通过电子邮件向个人和组发送通知。有关设置 Citrix 警报的详细信息,请参阅创建警报策略

注意:

确保您的防火墙、代理或 Microsoft Exchange Server 不会阻止电子邮件警报。

智能警报策略

针对交付组和多会话操作系统 VDA 范围提供了一组具有预定义阈值的内置警报策略。此功能需要 Delivery Controller 7.18 或更高版本。您可以在“警报 > Citrix 警报策略”中修改内置警报策略的阈值参数。 当您的站点中至少定义了一个警报目标(交付组或多会话操作系统 VDA)时,将创建这些策略。此外,这些内置警报会自动添加到新的交付组或多会话操作系统 VDA 中。

如果您升级 Director 和您的站点,则会沿用您之前 Director 实例中的警报策略。仅当 Monitor 数据库中不存在相应的警报规则时,才会创建内置警报策略。

对于内置警报策略的阈值,请参阅警报策略条件部分。

内置警报

创建警报策略

迪雷克特 警报策略

例如,要在满足特定会话计数条件时生成警报,请创建新的警报策略:

  1. 转至 警报 > Citrix 警报策略,然后选择(例如)多会话操作系统策略。
  2. 单击 创建
  3. 命名并描述策略,然后设置触发警报必须满足的条件。例如,为“峰值连接会话”、“峰值断开连接会话”和“峰值并发总会话”指定“警告”和“严重”计数。警告值不得大于严重值。有关详细信息,请参阅警报策略条件
  4. 设置重新警报间隔。如果警报条件仍然满足,警报将在此时间间隔再次触发,并且(如果已在警报策略中设置)将生成电子邮件通知。已解除的警报不会在重新警报间隔生成电子邮件通知。
  5. 设置范围。例如,为特定的交付组设置。
  6. 在“通知首选项”中,指定警报触发时应通过电子邮件通知谁。您必须在 电子邮件服务器配置 选项卡上指定电子邮件服务器,才能在警报策略中设置电子邮件通知首选项。
  7. 单击 保存

在“范围”中定义了 20 个或更多交付组的策略可能需要大约 30 秒才能完成配置。在此期间会显示一个加载指示器。

为多达 20 个唯一交付组(总共 1000 个交付组目标)创建 50 个以上的策略可能会导致响应时间增加(超过 5 秒)。

将包含活动会话的计算机从一个交付组移动到另一个交付组可能会触发使用计算机参数定义的错误交付组警报。

注意: 删除警报策略后,该策略生成的警报通知可能需要长达 30 分钟才能停止。

警报策略的条件

下面列出了警报类别、建议的警报缓解措施以及(如果已定义)内置策略条件。内置警报策略的警报和重新警报间隔为 60 分钟。

并发连接会话峰值

  • 在 Director 会话趋势视图中检查并发连接会话峰值。
  • 请检查以确保系统具备足够的容量来处理会话负载。
  • 如果需要,添加新计算机

并发断开连接会话峰值

  • 在 Director 会话趋势视图中检查并发断开连接会话峰值。
  • 检查以确保有足够的容量来适应会话负载。
  • 如果需要,添加新计算机。
  • 如果需要,注销断开连接的会话

并发会话总数峰值

  • 在 Director 的会话趋势视图中检查并发会话峰值。
  • 检查以确保有足够的容量来适应会话负载。
  • 如果需要,添加新计算机。
  • 如果需要,注销断开连接的会话

CPU

CPU 使用率百分比表示 VDA 上的整体 CPU 消耗,包括进程的消耗。您可以从相应 VDA 的“计算机详细信息”页面深入了解单个进程的 CPU 利用率。

  • 转到“计算机详细信息 > 查看历史利用率 > 前 10 个进程”,识别消耗 CPU 的进程。确保已启用进程监视策略以启动进程级别资源使用情况统计信息的收集。
  • 如有必要,结束进程。
  • 结束进程会导致未保存的数据丢失。
  • 如果一切正常,请在将来添加额外的 CPU 资源。

    注意:

    策略设置“启用资源监视”默认允许用于监视具有 VDA 的计算机上的 CPU 和内存性能计数器。如果此策略设置被禁用,则不会触发具有 CPU 和内存条件的警报。有关详细信息,请参阅监视策略设置

    智能策略条件:

    • 范围: 交付组、多会话操作系统范围
    • 阈值: 警告 - 80%,严重 - 90%

内存

内存使用率百分比表示 VDA 上的整体内存消耗,包括进程的消耗。您可以从相应 VDA 的“计算机详细信息”页面深入了解单个进程的内存使用情况。

  • 转到 计算机详细信息 > 查看历史利用率 > 前 10 个进程,识别占用内存的进程。确保已启用进程监视策略以启动进程级别资源使用情况统计信息的收集。
  • 如有必要,终止该进程。
  • 终止进程会导致未保存的数据丢失。
  • 如果一切正常,将来请添加额外的内存。

    注意:

    默认情况下,策略设置“启用资源监视”允许监视具有 VDA 的计算机上的 CPU 和内存性能计数器。如果禁用此策略设置,则不会触发具有 CPU 和内存条件的警报。有关详细信息,请参阅监视策略设置

    智能策略条件:

    • 范围: 交付组,多会话操作系统范围
    • 阈值: 警告 - 80%,严重 - 90%

连接失败的频率

过去一小时内连接失败的百分比。

  • 根据总失败次数与总尝试连接次数计算。
  • 检查 Director 连接失败趋势视图,查看从配置日志中记录的事件。
  • 确定应用程序或桌面是否可访问。

连接失败计数

过去一小时内的连接失败次数。

  • 检查 Director 连接失败趋势视图,查看配置日志中记录的事件。
  • 确定应用程序或桌面是否可访问。

ICA® 往返时间(平均值)

平均 ICA 往返时间。

  • 检查 Citrix ADM 以获取 ICA RTT 的详细分析,从而确定根本原因。有关详细信息,请参阅 Citrix ADM 文档。
  • 如果 Citrix ADM 不可用,请检查 Director 用户详细信息视图中的 ICA RTT 和延迟,并确定是网络问题还是应用程序或桌面问题。

ICA 往返时间(会话数)

超过阈值 ICA 往返时间的会话数。

  • 检查 Citrix ADM 以获取高 ICA RTT 的会话数。有关详细信息,请参阅 Citrix ADM 文档。
  • 如果 Citrix ADM 不可用,请与网络团队合作确定根本原因。

    智能策略条件:

    • 范围: 交付组、多会话操作系统范围
    • 阈值: 警告 - 5 个或更多会话 300 毫秒,严重 - 10 个或更多会话 400 毫秒

ICA RTT(会话百分比)

超过平均 ICA 往返时间的会话百分比。

  • 检查 Citrix ADM 中 ICA RTT 较高的会话数量。有关详细信息,请参阅 Citrix ADM 文档。
  • 如果 Citrix ADM 不可用,请与网络团队合作确定根本原因。

ICA 往返时间(用户)

应用于指定用户启动的会话的 ICA 往返时间。如果至少一个会话中的 ICA RTT 大于阈值,则会触发警报。

失败的计算机(单会话操作系统)

失败的单会话操作系统计算机数量。失败可能由于各种原因发生,如 Director 仪表板和筛选器视图中所示。

  • 运行 Citrix Scout 诊断以确定根本原因。

    智能策略条件:

    • 范围: 交付组,多会话操作系统范围
    • 阈值: 警告 - 1,严重 - 2

失败的计算机(多会话操作系统)

失败的多会话操作系统计算机数量。失败可能由于各种原因发生,如 Director 仪表板和筛选器视图中所示。

  • 运行 Citrix Scout 诊断以确定根本原因。

    智能策略条件:

    • 范围:交付组,多会话操作系统范围
    • 阈值:警告 - 1,严重 - 2

失败的计算机(百分比)

交付组中失败的单会话和多会话操作系统计算机的百分比,根据失败计算机的数量计算。此警报条件允许您将警报阈值配置为交付组中失败计算机的百分比,并每 30 秒计算一次。 失败可能由于各种原因而发生,如 Director 控制板和筛选器视图中所示。运行 Citrix Scout 诊断以确定根本原因。有关详细信息,请参阅解决用户问题

平均登录持续时间

针对过去一小时内发生的登录的平均登录持续时间。

  • 检查 Director 控制板以获取有关登录持续时间的最新指标。在短时间内大量用户登录可能会增加登录持续时间。
  • 检查登录的基线和细分以缩小原因范围。有关详细信息,请参阅诊断用户登录问题

    智能策略条件:

    • 范围:交付组,多会话操作系统范围
    • 阈值:警告 - 45 秒,严重 - 60 秒

登录持续时间(用户)

针对过去一小时内发生的指定用户的登录持续时间。

负载评估器索引

过去 5 分钟内负载评估器索引的值。

  • 检查 Director 中可能具有峰值负载(最大负载)的多会话操作系统计算机。查看“控制板”(故障)和“趋势负载评估器索引”报告。

    智能策略条件:

    • 范围: 交付组、多会话操作系统范围
    • 阈值: 警告 - 80%,严重 - 90%

使用 Webhook 配置警报策略

除了电子邮件通知之外,您还可以使用 Webhook 配置警报策略。

注意: 此功能需要 Delivery Controller 7.11 或更高版本。

您可以使用 PowerShell cmdlet 配置带有 HTTP 回调或 HTTP POST 的警报策略。它们已扩展以支持 Webhook。

有关创建新 Octoblu 工作流和获取相应 Webhook URL 的信息,请参阅 Octoblu 开发人员中心

要为新警报策略或现有策略配置 Webhook URL,请使用以下 PowerShell cmdlet。

创建具有 Webhook URL 的新警报策略:

$policy = New-MonitorNotificationPolicy -Name <Policy name> -Description <Policy description> -Enabled $true -Webhook <Webhook URL>
<!--NeedCopy-->

将 Webhook URL 添加到现有警报策略:

Set-MonitorNotificationPolicy - Uid <Policy id> -Webhook <Webhook URL>
<!--NeedCopy-->

有关 PowerShell 命令的帮助,请使用 PowerShell 帮助,例如:

Get-Help  <Set-MonitorNotificationPolicy>
<!--NeedCopy-->

警报策略生成的通知会通过对 Webhook URL 的 POST 调用触发 Webhook。POST 消息包含 JSON 格式的通知信息:

{"NotificationId" : \<Notification Id\>,

"Target" : \<Notification Target Id\>,

"Condition" : \<Condition that was violated\>,

"Value" : \<Threshold value for the Condition\>,

"Timestamp": \<Time in UTC when notification was generated\>,

"PolicyName": \<Name of the Alert policy\>,

"Description": \<Description of the Alert policy\>,

"Scope" : \<Scope of the Alert policy\>,

"NotificationState": \<Notification state critical, warning, healthy or dismissed\>,

"Site" : \<Site name\>}
<!--NeedCopy-->

管理程序警报监控

Director 显示警报以监控管理程序运行状况。来自 XenServer® 和 VMware vSphere 的警报有助于监控管理程序参数和状态。还会监控与管理程序的连接状态,以便在群集或主机池重新启动或不可用时提供警报。

管理程序警报筛选器(/zh-cn/citrix-virtual-apps-desktops/2311/media/hypervisor_alerts_filter.png)

要接收管理程序警报,请确保在 Web Studio 中创建了托管连接。有关详细信息,请参阅连接和资源。只有这些连接会受到监控以发出管理程序警报。

一旦达到或超过阈值,就会显示这些警报。管理程序警报可以是:

  • 严重—已达到或超过管理程序警报策略的严重阈值
  • 警告—已达到或超过管理程序警报策略的警告阈值
  • 已解除—警报不再显示为活动警报

管理程序警报显示(/zh-cn/citrix-virtual-apps-desktops/2311/media/hypervisor_alerts_display.png)

此功能需要 Delivery Controller™ 7 1811 或更高版本。如果您使用的是 Director 的旧版本,但站点版本为 7 1811 或更高版本,则仅显示管理程序警报计数。要查看警报,您必须升级 Director。

下表详细描述了管理程序警报的各种参数和状态。

警报 支持的管理程序 触发条件 警报条件 警报配置
CPU 使用率 泽恩服务器,威睿 vSphere 管理程序 CPU 使用率警报阈值已达到或超出 必须在管理程序中配置警报阈值。
内存使用率 泽恩服务器,威睿 vSphere 管理程序 内存使用率警报阈值已达到或超出 必须在管理程序中配置警报阈值。
网络使用率 思杰 XenServer 虚拟化平台, 威睿 vSphere 虚拟化平台 管理程序 网络使用率警报阈值已达到或超出 必须在管理程序中配置警报阈值。
磁盘使用情况 威睿虚拟化平台 管理程序 磁盘使用情况警报阈值已达到或超出 必须在管理程序中配置警报阈值。
主机连接或电源状态 威睿虚拟化平台 管理程序 管理程序主机已重新启动或不可用 警报在 VMware vSphere 中预先构建。无需额外配置。
管理程序连接不可用 虚拟化服务器、威睿虚拟化平台 交付控制器 与管理程序(池或群集)的连接已丢失、已断电或已重新启动。只要连接不可用,此警报就会每小时生成一次。 警报是与交付控制器一同预构建的。不需要进行任何额外的配置。

注意:

有关配置警报的更多信息,请参阅 Citrix XenCenter 警报 或查看 VMware vCenter 警报文档。

电子邮件通知首选项可在 Citrix Alerts Policy > Site Policy > Hypervisor Health 下配置。Hypervisor 警报策略的阈值条件只能在 Hypervisor 中配置、编辑、禁用或删除,而不能在 Director 中进行。但是,修改电子邮件首选项和解除警报可以在 Director 中完成。如果您的角色不涉及基础架构监控,则可以禁用此警报。

重要:

  • Hypervisor 触发的警报会在 Director 中获取并显示。但是,Hypervisor 警报生命周期/状态的变化不会反映在 Director 中。
  • 在 Hypervisor 控制台中处于正常、已解除或已禁用状态的警报仍会显示在 Director 中,并且必须明确解除。
  • 在 Director 中解除的警报不会在 Hypervisor 控制台中自动解除。
警报和消息通知