データ粒度と保持
データ値の集計
Monitor Serviceは、ユーザーセッションの使用状況、ユーザーログオンパフォーマンスの詳細、セッション負荷分散の詳細、接続およびマシン障害情報など、さまざまなデータを収集します。データは、そのカテゴリに応じて異なる方法で集計されます。OData Method APIを使用して提示されるデータ値の集計を理解することは、データを解釈するために不可欠です。例:
- 接続されたセッションとマシン障害は一定期間に発生します。したがって、それらは期間中の最大値として公開されます。
- ログオン期間は時間の長さを測定するものであるため、期間中の平均値として公開されます。
- ログオン数と接続障害は期間中の発生回数であるため、期間中の合計値として公開されます。
同時データ評価
セッションは、同時と見なされるためには重複している必要があります。ただし、時間間隔が1分の場合、その1分間のすべてのセッション(重複しているかどうかにかかわらず)は同時と見なされます。間隔のサイズが非常に小さいため、精度を計算するのに伴うパフォーマンスオーバーヘッドは、追加される価値に見合いません。セッションが同じ時間内に発生しても、同じ分内に発生しない場合、それらは重複しているとは見なされません。
サマリーテーブルと生データの相関
データモデルは、メトリックを2つの異なる方法で表します。
- サマリーテーブルは、分、時間、日ごとの時間粒度でメトリックの集計ビューを表します。
- 生データは、セッション、接続、アプリケーション、およびその他のオブジェクトで追跡される個々のイベントまたは現在の状態を表します。
API呼び出し間またはデータモデル自体内でデータを関連付けようとするときは、次の概念と制限を理解することが重要です。
- 部分的な間隔のサマリーデータはありません。 メトリックのサマリーは、長期間にわたる履歴トレンドのニーズを満たすように設計されています。これらのメトリックは、完全な間隔のサマリーテーブルに集計されます。データ収集の開始時(利用可能な最も古いデータ)または終了時の部分的な間隔に対するサマリーデータはありません。1日の集計(Interval=1440)を表示する場合、これは最初と最新の不完全な日にはデータがないことを意味します。これらの部分的な間隔には生データが存在する可能性がありますが、決して要約されません。特定のデータ粒度について、最も早い集計間隔と最も遅い集計間隔は、特定のサマリーテーブルからSummaryDateの最小値と最大値を抽出することで判断できます。SummaryDate列は間隔の開始を表します。Granularity列は集計データの期間の長さを表します。
- 時間による相関。 メトリックは、前述のセクションで説明されているように、完全な間隔のサマリーテーブルに集計されます。これらは履歴トレンドに使用できますが、生イベントはトレンド分析のために要約されたものよりも現在の状態をより正確に反映している可能性があります。サマリーデータと生データの時間ベースの比較を行う場合、発生する可能性のある部分的な間隔や期間の開始と終了に対するサマリーデータがないことを考慮する必要があります。
- 見逃されたイベントと潜在的なイベント。 集計テーブルに集約されるメトリックは、イベントが見逃されたり、集計期間に対して潜在的であったりする場合、わずかに不正確になる可能性があります。Monitor Serviceは正確な現在の状態を維持しようとしますが、見逃されたイベントや潜在的なイベントのために、集計テーブルの集計を再計算するために過去に遡ることはありません。
- 接続の高可用性。 接続の高可用性中、現在の接続のサマリーデータ数にギャップが生じますが、セッションインスタンスは引き続き生データで実行されます。
- データ保持期間。 サマリーテーブルのデータは、生イベントデータのスケジュールとは異なるグルーミングスケジュールで保持されます。データは、サマリーテーブルまたは生テーブルからグルーミングによって削除されたために、欠落している可能性があります。保持期間は、サマリーデータの異なる粒度によっても異なる場合があります。粒度の低いデータ(分単位)は、粒度の高いデータ(日単位)よりも迅速にグルーミングされます。グルーミングによってある粒度からデータが欠落している場合でも、より高い粒度で見つかる可能性があります。API呼び出しは要求された特定の粒度のみを返すため、ある粒度でデータが受信されないからといって、同じ期間のより高い粒度でデータが存在しないという意味ではありません。
- タイムゾーン。 メトリックはUTCタイムスタンプで保存されます。サマリーテーブルは、時間単位のタイムゾーン境界で集計されます。時間単位の境界に該当しないタイムゾーンの場合、データが集計される場所に関して多少の不一致が生じる可能性があります。
データの粒度と保持期間
Directorによって取得される集計データの粒度は、要求された時間 (T) スパンの関数です。ルールは次のとおりです。
- 0 < T <= 1時間 - 分単位の粒度を使用
- 0 < T <= 30日 - 時間単位の粒度を使用
- T > 31日 - 日単位の粒度を使用
集計データから取得されない要求データは、生のセッションおよび接続情報から取得されます。このデータは急速に増加する傾向があるため、独自のグルーミング設定があります。グルーミングにより、関連データのみが長期的に保持されます。グルーミングにより、レポートに必要な粒度を維持しながら、パフォーマンスが向上します。Premiumライセンスサイトのお客様は、グルーミング保持期間を希望の保持日数に変更できます。変更しない場合はデフォルトが使用されます。サイトデータベースとの接続が失われた場合、Monitor Serviceは以下の表に指定されているPremiumエンタイトルメントのデフォルト保持日数を使用します。
設定にアクセスするには、Delivery Controller™で次のPowerShellコマンドを実行します。
asnp Citrix.*
Get-MonitorConfiguration
Set-MonitorConfiguration -<setting name> <value>
<!--NeedCopy-->
| 設定名 | 影響を受けるグルーミング | Premiumの保持日数 | アドバンストの保持日数 | ||
|---|---|---|---|---|---|
| 1 | セッション整理保持日数 | セッション終了後のセッションおよび接続レコードの保持 | 90 | 31 | |
| 2 | 障害整理保持日数 | マシンフェイラーログおよびコネクションフェイラーログの記録 | 90 | 31 | |
| 3 | グルームロードインデックスリテンションデイズ | ロードインデックス レコード | 90 | 31 | |
| 4 | グルームデリーテッドリテンションデイズ | LifecycleStateが「Deleted」であるマシン、カタログ、デスクトップグループ、およびハイパーバイザーエンティティ。この設定は、関連するセッション、セッション詳細、概要、障害、またはロードインデックスのレコードも削除します。 | 90 | 31 | |
| 5 | サマリー整理保持日数 | デスクトップグループサマリー、障害ログサマリー、およびロードインデックスサマリーのレコード。集計データ - 日次粒度。 | 365 | 31 | |
| 6 | マシンのホットフィックスログ保持日数 | VDAおよびコントローラーマシンに適用されたホットフィックス | 90 | 31 | |
| 7 | 分単位の整理保持日数 | 集計データ - 分単位の粒度 | 3 | 3 | |
| 8 | 時間単位の整理保持日数 | 集計データ - 時間単位の粒度 | 32 | 31 | |
| 9 | アプリケーションインスタンスの整理保持日数 | アプリケーションインスタンス履歴 | 90 | 該当なし | |
| 10 | 通知ログの整理保持日数 | 通知ログレコード | 90 | 該当なし | |
| 11 | リソース使用状況生データの整理保持日数 | リソース使用率データ - 生データ | 3 | 3 | |
| 12 | リソース使用状況分単位データの整理保持日数 | リソース使用率サマリーデータ - 分単位の粒度 | 7 | 7 | |
| 13 | グルームリソースユースアワーデータリテンションデイズ | リソース使用率の概要データ - 時間単位 | 30 | 30 | |
| 14 | グルームリソースユースデイデータリテンションデイズ | リソース使用率の概要データ - 日単位 | 365 | 31 | |
| 15 | グルームプロセスユースローデータリテンションデイズ | プロセス使用率データ - 生データ | 1 | 1 | |
| 16 | データ整理プロセス使用状況分データ保持日数 | プロセス使用率データ - 分単位の粒度 | 3 | 3 | |
| 17 | データ整理プロセス使用状況時間データ保持日数 | プロセス使用率データ - 時間単位の粒度 | 7 | 7 | |
| 18 | データ整理プロセス使用状況日データ保持日数 | プロセス使用率データ - 日単位の粒度 | 30 | 30 | |
| 19 | セッションメトリクスデータ整理保持日数 | セッションメトリックデータ | 1 | 1 | |
| 20 | マシンメトリクスデータ整理保持日数 | マシンメトリックデータ | 3 | 3 | |
| 21 | マシンメトリクス日次サマリーデータ整理保持日数 | マシンメトリックサマリーデータ | 365 | 31 | |
| 22 | アプリケーションエラーの整理保持日数 | アプリケーションエラーデータ | 1 | 1 | |
| 23 | アプリケーション障害の整理保持日数 | アプリケーション障害データ | 1 | 1 | |
注意:
Monitor Serviceデータベースの値を変更した場合、新しい値を有効にするにはサービスを再起動する必要があります。Monitor Serviceデータベースへの変更は、Citrixサポートの指示の下でのみ行うことをお勧めします。
GroomProcessUsageRawDataRetentionDays、GroomResourceUsageRawDataRetentionDays、およびGroomSessionMetricsDataRetentionDaysの設定は、デフォルト値の1に制限されています。一方、GroomProcessUsageMinuteDataRetentionDaysはデフォルト値の3に制限されています。これらの値を設定するPowerShellコマンドは、プロセス使用状況データが急速に増加する傾向があるため、無効になっています。 また、ライセンスベースの保持設定は次のとおりです。
- Premiumライセンスサイト - すべての設定のグルーミング保持期間は1000日(Citrixは365日を推奨)に制限されています。
- Advancedライセンスサイト - すべての設定のグルーミング保持期間は31日に制限されています。
- その他のすべてのサイト - すべての設定のグルーミング保持期間は7日間に制限されます。
例外:
- アプリケーションインスタンスの保持日数は、Premium ライセンスサイトでのみ設定できます。
- GroomApplicationErrorsRetentionDays and GroomApplicationFaultsRetentionDays are limited to 31 days in Premium licensed sites.
データを長期間保持すると、テーブルサイズに以下の影響があります。
-
時間単位のデータ。 時間単位のデータを最大2年間データベースに保持すると、1000のデリバリーグループを持つサイトでは、データベースが次のように増加する可能性があります。
1000のデリバリーグループ x 24時間/日 x 365日/年 x 2年 = 17,520,000行のデータ。集計テーブルにこれほど大量のデータがあると、パフォーマンスへの影響は甚大です。ダッシュボードデータはこのテーブルから取得されるため、データベースサーバーへの要件は大きくなる可能性があります。過度に大量のデータは、パフォーマンスに劇的な影響を与える可能性があります。
-
セッションおよびイベントデータ。 セッションが開始され、接続/再接続が行われるたびに収集されるデータです。大規模なサイト(10万ユーザー)の場合、このデータは急速に増加します。たとえば、これらのテーブルの2年分のデータは1TBを超える可能性があり、ハイエンドのエンタープライズレベルのデータベースが必要になります。