このドキュメントでは、アセットの詳細メタデータに表示される「異常値検出」の計算の仕組みについて説明します。(異常値の検出は、コネクタ(Intelligence Agent)により統計情報を取得しているデータソースのアセットが対象です。)
この説明の対象ユーザー
すべてのユーザー
統計情報とは
コネクタを通じてユーザー組織内のサービス(データウェアハウスなど)で計算された統計値をカタログに統計情報として登録しています。統計情報もプロパティ(メタデータ)のひとつです。ユーザーは、アセットサイドドロワーからカラム別の統計情報を参照できます。
詳細は、以下を参照してください。アセットの統計情報について
異常値の検出について
QDICはカタログに登録された統計値を時系列で保持しています。この時系列の値を用いて、コネクタが直近で取得した値が異常値かどうかを判断しています。例えば平均値の場合、過去に算出された平均値を利用して箱ひげ図を計算し(箱ひげ図の計算には、運用者がデータ品質管理画面で設定した異常検知のウィンドウサイズ分の過去の値を利用しています。)、一番直近で取得できた平均値が、箱ひげ図の外れ値を超えたかどうかで異常値を推測してワークスペース上に表示しています。
実際に異常値であるかの判断は、ユーザー組織内のサービス(データウェアハウスなど)の実データを確認する必要があることに留意してください。
※ IQR = 第3四分位 - 第1四分位