基準値で異常検知!

デジタル化を知りたい
先生、「基準値ベース」っていうデジタル化の用語がよくわからないんですけど、教えてもらえますか?

デジタル化研究家
いいよ。「基準値ベース」は、あらかじめ決めた正常な範囲から外れた値を異常と判断する方法だよ。たとえば、工場の機械の温度がいつもは20度から25度の間なのに、30度になったら異常と判断する、といった具合だね。

デジタル化を知りたい
なるほど。じゃあ、正常な範囲はどうやって決めるんですか?

デジタル化研究家
過去のデータや、機械の仕様などを参考に決めるんだ。そして、その範囲を超えたらアラートを出すように設定しておくことで、すぐに異常に気づくことができるんだよ。
基準値ベースとは。
あらかじめ決めておいた「正常な範囲」の値を超えたら異常と判断するしくみについて説明します。
はじめに

近頃は、様々な分野で情報の活用が進んでいます。機械の調子を見守ったり、設備の整備を行ったり、はたまた事業の進め方を決めたりする時にも、情報に基づいた判断がますます大切になっています。特に、集まる情報の量が膨大になる中で、いつもと違う値をすぐに見つけることは、問題に早く気づき、効率的に対処するために欠かせません。
そこで今回は、基準値に基づいた異常検知の方法について説明します。この方法は、前もって決めておいた正常な範囲を基準にして、異常かどうかを判断するシンプルな方法です。例えば、工場の機械の温度を監視する場合、普段は20度から30度の範囲で動いているとします。この範囲を基準値として設定しておき、もし温度が35度になったら、異常と判断してアラームを鳴らすといった仕組みです。
この基準値に基づく方法は、とても分かりやすく、導入も比較的簡単です。特別な計算や複雑な設定が必要ないので、様々な場面ですぐに使い始めることができます。製造業では、機械の温度や圧力、製品の寸法などを監視するのに使われます。また、情報システムの分野では、サーバーの負荷や通信量などを監視するのにも役立ちます。さらに、普段の生活の中でも、例えば体温計で熱を測る時などは、基準値となる平熱と比べて高いか低いかで健康状態を判断しています。このように、基準値に基づいた異常検知は、身近な場面でも広く使われている、とても基本的な考え方です。
しかし、この方法はシンプルな反面、状況の変化に柔軟に対応できないという弱点もあります。例えば、季節によって正常な範囲が変わるような場合、基準値を定期的に見直す必要があります。また、常に変動する値に対しては、固定の基準値ではうまく異常を検知できないこともあります。このような場合は、より高度な異常検知の方法を検討する必要があります。
| 項目 | 内容 |
|---|---|
| 手法 | 基準値に基づいた異常検知 |
| 説明 | 予め設定した正常範囲(基準値)に基づき、データが範囲外に出た場合に異常と判断する。 |
| メリット |
|
| デメリット |
|
| 適用例 |
|
基準値の設定方法

物事の異常を数値で自動的に見つけるには、まず「普通の状態」を数値で表す必要があります。この普通の範囲をどのように決めるかが、異常を見つける精度に大きく影響します。適切な範囲を設定することで、より正確に異常を見つけられます。
普通の範囲を決める一般的な方法は、過去の数値データを使うことです。例えば、工場の機械の温度や、販売店の商品の売上のデータなどです。これらのデータから平均値や真ん中の値、データのばらつき具合などを計算し、普通の範囲を決めます。
具体的な例として、会社の事務用の計算機の処理能力を見てみましょう。過去1年間の計算機の平均処理能力が30で、ばらつきの程度が5だったとします。この場合、普通の範囲は20から40と設定できます。つまり、計算機の処理能力が20より小さかったり、40より大きかったりした場合は、異常と判断できます。
気を付けなければならないのは、データが時間や曜日によって変わる場合です。例えば、お昼時は会社の食堂の利用者が増えます。この場合、食堂の利用者数の普通の範囲は、お昼時とそれ以外の時間で別に設定する必要があります。同じように、曜日によっても変わるデータも存在します。例えば、週末はショッピングセンターの来客者数が増えます。このような場合は、曜日ごとに普通の範囲を設定する必要があります。
季節によっても変わるデータもあります。例えば、夏のアイスクリームの売上は冬よりも多くなります。アイスクリームの売上の普通の範囲は、夏と冬で別に設定する必要があります。このように、データの特徴に合わせて普通の範囲を適切に設定することで、より正確に異常を見つけることができます。
| 項目 | 説明 | 例 |
|---|---|---|
| 普通の範囲の決め方 | 過去の数値データから平均値、中央値、ばらつきなどを計算し、範囲を設定 | 平均処理能力30、ばらつき5 → 普通の範囲20〜40 |
| 時間・曜日による変動への対応 | 時間帯や曜日ごとに範囲を別々に設定 | 食堂の利用者数:お昼時とそれ以外で範囲を変える ショッピングセンターの来客者数:曜日ごとに範囲を変える |
| 季節による変動への対応 | 季節ごとに範囲を別々に設定 | アイスクリームの売上:夏と冬で範囲を変える |
基準値ベースのメリット

基準値にもとづく異常検知には、多くの利点があります。まず、分かりやすくて使いやすいことが挙げられます。複雑な計算式や手順を必要としないので、導入もスムーズに行えますし、結果の解釈も容易です。専門的な知識を持たない担当者でも、異常をすぐに把握し、適切な対応をとることができるでしょう。
次に、計算にかかる負担が少ないため、瞬時に状況を監視するのに向いています。膨大な量の情報を扱う仕組や、すぐに対応が必要な仕組では、この手軽さが大きな強みとなります。たとえば、工場の機械の稼働状況を監視する場合、リアルタイムで異常を検知することで、重大な故障や事故を未然に防ぐことが可能になります。また、ネットワークの通信量を監視する場合にも、急激な変化を即座にとらえ、対応することで、サービスの安定稼働を維持することができます。
さらに、過去の情報をもとに基準値を決めるため、それぞれの仕組や設備の特性に合わせた、的確な異常検知を行うことができます。たとえば、ある機械の温度は通常30度から35度の間で変動すると仮定します。過去のデータからこの範囲を基準値として設定しておけば、温度が36度になった場合に異常として検知し、早期の対応が可能になります。このように、基準値にもとづく異常検知は、個々の状況に合わせた柔軟な対応を可能にする、効果的な手法といえます。
| メリット | 説明 | 具体例 |
|---|---|---|
| 分かりやすくて使いやすい | 複雑な計算や手順が不要で、導入・解釈が容易。専門知識のない担当者でも理解しやすい。 | – |
| 計算にかかる負担が少ない | 瞬時の状況監視に最適。膨大な情報量や即時対応が必要なシステムに有効。 | 工場の機械稼働状況監視、ネットワーク通信量監視 |
| 過去の情報をもとに基準値を決める | システムや設備の特性に合わせた的確な異常検知が可能。 | 機械温度の異常検知(正常範囲:30~35度) |
基準値ベースのデメリット

物事の良し悪しを判断する際に、あらかじめ決めておいた値と比べるやり方には、手軽で役に立つ面がある一方で、いくつか注意すべき点もあります。まず、比べるための値を適切に決めるのが難しいことがあります。対象とするデータの性質をきちんと理解し、ふさわしい統計的な値や範囲を選ぶ必要があります。たとえば、ある製品の重さを検査する場合、平均値だけでなく、ばらつき具合も考慮する必要があるでしょう。
次に、一度決めた値は、状況の変化に対応できないことがあります。周りの環境やシステムの改良によって、データの性質が変わるかもしれません。たとえば、工場の設備を新しくしたことで、製品の品質が向上した場合、以前の基準では正常な製品でも異常と判断される可能性があります。このような変化に対応するために、基準値を定期的に見直す必要があります。
また、突然起こる異常や、少しずつ変化していく異常を見つけるのが難しいことがあります。たとえば、地震などの突発的な事象による異常や、機械の劣化による緩やかな性能低下などは、あらかじめ設定した値だけでは検知できない可能性があります。このような異常を捉えるためには、過去のデータとの比較だけでなく、データの変化の傾向にも注目する必要があります。
基準値を用いる方法は、単純で使いやすい反面、これらの欠点も理解した上で、適切な場面で使うことが大切です。状況に応じて、他の方法と組み合わせるなど、工夫が必要となるでしょう。
| メリット | デメリット | 具体例 | 対策 |
|---|---|---|---|
| 手軽で役に立つ | 適切な基準値の設定が難しい | 製品の重さ検査:平均値だけでなくばらつきも考慮する必要がある | データの性質を理解し、統計的に適切な値/範囲を選ぶ |
| 状況変化に対応できない | 工場設備更新による製品品質向上で、以前の基準では正常な製品が異常と判定される | 基準値の定期的な見直し | |
| 突発的/緩やかな異常の検知が難しい | 地震による突発的な異常、機械劣化による緩やかな性能低下 | 過去のデータ比較に加え、データの変化傾向にも注目 |
他の異常検知手法との比較

異常を捉えるには、あらかじめ決めた値を基準にする方法以外にも、様々なやり方があります。それぞれの手法には長所と短所があるので、それらを理解し、状況に応じて最適な方法を選ぶことが大切です。時には、基準値を用いる方法と他の方法を組み合わせることで、より効果的に異常を見つけることも可能です。
まず、基準値を基にする方法は、設定が簡単で分かりやすいという利点があります。しかし、あらかじめ適切な基準値を設定することが難しく、状況の変化に対応できない場合があります。例えば、季節の変化や機器の劣化などによって正常な値の範囲が変動する場合、基準値をその都度調整する必要があります。
次に、機械学習を用いる方法では、過去のたくさんのデータから異常の兆候を学び、これまで見たことのない異常も見つけることができます。これは、基準値を基にする方法では難しい、複雑な異常の検知に役立ちます。しかし、学習に大量のデータが必要で、計算に時間がかかるという欠点もあります。また、学習データに偏りがあると、正しく異常を検知できない可能性があります。
さらに、集団分けを用いる方法では、データの似た者同士をグループに分け、どのグループにも属さないものを異常と判断します。この方法は、データ全体の傾向を捉え、基準値を設定するのが難しい場合に有効です。ただし、データの性質によっては適切なグループ分けが難しく、異常を見逃したり、正常なものを異常と判断したりする可能性があります。
このように、それぞれの方法には得手不得手があります。状況に応じて、どの方法が最適かを判断することが重要です。例えば、単純な異常を検知したい場合は基準値を用いる方法が適していますし、複雑な異常を検知したい場合は機械学習を用いる方法が適しています。また、データの性質が不明な場合は、集団分けを用いる方法が有効な場合があります。
| 手法 | 長所 | 短所 | 適用例 |
|---|---|---|---|
| 基準値を用いる方法 | 設定が簡単で分かりやすい | 適切な基準値の設定が難しい 状況の変化に対応できない場合がある(季節の変化、機器の劣化など) |
単純な異常の検知 |
| 機械学習を用いる方法 | 過去のデータから異常の兆候を学習 これまで見たことのない異常も見つけることができる 複雑な異常の検知に役立つ |
学習に大量のデータが必要 計算に時間がかかる 学習データに偏りがあると、正しく検知できない可能性がある |
複雑な異常の検知 |
| 集団分けを用いる方法 | データ全体の傾向を捉える 基準値を設定するのが難しい場合に有効 |
適切なグループ分けが難しい 異常を見逃したり、正常なものを異常と判断する可能性がある |
データの性質が不明な場合 |
まとめ

今回は、あらかじめ定めた正常な値である基準値を基にして、異常を発見する手法について説明しました。この手法は、仕組みが単純で分かりやすい上に、様々な監視体制や情報分析に役立てることができます。手軽に導入でき、計算に掛かる負担が少ないことも大きな利点です。
まず、この手法を使う上で重要なのは、基準値をどのように設定するかです。基準値は、過去のデータの平均値や中央値などを用いて決めることが多いですが、データの特性をしっかり理解し、適切な値を選ぶ必要があります。例えば、季節によって変動するデータの場合、過去のデータ全体から一つの基準値を決めるのではなく、季節ごとに基準値を変えるなどの工夫が必要です。
また、周りの状況が変化した場合にも注意が必要です。システムの更新や利用者の増加などによって、データの特性が変わることもあります。このような変化に対応するために、基準値を定期的に見直したり、自動的に調整する仕組みを導入することが重要になります。
さらに、基準値に基づいた異常検知は、他の異常検知の手法と比較することで、それぞれの長所と短所を理解した上で、状況に応じて使い分ける、もしくは組み合わせることが大切です。例えば、機械学習を用いた異常検知は、基準値に基づいた手法よりも複雑な異常を捉えることができますが、導入や運用に手間が掛かります。それぞれの特性を理解し、適切な手法を選ぶ、あるいは組み合わせることで、より正確に異常を見つけ出し、安定したシステム運用や業務の効率化を実現できます。

