31/01/2017

Was versteht man unter Anomalieerkennung?

Man sagt zwar „Irren ist menschlich“, aber auch Maschinen machen manchmal Fehler!
In der Industrie ist es heutzutage Alltag sich von einer korrekt funktionierenden Produktionslinie oder der guten Produktqualität zu vergewissern. Bei solchen Prozessen wird unterschiedlich geprüft, seien es nun optisch oder mit physikalischen Sensoren. Zum Beispiel wird ein Schreiner seinen neu hergestellten Stuhl auf Schleiffehler kontrollieren, während ein Hersteller von Elektrokabeln überprüfen wird, ob diese den Strom gut leiten. Beide sind auf der Suche nach möglichen Anomalien. Die korrekte Erkennung von solchen Anomalien ist also entscheidend, um die Produktqualität sicherzustellen und die Produktion zu optimieren.

 

In einer computerisierten und vernetzten Welt haben wir es hier mit der Datenverarbeitung und deren Analyse verbundenen Problemansatz zu tun. Beim Schreiner geht es darum, anhand von Fotos des Stuhles die Fehler zu entdecken. Beim Kabelhersteller werden die elektrischen Sensordaten analysiert.

Anomaly Detection

Bild: Die zentralen Elemente einer Anomalieerkennung.

 

Die automatisierte Anomalieerkennung in einem Dataset ist eine komplexe Aufgabe, die Bereiche wie maschinelles Lernen, Statistik und Data-Mining einbezieht. Die Beschaffenheit der Daten, die vorhandenen Informationen, die Art der Anomalie und das erwartete Ergebnis bestimmen die Wahl des anzuwendenden Algorithmus. Dies sind die Schlüsselelemente einer Anomalieerkennungsproblematik (siehe Abbbildung).
Was eine formalere Definition des Problemfeldes angeht, so kann diese folgendermaßen lauten: „Die Anomalieerkennung wird definiert als Suchen nach Strukturen in einem Dataset, welche sich nicht erwartungsgemäß verhalten.“ [Anomaly detection: A survey, V. Chandola, A. Banerjee, V. Kumar, 2009, p.58].

 

Praktischer ausgedrückt, handelt es sich darum zu erkennen, welche Werte unter all den Daten problematisch sind. Zum Beispiel wird ein Kreditkartenanbieter versuchen, betrügerische Transaktionen zu identifzieren. Wenn das System einen Kauf über mehrere Tausend Franken registriert, obwohl Sie gewöhnlich Ihre Karte nur benutzen, um Ihre Zugfahrkarte zu lösen, ist die Wahrscheinlichkeit hoch, dass Ihnen Ihre Karte oder Ihre persönliche Identifikationsnummer gestohlen wurde. In einem anderen Zusammenhang, wenn die Fertigungslinie eines pharmazeutischen Unternehmens ein Endgewicht einer Medikamentenkapsel feststellt, welches 20% über dem gewohnten liegt, hat sich wahrscheinlich in deren Fertigung ein Fehler eingeschlichen.

 

Die betroffenen Bereiche sind also sehr vielfältig und die Lösungswege unterscheiden sich oft. Im nächsten Artikel «Die fünf grössten Schwierigkeiten der Anomalieerkennung» unserer fünfteiligen Anomalieerkennungs-Reihe beleuchten wir die Gründe für die Komplexität des Problemfeldes der Anomalieerkennung.