Künstliche Intelligenz zur Kältemittelüberwachung
100%ige Erkennung von Leckagen ohne Gassensoren und Kältemittelmangelschalter
Der vorliegende Beitrag ist eine grundlegende Zusammenfassung von Ergebnissen einer kältetechnischen Projektarbeit zur Leckageerkennung an kältetechnischen Systemen. Die Autoren dieser wissenschaftlichen Arbeit, die im Rahmen eines Technikerstudiums entstanden ist, sind beide Mechatroniker für Kältetechnik. Aufgrund des Innovationsgrades und der komplett neu gedachten Leckageerkennung unter Vernachlässigung aller bisher bekannten Bauteile, wurde diese Projektarbeit mit dem Dr. Terwiesch Sonderpreis der Max und Gustav Born Stiftung ausgezeichnet und prämiert.
In der heutigen Zeit wird eine effiziente und umweltbewusste Denk- und Lebensweise innerhalb der Gesellschaft immer ausgeprägter und spiegelt sich somit auch in der Industrie und im Handwerk wider. In der Kältebranche äußerte es sich 2015 am stärksten durch die Verschärfung der F-Gase-Verordnung, die im Jahre 2006 verabschiedet wurde, wodurch eine künstliche Verknappung klimaschädlicher Kältemittel mit einem hohen GWP-Wert (Global Warming Potential) erzwungen wurde.* Zudem sind Betreiber von Kälteanlagen dazu verpflichtet, ihre Anlagen regelmäßig warten und auf Dichtheit prüfen zu lassen, um den Kältemittelaustritt in die Umwelt so gering wie möglich halten zu können. Deshalb soll den Kunden die Möglichkeit gegeben werden, mit Hilfe eines innovativen, intelligenten und modernen Leckageerkennungssystems ihre Bestands- oder Neuanlagen ausrüsten zu können.
Strategie zur Leckageerkennung
Im Rahmen der eingangs beschriebenen Projektarbeit wurden Tools entwickelt, die eine Kältemittelmangelerkennung mithilfe einer künstlichen Intelligenz, einer sogenannten „KI“ ermöglichen. Dieses Programm wird mit verschiedensten kältetechnischen Anlagenparametern, wie Verdampfungstemperatur, Überhitzungstemperatur, Lüfter- und Kompressorlaufzeiten etc. gespeist und „trainiert“. Im Optimalfall können – sofern eine speicherprogrammierbare Steuerung (SPS) vorhanden ist – alle Parameter direkt in eine Datenbank geloggt und auf einen externen Server übertragen werden. Falls keine SPS vorhanden sein sollte, könnte man das Tool mithilfe eines Mini-Computers auch an solchen Anlagen nutzen. Somit können potentiell alle Bestandsanlagen mit niedrigem Aufwand nachgerüstet werden.
Was ist eine künstliche Intelligenz
Künstliche Intelligenz ist mittlerweile in aller Munde, jedoch können die meisten Menschen wenig mit diesem Begriff anfangen. Es beschreibt im Grundsatz nur, dass Maschinen oder Computer eigenständige Entscheidungen anhand vorliegender Parameter treffen können. Durch Algorithmen, welche programmiert oder durch das sogenannte maschinelle Lernen erlernt wurden, können diese Entscheidungen getroffen werden. Mit einer künstlichen Intelligenz kommen wir heute immer öfter in Kontakt, sei es bei der zielgerichteten Anzeige von Werbung im Internet oder der Erkennung von Kreditkartenbetrug, wie auch bei Chat Robotern oder Spracherkennung bei Telefondiensten. Es ergeben sich immer neue Möglichkeiten, in verschiedensten Bereichen künstliche Intelligenz einzusetzen.
Bei dem Verfahren des maschinellen Lernens werden Daten gesammelt, aus denen die verschiedensten Algorithmen abweichende Strukturen und Mustern erkennen. Aufgrund der erkannten Muster kann eine Prognose oder Klassifikation auf das konkrete Problem, im vorliegenden Fall Kältemittelmangel „Ja“ oder „Nein“, getroffen werden. Das maschinelle Lernen teilt sich in drei Kategorien auf:
Zum einen das überwachte Lernen. Dieses besitzt Eingabevektoren [x] und definierte Ausgabevektoren [y] und passt daraufhin Parameter zur Ausgabegewichtung an. Ein Beispiel dafür wäre, dass Hunde oder Katzen auf einem Bild erkannt werden sollen. In diesem Fall wären „Hund“ und „Katze“ als Ausgabe definiert.
Bei dem unüberwachten Lernen gibt man nur Eingabevektoren [x] hinein und der Algorithmus versucht zu erkennen, welche Daten die größte Zusammengehörigkeit besitzen. Als Beispiel hierfür gilt die gezielte Anzeige von Werbung für einen Benutzer, auf der Grundlage in der Vergangenheit getätigter Onlineeinkäufe.
Als letztes gibt es noch die Methode des verstärkenden Lernens, oft nur „Reinforcement Learning“ genannt. Hierbei gibt es einen so genannten „Agenten“ in einem fest definiertem Umfeld, welchem verschiedenen Aktionen zur Lösung eines Problems zur Verfügung stehen. Bei Aktionen, welche näher zum Zielpunkt führten, wird der Agent über ein Punktekonto belohnt. Nicht zielführende Aktionen wirken sich negativ aus. Als Beispiel lässt sich hier ein autonom fahrender Roboter anführen.
Neuronales Netz
Der am weitesten verbreitete Algorithmus im überwachten Lernen ist das so genannte neuronale Netz. Durch die immer schneller und besser werdenden Rechenleistungen, können Muster und Strukturen in Daten in extrem kurzer Zeit erlernt werden. Der große Vorteil des neuronalen Netzes ist, dass mehrere Eingabevektoren parallel hineingegeben werden können und somit mehrere Parameter in die Ausgabe mit einfließen. Das Besondere am neuronalen Netz ist, dass es ein biologisches Vorbild besitzt. Es ist unserem menschlichen Gehirn nachempfunden. In diesem sind ebenfalls zahlreiche Neuronen miteinander verschaltet, die die verschiedenen Rechenoperationen durch Aktivierungsfunktionen ausführen.
Ein neuronales Netz setzt sich aus der Eingabeschicht, möglicherweise mehreren verborgenen Schichten und der Ausgabeschicht zusammen (Bild 1). In der Eingabeschicht werden die Inputdaten entgegengenommen. Die Anzahl der Inputdaten ist also immer gleich der Anzahl der Neuronen der Eingabeschicht. Die Input-Neuronen verarbeiten diese Informationen und geben sie gewichtet an die erste verborgene Schicht weiter, wo sie erneut gewichtet und anschließend zur nächsten Schicht weitergeleitet werden, bis die Ausgabeschicht erreicht ist. Die Verarbeitung der Information ist nur in der Eingabe- und Ausgabeschicht zu sehen, im Gegensatz zu den verborgenen Schichten (Hidden Layer). Es gibt verschieden Arten von neuronalen Netzen, die bekanntesten sind das Perceptron, Feed forward Neural Networks, Convolutional Neural Networks und Recurrent Neural Networks. Dargestellt ist das am meisten verwendete Feed Forward Neuronal Network.
Aktivierungsfunktionen haben in einem neuronalen Netzwerk eine sehr wichtige Funktion. Sie entscheiden, ob die in ein Neuron hineingegebene Information relevant ist oder nicht und legen daraufhin fest, ob das Neuron aktiviert wird oder nicht.
Damit das neuronale Netz lernt, muss es genauso wie bei unserem Gehirn einen Fehler machen, den es durch ständiges Wiederholen minimieren möchte. An diesem Punkt kommen die Optimierungsfunktionen ins Spiel, die während des sogenannten „Backpropagation Algorithmus“ angewendet werden. Dabei wird nichts anderes gemacht, als nach jeder Epoche rückwärts durch das Netzwerk zu gehen und anhand der gemachten Fehler die Gewichte der Neuronen anzupassen. Bei den meisten Optimierungsfunktionen wird das Gradientenabstiegsverfahren angewendet, um die Fehlerfunktion, auch Kostenfunktion genannt, zu minimieren. Um die Kostenfunktion zu minimieren, wird die Steigung durch die erste Ableitung der Kostenfunktion bestimmt und ein Stück Richtung Minimum gegangen. Wie weit Richtung Minimum gegangen wird, bestimmt die Lernrate, welche im Vorhinein durch den Programmierer festgelegt wird und zwischen null und eins liegen muss. Dieses Vorgehen wird nach jedem Durchlauf des neuronalen Netzes angewandt, bis die Kostenfunktion minimiert ist und bei einer Steigung von annährend null angelangt ist.
Das Problem, dass immer wieder über das Ziel hinausgeschossen wird, kann durch eine mit jedem Durchlauf kleiner werdende Lernrate gelöst werden. Am Anfang werden die Gewichte durch den großen Fehler stark beeinflusst, nach jedem Durchlauf konvergiert das Verfahren jedoch immer stärker zu einem sehr kleinen Fehler. Da neuronale Netze in der Regel nicht konvexe Funktionen besitzen, besteht die Gefahr, dass das Gradientenabstiegsverfahren nicht das globale Minimum findet, sondern in einem lokalen Minimum stagniert oder nur schwer weiter zum globalen Minimum konvergieren kann. Dieses Problem stellt spezielle Anforderungen an die Optimierungsfunktionen.
Anwendung bei der Kältemittelmangelerkennung
Im vorgestellten Projekt wurden mit den geloggten Daten mehrere Modelle mit verschiedenen Optimierungsfunktionen trainiert und ihre Ergebnisse miteinander verglichen. Während des Lernens wurde nach jeder Epoche das Modell mit noch nie gesehen Daten getestet und eine Genauigkeit berechnet. Zur Veranschaulichung wurde ein Diagramm geplottet (Bild 2), in dem auf der x-Achse die durchlaufenden Epochen und auf der y-Achse die Genauigkeit aufgetragen ist. Dort ist zu erkennen, dass zwei Modelle zu guten Ergebnissen kamen. Einmal das Model mit dem Adam Optimierer (grün), der zu einer Genauigkeit von 100% kam und einmal der RMSprop (braun), welcher zu einer Genauigkeit von 99% kam.
Um das beste Modell weiter evaluieren zu können und zu prüfen, ob man nicht im Overfitting gelandet ist, wurde im Nachhinein das Model nochmals mit unbekannten Daten getestet. Overfitting bedeutet, die Daten wurden nicht erlernt, sondern nur auswendig gelernt, was später in der endgültigen Anwendung zu einer sehr schlechten Perfomance führt. Dazu wurde eine Konfusionsmatrix geplottet (Bild 3), in der die vom Modell erstellten Prognosen aufgetragen wurden. Ein True Positiv besagt, dass ein Kältemittelmangel richtig prognostiziert wurde und ein True Negativ besagt, dass ein nicht vorhandener Kältemittelmangel richtig erkannt wurde. Bei einem False Positiv hat das Modell vorhergesagt, dass ein Kältemittelmangel vorliegt, obwohl kein Kältemittelmangel vorlag und andersherum bei einem False Negativ. Bei diesem hat das Modell prognostiziert, dass kein Kältemittelmangel vorliegt, obwohl tatsächlich ein Kältemittelmangel vorlag. Der Grafik kann entnommen werden, dass ein False Positiv von 0 und ein False Negativ von 0 vorliegt und so das Modell auch zu einer Genauigkeit von 100% und zu einer Fehlerrate von 0% kam, was in diesem Kontext sehr wichtig ist da kein Fehlalarm verursacht wurde.
Fazit
Zu der Entwicklung eines derart komplexen und intelligenten Leckageerkennungssystems mit Hilfe einer künstlichen Intelligenz lässt sich sagen, dass dieses im Vergleich zum heutigen Stand der Technik (mittels Gassensoren und Kältemittelmangelschalter) deutlich besser und zuverlässiger eingesetzt werden kann. Durch die Überprüfung des Systems mit zuvor unbekannten Daten, wurden mögliche Fehlerquellen wie das Overfitting ausgeschlossen und Fehlalarme vollständig vermieden. Zukünftig sollte das neue System jedoch noch an weiteren Anlagen getestet werden, um die Generalisierbarkeit des Erlernten von einer Anlage auf die nächste bestätigen zu können. Somit können zukünftigen Anlagenbetreibern Zeit und Kosten z.B. bei einem Fehlalarm herkömmlicher Systeme erspart bleiben. Demzufolge können sämtliche, zuvor stark fehleranfällige Bauteile, wie der Gassensor oder der Kältemittelmangelschalter, minimiert oder gänzlich überflüssig werden.
* Umweltbundesamt. 2021. Fluorierte Treibhausgase und FCKW. [Online] 18. 05 2021 //www.umweltbundesamt.de/themen/klima-energie/fluorierte-treibhausgase-fckw-0:https://www.umweltbundesamt.de/themen/klima-energie/fluorierte-treibhausgase-fckw-0 (kurz: //t1p.de/6eyh8:https://t1p.de/6eyh8)