Immer öfter findet Künstliche Intelligenz (KI) Eingang in die Produktionshallen der Industrie – verspricht sie doch eine schnelle und einfache Automatisierung komplexer Aufgaben. Regelmäßig hört man dabei die Begriffe Machine Learning oder Deep Learning. Wir schaffen Klarheit zwischen den Begriffen – und zeigen in Zusammenarbeit mit unserem KI-Experten Wolfgang Andris, worauf es in der Bildverarbeitung dabei ankommt.  

Künstliche Intelligenz, Machine Learning, Deep Learning – diese drei präzise voneinander abzugrenzen, fällt selbst gestandenen Experten nicht immer leicht. In diesem Artikel möchten wir anhand ihrer Unterschiede zeigen, wie diese in der industriellen Bildverarbeitung sinnvoll eingesetzt werden können.

 

Sammelbegriff KI

Die übergreifende Kategorie für vielfältigste intelligente Anwendungen und Funktionen bildet heute der Begriff „Künstliche Intelligenz“ (Artificial Intelligence). KI bezeichnet entsprechend den Versuch, die menschliche Entscheidungsfähigkeit künstlich nachzuahmen. Dahinter stecken aufwändige und komplexe Algorithmen, die durch zahlreiche Abhängigkeiten und Abwägungen in der Lage sind, selbstständig vorgegebene Probleme zu lösen.

Auch mit klassischer Bildverarbeitung kann eine künstliche Intelligenz realisiert werden. Für eine einfache Prüfaufgabe kann ein solches System z.B. eine Kreisform erkennen und ihren Durchmesser berechnen. Wenn sich dieser nicht innerhalb einer vorgegebenen Toleranz befindet, wird das Werkstück anschließend aussortiert. Das System trifft also intelligente Entscheidungen – auf Basis klassischer Bildverarbeitungsalgorithmen.

Kreisdoagramm, das die Beziehungen zwischen Künstlicher Intelligenz, Machine Learning und Deep Learning aufzeigt

Künstliche Intelligenzen im Vergleich

 

Klassifizierungsaufgaben mit Machine Learning lösen

Für Klassifizierungsaufgaben können diese Methoden der klassischen Bildverarbeitung mit solchen des Machine Learnings ergänzt werden. Darunter fallen beispielsweise Support Vector Machines, ein Verfahren zur Mustererkennung. In der Praxis setzen Entwickler dafür zunächst sog. „hand crafted features“ ein; das sind einzelne Merkmale des Bildes, die über klassische Bildverarbeitungsalgorithmen berechnet werden. Erst im Anschluss tritt Machine Learning auf den Plan und verwertet diese Features zu einer berechneten Entscheidung.

Diese Machine Learning-Techniken nutzen folglich die Daten aus einer zuvor erfolgten klassischen Bildverarbeitung, um darauf im Anschluss Techniken des maschinellen Lernens anzuwenden. Das ursprünglich aufgenommene Bild benötigen diese Art Machine Learning-Algorithmen nicht, sie basieren lediglich auf den Zwischenergebnissen der Bildverarbeitung. Erst mit diesem Wissen treffen die dahinterstehenden Algorithmen die richtigen Entscheidungen.

 

Deep Learning für fortgeschrittene Erkennungsleistung

Zur relevantesten Form Künstlicher Intelligenz ist in jüngster Zeit allerdings Deep Learning avanciert. Dieses „tiefgehende Lernen“ soll der menschlichen Intelligenz stärker als vorherige Konzepte ähneln: Algorithmen gewichten und bewerten eingehende Daten über unzählige Parameter, die vielfach verbunden sind. Dieses Geflecht wird gerne mit den Nerven-Verbindungen im menschlichen Gehirn assoziiert – daher spricht man auch von neuronalen Netzen.

Kommen neuronale Netze und Deep Learning zum Einsatz, kommen nahezu keine klassischen Bildverarbeitungsalgorithmen zur Verwendung. Stattdessen greifen Deep Learning-Algorithmen fast direkt auf Rohdaten aus der Kamera zu. Je nach Aufgabenstellung durchlaufen diese noch ein sogenanntes Preprocessing: Etwa zur Unterteilung einer Aufnahme in verschiedene Abschnitte, um einzelne relevante Stellen aufzuzeigen. Fehler und Abweichungen auf den Bilddaten erkennt ein neuronales Netz zuverlässig. Zusätzlich erlernt es selbstständig, ab welchem Grad Werkstücke defekt sind – und arbeitet dabei genauer als viele menschlichen Prüfer.

Außerdem ist eine Deep Learning-gestützte Bildverarbeitung in der Lage, harmlosen Schmutz von Defekten zu unterscheiden. So lässt sich die Anzahl der Falsch Positiven effektiv zuverlässig minimieren. Es zeigt sich: Wo klassische Ansätze der Bildverarbeitung versagen würden, erweitern neuronale Netze den Bereich des Möglichen. Auf diese Weise lassen sich auch Aufgaben lösen, die mit klassischen Methoden undenkbar wären.

Damit setzen Deep Learning und neuronale Netze den derzeitigen Branchenstandard in der intelligenten Automatisierung komplexer Aufgaben. Für die industrielle Bildverarbeitung ergeben sich so neue, spannende Möglichkeiten in der Erkennung und Inspektion von Werkstücken.