+49 6221 672 19-00 info@hdvisionsystems.com

Robotern das Sehen beibringen

Kinderleicht und doch unglaublich schwer lautet das Motto. Maschinen erlangen durch Bildverarbeitungssysteme die Fähigkeit zu sehen. Allerdings benötigt es mehr als nur ein Vision-System, um Objekte zu identifizieren und zu verstehen.

Ein Roboter fährt über eine Kiste mit bunten Bauklötzen in verschiedenen Formen und greift zielstrebig nach einem roten Quadrat und legt es neben der Kiste ab. Dieses Szenario erscheint Menschen denkbar einfach. Ein Roboter-Programmierer steht hier allerdings vor großen Herausforderungen. Der Griff in die Kiste zählt zu den schwierigsten Aufgabenstellungen in der Robotik. Dabei bereiten nicht das Greifen und Ablegen Probleme, sondern das Erkennen der unsortierten Objekte. 

 

Definition von Sehen

Wahrnehmen. So definiert der Duden den Begriff Sehen. Aber wie soll eine Maschine, der dieses Sinnesorgan fehlt, etwas wahrnehmen? Wie bereits erwähnt, sind Bildverarbeitungssysteme die Lösung. Diese funktionieren ähnlich wie das menschliche Sehen, da sowohl der Mensch als auch eine Maschine ein Objekt nicht selbst sehen.

Beide „Augen“ – das menschliche und das technische ­­– nehmen lediglich Reflexionen wahr, die ein Objekt zurückwirft. Beim Menschen sind hierfür Iris, Pupille und Netzhaut zuständig. Das Auge bündelt Licht, fokussiert und bildet Farben ab. Zum Schluss werden alle Information an das Gehirn weitergeleitet. Bei einer Maschine übernehmen diese Aufgaben Kameras, Blenden, Kabel und Recheneinheiten.

Trotz dieser vielen Ähnlichkeiten existieren doch große Unterschiede zwischen menschlichem und technischem Sehen. Der größte Unterschied liegt im Verstehen und der Interpretation der Bildinformationen. Ein Mensch lernt im Laufe seines Lebens die Bedeutung von Objekten sowie Situationen einzuschätzen und zu filtern. Bildverarbeitungssysteme hingegen identifizieren Objekte nur korrekt, wenn diese im Vorfeld programmiert oder antrainiert wurden. Ein Beispiel um dies zu verdeutlichen: Kleinkinder können Bananen und Äpfel oder Pferde und Kühe ohne Probleme voneinander unterschieden.

Ein technisches System hingegen muss für die unterschiedlichen Aufgabe angepasst sein, um unterschiedliche Obstsorten oder Tiere voneinander unterscheiden zu können. Dafür müssen Programmierer bereits im Vorfeld wissen, was ein System später zu leisten im Stande sein muss. 

 

Wie kann eine Maschine letztendlich Objekte wahrnehmen?

Deep Learning und Neuronale Netze ermöglichen die Klassifizierung von Bildern. So erzielen Standardanwendungen gute Ergebnisse. Um dies zu erreichen, benötigen Bildverarbeitungssysteme eine große Menge an Bildmaterial. Häufig ist vor allem von fehlerhaften Objekten nicht genügend Lernmaterial vorhanden. Zudem ist es sinnvoll, nicht nur die gewonnenen Informationen bezüglich des Griffpunkts aus dem Bild zu entnehmen.

Es ist auch wichtig, sich Gedanken darüber zu machen, welche Handlungen sich aus diesen Informationen für den Roboter ergeben. Wenn beispielsweise ein Bauteil in verschobener Position beim Roboter ankommt, der Griffpunkt also etwas verändert ist, muss dieser die Situation erkennen, damit das Bauteil richtig gegriffen und im weiteren Verlauf richtig positioniert werden kann. 

 

Deep Learning erweitert den bisherigen Anwendungsbereich

Durch die Kombination von Deep Learning und Mobilität ergeben sich neue Anwendungsfelder: von der roboterbasierten Ernte bis hin zu Anwendungen im Pflegebereich. Ein weiteres großes Zukunftsgebiet ist Embedded Vision. Dies beschreibt die direkte Einbettung von Bildverarbeitung in die Endgeräte und wird beispielsweise beim autonomen Fahren benötigt. 

 

Hilfestellung durch Cloud-Systeme

All diese Gebiete erfordern von der Bildverarbeitung eine hohe Rechenkapazität. In Zukunft werden hier hauptsächlich Edge- und Cloud Computing-Konzepte eine Rolle spielen. Wenn Bildverarbeitungssysteme direkt aus der Produktionsanlage mit Cloud-Systemen verbunden sind, ergeben sich einige Vorteile:

  1. Logistik-ERP-Module können direkt Nachbestellungen anstoßen oder Ergebnisse aus der Qualitätssicherung transparent als Statistik in der Cloud sammeln und auswerten.
  2. Flexible Skalierbarkeit, die bei Bedarf jederzeit eine zusätzliche Speicherkapazität oder eine größere Rechenkapazität ermöglicht.
  3. Höhere Kosteneffizienz, da Nutzer nur für tatsächlich benötigte Ressourcen zahlen.
  4. Seriöse Cloud-Dienstleister bieten hochverfügbare, geclusterte Rechenzentren an, wodurch ein hohes Maß an Ausfallsicherheit gewährleistet ist.

All diese Herausforderungen zeigen, dass das menschliche Sehen und Urteilsvermögen dem technischen Sehen noch immer etwas voraus sind. Der Griff in die Kiste entwickelt sich jedoch durch Deep Learning und die Cloud immer weiter und verbessert sich stetig. Das menschliche Auge kann Sensoren zwar noch nicht vollständig ersetzen, aber durch Anpassungen und Training lassen sich sehr gute Ergebnisse erzielen. Zudem erfüllt ein Vision-System höchste Qualitätsansprüche, da ein Roboter 24/7 arbeiten kann und unterstützt so die Unternehmen produktiver und wettbewerbsfähiger zu sein.

In der sich rasant entwickelnden Welt der industriellen Automatisierung ist eine zuverlässige und flexible Objekterkennung ein Grundpfeiler für Vision-Guided Robotics (VGR) und Qualitätssicherung. Bei HD Vision Systems ist es unsere Mission, die Grenzen des Möglichen in der Automatisierung neu zu definieren. Als Vision-Partner auf der Bosch Rexroth CtrlX-Plattform bringen wir modernste Bildverarbeitungstechnologie durch leistungsstarke Apps auf den Fabrikboden, die Konnektivität vereinfachen und die Leistung verbessern.

Pattern Matching: Ein traditioneller Ansatz

Eine der häufigsten Fragen beim Entwurf von Automatisierungslösungen ist, ob traditionelle Pattern-Matching-Techniken oder moderne KI-basierte Objekterkennung verwendet werden sollen. Pattern Matching ist regelbasiert und nutzt manuell definierte Vorlagen oder geometrische Formen zur Objekterkennung. Obwohl es lange ein fester Bestandteil klassischer Bildverarbeitung war, stößt es unter realen Bedingungen oft an seine Grenzen. Änderungen in Beleuchtung, Ausrichtung, Maßstab oder selbst kleine Verdeckungen können zu Erkennungsfehlern führen. Zudem ist die Einrichtung aufwändig, erfordert Expertenwissen und lässt sich nur schwer an Veränderungen in der Produktionslinie anpassen.

Deep Learning: Intelligent und anpassungsfähig

Im Gegensatz dazu nutzt die KI-basierte Objekterkennung datengetriebene Modelle, die auf großen und vielfältigen Datensätzen trainiert wurden. Diese Modelle erkennen Objekte anhand abstrakter Muster und sind dadurch wesentlich robuster und flexibler. Sie kommen mit unterschiedlichsten Abweichungen und Unregelmäßigkeiten in industriellen Umgebungen zurecht. Mithilfe von Transfer Learning und Datenaugmentation lassen sich Modelle zudem schnell auf neue Objekte oder Bedingungen anpassen – ganz ohne komplexes Regelwerk.

Integrierte KI auf CtrlX

Wir bei HD Vision Systems setzen konsequent auf diesen modernen Ansatz und haben ihn direkt in die Bosch Rexroth CtrlX-Plattform integriert. Unsere Apps ermöglichen den Anschluss von Standard-Industriekameras gemäß dem GenICam-Standard via Ethernet. Die aufgenommenen Bilder werden von KI-Modellen direkt im CtrlX-Ökosystem verarbeitet. Die Ergebnisse sind nicht nur präzise, sondern werden auch automatisch aus 2D-Bildkoordinaten in 3D-Weltkoordinaten überführt – entscheidend für präzise Roboterführung und Qualitätssicherung.

Vor-Ort-Training und Individualisierung

Neben vortrainierten Modellen bieten wir Frameworks an, mit denen Nutzer eigene Bilddaten annotieren und individuelle Objekterkennungsnetzwerke trainieren können – komplett vor Ort, ohne Daten in die Cloud zu senden. So behalten Sie die volle Kontrolle über Datenschutz und Datensicherheit. Integratoren und Endanwender können so hochspezialisierte Erkennungslösungen entwickeln – exakt zugeschnitten auf ihre Anwendung.

Zukunftsausblick: KI für moderne Fertigung

Pattern Matching hatte seine Zeit, aber die zunehmende Komplexität moderner Fertigungsprozesse verlangt intelligentere, flexiblere Systeme. Deep Learning liefert genau das. Mit den fortschrittlichen Vision-Tools von HD Vision Systems und der Modularität der Bosch Rexroth CtrlX-Plattform stehen Herstellern leistungsstarke Objekterkennungslösungen zur Verfügung, die mit ihren Anforderungen wachsen.

Egal ob Nachrüstung bestehender Anlagen oder Neuplanung – jetzt ist der richtige Zeitpunkt, die Kraft KI-gesteuerter Bildverarbeitung zu nutzen. Wir freuen uns, Sie dabei zu begleiten.

Continue reading:

Share This