Oriented Bounding Boxes: Eine Verfolgungsjagd des BND

Künstliche Intelligenz

Stellen Sie sich vor, Sie sitzen an ihrem Schreibtisch im Hauptquartier des BND und werden plötzlich mit der Überwachung mehrerer Länder beauftragt. Ihre Vorgesetzten interessieren sich für die Bewegung von bestimmten Fahrzeugen und den Bau von geheimen Stützpunkten in abgelegenen Gebieten.

Genauer gesagt wird von Ihnen verlangt, dass Sie diese Fahrzeuge auf Satelliten- und Drohnenbildern identifizieren. Glücklicherweise kann Sie diese Aufgabe nicht aus der Ruhe bringen. Sie haben Freunde bei HD Vision Systems, die Ihnen mit Hilfe von künstlicher Intelligenz und Oriented Bounding Boxes zur Seite stehen können.

Grundlegende Objekterkennung mit künstlicher Intelligenz

Mit dem Aufkommen von künstlicher Intelligenz ist es möglich geworden, Computern beizubringen, Informationen aus Bildern zu gewinnen. Ein potenzielles Anwendungsgebiet ist dabei die computergestützte Erkennung von Objekten, die in einem Bild zu sehen sind.

Für Computer bedeutet dies, dass sie das Bild nach Strukturen durchsuchen, die sie schon einmal gesehen haben und entsprechend mit bekannten Objekten in Verbindung bringen können. Aufbauend auf dieser Analyse treffen die Computer eine Vorhersage, welches Objekt auf dem Bild zu sehen ist.

Hier ist eine Katze zu sehen. Auch für Computer. Katzen sind cool.

Die reine Objekterkennung ist jedoch zunächst eine akademische Errungenschaft gewesen. In realen Anwendungen steht man nur selten vor dem Problem, mit einem Bild konfrontiert zu werden, das genau ein unbekanntes Objekt enthält, dessen Typ bestimmt werden soll. Die Realität sieht oft anders aus:

Gehen wir also einen Schritt weiter und nehmen an, dass sich mehrere verschiedene Objekte in einem Bild befinden, deren Typ jeweils bestimmt werden soll. Um diese Informationen später verwenden zu können, wollen wir zusätzlich wissen, wo sich jedes Objekt im Bild befindet. Dies könnte z. B. nützlich sein, um den Standort an einen Roboter zur weiteren Bearbeitung zu übermitteln.

Bounding Boxes

Eine Möglichkeit, mit mehreren Objekten in einem Bild umzugehen, besteht darin, einen Algorithmus einen Blick auf das Bild werfen zu lassen und genaue Informationen darüber zurückzugeben:

Welche Objekte in dem Bild zu sehen sind,
Wo die Objekte platziert sind,
Welche Abmessungen die Objekte haben.

Mit anderen Worten: Der Algorithmus legt einen Rahmen um jedes Objekt, eine so genannte Bounding Box, um die Ergebnisse zu markieren. Normalerweise wird zusätzlich die Art des Objekts, das sogenannte Label, vorhergesagt.

Auch bei dieser Aufgabe analysieren Computer zunächst die Strukturen des Bildes und ordnen sie bekannten Objekten zu. Nur werden in diesem Fall verschieden Teile des Bildes separat betrachtet, wodurch es möglich ist mehrere Objekte zu erkennen. Anschließend werden die gefundenen Objekte nicht nur identifiziert, sondern auch ihre genaue Lage und Größe vorhergesagt.

Hier ist immer noch eine Katze zu sehen. Es ist auch offensichtlich wo die Katze in dem Bild zu sehen ist. Und zwar nicht nur für uns, sondern auch für unseren Computer.

Der BND ist begeistert. Sie haben die entsprechenden Fahrzeuge identifiziert.

Doch Sie sind zu erfolgreich gewesen. Sie haben zwar gedacht, dass Sie dem BND mehr Daten gegeben haben, als er jemals nutzen könnte, aber jetzt will er auch noch wissen, in welche Richtung sich die Fahrzeuge bewegen.

Kann man das schaffen?

Bounding Boxes mit Orientierung und Richtung

Es ist nun also möglich zu erkennen, was sich wo in einem Bild befindet.

Für den nächsten Schritt kann man an das Satellitenbild eines Parkplatzes denken: Auf diesem Parkplatz sind die Fahrzeuge in verschiedenen Ausrichtungen geparkt, von denen keine mit der Ausrichtung übereinstimmt, in der das Bild aufgenommen wurde. Das bedeutet, dass wir zwar eine gute Vorstellung von dem Ort haben, an dem die Fahrzeuge geparkt sind, aber die Maße, die wir erhalten haben, entsprechen nicht den Abmessungen der Fahrzeuge.

Um das Ergebnis weiter zu verbessern, erkennen wir nicht nur die Bounding Boxes, sondern auch ihre Ausrichtung. Auf diese Weise können die Bounding Boxes so gedreht werden, dass sie mit der Ausrichtung des erkannten Objekts übereinstimmen und somit nur das Objekt und so wenig Raum wie möglich um dieses herum umfassen. Folglich erkennen wir sogenannte orientierte oder minimale Bounding Boxes.

Jetzt dreht die Katze durch. Aber das ist egal, jeder liebt Katzen. Selbst unserem Computer ist es egal. Er akzeptiert das Verhalten der Katze und kann immer noch nicht nur sagen wo die Katze ist, sondern auch wo sie hinschaut.

Für den letzten Schritt verlassen die Fahrzeuge die Parklücke und fahren auf einer Landstraße. Vom Straßenrand aus gesehen wäre es klar, in welche Richtung die Autos fahren. Aber da steht nun mal niemand.

Ein Auto hat aber auch eine klar definierte Front und ein klar definiertes Heck. Und daraus lässt sich in der Regel bestimmen, in welche Richtung das Auto fährt. Insbesondere auf einer Landstraße.

Auch auf diese letzte Information kann man mit scheinbar einfachen Änderungen am Algorithmus schließen. Man muss nur eine weitere Vorhersage zu den bereits vorhandenen hinzufügen (Ort, Dimension, Bezeichnung). Diese letzte Vorhersage gibt entweder nur die Ausrichtung des Objekts oder seine Richtung an.

Der Algorithmus kann nun die Richtung von Objekten in einem Bild bestimmen – wenn ein Objekt eine Orientierung haben kann.

Insgesamt können wir mit orientierten Begrenzungsrahmen sagen, was in einem Bild sichtbar ist, wo sich diese Objekte befinden, wie sie ausgerichtet sind und auf welche Seite des Rahmens die Oberseite des Objekts blickt.

Sie haben erfolgreich geliefert. Ihre Vorgesetzten sind zufrieden.

Sie dürfen morgen wieder kommen, um sich neuen Herausforderungen beim BND zu stellen.

In der sich rasant entwickelnden Welt der industriellen Automatisierung ist eine zuverlässige und flexible Objekterkennung ein Grundpfeiler für Vision-Guided Robotics (VGR) und Qualitätssicherung. Bei HD Vision Systems ist es unsere Mission, die Grenzen des Möglichen in der Automatisierung neu zu definieren. Als Vision-Partner auf der Bosch Rexroth CtrlX-Plattform bringen wir modernste Bildverarbeitungstechnologie durch leistungsstarke Apps auf den Fabrikboden, die Konnektivität vereinfachen und die Leistung verbessern.

Pattern Matching: Ein traditioneller Ansatz

Eine der häufigsten Fragen beim Entwurf von Automatisierungslösungen ist, ob traditionelle Pattern-Matching-Techniken oder moderne KI-basierte Objekterkennung verwendet werden sollen. Pattern Matching ist regelbasiert und nutzt manuell definierte Vorlagen oder geometrische Formen zur Objekterkennung. Obwohl es lange ein fester Bestandteil klassischer Bildverarbeitung war, stößt es unter realen Bedingungen oft an seine Grenzen. Änderungen in Beleuchtung, Ausrichtung, Maßstab oder selbst kleine Verdeckungen können zu Erkennungsfehlern führen. Zudem ist die Einrichtung aufwändig, erfordert Expertenwissen und lässt sich nur schwer an Veränderungen in der Produktionslinie anpassen.

Deep Learning: Intelligent und anpassungsfähig

Im Gegensatz dazu nutzt die KI-basierte Objekterkennung datengetriebene Modelle, die auf großen und vielfältigen Datensätzen trainiert wurden. Diese Modelle erkennen Objekte anhand abstrakter Muster und sind dadurch wesentlich robuster und flexibler. Sie kommen mit unterschiedlichsten Abweichungen und Unregelmäßigkeiten in industriellen Umgebungen zurecht. Mithilfe von Transfer Learning und Datenaugmentation lassen sich Modelle zudem schnell auf neue Objekte oder Bedingungen anpassen – ganz ohne komplexes Regelwerk.

Integrierte KI auf CtrlX

Wir bei HD Vision Systems setzen konsequent auf diesen modernen Ansatz und haben ihn direkt in die Bosch Rexroth CtrlX-Plattform integriert. Unsere Apps ermöglichen den Anschluss von Standard-Industriekameras gemäß dem GenICam-Standard via Ethernet. Die aufgenommenen Bilder werden von KI-Modellen direkt im CtrlX-Ökosystem verarbeitet. Die Ergebnisse sind nicht nur präzise, sondern werden auch automatisch aus 2D-Bildkoordinaten in 3D-Weltkoordinaten überführt – entscheidend für präzise Roboterführung und Qualitätssicherung.

Vor-Ort-Training und Individualisierung

Neben vortrainierten Modellen bieten wir Frameworks an, mit denen Nutzer eigene Bilddaten annotieren und individuelle Objekterkennungsnetzwerke trainieren können – komplett vor Ort, ohne Daten in die Cloud zu senden. So behalten Sie die volle Kontrolle über Datenschutz und Datensicherheit. Integratoren und Endanwender können so hochspezialisierte Erkennungslösungen entwickeln – exakt zugeschnitten auf ihre Anwendung.

Zukunftsausblick: KI für moderne Fertigung

Pattern Matching hatte seine Zeit, aber die zunehmende Komplexität moderner Fertigungsprozesse verlangt intelligentere, flexiblere Systeme. Deep Learning liefert genau das. Mit den fortschrittlichen Vision-Tools von HD Vision Systems und der Modularität der Bosch Rexroth CtrlX-Plattform stehen Herstellern leistungsstarke Objekterkennungslösungen zur Verfügung, die mit ihren Anforderungen wachsen.

Egal ob Nachrüstung bestehender Anlagen oder Neuplanung – jetzt ist der richtige Zeitpunkt, die Kraft KI-gesteuerter Bildverarbeitung zu nutzen. Wir freuen uns, Sie dabei zu begleiten.

Suche

Social Media

Continue reading:

5 Schritte zur Einführung von KI in der Produktion

von HD Vision Systems | 20. Jan. 2022 | Künstliche Intelligenz

Das Feld der Künstlichen Intelligenz ist ein wichtiger Baustein für viele Unternehmen und der gesamten deutschen Wirtschaft, um international wettbewerbsfähig zu bleiben. KI bietet Unternehmen die...

Inferenz in der Künstlichen Intelligenz – Praxiseinsatz für neuronale Netze

von HD Vision Systems | 9. Dez. 2021 | Künstliche Intelligenz

Sollen neuronale Netze in einer produktiven Umgebung eingesetzt werden, gilt es, diese mithilfe der sog. Inferenz in eine praxistaugliche Form zu gießen und anzuwenden. Doch zunächst: Woran erkennen...

Wie Unternehmen durch KI noch erfolgreicher werden können

von HD Vision Systems | 23. Sep. 2021 | Künstliche Intelligenz

Kaum ein Thema ist in der Forschung derzeit so wichtig wie Künstliche Intelligenz. Was vor zehn Jahren noch nach Science-Fiction klang, ist längst Realität geworden. Roboter erledigen Aufgaben...

« Ältere Einträge

Oriented Bounding Boxes: Eine Verfolgungsjagd des BND

Grundlegende Objekterkennung mit künstlicher Intelligenz

Bounding Boxes

Bounding Boxes mit Orientierung und Richtung

Pattern Matching: Ein traditioneller Ansatz

Deep Learning: Intelligent und anpassungsfähig

Integrierte KI auf CtrlX

Vor-Ort-Training und Individualisierung

Zukunftsausblick: KI für moderne Fertigung

Suche

Kategorien

Social Media

Archiv

Meta

Continue reading:

5 Schritte zur Einführung von KI in der Produktion

Inferenz in der Künstlichen Intelligenz – Praxiseinsatz für neuronale Netze

Wie Unternehmen durch KI noch erfolgreicher werden können

Produkte

Technologie

Kundenservice

Ressourcen

Über uns

Produkte

Technologie

Kundenservice

Ressourcen

Über uns