Damit Roboter erkennen, was sie visuell erfassen

21.03.2023

Ein Beitrag von Pressemitteilung

KI-Forscher Enrico Motta spricht bei Vortragsreihe zur Ko-Konstruktion

?Roboter, die in der realen Welt eingesetzt werden, ben?tigen eine ausgefeilte visuelle Intelligenz, um sich in der Fülle der Situationen zurechtzufinden, denen sie begegnen k?nnen.“ Das sagt der Informatiker Prof. Dr. Enrico Motta vom Knowledge Media Institute (KMi) der Open University in Gro?britannien. Die dominierenden Deep-Learning-Methoden reichen dafür nicht aus. Wie sich visuelle Intelligenz durch Kombination mit anderen Komponenten der Künstlichen Intelligenz verbessern kann, erl?utert Motta am kommenden Donnerstag, 23. M?rz, ab 16 Uhr in der Reihe ?Co-Constructing Intelligence“ (Ko-Konstruktion von Intelligenz), einem Angebot der Universit?ten Bielefeld, Bremen und Paderborn.

?Ein visuell intelligenter Roboter muss mindestens in der Lage sein, den Inhalt seiner Beobachtungen zu erkennen“, sagt Enrico Motta. Die Objekterkennung erfolgt typischerweise mit Methoden des Deep Learning (DL). 360直播吧 stellen den De-facto-Standard für verschiedene Aufgaben der Künstlichen Intelligenz dar, darunter Bild- und Spracherkennung.

Aktuelle Technologie auf gro?e Datenmengen angewiesen

?Doch trotz der gro?en Erfolge bei diesen und anderen Leistungsvergleichen schneiden DL-Architekturen aus kognitiver Sicht im Vergleich zu menschlichen F?higkeiten immer noch schlecht ab, sowohl in Bezug auf die Effizienz als auch auf die Erkenntnisgewinnung“, sagt Enrico Motta. Mit Blick auf Effizienz seien DL-Methoden bekannterma?en sehr datenhungrig, w?hrend Menschen in der Lage seien, selbst aus einem einzigen Beispiel zu lernen und zu verallgemeinern.

Hinzu kommt: Aus erkenntnistheoretischer Sicht haben Menschen den Maschinen voraus, dass sie das Gesehene verstehen k?nnen, obwohl ein Objekt typische Eigenschaften vermissen l?sst. ?Aus erkenntnistheoretischer Sicht besteht ein Schlüsselaspekt des menschlichen Lernens darin, dass es weit über die Mustererkennung hinausgeht. Menschen lernen Konzepte – nicht nur Muster. 360直播吧 k?nnen daher Beispiele dieser Konzepte erkennen, selbst wenn wichtige Merkmale fehlen“, so Motta. Das gelte zum Beispiel für ein Auto, von dem alle R?der abmontiert wurden oder die Darstellung eines rosa Elefanten in einem Tutu. Diese F?higkeit vermeide die ?Brüchigkeit“, die für DL-Methoden wie auch für andere Arten von KI-Systemen typisch ist.

Schw?chen von Deep Learning mit zus?tzlichen Technologien ausgleichen

Um Roboter mit visueller Intelligenz auszustatten, arbeiten Enrico Motta und sein Team an hybriden Computerarchitekturen, die DL-Methoden mit anderen KI-Komponenten kombinieren. In seinem Vortrag stellt Motta seine aktuelle Forschung dazu vor. ?Wir haben eine hybride Architektur entwickelt – sie erg?nzt einen Deep-Learning-Ansatz mit einer Vielzahl von Komponenten zum logischen Denken aus der Kognitionswissenschaft, um eine neue Klasse von visuell intelligenten Robotern zu entwickeln.“

?Enrico Motta geh?rt zu den international führenden Wissenschaftler*innen zu Wissensrepr?sentation und -management und semantischen Technologien“, sagt Prof. Dr. Philipp Cimiano, Leiter der Arbeitsgruppe Semantische Datenbanken an der Universit?t Bielefeld, der den Vortrag mit organisiert. ?Seine Forschung liefert weitreichende Impulse dazu, wie Roboter und andere KI-Systeme Beobachtungen semantisch interpretieren k?nnen, indem sie sich nicht nur auf die beobachteten Merkmale, sondern auch auf ihr Hintergrundwissen verlassen. Dadurch k?nnen Roboter besser generalisieren und von konkreten Situationen und Beobachtungen abstrahieren, um besser ihr Wissen auf unbekannte Situationen zu übertragen.“

Prof. Dr. Enrico Motta ist Professor für Wissenstechnologien an der Open University mit Sitz in Milton Keynes, Gro?britannien. Dort leitet er die Forschungsgruppe Intelligente Systeme und Datenwissenschaft am Knowledge Media Institute (KMI), dessen Direktor er von 2002 bis 2007 war. Er hat au?erdem eine Professur am Fachbereich Informationswissenschaft und Medienwissenschaft der Universit?t Bergen in Norwegen. In seiner Forschung besch?ftigt er sich mit der Integration und Modellierung gro?er Datenmengen, semantischen und sprachlichen Technologien, intelligenten Systemen und Robotik sowie Mensch-Maschine-Interaktion.

Vortragsreihe dazu, wie die Umwelt gemeinsam interpretiert wird

Der Vortrag tr?gt den Titel ?A Hybrid Approach to Enabling Visual Intelligence in Robots“. Er ist Teil der Vortragsreihe ?Co-Constructing Intelligence“. Für die Reihe kooperieren die Universit?ten Bielefeld, Bremen und Paderborn. Philipp Cimiano organisiert die neue Vortragsreihe unter anderem mit der Bielefelder Informatikerin Prof. Dr.-Ing. Britta Wrede, dem Bremer Informatiker Prof. Dr. Michael Beetz und der Paderborner Linguistin Prof. Dr. Katharina Rohlfing. Die Vortragsreihe ist ein Angebot einer gemeinsamen Forschungsinitiative der drei Universit?ten. Der Zusammenschluss nutzt das Prinzip der Ko-Konstruktion, um das Verst?ndnis und die F?higkeiten von Robotern an die von Menschen anzupassen. Die Forschenden arbeiten so an der Basis für eine flexible und sinnhafte Interaktion von Robotern mit Menschen im Alltag. Der Begriff Ko-Konstruktion bezieht sich darauf, dass die Interpretation der Umwelt und die Ausführung von Handlungen in Zusammenarbeit erfolgen.

Weitere Informationen:

Link zum Onlinevortrag (keine Anmeldung erforderlich)
Hinweise zum Vortrag auf Website des Instituts JAII
?Maschinen beibringen, wie Menschen zu denken“ (Pressemitteilung vom 16. Januar 2023)

Kontakt:

Prof. Dr. Philipp Cimiano, Universit?t Bielefeld

Technische Fakult?t

Telefon: 0521 106-12249

E-Mail: cimiano(at)techfak.uni-bielefeld(dot)de