Hybride KI-gestützte Computer Vision kombiniert Physik und Big Data – ScienceDaily


Forscher der UCLA und des United States Army Research Laboratory haben einen neuen Ansatz zur Verbesserung künstlicher Intelligenz-gestützter Computer-Vision-Technologien entwickelt, indem sie datengesteuerte Techniken um physikbasiertes Bewusstsein ergänzen.

Veröffentlicht in Naturmaschinenintelligenz, Die Studie bot einen Überblick über eine Hybridmethodik, die darauf abzielt, die Art und Weise zu verbessern, wie KI-basierte Maschinen ihre Umgebung in Echtzeit wahrnehmen, interagieren und darauf reagieren – beispielsweise wie sich autonome Fahrzeuge bewegen und manövrieren oder wie Roboter die verbesserte Technologie nutzen, um Präzision auszuführen Aktionen.

Computer Vision ermöglicht es KIs, ihre Umgebung zu sehen und zu verstehen, indem sie Daten dekodieren und aus Bildern auf Eigenschaften der physischen Welt schließen. Während solche Bilder durch die Physik des Lichts und der Mechanik entstehen, konzentrieren sich traditionelle Computer-Vision-Techniken überwiegend auf datenbasiertes maschinelles Lernen, um die Leistung zu steigern. Die physikalische Forschung wurde in einem separaten Bereich entwickelt, um die verschiedenen physikalischen Prinzipien zu erforschen, die hinter vielen Herausforderungen im Bereich Computer Vision stehen.

Es war eine Herausforderung, ein Verständnis der Physik – der Gesetze, die Masse, Bewegung und mehr regeln – in die Entwicklung neuronaler Netze zu integrieren, in denen KIs dem menschlichen Gehirn nachempfunden sind und Milliarden von Knoten haben, um riesige Bilddatensätze zu verarbeiten, bis sie funktionieren ein Verständnis dafür gewinnen, was sie „sehen“. Mittlerweile gibt es jedoch einige vielversprechende Forschungslinien, die darauf abzielen, Elemente des Physikbewusstseins in bereits robuste datengesteuerte Netzwerke einzubauen.

Die UCLA-Studie zielt darauf ab, die Kraft sowohl des tiefgreifenden Wissens aus Daten als auch des realen Know-hows der Physik zu nutzen, um eine hybride KI mit erweiterten Fähigkeiten zu schaffen.

„Visuelle Maschinen – Autos, Roboter oder Gesundheitsinstrumente, die Bilder nutzen, um die Welt wahrzunehmen – erledigen letztendlich Aufgaben in unserer physischen Welt“, sagte Achuta Kadambi, korrespondierender Autor der Studie, Assistenzprofessor für Elektro- und Computertechnik an der UCLA Samueli School of Engineering. „Physikbewusste Formen der Schlussfolgerung können es Autos ermöglichen, sicherer zu fahren, oder chirurgischen Robotern, präziser zu fahren.“

Das Forschungsteam skizzierte drei Möglichkeiten, wie Physik und Daten beginnen, in künstlicher Computer-Vision-Intelligenz kombiniert zu werden:

  • Einbindung der Physik in KI-Datensätze Kennzeichnen Sie Objekte mit zusätzlichen Informationen, etwa wie schnell sie sich bewegen können oder wie viel sie wiegen, ähnlich wie bei Charakteren in Videospielen
  • Einbindung der Physik in Netzwerkarchitekturen Führen Sie Daten durch einen Netzwerkfilter, der physikalische Eigenschaften in die von den Kameras erfassten Daten kodiert
  • Einbeziehung der Physik in die Netzwerkverlustfunktion Nutzen Sie physikalisches Wissen, um der KI dabei zu helfen, Trainingsdaten zu den beobachteten Daten zu interpretieren

Diese drei Untersuchungslinien haben bereits zu ermutigenden Ergebnissen bei der Verbesserung des Computersehens geführt. Der Hybridansatz ermöglicht es der KI beispielsweise, die Bewegung eines Objekts genauer zu verfolgen und vorherzusagen und genaue, hochauflösende Bilder von Szenen zu erzeugen, die durch schlechtes Wetter verdeckt sind.

Mit weiteren Fortschritten bei diesem dualen Modalitätsansatz könnten auf Deep Learning basierende KIs sogar beginnen, die Gesetze der Physik selbstständig zu erlernen, so die Forscher.

Die anderen Autoren des Papiers sind der Informatiker Celso de Melo vom Army Research Laboratory und der UCLA-Dozent Stefano Soatto, Professor für Informatik; Cho-Jui Hsieh, außerordentlicher Professor für Informatik, und Mani Srivastava, Professor für Elektrotechnik, Computertechnik und Informatik.

Die Forschung wurde teilweise durch ein Stipendium des Army Research Laboratory unterstützt. Kadambi wird durch Zuschüsse der National Science Foundation, des Army Young Investigator Program und der Defense Advanced Research Projects Agency unterstützt. Als Mitbegründer von Vayu Robotics erhält Kadambi auch Fördermittel von Intrinsic, einem Alphabet-Unternehmen. Hsieh, Srivastava und Soatto erhalten Unterstützung von Amazon.

Weitere Artikel