Säuglinge übertreffen künstliche Intelligenz darin, zu erkennen, was die Handlungen anderer Menschen motiviert, findet eine neue Studie eines Teams von Psychologie- und Data-Science-Forschern. Seine Ergebnisse, die grundlegende Unterschiede zwischen Kognition und Berechnung hervorheben, weisen auf Mängel in den heutigen Technologien hin und zeigen, wo Verbesserungen erforderlich sind, damit die KI das menschliche Verhalten vollständiger nachbilden kann.
„Erwachsene und sogar Kleinkinder können leicht verlässliche Rückschlüsse darauf ziehen, was die Handlungen anderer Menschen antreibt“, erklärt Moira Dillon, Assistenzprofessorin am Department of Psychology der New York University und leitende Autorin des Artikels, der in der Zeitschrift erscheint Erkenntnis. „Die aktuelle KI findet es schwierig, diese Schlussfolgerungen zu ziehen.“
„Die neuartige Idee, Säuglinge und KI gegeneinander an denselben Aufgaben zu stellen, ermöglicht es Forschern, das intuitive Wissen von Säuglingen über andere Menschen besser zu beschreiben und Möglichkeiten vorzuschlagen, dieses Wissen in die KI zu integrieren“, fügt sie hinzu.
„Wenn KI darauf abzielt, flexible, vernünftige Denker zu entwickeln, wie sie erwachsene Menschen werden, dann sollten Maschinen auf die gleichen Kernfähigkeiten zurückgreifen, die Säuglinge beim Erkennen von Zielen und Vorlieben besitzen“, sagt Brenden Lake, Assistenzprofessor am Center for Data Science and Department of Psychology der NYU und einer der Autoren des Papiers.
Es ist allgemein bekannt, dass Kleinkinder von anderen Menschen fasziniert sind – was sich daran zeigt, wie lange sie andere ansehen, um ihre Handlungen zu beobachten und sich sozial mit ihnen zu beschäftigen. Darüber hinaus haben frühere Studien, die sich auf die „Psychologie des gesunden Menschenverstands“ von Säuglingen konzentrierten – ihr Verständnis der Absichten, Ziele, Präferenzen und Rationalität, die den Handlungen anderer zugrunde liegen – gezeigt, dass Säuglinge in der Lage sind, anderen Ziele zuzuschreiben und von anderen zu erwarten, dass sie Ziele verfolgen rationell und effizient. Die Fähigkeit, diese Vorhersagen zu treffen, ist grundlegend für die soziale Intelligenz des Menschen.
Umgekehrt sagt „Commonsense AI“ – angetrieben von maschinellen Lernalgorithmen – Aktionen direkt voraus. Aus diesem Grund erscheint beispielsweise eine Anzeige, die San Francisco als Reiseziel anpreist, auf Ihrem Computerbildschirm, nachdem Sie eine Nachricht über einen neu gewählten Stadtbeamten gelesen haben. Was der KI jedoch fehlt, ist die Flexibilität beim Erkennen verschiedener Kontexte und Situationen, die das menschliche Verhalten leiten.
Um ein grundlegendes Verständnis der Unterschiede zwischen den Fähigkeiten von Menschen und KI zu entwickeln, führten die Forscher eine Reihe von Experimenten mit 11 Monate alten Säuglingen durch und verglichen ihre Reaktionen mit denen eines hochmodernen lerngesteuerten neuronalen Netzwerks Modelle.
Dazu setzten sie den zuvor etablierten „Baby Intuitions Benchmark“ (BIB) ein – sechs Aufgaben, die die Psychologie des gesunden Menschenverstandes untersuchen. BIB wurde entwickelt, um sowohl die Intelligenz von Säuglingen als auch von Maschinen zu testen, einen Leistungsvergleich zwischen Säuglingen und Maschinen zu ermöglichen und vor allem eine empirische Grundlage für den Aufbau einer menschenähnlichen KI zu schaffen.
Insbesondere sahen sich Kleinkinder auf Zoom eine Reihe von Videos mit einfachen animierten Formen an, die sich auf dem Bildschirm bewegten – ähnlich wie bei einem Videospiel. Die Aktionen der Formen simulierten menschliches Verhalten und Entscheidungsfindung durch das Abrufen von Objekten auf dem Bildschirm und andere Bewegungen. In ähnlicher Weise bauten und trainierten die Forscher lerngesteuerte neuronale Netzwerkmodelle – KI-Tools, die Computern helfen, Muster zu erkennen und menschliche Intelligenz zu simulieren – und testeten die Reaktionen der Modelle auf genau dieselben Videos.
Ihre Ergebnisse zeigten, dass Säuglinge selbst in den vereinfachten Handlungen animierter Formen menschenähnliche Motivationen erkennen. Säuglinge sagen voraus, dass diese Aktionen von versteckten, aber konsistenten Zielen angetrieben werden – zum Beispiel das Abrufen des gleichen Objekts auf dem Bildschirm, egal wo es sich befindet, und die effiziente Bewegung dieser Form, selbst wenn sich die Umgebung ändert. Säuglinge demonstrieren solche Vorhersagen, indem sie länger auf solche Ereignisse schauen, die ihre Vorhersagen verletzen – ein gängiges und jahrzehntealtes Maß zur Beurteilung der Art des Wissens von Säuglingen. Die Übernahme dieses „Überraschungsparadigmas“ zur Untersuchung der maschinellen Intelligenz ermöglicht direkte Vergleiche zwischen dem quantitativen Überraschungsmaß eines Algorithmus und einem etablierten menschlichen psychologischen Überraschungsmaß – der Sehzeit von Säuglingen. Die Modelle zeigten keine solchen Beweise für das Verständnis der Motivationen, die solchen Handlungen zugrunde liegen, und zeigten, dass ihnen wichtige Grundprinzipien der gesunden Menschenverstandspsychologie fehlen, die Säuglinge besitzen.
„Das grundlegende Wissen eines menschlichen Säuglings ist begrenzt, abstrakt und spiegelt unser evolutionäres Erbe wider, aber es kann jeden Kontext oder jede Kultur aufnehmen, in der dieser Säugling leben und lernen könnte“, bemerkt Dillon.
Die Forschung wurde durch Zuschüsse der National Science Foundation (DRL1845924) und der Defense Advanced Projects Research Agency (HR001119S0005) unterstützt.