Press release

AI Alignment Lab erreicht wichtigen Meilenstein auf dem Weg zu agentenbasierter KI

0
Präsentiert von Businesswire

Aligned AI, ein führendes Unternehmen auf dem Gebiet der KI-Forschung (künstliche Intelligenz), hat einen bahnbrechenden KI-Fortschritt bei einer kritischen Herausforderung der KI, der Fehlgeneralisierung, angekündigt. Es ist das erste System, das einen wichtigen Benchmark namens CoinRun übertrifft, indem es einem KI-System lehrt, in menschenähnlichen Konzepten zu „denken“. Die Technologie, die dieser Errungenschaft zugrunde liegt, öffnet die Tür zu präziserer, zuverlässiger und kontrollierbarer KI für eine Vielzahl von Anwendungen in der realen Welt.

Die Innovation von Aligned AI ermöglicht es KI-Modellen, Konzepte in neuen Situationen und Umgebungen korrekt zu identifizieren. Dazu lernen die Modelle, auf eine Art und Weise zu generalisieren, die der menschlichen Kognition ähnlicher ist, und reduzieren so den Bedarf an langwierigen Produktions-, Test- und Nachschulungsprozessen.

Fehlgeneralisierung tritt auf, wenn KI-Systeme falsche Muster und Verhaltensweisen aus ihren Trainingsdaten lernen und nicht in der Lage sind, sich korrekt anzupassen, wenn sie mit neuen Informationen konfrontiert werden. Dies führt zu unerwarteten und oft schädlichen Ergebnissen. Die heutigen Basismodelle sind in unterschiedlichem Maße falsch verallgemeinert, was sich darin zeigt, dass sie von den Benutzern „geknackt” werden können, oder es besteht ein Kompromiss zwischen Funktionalität und unerwünschtem Verhalten. Die Herausforderung der Fehlgeneralisierung verhindert außerdem den Fortschritt der Branche als Ganzes. So ist beispielsweise für wirklich autonome Fahrzeuge und die Anwendung von KI auf kritische Anwendungen eine Generalisierung erforderlich. Andernfalls kann die KI nicht gut genug in unbekannten Umgebungen agieren oder ohne menschliches Eingreifen die richtigen Ziele erkennen.

Um diesen Meilenstein zu erreichen, nutzte Aligned AI den 2021 CoinRun Misgeneralization Benchmark, ein Spiel im Stil von Atari, das von Forschern von Google DeepMind, der University of Cambridge, der Universität Tübingen und der University of Edinburgh veröffentlicht wurde. Der Benchmarks soll testen, ob ein KI-System ein komplexes Ziel ableiten kann, wenn dieses Ziel mit einem einfacheren Ziel in seiner Trainingsumgebung fälschlicherweise korreliert ist. Die KI wird für den Erhalt einer Münze belohnt, die während des Trainingszeitraums immer am Ende des Levels platziert ist, während des Testzeitraums jedoch an einer zufälligen Stelle platziert wird, ohne dass zusätzliche Informationen über die Belohnung bereitgestellt werden.

Vor der Innovation von Aligned AI „glaubten“ die auf CoinRun trainierten KI-Systeme, dass die optimale Vorgehensweise im Spiel darin bestand, nach rechts zu gehen und dabei Monster und Löcher zu meiden. Da die Münze während des Trainings immer am Ende des Levels war, schien diese Strategie effektiv zu sein. Sobald das KI-System ein neues Level erreichte, in dem die Münze an einer anderen Stelle des Levels platziert war und das System keine neuen Informationen erhielt, ignorierte es die Münze und erhielt sie entweder nicht oder nur zufällig. ACE (steht für „Algorithm for Concept Extrapolation“), das neue, von Aligned AI entwickelte KI-System, bemerkt die Veränderungen in der Testumgebung und findet heraus, dass es die Münze auch ohne neue Belohnungsinformationen nehmen sollte – genau, wie ein Mensch es tun würde.

Die wichtigsten Vorteile dieses Durchbruchs:

  • Höhere Sicherheit: Durch die Verringerung der Fehlgeneralisierung werden KI-Systeme zuverlässiger und gewährleisten einen sicheren Betrieb in zahlreichen Szenarien von autonomen Fahrzeugen bis zur Robotik.

  • Verbesserte Funktionen: Das KI-System kann dadurch die menschlichen Absichten besser verstehen und Entscheidungen treffen, die mit diesen Absichten übereinstimmen, was ihre Fähigkeiten erheblich steigert.

  • Ethische KI: Die ethischen Aspekte der KI werden durch die Förderung von Fairness, Transparenz und Nicht-Diskriminierung verbessert. KI-Systeme, die präzise, zuverlässig und interpretierbar sind, treffen mit größerer Wahrscheinlichkeit ethische Entscheidungen, indem sie Vorurteile vermeiden und sich an menschlichen Werten orientieren.

  • Auswirkungen auf die Industrie: Die Technologie ist in der Lage, Branchen wie Robotik, autonome Fahrzeuge und Stiftungsmodelle zu verändern, indem sie sie praktischer und in verschiedenen realen Umgebungen anwendbar macht.

„Dies ist nicht nur ein Wendepunkt in der Welt der KI, sondern auch ein Umbruch für zahlreiche Branchen“, so Rebecca Gorman, Mitbegründerin und CEO von Aligned AI. „Indem wir die Fehlgeneralisierung deutlich reduzieren und die Fähigkeit der KI verbessern, unvorhergesehene Szenarien zu verstehen und sich an sie anzupassen, öffnen wir die Türen zu unvergleichlichen Möglichkeiten in allen Bereichen. Von autonomen Fahrzeugen, die auf noch nie zuvor gesehenen Straßen von San Francisco nach Phoenix navigieren können, bis hin zu Robotern, die in einer Reihe von sich ändernden und unvorhergesehenen Umgebungen effektiv arbeiten können, ist diese Benchmark der Dreh- und Angelpunkt, der diese futuristischen Visionen Wirklichkeit werden lässt. Es geht nicht nur darum, die KI zu verbessern, sondern auch darum, die Art und Weise zu revolutionieren, wie die Industrie arbeitet, innovativ ist und der Menschheit dient.“

Die Innovation von Aligned AI befasst sich mit einem kritischen Problem, dem alle KI-Systeme gegenüberstehen. Wenn sie mit neuen Umgebungen konfrontiert werden, neigen aktuelle KI-Systeme dazu, die Trainingsdaten falsch zu erweitern. Aus diesem Grund schaffen es 70 % der Modelle nicht in die Produktion oder müssen lange Produktions- und Testzeiten in Kauf nehmen, was die Skalierbarkeit behindert und oft eine erneute Schulung innerhalb des ersten Jahres nach der Veröffentlichung erfordert.

„Auch wenn KI immer leistungsfähiger wird und immer häufiger zum Einsatz kommt, bleibt die Generalisierung eine Herausforderung“, sagt John Sviokla, ein Pionier der KI-Forschung und Mitbegründer von GAI Insights, einem Beratungsunternehmen, das Unternehmen dabei unterstützt, mit generativer KI Rendite zu erzielen. „Die Forschung von Aligned AI ist ein entscheidender Schritt vorwärts für den sicheren, ethischen und effektiven Einsatz von KI in allen Branchen.“

Seit seiner Gründung steht Aligned AI an vorderster Front, wenn es darum geht, die kritischen Herausforderungen bei der Entwicklung und dem Einsatz von KI anzugehen. Im Jahr 2022 war Aligned AI führend bei der Verhinderung von ChatGPT-„Jailbreaks“ und veröffentlichte den ersten Prompt-Evaluator als Open-Source-Projekt. Im September 2023 erhielt Aligned AI den CogX-Preis für die „Best Innovation in Mitigating Algorithm Bias“ für EquitAI, einen Algorithmus, der LLMs dazu zwingt, geschlechtsneutrale Texte auszugeben, und für faAIr, seinen Algorithmus zur Messung und Einstufung geschlechtsspezifischer Verzerrungen in Stiftungsmodellen. Die frühere Arbeit von Aligned AI an der Konzeptextrapolation verbessert die Leistung von KI bei nicht verteilten Datensätzen und hilft Modellen, sich sicher zu verhalten, während sie auf menschliches Feedback warten.

Weitere Informationen über Aligned AI und seinen Durchbruch bei der Fehlgeneralisierung finden Sie unter buildaligned.ai.

Über Aligned AI:

Aligned AI wurde in Oxford von Rebecca Gorman und Dr. Stuart Armstrong gegründet und ist ein Deep-Tech-Startup, das den nächsten Schritt in der KI ermöglicht, indem es KI lehrt, menschenähnliche Konzepte zu verstehen und anzuwenden. Ihre Kerntechnologie der „Konzeptextrapolation“ ermöglicht es der KI, die Absichten ihrer Trainer über die Trainingsdaten hinaus zu erweitern, sodass sie auch in neuen Szenarien wie gewünscht funktioniert. Aligned AI ist der Ansicht, dass Sicherheit und Leistungsfähigkeit keine Gegensätze sind, sondern dass ein KI-System, die präziser und kontrollierbarer ist, auch leistungsfähiger ist.

Die Ausgangssprache, in der der Originaltext veröffentlicht wird, ist die offizielle und autorisierte Version. Übersetzungen werden zur besseren Verständigung mitgeliefert. Nur die Sprachversion, die im Original veröffentlicht wurde, ist rechtsgültig. Gleichen Sie deshalb Übersetzungen mit der originalen Sprachversion der Veröffentlichung ab.