nxtAIM im Dialog mit Dr. Robert Habeck, Bundesminister für Wirtschaft und Klimaschutz
Autonomes Fahren und KI: Eine nxtAIM Präsentation
Das Projekt nxtAIM präsentiert vom Koordinator Dr. Jörg Reichardt, im Ministerium für Wirtschaft und Klimaschutz am 7. Oktober 2024.
Die Präsentation ist ebenfalls im Video-Stream verfügbar unter:
Die Mobilität der Zukunft
Die Mobilität und die Logistik der Zukunft sind autonom. LKW transportieren dann 24 Stunden, sieben Tage die Woche, Waren von A nach B und nicht deren Fahrer von Rastplatz zu Rastplatz. Die Steuerung eines PKW wird vom Fahrzeug übernommen und der Mensch am Steuer wird zum Passagier.
Funktionsentwicklung
Die dazu notwendige Fähigkeit, automatisiert zu navigieren, basiert in großen Teilen auf Methoden des maschinellen Lernens und der künstlichen Intelligenz. Dabei wird Funktionalität anhand von präzise annotierten Beispiel- oder Trainingsdaten von einem Computersystem erlernt. Die für diesen Prozess notwendigen Trainingsdaten im Realverkehr einzufahren und ihre Annotation, sogenannte Label, zu erstellen, ist eine teure und komplexe Aufgabe. Das gilt insbesondere für seltene und schwierige, aber damit besonders relevante Szenarien, in denen auch menschliche Fahrer besonders gefordert sind.
Was kann nun generative KI für die Entwicklung autonomer Fahrfunktionen beitragen? Auch Generative Modelle werden auf Basis einer Stichprobe von Beispieldaten trainiert. Sie erlernen jedoch keine spezifische, für das automatisierte Fahren notwendige Funktion wie Fussgänger- oder Fahrspurerkennung aus gelabelten Beispielen.
Generative KI
Generative Modelle sind stochastische Modelle. Sie erlernen die Verteilung der Beispieldaten so zu beschreiben, dass ein Sampling daraus möglich wird. Mittels zufälliger stochastischer Prozesse erzeugen sie neue, synthetische Daten, die den ursprünglichen Trainingsdaten äquivalent sind.
In der Funktionsentwicklung sind wir also nicht mehr durch die Menge eingefahrener Daten beschränkt, sondern können unbegrenzt neue Daten sampeln bzw. generieren. Dies eröffnet völlig neue Möglichkeiten für Training, Test und Validierung von Fahrfunktionen gerade auch in den schwierigen Rändern des Betriebsbereichs – den “Edge Cases”. Generative Modelle erlauben somit die schrittweise Ausweitung des Funktionsumfangs. Perspektivisch im Fahrzeug eingesetzt, ermöglichen sie die Echtzeitvalidierung der Perzeption durch den Abgleich von Umfeldhypothesen gegen den tatsächlichen Sensoreindruck.
Erfolgsfaktoren
Im Projekt nxtAIM kommen drei Erfolgsfaktoren zusammen. Da ist erstens die technische Reife Generativer Methoden. Allgemein bekannt sind die Beispiele von unwahrscheinlichen, aber photorealistischen Darstellungen, wie vom Papst im weißen Daunenmantel. Wenn man als Mensch ein generiertes Bild nicht mehr von einem echten Foto unterscheiden kann, dann ist die Qualität der generierten Daten hoch genug, um damit Perzeptionssysteme zu trainieren und zu testen. Und wenn das mit Kameradaten geht, dann sollte das auch mit anderen Sensormodalitäten wie Radar oder LiDAR funktionieren. Da Generative Methoden keine Label oder Annotation voraussetzen und zunächst ohne Funktionsbezug trainiert werden, können sie mit genug Rechenpower relativ einfach auf riesige Datensätze skaliert werden.
Darüber hinaus sind Generative Methoden erstaunlich universell einsetzbar. Sie finden auch Anwendung für die Modellierung von Verkehrsszenarien und zur Vorhersage des Verhaltens von Verkehrsteilnehmern, wie sie für die Fahrwegsplanung benötigt wird.
Ein zweiter Erfolgsfaktor ist die Möglichkeit, Kontrolle über den Generationsprozess auszuüben und ihn nach unseren Vorgaben steuern zu können. Bei bestimmten Aspekten – wie hier im Beispiel bei der Haltung der Personen in einer Szene – können dann genaue Vorgaben gemacht werden, während alles Übrige wie Kleidung und Hintergrund dem Zufall überlassen bleibt.
Diese Fähigkeit zur Steuerung kann auch bei bereits fertig trainierten Modellen noch im Nachhinein hinzugefügt werden – und zwar mit viel geringerem Aufwand an Daten und Rechenleistung als das Training des ursprünglichen Modells. Diese Eigenschaft kennzeichnet Basis- oder Foundation Modelle.
Damit stehen wir auch vor einem Paradigmenwechsel in der KI Entwicklung. Von Modellen mit einer spezifischen Funktion, die aus funktionsspezifischen Daten mit funktionsspezifischer Annotation erlernt wird, hin zu Foundation Modellen mit breitem Einsatzspektrum aus einer breiten Datenbasis.
Der dritte Erfolgsfaktor sind die Daten der Industriepartner, die in den vergangenen Jahren aufwendig eingefahren wurden und die jetzt in diesem Projekt gemeinsame Verwendung finden, um auf die Sensor-Anforderungen im Automobilsektor angepasste generative Modelle zu entwickeln. Dies alles geschieht unter strenger Wahrung der datenschutzrechtlichen Randbedingungen.
Schließlich ist da das Know-how im Konsortium aus Wissenschaft und Industrie innerhalb der Leitinitiative des VDA. Hervorzuheben ist hier die Zusammenarbeit mit dem Super-Computing-Center in Jülich als Projektpartner, das die für das Projekt notwendige Rechnerinfrastruktur bereitstellt. Gerade der aktive Austausch mit den Wissenschaftspartnern in Verbindung mit der benötigten Recheninfrastruktur hat langfristig positive Wirkungen auf die Wettbewerbsfähigkeit der Industrie.
Besonders positiv ist, dass einige der Grundlagen für dieses Projekt bereits innerhalb der Leitinitiative entwickelt wurden. Stable Diffusion beispielsweise, einer der populärsten Text-zu-Bild Generatoren, wurden an den Universitäten Heidelberg und der LMU mit Förderung aus dem LI Projekt KI-Absicherung entwickelt.
Die Partner erwarten, dass die im Projekt nxtAIM entwickelten Generativen Modelle die erfolgreiche Entwicklung automatisierter Fahrfunktionen fortsetzen und bestehende Architekturen komplementieren. Als stochastische Modelle ergänzen sie klassische Simulationen zur synthetischen Datengenerierung in einfacher Weise um bisher nicht gekannten Variantenreichtum. Wir sind überzeugt, dass die Entwicklung zum Autonomen Fahren durch dieses Projekt massiv profitiert.
Absicherung
Damit die Vision der Autonomen Mobilität der Zukunft Wirklichkeit werden kann, bedarf es aber neben technischer Exzellenz einer weiteren Bedingung: Soll die Person am Steuer ihre Verantwortung tatsächlich abgeben, muss diese Verantwortung von anderer Stelle übernommen werden.
Wer das Lenkrad zwar aus der Hand gibt, die Verantwortung für die Fahrfunktion aber behält, sitzt eben nicht in einem selbstfahrenden Auto. Vielmehr wird er oder sie zur permanenten Überwachung eines technischen Systems genötigt.
Die deutsche Automobilindustrie verfolgt hier einen anderen Ansatz und Anspruch – sie übernimmt Verantwortung und Haftung. Die ersten international zugelassenen Level 3 Systeme für Privatfahrzeuge, in denen der Fahrer sowohl Kontrolle an das Fahrzeug als auch Verantwortung an den Hersteller abgibt – also wirklich vom Fahrer zum Passagier wird – kommen aus Deutschland.
Das Projektteam ist überzeugt, dass nur dieser konsequente Ansatz Vertrauen schafft. Und nur Vertrauen schafft Akzeptanz. Und letztlich schafft nur Akzeptanz auch Verbreitung. Das ist der Weg, den das Projekt nxtAIM weiter beschreiten will.