Prädiktion mit Hintertür

Beitrag von Michael Olbrich, M.Sc., Universität Augsburg

Unsicherheiten im zukünftigen Fahrverhalten anderer Verkehrsteilnehmer stellen eine Schwierigkeit für Algorithmen im autonomen Fahren dar. Sicherheit und Effizienz stehen sich gegenüber. Die Kombination zweier Methoden beseitigt bisherige Schwachstellen und erlaubt effizientes Fahren bei garantierter Kollisionsfreiheit durch eine sichere Trajektorienplanung. Welche beiden Methoden dafür zum Einsatz kommen und wie diese im Detail funktionieren.

Algorithmus für sichere Trajektorie

Ein typischer Ansatz zur rechnerbasierten Pfad- oder Trajektorienplanung autonomer Fahrzeuge entspricht im Wesentlichen einer Vereinfachung der menschlichen Strategie: Jeder relevante Verkehrsteilnehmer wird beobachtet, um einen Rückschluss auf dessen wahrscheinlichstes Verhalten in naher Zukunft zu ziehen. Diese Information wird genutzt, um unter Berücksichtigung von Unsicherheiten einen voraussichtlich kollisionsfreien, effizienten Pfad zu bestimmen. Durch die kontinuierliche Beobachtung und der darauf basierten Anpassung von Lenkung und Beschleunigung schließt somit der Mensch als Sensor und Regler den Kreis.

Diese Art der Trajektorienplanung kann im informationstechnischen System durch einen sogenannten stochastischen modellprädiktiven Regler (engl. stochastic model predictive controller, SMPC) realisiert werden. Eine Schwachstelle dieser Methode liegt jedoch darin, dass die Vermeidung von Kollisionen aufgrund von Unsicherheiten im Fahrverhalten anderer Verkehrsteilnehmer nicht vollständig gewährleistet werden kann. Dies ist insbesondere der Fall für unwahrscheinliche Szenarien wie Notfallmanöver. Hierfür werden in der Regel robuste Ansätze verwendet, die zwar sicher, aber ineffektiv sind.

Wir wollen daher einen Algorithmus vorstellen, der beide Methoden kombiniert, um garantiert sichere und gleichzeitig effiziente Trajektorien zu planen. Es soll zuerst die generelle Funktionsweise von MPC beschrieben werden, die anschließend um die stochastische Betrachtung und einer Backup-Strategie erweitert wird.

MPC für autonomes Fahren

Übersicht mit Verknüpfung der einzelnen Elemente: Zukünftige Eingänge führen zu einem Modell, dies wiederum hat einen prädizierten Pfad zum Ergebnis. Von da aus können zukünftige Fehler berechnet werden, was ebenfalls durch eine Referenz geschieht und zu einer Optimierung führt. Die Beschränkung durch die Umgebungsinformation und die Kostenfunktion führen ebenfalls zu einer Optimierung. — Grundlegende MPC Struktur für autonomes Fahren | Grafik: Michael Olbrich

Der modellprädiktive Regler basiert auf der Lösung eines Optimierungsproblems zur Laufzeit, aus welchem die Systemeingänge hervorgehen. Es wird also eine Kostenfunktion vorgegeben, die von einer Sequenz zukünftiger Eingangssignale wie Lenkung und Beschleunigung, sowie von den daraus erzeugten prädizierten Systemzuständen wie Position und Geschwindigkeit abhängt. Diese zu minimierende Kostenfunktion gewichtet sowohl hohe Stellgrößen als auch Abweichungen von den Sollzuständen und legt somit ein Maß für die Effizienz des Pfades fest.

Nach erfolgreicher numerischer Optimierung erhalten wir eine Reihe von Eingängen für einen vorgegebenen Prädiktionshorizont. Davon wird lediglich ein kurzes Teilsignal in das reale System eingespeist und die Berechnung für die neuen Anfangszustände gelöst.

Ein entscheidender Vorteil von MPC ist die Möglichkeit, Beschränkungen wie Straßenbegrenzungen und Verkehrsteilnehmer direkt mit einzubeziehen. Nach Ermittlung deren voraussichtlichen Verhaltens für den Zeitraum des Prädiktionshorizonts können die entsprechend besetzten Bereiche aus dem Lösungsraum der Optimierung herausgenommen werden. Unter Voraussetzung der exakten Prädiktion werden damit kollisionsfreie Pfade generiert.

Stochastische Erweiterung

In der Regel stimmt diese Schätzung nicht exakt mit der Realität überein. Grund dafür sind einerseits menschlich bedingte Unsicherheiten, z. B. in Form leichter Schwankungen beim Halten von Geschwindigkeit und Spurmitte, insbesondere aber auch plötzliche Änderungen des Manövers wie ein Spurwechsel oder eine Vollbremsung. Zusätzlich unterliegt auch die Messung des tatsächlichen Zustands Ungenauigkeiten durch Sensorrauschen.

Der konservative Ansatz, grundsätzlich mit den größtmöglichen Fehlern zu rechnen, führt zu einer robusten, aber ineffektiven Lösung. Ziel der stochastischen Methode ist daher, nur Unsicherheiten bis zu einem vorgegebenen Wahrscheinlichkeitslevel zu berücksichtigen. Dafür soll der vorher beschriebene, im Lösungsraum ausgeschlossene Bereich so weit vergrößert werden, bis die probabilistische Anforderung erfüllt ist.

Positionsberechnung der Verkehrsteilnehmer

Wir nehmen an, dass sowohl der Messfehler als auch die nichtdeterministischen Abweichungen der Verkehrsteilnehmer von deren prädizierten Trajektorien durch mittelwertfreie, normalverteilte Wahrscheinlichkeiten approximiert werden können, deren Kovarianzmatrizen bekannt sind. Durch Unsicherheitsfortpflanzung kann dann ein Bereich um die prädizierten Zustände der Verkehrsteilnehmer berechnet werden, die deren tatsächliche, zukünftige Position mit einer vorgegebenen Wahrscheinlichkeit enthält. Diese Vorgabe wird über einen variablen Risikoparameter realisiert.

Durch ein klein eingestelltes Risiko verkleinert sich die Region, die das autonome Fahrzeug zur Pfadplanung nutzen darf, und umgekehrt. Somit kann ein Kompromiss zwischen Effektivität und Sicherheit getroffen werden.

Backup-Strategie

Durch die Restwahrscheinlichkeit unvorhergesehener Manöver bleibt ein Unfallrisiko bestehen. Dies kann durch die Erweiterung um eine nur im Notfall angewandte Trajektorie behoben werden. Unter Voraussetzung, dass zum Startzeitpunkt ein kollisionsfreier Pfad bekannt ist, wird zuerst eine effiziente SMPC Trajektorie ermittelt. Bevor das erste Teilstück dieser Sequenz abgefahren werden kann, müssen zwei Kriterien erfüllt sein:

Zum einen ist es erforderlich, dass dieser Teilpfad sicher ist, andererseits muss die Existenz eines darauf folgenden, kollisionsfreien Pfades garantiert werden.
Die zweite Bedingung wird durch die Berechnung einer weiteren Trajektorie mittels robustem MPC erfüllt, die im Endzustand des anzuwendenden, stochastischen Teilpfades beginnt.

Sicherheit eines Pfades
Ein Pfad ist sicher, wenn keine Überschneidungen mit den erlaubten, physikalisch möglichen Bewegungsbereichen anderer Fahrzeuge auftreten. Garantierte Kollisionsfreiheit wird somit erreicht, indem eine Überapproximation dieser Regionen für die Zeit des Prädiktionshorizonts ausgeschlossen und der Endzustand auf einen Lösungsraum begrenzt wird, für den eine reine Vollbremsung unfallfrei möglich ist.

Durch Kombination beider Methoden ergeben sich nun zwei verschiedene Pfade. Einerseits die effiziente, aber unsichere Trajektorie, andererseits eine davon abzweigende, garantiert sichere Lösung. Im Idealfall können beide Optimierungsprobleme gelöst werden, sodass die effiziente Eingangssequenz bis zum Beginn des Backup-Pfades angewandt und die Planung wiederholt werden kann. Ist das nicht der Fall, so wird die zum vorhergehenden Zeitpunkt erhaltene Backup-Strategie so lange abgefahren, bis erneut beide Optimierungen lösbar sind.

Sicherheit eines Pfades

Zwei rote und ein blaues Auto; durch Pfeile und Flächen auf einer Straße werden der SMPC Pfad (die stochastische Wahrscheinlichkeit) und der Notfallplan (hier im Bild: an einem Auto vorbeifahren) dargestellt — Effizienter SMPC Pfad (blau) und sicherer Notfallplan (grün) basierend auf dem Worst Case Verhalten der Verkehrsteilnehmer | Grafik: Michael Olbrich

Ein Pfad ist sicher, wenn keine Überschneidungen mit den erlaubten, physikalisch möglichen Bewegungsbereichen anderer Fahrzeuge auftreten. Garantierte Kollisionsfreiheit wird somit erreicht, indem eine Überapproximation dieser Regionen für die Zeit des Prädiktionshorizonts ausgeschlossen und der Endzustand auf einen Lösungsraum begrenzt wird, für den eine reine Vollbremsung unfallfrei möglich ist.

Durch Kombination beider Methoden ergeben sich nun zwei verschiedene Pfade. Einerseits die effiziente, aber unsichere Trajektorie, andererseits eine davon abzweigende, garantiert sichere Lösung. Im Idealfall können beide Optimierungsprobleme gelöst werden, sodass die effiziente Eingangssequenz bis zum Beginn des Backup-Pfades angewandt und die Planung wiederholt werden kann. Ist das nicht der Fall, so wird die zum vorhergehenden Zeitpunkt erhaltene Backup-Strategie so lange abgefahren, bis erneut beide Optimierungen lösbar sind.

Verbindung von Effizienz und Sicherheit

Die kombinierte Methode vereint damit die Vorteile beider Ansätze. Effizienz folgt aus der im Regelfall angewandten SMPC Trajektorie, während die Sicherheitsgarantie über die Notfalllösung erreicht wird. Zusätzlich kann der Risikoparameter variiert und an die momentane Verkehrssituation angepasst werden, ohne die Sicherheit zu beeinflussen. Simulationen lassen erkennen, dass das probabilistische Einbeziehen von Unsicherheiten im nominalen Pfad einen positiven Effekt auf die Effizienz hat.

In weiteren Forschungsarbeiten können detaillierte Untersuchungen zur optimalen Einstellung des Risikoparameters angestellt werden.

Literatur

Olbrich, Development of a framework to combine stochastic model predictive control with failsafe trajectory planning, Master‘s Thesis, Technische Universität München, 2019
Magdici et al. Fail-safe motion planning of autonomous vehicles, IEEE ITSC, p. 452-458, Rio de Janeiro, 2016
Carvalho, Predictive control under uncertainty for safe autonomous driving: Integrating datadriven forecasts with control design, Dissertation, University of California, 2016
Brüdigam et al., Combining stochastic and scenario model predictive control to handle target vehicle uncertainty in an autonomous driving highway scenario, IEEE ITSC, p. 1317- 1324, Maui, 2018

Erstmals erschienen in: TiB Ausgabe 2020 März/April