DeepMind ist die KI-Tochter der Google-Mutter Alphabet. Dem Unternehmen gelang es kürzlich erneut, die eigenen Algorithmen auf ein komplexes wissenschaftliches Problem anzuwenden. Dabei ging es darum, die Deep-Reinforcement-Learning-KI des Unternehmens darauf zu trainieren, ultraheißes Plasma in einem experimentellen Fusionsreaktor zu steuern. An dem Projekt war das Swiss Plasma Center der Eidgenössischen Technischen Hochschule Lausanne )EPFL) in der Schweiz beteiligt.


Die Kontrolle von Plasma in einem Fusionsreaktor ist extrem komplex. Bis zur Fertigstellung des ITER-Reaktors im Jahr 2035 könnte sie von KIs übernommen werden.
Bild: ITER

Fusionsreaktoren: Plasma am Limit

Das System wird Physikern dabei helfen können, die Funktionsweise der Kernfusion besser verstehen zu können. Letztlich ist das Ziel, die Erschließung der Kernfusion zu beschleunigen. Kernfusion bleibt weiterhin eine Vision für unbegrenzte saubere Energie und gilt als eine der großen Hoffnungen bei der Lösung des Widerspruchs zwischen dem Energiebedarf der Menschheit und dem Klimaschutz. „Das ist eine der anspruchsvollsten Anwendungen von Reinforcement Learning in einem Echtsystem„, so Martin Riedmiller von DeepMind über das Projekt.

Das Prinzip der Kernfusion ist das Zusammenpressen der Kerne von Wasserstoffatomen, um schwerere Atome wie Helium zu bilden. Dieser Vorgang findet auch auf der Sonne statt. Im Verhältnis zu der Menge der Ausgangsstoffe entsteht dabei eine große Menge Energie – Kernfusion ist damit eine sehr effiziente Energiequelle und weitaus sauberer und sicherer als fossile Brennstoffe oder Atomkraft. Allerdings ist die Kontrolle der Kernfusion in einem Reaktor mit Schwierigkeiten verbunden. Ein zentraler Punkt ist dabei die Tatsache, dass Atomkerne sich gegenseitig abstoßen, was es kompliziert macht, sie in einem Reaktor zusammenzubringen. Dafür werden extrem hohe Temperaturen im Bereich von mehreren hundert Millionen Grad benötigt. Bei derartigen Temperaturen ist Materie nicht flüssig oder gasförmig, sondern geht in einen vierten Zustand über, der als Plasma bezeichnet wird.


Dieses Plasma muss in einem Reaktor dann lange genug zusammengehalten werden, um daraus Energie zu gewinnen. In der Sonne geschieht das einfach durch die Schwerkraft. Dies ist auf der Erde so nicht möglich, sodass einige Tricks angewendet werden müssen. In den sogenannten Tokamak-Reaktoren ist das Plasma in einem magnetischen Käfig gefangen. Flexibel formbare Magnetfelder verhindern, dass das Plasma die Wände des Reaktorgefäßes berührt. Eine solche Berührung würde das Plasma erkalten lassen und könnte außerdem den Reaktor beschädigen.

Allerdings muss das Magnetfeld stetig überwacht und verändert werden, um das Plasma kontrollieren zu können. Dies stellt die Wissenschaft bisher vor einige Herausforderungen. Das Team von DeepMind trainierte also seine KI im Rahmen einer Simulation auf genau diese Aufgabe. So sollte ein Software-Agent in die Lage versetzt werden, das Ziel möglichst stringent zu verfolgen. Die Trainingsmethode dahinter ist Trial und Error: Wenn eine bestimmte Aktion zielführend ist, wird sie beim nächsten Mal mit höherer Wahrscheinlichkeit ausgewählt und andersrum. Wenn die Anzahl der Versuche ausreichend hoch ist, kann der Agent daraus eine Art „Policy“ entwickeln, die die höchsten Erfolgsaussichten hat.

Plasmasteuerung über zwei neuronale Netze

Nachdem die KI den Lernprozess durchlaufen hatte, wurde sie im Experiment mit einem echten Reaktor auf die Probe gestellt – dem Variable Configuration Tokamak (TCV) an der EPFL. Im Ergebnis erkannten die ForscherInnen, dass die KI den realen Reaktor ohne zusätzliche Eingriffe von menschlicher Seite aus zu kontrollieren vermochte. Systembedingt war der Versuch jedoch nur kurz: Di KI steuerte das Plasma insgesamt zwei Sekunden lang, eine längere Laufzeit erlaubt der TCV nicht.

Während der Steuerung des Plasmas erfasste das neuronale Netzwerk der KI 90 verschiedene Messwerte – und das etwa 10.000 Mal pro Sekunde. Passend zu den Werten wurde dann die Spannung der 19 Magnete, die für die Kontrolle des Plasmas zuständig sind, stetig angepasst. Die Steuerung durch die KI ist nicht nur schneller als die normalerweise vorhandenen PID-Controller, sondern auch sehr viel flexibler.

Die KI wurde während des Versuchs in zwei neuronale Netze aufgeteilt, von denen eines in der Simulation lernte, wie man den Reaktor steuert. Diese Fähigkeiten wurden dann in eine schnelleres Netzwerk übertragen, das für die Steuerung des Reaktors verantwortlich war.

Beeindruckende Ergebnisse

Die im Versuch erreichten Ergebnisse vermochten zu beeindrucken. „Das ist eine unglaublich leistungsfähige Methode. Es ist ein wichtiger erster Schritt in eine sehr spannende Richtung„, so Jonathan Citrin vom Dutch Institute for Fundamental Energy Research, der nicht an der Studie beteiligt war. Das Team von DeepMind geht davon aus, dass ihre KI das Experimentieren mit verschiedenen Bedingungen in Fusionsreaktoren erleichtern könnte.

Die Forschung im Bereich Fusionsenergie macht Fortschritte – allerdings nur langsam. Große Hoffnungen werden auf das ITER-Projekt in Frankreich gesetzt. Fertig wird dieser allerdings erst 2035. Zudem arbeiten mehrere private Unternehmen an der Energiegewinnung aus Fusionsreaktoren. Eine Steuerung mittels KI könnte einen beträchtlichen Beitrag leisten – unter anderem, indem der Faktor Mensch aus der Plasmasteuerung eliminiert wird, was für mehr Experimentierfreude sorgen dürfte.

via DeepMind

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.