Viren sind überall, und längst nicht alle von ihnen sind schädlich. Auch wir Menschen fungieren als Wirt für mehrere Milliarden viraler Spezies. Und wir kennen nur einen Bruchteil der existierenden Viren. Tatsächlich ist der Großteil der sogenannten Virosphäre, also des viralen Lebens auf der Erde, für uns weiterhin ein Dunkelfeld. Virenforscher:innen gelang es nun, deutlich mehr Licht in dieses Dunkelfeld zu bringen: Sie fanden in weltweiten Probendaten mehr als 161.000 neue, zuvor unbekannte RNA-Viren. So viele neue Viren wurden zuvor noch nie entdeckt. Der Fund der Forscher:innen erweitert die der Wissenschaft bekannte Virosphäre, also sozusagen das Hellfeld, um das Eineinhalbfache. Ermöglicht wurde diese umfassende Entdeckung durch eine künstliche Intelligenz, mit deren Hilfe die Virensignaturen in den genetischen Proben identifiziert werden konnten.


KI auf Virenjagd

Die Identifizierung neuer RNA-Viren stellte bisher ein besonderes Problem dar, da diese Art Viren eine besonders hohe Mutationsrate hat und daher im Vergleich zu DNA-Viren besondere Analysemethoden erfordert. Bei diesen Methoden wird neben der RNA-Sequenz auch gesondert nach den RNA-Bauanleitungen für die RNA-Polymerase gesucht.


Ein Forschungsteam rund um Xin Hou vom staatlichen Labor für Biokontrolle in Shenzhen in China griff nun auf künstliche Intelligenz zurück, um nach RNA-Viren zu suchen. Die Forscher:innen entwickelten ein KI-System, das speziell für die Suche nach viralen Signaturen in RNA-Daten trainiert wurde. Sie tauften das System auf den Namen „LucaProt“. Die Basis des Systems ist ein lernfähiges Transformer-Modell, das ähnlichen Grundprinzipien folgt wie Große Sprachmodelle wie ChatGPT.

Allerdings analysiert „LucaProt“ nicht Sprache, sondern RNA-Sequenzen, um sie auf wiederkehrende Muster auszuwerten. Die Wissenschaftler:innen trainierten das System zunächst anhand von 5.000 bekannten RNA-Signaturen viraler RNA-Polymerasen. Danach ließen sie „LucaProt“ auf insgesamt 51 Terabyte an aus Umweltproben gewonnenen RNA-Daten los. Die Proben stammten von insgesamt 1.612 Orten aus 32 verschiedenen Lebensräumen und Ökosystemen weltweit.

Entdeckung kratzt nur an der Oberfläche

Im Ergebnis fand das KI-System 161.979 neue Arten von RNA-Viren. Dies stellte einen neuen Rekord auf. „So viele neue Viren auf einen Streich zu finden ist umwerfend“, freut sich Edwards Holmes von der University of Sydney, Seniorautor der Studie. Die Entdeckung erweitert die bekannte Virosphäre um den Faktor 1,5 und die viralen Supergruppen sogar um das 8,6-Fache.

Die neu entdeckten Viren verteilen sich auf alle 32 untersuchten Ökosysteme. Dabei fanden die Forscher:innen besonders viele Viren in antarktischen und marinen Sediment und in einigen Binnengewässern. 86 Prozent der identifizierten Virenarten kamen nur in einem Ökosystem vor. Allerdings fanden sie auch Viren, die in so gut wie jeder Probe vorkamen.

Die Forscher:innen betonen allerdings auch, dass es auch weiterhin noch eine gewaltige Zahl unentdeckter Viren gibt. „Wir kratzen damit gerade erst an der Oberfläche. Es gibt noch Millionen weitere Viren zu entdecken“, sagt Holmes. Und auch die neu entdeckten Viren bergen noch viel Potential für weitere Forschung. Es ist etwa noch weitgehend unbekannt, auf welchen Wirten sich diese Viren finden.

Die Mehrheit der bisher bekannten RNA-Viren infizieren Eukaryoten. Es ist aber auch durchaus denkbar, dass ein substanzieller Teil der neuentdeckten Viren mit Bakterien oder Archaeen als Wirten assoziiert ist“, schreiben die Forscher:innen. Die Forschung steckt in diesem Bereich noch in den Kinderschuhen – es gibt noch viel zu tun.

Der nächste Schritt ist es, unsere KI so zu trainieren, dass sie noch mehr von dieser erstaunlichen Vielfalt aufspüren kann. Wer weiß, was noch an Überraschungen auf uns wartet“, schließt Holmes.

Via University of Sydney

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.