Trotz der rasanten Fortschritte in der künstlichen Intelligenz ist die KI noch nicht annähernd bereit, den Menschen in der wissenschaftlichen Praxis zu ersetzen. Das heißt aber nicht, dass sie nicht dabei helfen können, einen Teil der harten Arbeit, die mit alltäglichen wissenschaftlichen Experimenten verbunden ist, zu automatisieren. Vor einigen Jahren haben Forscher beispielsweise künstliche Intelligenz zur Steuerung automatisierter Laborgeräte eingesetzt und ihr beigebracht, alle Wechselwirkungen, die zwischen einer Reihe von Rohstoffen auftreten können, umfassend zu klassifizieren.
Obwohl dies nützlich ist, erfordert es dennoch umfangreiche Eingriffe seitens der Forscher, um das System überhaupt zu trainieren. Eine Gruppe der Carnegie Mellon University hat nun herausgefunden, wie man ein künstliches Intelligenzsystem dazu bringen kann, sich selbst den Umgang mit Chemie beizubringen. Das System erfordert einen Satz von drei KI-Instanzen, die jeweils auf unterschiedliche Prozesse spezialisiert sind. Aber sobald Sie es eingerichtet und mit den Rohstoffen versorgt haben, müssen Sie ihm nur noch sagen, welche Art von Reaktion Sie durchführen möchten, und es wird es herausfinden.
Dreifaltigkeit der künstlichen Intelligenz
Die Forscher weisen darauf hin, dass sie daran interessiert sind, die Möglichkeiten zu verstehen, die große linguistische Modelle (LLMs) für das wissenschaftliche Unterfangen bieten können. Daher sind alle in dieser Arbeit verwendeten KIs LLMs, hauptsächlich GPT-3.5 und GPT-4, obwohl auch andere – Claude 1.3 und Falcon-40B-Instruct – getestet wurden. (GPT-4 und Claude 1.3 schnitten am besten ab.) Doch anstatt ein einziges System zur Behandlung aller Aspekte der Chemie zu verwenden, schufen die Forscher unterschiedliche Instanzen der Zusammenarbeit und etablierten eine Arbeitsteilung, die sie die „kosmische Welt“ nannten.
Die drei verwendeten Systeme sind:
Websucher. Dies hat zwei Hauptfunktionen. Eine besteht darin, die Google Search API zu verwenden, um Seiten zu finden, die aufgrund der darin enthaltenen Informationen möglicherweise interessant sind. Die zweite besteht darin, diese Seiten aufzunehmen und daraus Informationen zu extrahieren – stellen Sie sich dies als Analogie zum Kontext früherer Teile einer Konversation vor, die Chat GPT behalten kann, um seine nachfolgenden Antworten zu informieren. Die Forscher konnten verfolgen, wo diese Einheit ihre Zeit verbrachte, und etwa die Hälfte der Orte, die sie besuchte, waren Wikipedia-Seiten. Zu den fünf am häufigsten besuchten Websites gehörten Zeitschriften, die sowohl von der American Chemical Society als auch von der Royal Society of Chemistry herausgegeben wurden.
Dokumentationsforscher. Stellen Sie sich das so vor RTFM Beispiel. Der KI sollte die Kontrolle über eine Vielzahl von Laborautomatisierungsgeräten wie automatisierten Flüssigkeitshandhabern und dergleichen übertragen werden, die oft entweder über spezielle Befehle oder so etwas wie eine Python-API gesteuert wurden. Diese KI-Instanz hat Zugriff auf alle Handbücher für dieses Gerät erhalten, sodass sie lernen kann, wie man es steuert.
ein Plan. Der Planer kann den beiden anderen Instanzen der KI Befehle erteilen und deren Antworten verarbeiten. Es hat Zugriff auf eine Python-Codeausführungs-Sandbox und kann so Berechnungen durchführen. Außerdem verfügt er über automatisierte Laborgeräte, die es ihm ermöglichen, Experimente virtuell durchzuführen und zu analysieren. Man kann sich den Planer also als Teil des Systems vorstellen, das sich wie ein Chemiker verhalten muss, der aus der Literatur lernt und versucht, das Gelernte mit der Ausrüstung umzusetzen.
Der Planer kann auch erkennen, wenn Programmierfehler auftreten (entweder in Python-Skripten oder bei seinen Versuchen, automatisierte Maschinen zu steuern), und so die Fehler beheben.
Nehmen Sie das System in Betrieb
Ursprünglich sollte das System eine Reihe von Chemikalien wie Paracetamol und Ibuprofen synthetisieren, was bestätigte, dass es nach einer Suche im Internet und in der wissenschaftlichen Literatur im Allgemeinen eine brauchbare Formulierung finden konnte. Die Frage ist also, ob das System in der Lage ist, die Geräte, auf die es Zugriff hat, gut genug zu erkennen, um seine konzeptionelle Kapazität auszulösen.
Um mit etwas Einfachem zu beginnen, verwendeten die Forscher eine Standard-Probenplatte, die eine Reihe kleiner Vertiefungen enthielt, die in einem rechteckigen Raster angeordnet waren. Das System sollte Quadrate, diagonale Linien oder andere Muster mit verschiedenfarbigen Flüssigkeiten ausfüllen und konnte dies effektiv tun.
Anschließend platzierten sie drei verschiedenfarbige Lösungen an zufälligen Stellen im Brunnennetzwerk. Das System wurde aufgefordert, Vertiefungen und deren Farbe zu identifizieren. Coscientist allein wusste nicht, wie man das macht. Als er jedoch daran erinnert wurde, dass verschiedene Farben unterschiedliche Absorptionsspektren aufweisen würden, benutzte er ein Spektrometer, zu dem er Zugang hatte, und konnte die verschiedenen Farben identifizieren.
Da grundlegende Befehls- und Kontrollfunktionen scheinbar funktionierten, beschlossen die Forscher, etwas Chemie auszuprobieren. Sie bestückten die Probenplatte mit Vertiefungen, die mit einfachen Chemikalien, Katalysatoren und Ähnlichem gefüllt waren, und forderten sie auf, eine bestimmte chemische Reaktion durchzuführen. Der Kosmologe hat von Anfang an die Chemie verstanden, aber seine Versuche, die Synthese zum Laufen zu bringen, scheiterten, weil sie einen ungültigen Befehl an die Maschinen sendete, die die Reaktionen erhitzen und antreiben. Dadurch gelangte er zurück zum Dokumentationsmodul und konnte das Problem beheben und die Interaktionen ausführen.
Und es hat funktioniert. Im Reaktionsgemisch waren spektrale Fingerabdrücke der gewünschten Produkte vorhanden, deren Vorhandensein durch Chromatographie bestätigt wurde.
verbessern
Nachdem die Grundreaktionen funktionierten, forderten die Forscher das System auf, die Effizienz der Reaktion zu optimieren, und präsentierten den Optimierungsprozess als ein Spiel, bei dem die Punktzahl mit dem Ergebnis der Reaktion stieg.
Das System machte in der ersten Runde des Testfeedbacks einige Fehleinschätzungen, konzentrierte sich aber schnell darauf, bessere Ergebnisse zu erzielen. Die Forscher fanden außerdem heraus, dass sie schlechte Entscheidungen in der ersten Runde vermeiden konnten, indem sie dem Coscientist Informationen über die Ergebnisse lieferten, die durch einige zufällige Anfangsmischungen erzielt wurden. Das bedeutet, dass ein Coscientist unabhängig davon, woher er seine Informationen bezieht – sei es aus seinem eigenen Feedback oder aus einer externen Informationsquelle –, die Informationen in seine Planung integrieren kann.
Die Forscher kamen zu dem Schluss, dass der Coscientist über eine Reihe bemerkenswerter Fähigkeiten verfügt:
- Planung einer chemischen Synthese anhand allgemeiner Informationen.
- Navigieren und verarbeiten Sie technische Handbücher für komplexe Geräte.
- Nutzen Sie dieses Wissen, um eine Reihe von Laborgeräten zu steuern.
- Integrieren Sie diese Instrumentierungsfunktionen in Ihren Laborarbeitsablauf.
- Analysieren Sie seine Reaktionen und nutzen Sie diese Informationen, um verbesserte Reaktionsbedingungen zu entwickeln.
In vielerlei Hinsicht klingt das nach der Erfahrung, die ein Student im ersten Jahr seines Graduiertenstudiums machen könnte. Im Idealfall erreicht der Doktorand darüber hinausgehende Fortschritte. Aber vielleicht wird GPT-5 das auch können.
Noch gefährlicher ist, dass die kowissenschaftliche Architektur, die auf dem Zusammenspiel einer Reihe spezialisierter Systeme beruht, der Funktionsweise des Geistes ähnelt. Offensichtlich sind spezialisierte Gehirnsysteme zu einer Vielzahl von Aktivitäten fähig, und davon gibt es viele. Diese Art von Struktur kann jedoch entscheidend sein, um komplexeres Verhalten zu ermöglichen.
Die Forscher selbst sind jedoch besorgt über einige Fähigkeiten des Co-Wissenschaftlers. Es gibt viele Chemikalien (denken Sie an Nervengifte), deren Herstellung wir nicht einfacher sehen wollen. Herauszufinden, wie man GPT-Instanzen anweist, etwas nicht zu tun, erweist sich als ständige Herausforderung.
Natur2023. Digitale ID: 10.1038/s41586-023-06792-0 (Über digitale IDs).