Diese Gedankenlesekappe kann dank KI Gedanken in Text übersetzen

Diese Gedankenlesekappe kann dank KI Gedanken in Text übersetzen

Diese Gedankenlesekappe kann dank der KI von PlatoBlockchain Data Intelligence Gedanken in Text übersetzen. Vertikale Suche. Ai.

Ein junger Mann trägt eine mit Elektroden besetzte Kappe voller Drähte und liest schweigend einen Satz in seinem Kopf. Augenblicke später ertönt eine Siri-ähnliche Stimme: versucht, seine Gedanken in Text zu übersetzen„Ja, ich hätte gerne eine Schüssel Hühnersuppe, bitte.“ Es ist das neueste Beispiel dafür, wie Computer die Gedanken einer Person in Wörter und Sätze übersetzen.

Bisher verwendeten Forscher chirurgisch im Gehirn implantierte Implantate oder sperrige, teure Maschinen, um Gehirnaktivität in Text zu übersetzen. Der neuer Ansatz, das diese Woche auf der NeurIPS-Konferenz von Forschern der University of Technology Sydney vorgestellt wurde, beeindruckt durch die Verwendung einer nicht-invasiven EEG-Haube und das Potenzial zur Generalisierung auf mehr als ein oder zwei Personen.

Das Team hat ein KI-Modell namens DeWave entwickelt, das auf Gehirnaktivität und Sprache trainiert, und es mit einem großen Sprachmodell – der Technologie hinter ChatGPT – verknüpft, um dabei zu helfen, Gehirnaktivität in Wörter umzuwandeln. In einem Vorabdruck auf arXiv veröffentlichtMit einer Genauigkeit von etwa 40 Prozent übertraf das Modell frühere Bestnoten für die EEG-Gedanken-zu-Text-Übersetzung. Chin-Teng Lin, korrespondierender Autor des Artikels, sagte MSN Sie haben die Genauigkeit kürzlich auf 60 Prozent erhöht. Die Ergebnisse werden noch einem Peer-Review unterzogen.

Obwohl es hinsichtlich der Zuverlässigkeit noch ein langer Weg ist, zeigt es Fortschritte bei nicht-invasiven Methoden zum Lesen und Übersetzen von Gedanken in Sprache. Das Team glaubt, dass ihre Arbeit denjenigen eine Stimme geben könnte, die aufgrund einer Verletzung oder Krankheit nicht mehr kommunizieren können, oder dazu verwendet werden könnte, Maschinen wie Laufroboter oder Roboterarme allein mit Gedanken zu steuern.

Ratet mal, was ich denke

Sie erinnern sich vielleicht an Schlagzeilen über „Gedankenlesemaschinen“, die Gedanken mit hoher Geschwindigkeit in Text übersetzen. Denn solche Bemühungen sind nichts Neues.

Anfang dieses Jahres haben Stanford-Forscher beschriebene Arbeit mit einem Patienten, Pat Bennett, der aufgrund von ALS nicht mehr sprechen konnte. Nachdem Bennett vier Sensoren in zwei Teile ihres Gehirns implantiert und umfassend trainiert hatte, konnte sie kommunizieren, indem sie ihre Gedanken hatte mit einer Geschwindigkeit von 62 Wörtern pro Minute in Text umgewandelt– eine Verbesserung gegenüber dem Rekord des gleichen Teams aus dem Jahr 2021 von 18 Wörtern pro Minute.

Es ist ein erstaunliches Ergebnis, aber Gehirnimplantate können riskant sein. Wissenschaftler würden gerne ein ähnliches Ergebnis ohne Operation erzielen.

In eine weitere Studie in diesem Jahr, wandten sich Forscher der University of Texas in Austin einer Gehirn-Scan-Technologie namens fMRI zu. In der Studie mussten die Patienten ganz still in einer Maschine liegen, die den Blutfluss in ihrem Gehirn aufzeichnete, während sie Geschichten hörten. Nachdem das Team diese Daten verwendet hatte, um einen Algorithmus zu trainieren – der teilweise auf dem ChatGPT-Vorfahren GPT-1 basiert –, nutzte das Team das System, um anhand ihrer Gehirnaktivität zu erraten, was die Teilnehmer hörten.

Die Genauigkeit des Systems war nicht perfekt, es erforderte umfangreiche Anpassungen für jeden Teilnehmer und fMRT-Geräte sind sperrig und teuer. Dennoch diente die Studie als Proof of Concept dafür, dass Gedanken nicht-invasiv entschlüsselt werden können und die neueste KI dabei helfen kann, dies zu erreichen.

Der Sortierhut

In Harry Potter, Schüler werden durch einen magischen Hut, der Gedanken liest, in Schulhäuser eingeteilt. Wir Muggel greifen auf komisch aussehende Badekappen zurück, die von Drähten und Elektroden durchlöchert sind. Diese als Elektroenzephalographen (EEG) bezeichneten Geräte lesen und zeichnen die elektrische Aktivität in unserem Gehirn auf. Im Gegensatz zu Gehirnimplantaten erfordern sie keinen chirurgischen Eingriff, sind aber deutlich ungenauer. Die Herausforderung besteht also darin, das Signal vom Rauschen zu trennen, um ein brauchbares Ergebnis zu erhalten.

In der neuen Studie verwendete das Team zwei Datensätze, die Eye-Tracking- und EEG-Aufzeichnungen von 12 bzw. 18 Personen beim Lesen von Texten enthielten. Eye-Tracking-Daten halfen dem System, die Gehirnaktivität wortweise aufzuschlüsseln. Das heißt, wenn die Augen einer Person von einem Wort zum nächsten huschen, bedeutet das, dass es eine Pause zwischen der mit diesem Wort verbundenen Gehirnaktivität und der Aktivität geben sollte, die mit dem nächsten korreliert sein sollte.

Anschließend trainierten sie DeWave anhand dieser Daten und im Laufe der Zeit lernte der Algorithmus, bestimmte Gehirnwellenmuster mit Wörtern zu verknüpfen. Schließlich wurden mit Hilfe eines vorab trainierten großen Sprachmodells namens BART – das genau abgestimmt wurde, um die einzigartige Ausgabe des Modells zu verstehen – die Gehirnwellen-Wort-Assoziationen des Algorithmus wieder in Sätze übersetzt.

In Tests übertraf DeWave die Top-Algorithmen in dieser Kategorie sowohl bei der Übersetzung roher als auch nach Wörtern zerlegter Gehirnwellen. Letztere waren genauer, blieben aber immer noch weit hinter der Übersetzung zwischen Sprachen – wie Englisch und Französisch – und der Spracherkennung zurück. Sie fanden auch heraus, dass der Algorithmus bei allen Teilnehmern ähnlich funktionierte. Frühere Experimente lieferten in der Regel Ergebnisse für eine einzelne Person oder erforderten extreme Anpassungen.

Das Team sagt, die Forschung sei ein weiterer Beweis dafür, dass große Sprachmodelle dabei helfen können, Brain-to-Text-Systeme voranzutreiben. Obwohl sie in der offiziellen Studie einen relativ alten Algorithmus verwendeten, enthielten sie in ergänzendem Material Ergebnisse größerer Modelle, einschließlich Metas ursprünglichem Llama-Algorithmus. Interessanterweise verbesserten die größeren Algorithmen die Ergebnisse nicht wesentlich.

„Dies unterstreicht die Komplexität des Problems und die Herausforderungen bei der Verknüpfung von Gehirnaktivitäten mit LLMs“, schrieben die Autoren und forderten differenziertere Forschung in der Zukunft. Dennoch hofft das Team, dass es sein eigenes System weiter vorantreiben kann, vielleicht bis zu einer Genauigkeit von 90 Prozent.

Die Arbeit zeigt Fortschritte auf diesem Gebiet.

„Die Leute wollten schon lange EEG in Text umwandeln und das Modell des Teams zeigt ein bemerkenswertes Maß an Korrektheit“, sagte Craig Jin von der University of Sydney MSN. „Vor einigen Jahren waren die Umstellungen von EEG auf Text völliger Unsinn.“

Bild-Kredit: Technische Universität Sydney

Zeitstempel:

Mehr von Singularity Hub