Μια παράλυτη γυναίκα μπόρεσε να μιλήσει μέσω ενός άβαταρ χάρη σε τεχνολογία που μετέφραζε τα εγκεφαλικά σήματα σε ομιλία και εκφράσεις του προσώπου.
Οι ερευνητές χρησιμοποιώντας μία συσκευή Brain-Computer Interface (BCI), μετέτρεψαν τα αναλογικά σήματα που παράγει ο εγκέφαλος σε ψηφιακά, τα οποία μπορεί να καταλαβαίνει ένας υπολογιστής. Με τον τρόπο αυτόν έδωσαν τη δυνατότητα σε μία παράλυτη γυναίκα που δεν μπορούσε να μιλήσει έπειτα από ένα εγκεφαλικό επεισόδιο, να μιλήσει ξανά μέσω ενός ψηφιακού άβαταρ.
Το συγκεκριμένο ιστορικό επίτευγμα έρχεται να δώσει ελπίδες σε ανθρώπους που έχουν χάσει την ικανότητα να μιλούν λόγω ιατρικών καταστάσεων όπως το εγκεφαλικό επεισόδιο και η αμυοτροφική πλευρική σκλήρυνση (ALS).
Σύμφωνα με την Guardian, η εν λόγω τεχνολογία χρησιμοποιεί μικροσκοπικά ηλεκτρόδια εμφυτευμένα στην επιφάνεια του εγκεφάλου για να ανιχνεύσει την ηλεκτρική δραστηριότητα στο τμήμα του εγκεφάλου που ελέγχει την ομιλία και τις κινήσεις του προσώπου. Αυτά τα σήματα μεταφράζονται απευθείας σε ομιλία και εκφράσεις του προσώπου ενός ψηφιακού άβαταρ, όπως το χαμόγελο ή την έκπληξη.
«Στόχος μας είναι να αποκαταστήσουμε έναν πλήρη, ενσωματωμένο τρόπο επικοινωνίας, που είναι πραγματικά ο πιο φυσικός τρόπος για να μιλάμε με άλλους», δήλωσε ο καθηγητής Edward Chang, ο οποίος ηγήθηκε της εν λόγω εργασίας στο πανεπιστήμιο της Καλιφόρνια στο Σαν Φρανσίσκο. «Αυτές οι εξελίξεις μας φέρνουν πολύ πιο κοντά στο να δώσουμε μία πραγματική λύση στους ασθενείς».
Η 47χρονη Ann είναι παράλυτη για παραπάνω από 18 χρόνια, μετά από ένα εγκεφαλικό επεισόδιο που υπέστη. Δεν μπορεί να μιλήσει ή να πληκτρολογήσει και συνήθως επικοινωνεί χρησιμοποιώντας τεχνολογία παρακολούθησης κινήσεων που της επιτρέπει να επιλέγει αργά γράμματα έως και 14 λέξεις το λεπτό. Τώρα ελπίζει ότι η τεχνολογία άβαταρ θα της επιτρέψει να εργαστεί ως σύμβουλος στο μέλλον.
Πώς λειτουργεί το άβαταρ
Η ομάδα εμφύτευσε ένα λεπτό -σαν χαρτί- ορθογώνιο, με 253 ηλεκτρόδια, στην επιφάνεια του εγκεφάλου της Ann σε μια περιοχή κρίσιμη για την ομιλία. Τα ηλεκτρόδια κατέγραφαν τα σήματα του εγκεφάλου που, αν δεν είχε υποστεί εγκεφαλικό, θα έλεγχαν τους μύες στη γλώσσα, το σαγόνι, τον λάρυγγα και το πρόσωπό της.
Μετά την εμφύτευση, η Ann συνεργάστηκε με την ομάδα για να εκπαιδεύσει τον αλγόριθμο τεχνητής νοημοσύνης του συστήματος να ανιχνεύει τα εγκεφαλικά της σήματα για τους ήχους ομιλίας, επαναλαμβάνοντας διαφορετικές φράσεις.
Ο υπολογιστής έμαθε 39 διακριτικούς ήχους και χρησιμοποιήθηκε ένα γλωσσικό μοντέλο τύπου Chat-GPT για τη μετάφραση των σημάτων σε κατανοητές προτάσεις. Αυτό στη συνέχεια χρησιμοποιήθηκε για τον έλεγχο ενός άβαταρ με μια φωνή εξατομικευμένη ώστε να ακούγεται όπως η Ann πριν από το εγκεφαλικό, με βάση μια ηχογράφηση από τον γάμο της.
Η τεχνολογία δεν ήταν τέλεια, καθώς αποκωδικοποιούσε λανθασμένα το 28% των λέξεων σε μια δοκιμαστική λειτουργία που περιελάμβανε περισσότερες από 500 φράσεις ενώ παρήγαγε 78 λέξεις το λεπτό, σε σύγκριση με τις 110-150 που συνήθως εκφωνούνται σε μια συνομιλία. Ωστόσο, οι επιστήμονες είπαν ότι οι πιο πρόσφατες εξελίξεις στην ακρίβεια, την ταχύτητα και την πολυπλοκότητα υποδηλώνουν ότι η τεχνολογία είναι πλέον σε σημείο που να είναι πρακτικά χρήσιμη για τους ασθενείς.
Ο καθηγητής Nick Ramsey, νευροεπιστήμονας στο Πανεπιστήμιο της Ουτρέχτης στην Ολλανδία, δήλωσε: «Πρόκειται για μεγάλο άλμα σε σχέση με τα προηγούμενα αποτελέσματα. Βρισκόμαστε σε σημείο καμπής». Ένα κρίσιμο επόμενο βήμα είναι η δημιουργία μιας ασύρματης έκδοσης του BCI που θα μπορούσε να εμφυτευτεί κάτω από το κρανίο.
«Η παροχή δυνατότητας στους ανθρώπους να ελέγχουν ελεύθερα τους υπολογιστές και τα τηλέφωνά τους με αυτή την τεχνολογία θα είχε σημαντική επίδραση στην ανεξαρτησία και τις κοινωνικές τους αλληλεπιδράσεις», δήλωσε από την πλευρά του ο David Moses, επίκουρος καθηγητής νευρολογικής χειρουργικής στο UCSF και συν-συγγραφέας της έρευνας.
Με πληροφορίες από Guardian