Η Google παρουσιάζει την τέλεια απομίμηση ανθρώπινης φωνής από Τεχνητή Νοημοσύνη

Η Google μόλις αποκάλυψε την πρώτη αλάνθαστη εξομοίωση της ανθρώπινης φωνής από το νέο της σύστημα Τεχνητής Νοημοσύνης.

Γιάννης Παπαϊωάννου 27.12.2017 | 15:40

27.12.2017 | 15:40

Πριν ένα χρόνο το σύστημα WaveNet της Google είχε φέρει την τεχνητή και μηχανική ομιλία σε πρωτοποριακά επίπεδα. Λίγο πριν κλείσει το 2017 η Google ανακοίνωσε ένα νέο σύστημα που μετατρέπει κείμενο σε ομιλία με μια τεχνητή φωνή που πολύ δύσκολα ξεχωρίζει από ανθρώπινη.

Η Google πρωτοπορεί με ένα ολοκαίνουργιο σύστημα μετατροπής κειμένου σε ομιλία το οποίο ονομάζει Tacotron 2 και λειτουργεί με εκπληκτική ακρίβεια, παρέχοντας φωνητικές αφηγήσεις που δεν διακρίνονται από τη φωνή ενός πραγματικού ανθρώπου. Και δεν για υπερβολή: Το Tacotron 2 τεχνολογία δεύτερης γενιάς και αποτελείται από δύο βαθιά νευρωνικά δίκτυα, ένα που μετατρέπει το κείμενο σε ένα ειδικό φασματογράφημα (όπως αυτό που βλέπετε στην εικόνα παρακάτω) και ένα δεύτερο, το WaveNet, που διαβάζει αυτό το γράφημα και το ερμηνεύει σε μια πραγματική φωνή.

Το σύστημα μέχρι σήμερα είναι εκπαιδευμένο να εργάζεται μόνο στα αγγλικά με τη μία θηλυκή φωνή που μπορείτε να ακούσετε στα δείγματα που βρίσκονται στο σύνδεσμο παρακάτω. Το εκπληκτικό όμως δεν είναι ότι μπορεί να διαβάσει με τέλεια προφορά (η οποία δεν ξεχωρίζει από την ανθρώπινη), αλλά ότι είναι σε θέση να τονίζει τις αποχρώσεις σε μια πρόταση. Επίσης, αν μια συγκεκριμένη λέξη είναι γραμμένη με κεφαλαία, θα της προσθέσει μια έμφαση στον τρόπο απόδοσής της, ενώ εάν προσπαθήσει να διαβάζει μια πρόταση που έχει γραφτεί με μοντέρνο τρόπο, θα την καταλάβει και θα τη διαβάσει, αφού το σύστημα αυτό είναι σε θέση να αντιμετωπίσει και μια μικρή (ακόμα) ποσότητα τυπογραφικών λαθών ή μοντέρνας έκφρασης.

Το νέο σύστημα, με κανένα τρόπο, δεν ακούγεται ρομποτικό ή ψηφιοποιημένο και μπορεί να πει τη σωστή προφορά δύο ίδιων γραμμένων λέξεων ανάλογα με τη σημασία τους στην πρόταση.

Μια πλήρης περιγραφή του νέου συστήματος της Google μπορεί να βρεθεί στην εργασία «Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions.» Χρησιμοποιώντας ένα μοντέλο ακολουθιών το Tacotron 2 χαρτογραφεί την ακολουθία των γραμμάτων σε μια σειρά χαρακτηριστικών που κωδικοποιούν τον ήχο. Όλα αυτά τα χαρακτηριστικά, δημιουργούν ένα 80-διάστατο φασματογράφημα ήχου, χωρισμένο σε καρέ που υπολογίζονται κάθε 12,5 χιλιοστά του δευτερολέπτου, τα οποία καταγράφουν όχι μόνο την προφορά λέξεων αλλά και διάφορες λεπτές αποχρώσεις της ανθρώπινης ομιλίας, συμπεριλαμβανομένου του όγκου, της ταχύτητας και του ήχου. Τέλος, αυτά τα χαρακτηριστικά μετατρέπονται σε μια κυματομορφή 24 kHz χρησιμοποιώντας την αρχιτεκτονική του συστήματος WaveNet.

Σε αντίθεση με ορισμένες βασικές έρευνες AI που κάνει η εταιρεία, αυτή η τεχνολογία είναι άμεσα χρήσιμη για την Google. Το WaveNet, που ανακοινώθηκε για πρώτη φορά το 2016, χρησιμοποιείται τώρα για τη δημιουργία της φωνής στο Google Assistant. Μόλις προετοιμαστεί για παραγωγή, το Tacotron 2 θα μπορούσε να είναι μια ακόμη πιο ισχυρή προσθήκη στην υπηρεσία.

Ωστόσο, το σύστημα έχει «εκπαιδευτεί» για να μιμείται μόνο τη συγκεκριμένη θηλυκή φωνή. Για να μιλήσει σαν άνδρας ή κάποια άλλη γυναίκα, η Google θα πρέπει να εκπαιδεύσει ξανά το σύστημα απο την αρχή.

Εδώ μπορείτε να ακούσετε τα φανταστικά δείγματα της νέας τεχνητής φωνής της Google σε σύγκριση με τα πραγματικά δείγματα πάνω στα οποία εκπαιδεύτηκε.

Τech & Science

ΔΕΙΤΕ ΑΚΟΜΑ

Τech & Science / Ο Ανταρόλυκος επιστρέφει: Πώς επιστήμονες «ανέστησαν» ένα προϊστορικό ζώο που εξαφανίστηκε πριν 13.000 χρόνια

Οι ειδικοί έφεραν τους Ανταρόλυκους στη ζωή χρησιμοποιώντας ανάλογη μέθοδο με εκείνη βάσει της οποίας δημιουργήθηκε το πρώτο κλωνοποιημένο θηλαστικό, το πρόβατο Dolly

Η Google παρουσιάζει την τέλεια απομίμηση ανθρώπινης φωνής από Τεχνητή Νοημοσύνη

Tags

ΕΓΓΡΑΦΕΙΤΕ ΣΤΟ NEWSLETTER ΜΑΣ

ΔΙΑΒΑΖΟΝΤΑΙ ΤΩΡΑ

Ο Ανταρόλυκος επιστρέφει: Πώς επιστήμονες «ανέστησαν» ένα προϊστορικό ζώο που εξαφανίστηκε πριν 13.000 χρόνια

«Συγχώρεσέ με» - Μαντόνα και Έλτον Τζον βάζουν τέλος στην πολυετή κόντρα τους

Δημήτρης Παπαϊωάννου: Επίτιμος διδάκτορας του Πανεπιστημίου Θεάτρου και Κινηματογράφου στο Βουκουρέστι

Μεγάλη φωτιά στο Παρίσι - Έκκληση της Πυροσβεστικής στους πολίτες να αποφύγουν την περιοχή

Τραμπ: «Η ΕΕ θα πρέπει να αγοράσει ενέργεια από τις Ηνωμένες Πολιτείες»

Άργος: Βάφτηκε το κτίριο στον αρχαιολογικό χώρο που προκάλεσε την αντίδραση της Μενδώνη

ΔΕΙΤΕ ΑΚΟΜΑ

Τech & Science / Ο Ανταρόλυκος επιστρέφει: Πώς επιστήμονες «ανέστησαν» ένα προϊστορικό ζώο που εξαφανίστηκε πριν 13.000 χρόνια

Τech & Science / Το X αυστηροποιεί τους κανόνες για τα parody accounts

Τech & Science / Νέα μελέτη: Τα οφέλη της φαρμακευτικής αγωγής για τη ΔΕΠΥ υπερτερούν των κινδύνων

Τech & Science / Κρύβουν οι μέλισσες το μυστικό της μακροζωίας; Τι εξετάζουν ερευνητές

Τech & Science / Hantavirus: Τρεις νεκροί από τον σπάνιο ιό των τρωκτικών που σκότωσε τη σύζυγο του Τζιν Χάκμαν

Τech & Science / «Ένα θαύμα χωρίς πόδια και κεφάλι»: Το απολίθωμα - γρίφος 444 εκατ. ετών

Τech & Science / Το πρόσωπο γυναίκας από τη Μυκηναϊκή εποχή «ζωντανεύει» 3.500 χρόνια μετά

Τech & Science / Γαστρεντερολόγος του Harvard εξηγεί γιατί πρέπει να πετάξουμε το χαρτί τουαλέτας

Τech & Science / Τα πέντε πράγματα που σίγουρα δεν πρέπει να μοιράζεστε με το ChatGPT

Τech & Science / Πώς επηρεάζουν την ενδομητρίωση γλουτένη, καφές, γαλακτοκομικά και αλκοόλ, δείχνει μελέτη

Τech & Science / Ψηφιακό avatar εμφανίστηκε σε δικαστήριο της Νέας Υόρκης - και εξόργισε την έδρα

Τech & Science / Η έρημος Σαχάρα κάποτε ήταν μία καταπράσινη σαβάνα - Τι γνωρίζουμε για τη φυλή που ζούσε εκεί

Τech & Science / Επιληψία: Νέος μαγνητικός τομογράφος επιτρέπει χειρουργική επέμβαση που «αλλάζει τη ζωή των ασθενών»

Τech & Science / Η NASA φωτογράφισε τον αστεροειδή που τελικά δεν θα χτυπήσει τη γη - Οι πιθανότητες να συγκρουστεί με τη Σελήνη

Τech & Science / Μήπως οι άνθρωποι αρχίζουν να προτιμούν την ενσυναίσθηση της Τεχνητής Νοημοσύνης από την ανθρώπινη;

Τech & Science / Οι αρσενικές μύγες πίνουν αλκοόλ για να γίνουν πιο ελκυστικές - Γιατί είναι αποτελεσματικό

Τech & Science / Ο μικρότερος βηματοδότης στον κόσμο, είναι ενέσιμος και διαλύεται μετά τη χρήση

Τech & Science / Η «παρενέργεια» που έχει στον εγκέφαλο τεχνητή γλυκαντική ουσία από ποτά διαίτης

Τech & Science / Έρευνα ΠΙΣ: Δυσαρεστημένοι από το σύστημα Υγείας οι πολίτες, ικανοποιημένοι από τους γιατρούς

Τech & Science / Nintendo Switch 2: Κυκλοφορεί τον Ιούνιο με έμφαση στο streaming

σχόλια