Αλγόριθμος φτιάχνει μικρές βιντεοταινίες από ένα μικρό μόνο κείμενο

Αλγόριθμος φτιάχνει μικρές βιντεοταινίες από ένα μικρό μόνο κείμενο Facebook Twitter
0

Ένας νέος αλγόριθμος τεχνητής νοημοσύνης τροφοδοτείται με λίγες γραμμές κειμένου και τις μετατρέπει σε -προς το παρόν σύντομη- βιντεοταινία.

Στο μέλλον μια τέτοια τεχνική αναμένεται να αξιοποιηθεί ευρέως από τον τομέα της ψυχαγωγίας (π.χ. οι σεναριογράφοι θα μπορούν να βλέπουν δοκιμαστικά πώς φαίνεται το σενάριό τους) έως της εγκληματολογίας (π.χ. θα μπορεί να αναπαραχθεί οπτικά η σκηνή ενός φόνου ή ενός τροχαίου από μια μαρτυρική κατάθεση).

Οι ερευνητές, με επικεφαλής τον Γιτόνγκ Λι του Τμήματος Επιστήμης των Υπολογιστών του Πανεπιστημίου Ντιουκ της Β.Καρολίνα, που παρουσίασαν τη δουλειά τους σε συνέδριο της Ένωσης για την Προώθηση της Τεχνητής Νοημοσύνης στη Λουιζιάνα των ΗΠΑ, σύμφωνα με το "Science", εκπαίδευσαν τον αλγόριθμό τους, έτσι ώστε όταν κανείς πληκτρολογεί π.χ. «παιγνίδι στο λιβάδι» ή «σέρφινγκ στη θάλασσα», να δημιουργείται αυτόματα μια σχετική σύντομη βιντεοταινία.

Το σύστημα ανταποκρίνεται ακόμη και σε «παράλογα» κείμενα, όπως «ιστιοπλοΐα στο χιόνι» ή «γκολφ στην πισίνα», πράγμα πολύ χρήσιμο για καλλιτεχνικές δημιουργίες με φαντασία.

Η τεχνητή νοημοσύνη βελτιώνεται συνεχώς στο να καταλαβαίνει το περιεχόμενο των εικόνων και να βάζει τις κατάλληλες λεζάντες σε φωτογραφίες. Πιο δύσκολο είναι το αντίστροφο, δηλαδή να παράγει εικόνες από λεζάντες. Ενώ έως τώρα είχε αποδειχθεί σχεδόν αδύνατο να παράγονται κινούμενες εικόνες (βίντεο) από λεζάντες και εν γένει από σύντομα κείμενα.

Το νέο σύστημα μηχανικής μάθησης είναι ο πρώτος αλγόριθμος μετατροπής κειμένου σε βίντεο που καταφέρνει να πετύχει σχετικά καλά αποτελέσματα. Δεν είναι τέλειες οι ταινίες του, αλλά αρχίζουν να μοιάζουν με πραγματικά βίντεο.

Ο αλγόριθμος είναι ένα νευρωνικό δίκτυο, που επεξεργάζεται τα δεδομένα με τρόπο παρεμφερή με τους νευρώνες του εγκεφάλου. Στη διάρκεια της αυτοεκπαίδευσής του, αξιολογεί συνεχώς τις επιτυχίες και τα λάθη του, βελτιώνοντας έτσι σταδιακά τις επιδόσεις του.

Ακόμη κάνει λάθη (π.χ. μπορεί να μπερδέψει την ιστιοπλοΐα με το kitesurfing), τα βίντεό του διαρκούν μόλις λίγα δευτερόλεπτα και έχουν μέγεθος γραμματοσήμου, ενώ οι φιγούρες των ανθρώπων συχνά εμφανίζουν παραμόρφωση. Αλλά αποτελεί μια πρόοδο και, επιπλέον, επιτρέπει σε κάποιον να πάρει μια ιδέα για το πώς είναι να κάνει σκι στην έρημο!

Τech & Science
0

ΔΕΙΤΕ ΑΚΟΜΑ

Τι μας δείχνουν τα πρώτα ίχνη ζωής εκτός της Γης;

Διάστημα / Βρέθηκαν όντως ίχνη εξωγήινης ζωής;

Τι ανακάλυψε ακριβώς το τηλεσκόπιο James Webb; Θα υπάρξει σύντομα κατοικήσιμος πλανήτης; Πόσο κοντά είμαστε στην κατάκτηση του Διαστήματος; Ο αστρονόμος και καθηγητής Φυσικής του Διαστήματος Ξενοφών Μουσάς εξηγεί τι σηματοδοτεί η ανακάλυψη του Πανεπιστημίου του Κέιμπριτζ.
ΓΙΑΝΝΗΣ ΠΑΝΤΑΖΟΠΟΥΛΟΣ
Δεινόσουχος: Ο γιγάντιος πρόγονος των κροκοδείλων που κυνηγούσε δεινόσαυρους και άντεχε το αλμυρό νερό

Τech & Science / Δεινόσουχος: Ο γιγάντιος πρόγονος των κροκοδείλων που κυνηγούσε δεινόσαυρους και άντεχε το αλμυρό νερό

Ο Δεινόσουχος, ένας τεράστιος προϊστορικός συγγενής των κροκοδείλων, μπορούσε να τρώει δεινόσαυρους και να διασχίζει θάλασσες χάρη στην ανοχή του στο αλμυρό νερό. Νέα μελέτη ανατρέπει όσα γνωρίζαμε για την εξέλιξή του.
LIFO NEWSROOM
Πρωτοποριακή μελέτη: Ενήλικες με αλλεργία στα φιστίκια μπορούν να μειώσουν την ευαισθησία τους σε αυτά

Τech & Science / Πρωτοποριακή μελέτη: Ενήλικες με αλλεργία στα φιστίκια μπορούν να μειώσουν την ευαισθησία τους σε αυτά

Νέα έρευνα δείχνει ότι η καθημερινή έκθεση σε μικρές δόσεις φιστικιού μπορεί να μειώσει τις αλλεργικές αντιδράσεις σε ενήλικες με σοβαρή αλλεργία - Ελπίδες για νέα θεραπευτική προσέγγιση
LIFO NEWSROOM
Σεισμοί βαθιά κάτω από τη Σιέρα Νεβάδα αποκαλύπτουν πώς σχηματίζονται οι ήπειροι

Τech & Science / Σεισμοί βαθιά κάτω από τη Σιέρα Νεβάδα στην Καλιφόρνια αποκαλύπτουν πώς σχηματίζονται οι ήπειροι

Ασυνήθιστοι σεισμοί σε βάθη έως και 40 χλμ. κάτω από τη Σιέρα Νεβάδα δείχνουν ότι η λιθόσφαιρα της Γης αποκολλάται. Μια σπάνια ματιά σε μια διαδικασία που δημιουργεί ηπείρους
LIFO NEWSROOM