Αλγόριθμος φτιάχνει μικρές βιντεοταινίες από ένα μικρό μόνο κείμενο

Αλγόριθμος φτιάχνει μικρές βιντεοταινίες από ένα μικρό μόνο κείμενο Facebook Twitter
0

Ένας νέος αλγόριθμος τεχνητής νοημοσύνης τροφοδοτείται με λίγες γραμμές κειμένου και τις μετατρέπει σε -προς το παρόν σύντομη- βιντεοταινία.

Στο μέλλον μια τέτοια τεχνική αναμένεται να αξιοποιηθεί ευρέως από τον τομέα της ψυχαγωγίας (π.χ. οι σεναριογράφοι θα μπορούν να βλέπουν δοκιμαστικά πώς φαίνεται το σενάριό τους) έως της εγκληματολογίας (π.χ. θα μπορεί να αναπαραχθεί οπτικά η σκηνή ενός φόνου ή ενός τροχαίου από μια μαρτυρική κατάθεση).

Οι ερευνητές, με επικεφαλής τον Γιτόνγκ Λι του Τμήματος Επιστήμης των Υπολογιστών του Πανεπιστημίου Ντιουκ της Β.Καρολίνα, που παρουσίασαν τη δουλειά τους σε συνέδριο της Ένωσης για την Προώθηση της Τεχνητής Νοημοσύνης στη Λουιζιάνα των ΗΠΑ, σύμφωνα με το "Science", εκπαίδευσαν τον αλγόριθμό τους, έτσι ώστε όταν κανείς πληκτρολογεί π.χ. «παιγνίδι στο λιβάδι» ή «σέρφινγκ στη θάλασσα», να δημιουργείται αυτόματα μια σχετική σύντομη βιντεοταινία.

Το σύστημα ανταποκρίνεται ακόμη και σε «παράλογα» κείμενα, όπως «ιστιοπλοΐα στο χιόνι» ή «γκολφ στην πισίνα», πράγμα πολύ χρήσιμο για καλλιτεχνικές δημιουργίες με φαντασία.

Η τεχνητή νοημοσύνη βελτιώνεται συνεχώς στο να καταλαβαίνει το περιεχόμενο των εικόνων και να βάζει τις κατάλληλες λεζάντες σε φωτογραφίες. Πιο δύσκολο είναι το αντίστροφο, δηλαδή να παράγει εικόνες από λεζάντες. Ενώ έως τώρα είχε αποδειχθεί σχεδόν αδύνατο να παράγονται κινούμενες εικόνες (βίντεο) από λεζάντες και εν γένει από σύντομα κείμενα.

Το νέο σύστημα μηχανικής μάθησης είναι ο πρώτος αλγόριθμος μετατροπής κειμένου σε βίντεο που καταφέρνει να πετύχει σχετικά καλά αποτελέσματα. Δεν είναι τέλειες οι ταινίες του, αλλά αρχίζουν να μοιάζουν με πραγματικά βίντεο.

Ο αλγόριθμος είναι ένα νευρωνικό δίκτυο, που επεξεργάζεται τα δεδομένα με τρόπο παρεμφερή με τους νευρώνες του εγκεφάλου. Στη διάρκεια της αυτοεκπαίδευσής του, αξιολογεί συνεχώς τις επιτυχίες και τα λάθη του, βελτιώνοντας έτσι σταδιακά τις επιδόσεις του.

Ακόμη κάνει λάθη (π.χ. μπορεί να μπερδέψει την ιστιοπλοΐα με το kitesurfing), τα βίντεό του διαρκούν μόλις λίγα δευτερόλεπτα και έχουν μέγεθος γραμματοσήμου, ενώ οι φιγούρες των ανθρώπων συχνά εμφανίζουν παραμόρφωση. Αλλά αποτελεί μια πρόοδο και, επιπλέον, επιτρέπει σε κάποιον να πάρει μια ιδέα για το πώς είναι να κάνει σκι στην έρημο!

Τech & Science
0

ΔΕΙΤΕ ΑΚΟΜΑ

Ο Ανταρόλυκος επιστρέφει: Πώς επιστήμονες «ανέστησαν» ένα προϊστορικό ζώο που εξαφανίστηκε πριν 13.000 χρόνια

Τech & Science / Ο Ανταρόλυκος επιστρέφει: Πώς επιστήμονες «ανέστησαν» ένα προϊστορικό ζώο που εξαφανίστηκε πριν 13.000 χρόνια

Οι ειδικοί έφεραν τους Ανταρόλυκους στη ζωή χρησιμοποιώντας τεχνική παρόμοια τη μέθοδο που γεννήθηκε το πρώτο κλωνοποιημένο θηλαστικό, το πρόβατο Dolly
LIFO NEWSROOM
Η NASA φωτογράφισε τον αστεροειδή που τελικά δεν θα χτυπήσει τη γη - Ίσως συγκρουστεί με τη Σελήνη

Τech & Science / Η NASA φωτογράφισε τον αστεροειδή που τελικά δεν θα χτυπήσει τη γη - Οι πιθανότητες να συγκρουστεί με τη Σελήνη

Οι πιθανότητες πρόσκρουσης με τη Σελήνη είναι 3,8%, αν και η NASA σημειώνει ότι ακόμη και σε περίπτωση σύγκρουσης, η τροχιά του φεγγαριού δεν θα αλλάξει
LIFO NEWSROOM
Μήπως οι άνθρωποι αρχίζουν να προτιμούν την ενσυναίσθηση της Τεχνητής Νοημοσύνης από την ανθρώπινη;

Τech & Science / Μήπως οι άνθρωποι αρχίζουν να προτιμούν την ενσυναίσθηση της Τεχνητής Νοημοσύνης από την ανθρώπινη;

Πιο «ανθρώπινο» κι από άνθρωπο αποδείχθηκε το GPT-4.5, σύμφωνα με νέα έρευνα – γιατί το τεστ Τιούρινγκ ίσως πλέον δεν αφορά την τεχνητή νοημοσύνη, αλλά εμάς τους ίδιους
LIFO NEWSROOM