Όπως αναφέρει με σχετικό του δημοσίευμα το BBC, η Google, έχει σημειώσει τεράστια βήματα προόδου στο να 'εκπαιδεύει' το λογισμικό αναγνώρισης εικόνων που διαθέτειο, ώστε να περιγράφει, σε μορφή λεζάντας, με απλά λόγια μια φωτογραφία. Μάλιστα, η ακρίβεια των περιγραφών του συστήματος αναγνώρισης φωτογραφιών της Google, είναι πλέον τόσο ακριβής, που μοιάζει σαν να έχει γραφτεί από ανθρώπινο χέρι.
Η Google υποστηρίζει ότι το νέο λογισμικό αυτόματης αναγνώρισης και περιγραφής εικόνων εκτός του ότι διευκολύνει την αναζήτηση εικόνων στο διαδίκτυο, αποτελεί ένα χρήσιμο εργαλείο και στα άτομα με απώλεια όρασης, αφού με την ακριβή περιγραφή του, θα τους βοηθά να σχηματίσουν στο μυαλό τους την εκάστοτε φωτογραφία.
Το συγκεκριμένο υπολογιστικό μοντέλο που αναγνωρίζει και περιγράφει τις φωτογραφίες, στηρίζεται σε ένα δίκτυο νευρώνων που κάνει λογικούς συνειρμούς, μιμούμενο τον ανθρώπινο εγκέφαλο και είναι το αποτέλεσμα σκληρήσς δουλειάς τεσσάρων επιστημόνων στο τμήμα έρευνας της Google.
Οι Oriol Vinyals, Alexander Toshev, Samy Bengio και Dumitru Erhan περιγράφοντας το νέο σύστημα περιγραφής φωτογραφιών στο blog του Google Research, υπογραμμίζουν ότι "Μια εικόνα μπορεί να αξίζει όσο χίλιες λέξεις αλλά κάποιες φορές, η βαρύτητα πέφτει στις λέξεις, οπότε έπρεπε να εφεύρουμε μια μέθοδο που θα μεταφράζει αυτόματα και με ακρίβεια τις εικόνες σε λέξεις".
Ιδού ορισμένα επιτυχημένα παραδείγματα της αυτόματης περιγραφής και τιτλοφόρησης φωτογραφιών από το σύστημα της Google:
...αλλά και ορισμένες ατυχείς στιγμές:
[ΠΗΓΗ]
σχόλια