Ένας νέος αλγόριθμος που αναπτύχθηκε από ερευνητές του Πανεπιστημίου Stony Brook της Νέας Υόρκης είναι σε θέση να προβλέψει με ακρίβεια που φθάνει το 84%, εάν το επόμενο βιβλίο σου θα είναι μια εκδοτική επιτυχία!
Η ομάδα των ερευνητών, ανέπτυξε ένα σύστημα που ονομάζεται "στατιστική μέτρηση του στιλ" (statistical stylometry) το οποίο, εξετάζοντας με μαθηματικό τρόπο το στιλ γραφής, τις λέξεις, το συντακτικό και τη γραμματική ενός βιβλίου, είναι σε θέση να προβλέψει εάν θα γίνει ένα μπεστ σέλερ.
Η ομάδα εργάστηκε σε έναν ογκώδη αριθμό κειμένων αναλύοντας όλα τα κλασικά βιβλία που βρίσκονται ψηφιοποιημένα στο αρχείο Project Gutenberg, με βάση το λεξιλόγιο και τη δομή του καθενός. Στη συνέχεια, συνέκριναν τις προβλέψεις του αλγορίθμου με τα ιστορικά στοιχεία της εκδοτικής η μή επιτυχίας όλων των βιβλίων. Ο αλγόριθμος κατάφερε να διακρίνει την επιτυχία κάθε βιβλίου με ακρίβεια 84 τοις εκατό!
Ποια είναι όμως τα στοιχεία που - με βάση τον παραπάνω αλγόριθμο - συνθέτουν ένα μπεστ σέλερ;
Ένας γενικός κανόνας που προέκυψε ήταν ότι τα επιτυχημένα βιβλία χρησιμοποιούν περισσότερους συνδέσμους ("και" και "αλλά"), καθώς και μεγάλο αριθμό ουσιαστικών και επιθέτων. Αντίθετα, αποτυχημένα εκδοτικά έργα περιλαμβάνουν περισσότερα ρήματα και επιρρήματα που περιγράφουν ευθέως δράσεις και συναισθήματα όπως "ήθελε", "πήρε" ή "υποσχέθηκε". Τα ρήματα σε επιτυχημένα βιβλία περιγράφουν πιο συχνά τον τρόπο σκέψης με λέξεις όπως, "αναγνώρισε" ή "θυμήθηκε".
Για πλάκα, οι ερευνητές αναφέρουν ότι εξέτασαν με τον αλγόριθμο αρκετά από τα βιβλία που βρίσκονται στη λίστα με τις εκδοτικές αποτυχίες του Amazon, όπου κι εκεί ο αλγόριθμος ήταν εντυπωσιακά εύστοχος στις προβλέψεις του.
Η έρευνα δημοσιεύεται από την Ένωση Υπολογιστικής Γλωσσολογίας.
[via]
σχόλια