Σοβαρά κενά ασφαλείας στο Grok 3 του Έλον Μασκ - Έυκολη παραβίαση του μοντέλου

Η έρευνα αποκάλυψε ότι το μοντέλο μπορεί να δώσει οδηγίες για επικίνδυνες δραστηριότητες, όπως η κατασκευή βομβών, η διακίνηση ναρκωτικών και η απόκρυψη εγκλημάτων

LifO Newsroom 20.2.2025 | 09:12

Σοβαρά κενά ασφαλείας στο Grok 3 του Έλον Μασκ - Έυκολη παραβίαση του μοντέλου — Ελον Μασκ/ Φωτ.: EPA

20.2.2025 | 09:12

Το Grok 3, το νέο γλωσσικό μοντέλο που παρουσίασε η xAI του Έλον Μασκ, αποδεικνύεται ιδιαίτερα ευάλωτο σε κυβερνοεπιθέσεις, σύμφωνα με έρευνα της εταιρείας ασφάλειας Adversa AI.

Οι ερευνητές εντόπισαν σοβαρές αδυναμίες που επιτρέπουν σε κακόβουλους χρήστες να παρακάμψουν τους μηχανισμούς ασφαλείας του μοντέλου, καθιστώντας το εν δυνάμει «κυβερνο-όπλο».

Σύμφωνα με τον CEO της Adversa AI, Άλεξ Πολιακόβ, το Grok 3 είναι εξαιρετικά ευάλωτο σε "απλά jailbreaks" – τεχνικές που επιτρέπουν την παράκαμψη των περιορισμών του μοντέλου. Η έρευνα αποκάλυψε ότι το μοντέλο μπορεί να δώσει οδηγίες για επικίνδυνες δραστηριότητες, όπως η κατασκευή βομβών, η διακίνηση ναρκωτικών και η απόκρυψη εγκλημάτων.

Πέρα από τα jailbreaks, οι ερευνητές ανακάλυψαν ένα ακόμη πιο σοβαρό πρόβλημα: το μοντέλο διέρρευσε ολόκληρη την εσωτερική προτροπή (system prompt), δίνοντας στους επιτιθέμενους τη δυνατότητα να κατανοήσουν τον αλγόριθμό του και να εκμεταλλευτούν τις αδυναμίες του στο μέλλον.

Το Grok 3 συγκέντρωσε θετικές κριτικές για την απόδοσή του σε γλωσσικά benchmarks, με τον ερευνητή Αντρέι Καρπάθι να το συγκρίνει με τα πιο ισχυρά μοντέλα της OpenAI. Ωστόσο, στα τεστ κυβερνοασφάλειας της Adversa AI, τρία από τα τέσσερα jailbreaks που δοκιμάστηκαν πέτυχαν, σε αντίθεση με τα μοντέλα της OpenAI και της Anthropic που άντεξαν όλες τις επιθέσεις.

«Η ασφάλεια του Grok 3 είναι αδύναμη στα ίδια επίπεδα με τα κινεζικά LLMs, όχι με τη δυτική τεχνολογία», δήλωσε ο Πολιακόβ. «Όλα αυτά τα νέα μοντέλα φαίνεται να δίνουν προτεραιότητα στην ταχύτητα ανάπτυξης, εις βάρος της ασφάλειας».

Οι ειδικοί προειδοποιούν ότι τα ευάλωτα μοντέλα όπως το Grok 3 θα μπορούσαν να αποτελέσουν σοβαρό κίνδυνο όταν χρησιμοποιηθούν σε AI Agents – λογισμικά που εκτελούν ενέργειες για λογαριασμό των χρηστών. Ένα παράδειγμα που αναφέρει η Adversa AI είναι η δυνατότητα των επιτιθέμενων να εισάγουν κακόβουλες εντολές σε emails ή μηνύματα, κάνοντας τους AI Agents να τις εκτελέσουν αυτόματα.

«Αυτή η απειλή δεν είναι θεωρητική – είναι το μέλλον της εκμετάλλευσης των AI», δήλωσε ο Πολιακόβ. «Όταν τα LLMs αρχίσουν να παίρνουν πραγματικές αποφάσεις, κάθε ευπάθεια θα μετατραπεί σε πιθανή κυβερνοεπίθεση».

Με τις AI εταιρείες να επιταχύνουν την ανάπτυξη τέτοιων συστημάτων, όπως το νέο «Operator» της OpenAI, οι ειδικοί τονίζουν ότι η ασφάλεια πρέπει να αποτελέσει κορυφαία προτεραιότητα, πριν οι κίνδυνοι γίνουν ανεξέλεγκτοι.

Τech & Science

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Διεθνή / Τραμπ: Εκτελεστικό διάταγμα για τον τερματισμό των ομοσπονδιακών παροχών σε παράτυπους μετανάστες

Την ίδια ημέρα, ο Τραμπ υπέγραψε διάταγμα που απαιτεί από όλα τα υπουργεία να επανεξετάσουν τους κανονισμούς τους, σε συνεργασία με την ομάδα του Έλον Μασκ για την «αποτελεσματικότητα της κυβέρνησης»

Tags

ΕΓΓΡΑΦΕΙΤΕ ΣΤΟ NEWSLETTER ΜΑΣ

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Διεθνή / Τραμπ: Εκτελεστικό διάταγμα για τον τερματισμό των ομοσπονδιακών παροχών σε παράτυπους μετανάστες

Διεθνή / Τραμπ και Μασκ αντάλλαξαν λόγια αγάπης στη κοινή συνέντευξή τους: «Προσπαθούν να μας χωρίσουν»

ΔΙΑΒΑΖΟΝΤΑΙ ΤΩΡΑ

Τούρκος ηθοποιός ακύρωσε την εμφάνισή του σε ελληνικό θέατρο λόγω απαγόρευσης Ερντογάν

Το φρούτο που μειώνει την υπέρταση, σύμφωνα με το Πανεπιστήμιο του Γουότερλου

Δυστύχημα στην Εγνατία Οδό: Τι ισχυρίζεται ο οδηγός πως συνέβη - Την Παρασκευή η απολογία του

ΗΠΑ εναντίον Τουρκίας: Οι κυρώσεις «παγώνουν» κρίσιμες εξοπλιστικές συμφωνίες

Ααρόν Μπουπεντζά: Νεκρός ο ποδοσφαιριστής μετά από πτώση από τον 11ο όροφο πολυκατοικίας

Τρία σημάδια που δείχνουν ότι οι ΗΠΑ μπορεί ήδη να βρίσκονται σε ύφεση και ας μην το παραδέχονται

ΔΕΙΤΕ ΑΚΟΜΑ

Τech & Science / Η αινιγματική εμμονή του Tim Cook να προσπεράσει τη Meta και τον Mark Zuckerberg

Τech & Science / Spotify: Χιλιάδες χρήστες σε όλο τον κόσμο αναφέρουν προβλήματα στην πλατφόρμα

Τech & Science / Το φρούτο που μειώνει την υπέρταση, σύμφωνα με το Πανεπιστήμιο του Γουότερλου

Τech & Science / ΠΟΥ: «Ιστορική συμφωνία» για την προετοιμασία κατά μελλοντικών πανδημιών - Απούσα η Ουάσινγκτον

Τech & Science / Καταγράφηκε για πρώτη φορά ζωντανό κολοσσιαίο καλαμάρι στα βάθη της Ανταρκτικής

Τech & Science / «Καμπανάκι» ερευνητών για παιδικά στρώματα: «Περιέχουν χημικές ουσίες που μπορούν να βλάψουν τον εγκέφαλο»

Τech & Science / Ανατροπή με το πώς κινητά και υπολογιστές επηρεάζουν το μυαλό - Νέα έρευνα

Τech & Science / Η «τρελή ιδέα» του Μαρκ Ζούκερμπεργκ να διαγράψει τους φίλους όλων στο Facebook

Τech & Science / Συνδυασμός δύο φθηνών φαρμάκων σώζει ζωές μετά από καρδιακή προσβολή, δείχνει μελέτη

Τech & Science / Έρευνα: Ο καρκίνος του τραχήλου της μήτρας θα έχει εξαλειφθεί στη Δανία μέχρι το 2040

Τech & Science / Η Sony αυξάνει την τιμή του Playstation 5 κατά 25% λόγω των εμπορικών πιέσεων

Τech & Science / Πάρκινσον: Πώς τα φυτοφάρμακα μπορεί να τροφοδοτούν μια παγκόσμια επιδημία

Τech & Science / «Υπαρξιακή απειλή»: Η Meta στο εδώλιο για την εξαγορά των Instagram και WhatsApp

Τech & Science / Ήταν ήδη υπό εξαφάνιση οι δεινόσαυροι πριν χτυπήσει ο αστεροειδής; Νέα μελέτη το αμφισβητεί

Τech & Science / Πάνω από 3 εκατ. παιδιά παγκοσμίως πέθαναν το 2022 από λοιμώξεις

Τech & Science / Νέο επαναστατικό εμβόλιο για τον καρκίνο του δέρματος χορηγείται σε ασθενείς στην Αγγλία μέσω ταχείας πρόσβασης από το NHS

Τech & Science / Γιατί ένας οδηγός της Amazon θα μπορούσε να είναι αυτός που θα σας σώσει τη ζωή

Τech & Science / Αρχαία γνάθος που ανακαλύφθηκε στην Ταϊβάν ανήκει σε μυστηριώδεις προγόνους του ανθρώπου

Τech & Science / Η «αναβίωση» του ανταρόλυκου: Το επιστημονικό επίτευγμα που ξανανοίγει τη συζήτηση για τα όρια της γενετικής

Τech & Science / ΗΠΑ: Ασθενής επιβίωσε επί τέσσερις μήνες με νεφρό από χοίρο