Μπορεί το ChatGPT να αποκαλύψει τα «μυστικά» του με μια λέξη; – Τι έδειξε έρευνα της Google

Μπορεί το ChatGPT να αποκαλύψει τα «μυστικά» του με μια λέξη; – Τι έδειξε έρευνα της Google
A laptop screen is seen with the OpenAI ChatGPT website active in this photo illustration on 02 August, 2023 in Warsaw, Poland. (Photo by Jaap Arriens/NurPhoto) (Photo by Jaap Arriens / NurPhoto / NurPhoto via AFP) Photo: AFP
Ορισμένες λέξεις-κλειδιά ανάγκασαν το bot να αποκαλύψει τμήματα του συνόλου δεδομένων στα οποία εκπαιδεύτηκε.

Ένα από τα σημεία που παρουσιάζουν μεγάλο ενδιαφέρον γύρω από τη λειτουργία του ChatGPT είναι το πως το εργαλείο τεχνητής νοημοσύνης της OpenAI καταλήγει στις απαντήσεις που δίνει σε κάθε ερώτηση του εκάστοτε χρήστη.

Μια ομάδα ερευνητών της Google υποστήριξε πως ορισμένες λέξεις-κλειδιά ανάγκασαν το bot να αποκαλύψει τμήματα του συνόλου δεδομένων στα οποία εκπαιδεύτηκε.

Σε ένα παράδειγμα που δημοσιεύθηκε την περασμένη εβδομάδα, το μοντέλο έδωσε αυτό που φαινόταν να είναι μια πραγματική διεύθυνση email και ένας αριθμός τηλεφώνου αφού του ζητήθηκε να επαναλάβει τη λέξη «ποίημα» για πάντα.

Οι ερευνητές δήλωσαν ότι η απελευθέρωση προσωπικών πληροφοριών συνέβαινε συχνά όταν εκτελούσαν την επίθεση, ανέφερε το businessinsider.com.

Μια παρόμοια διαρροή δεδομένων εκπαίδευσης επιτεύχθηκε επίσης όταν το ChatGPT κλήθηκε να επαναλάβει τη λέξη «εταιρεία» για πάντα, σε ένα άλλο παράδειγμα.

Οι ερευνητές, οι οποίοι αποκάλεσαν την απλή επίθεση «κάπως ανόητη», υποστήριξε πως «είναι άγριο για εμάς ότι η επίθεσή μας λειτουργεί και θα έπρεπε, θα μπορούσε, θα μπορούσε να είχε βρεθεί νωρίτερα». Οι ίδιοι πρόσθεσαν πως με ερωτήματα που κόστισαν μόνο 200 δολάρια κατάφεραν να «εξάγουν πάνω από 10.000 μοναδικά λεκτικά απομνημονευμένα παραδείγματα εκπαίδευσης».

«Η παρέκτασή μας σε μεγαλύτερους προϋπολογισμούς υποδηλώνει ότι οι αφοσιωμένοι αντίπαλοι θα μπορούσαν να εξάγουν πολύ περισσότερα δεδομένα», πρόσθεσαν.

Η OpenAI αντιμετωπίζει επί του παρόντος αρκετές αγωγές σχετικά με τα μυστικά δεδομένα εκπαίδευσης του ChatGPT.

Το μοντέλο τεχνητής νοημοσύνης που τροφοδοτεί το ChatGPT εκπαιδεύτηκε χρησιμοποιώντας βάσεις δεδομένων κειμένου από το διαδίκτυο και πιστεύεται ότι εκπαιδεύτηκε σε περίπου 300 δισεκατομμύρια λέξεις ή 570 GB δεδομένων.

Μια ομαδική αγωγή κατά της εταιρείας ισχυρίστηκε ότι η OpenAI «έκλεψε κρυφά τεράστιες ποσότητες προσωπικών δεδομένων», συμπεριλαμβανομένων ιατρικών αρχείων και πληροφοριών για παιδιά, για να εκπαιδεύσει το ChatGPT.

Μια ομάδα συγγραφέων μηνύει επίσης την εταιρεία AI, κατηγορώντας την ότι «καταβρόχθισε» τα βιβλία τους για να εκπαιδεύσει το chatbot.

ΔΙΑΒΑΣΤΕ ΠΕΡΙΣΣΟΤΕΡΕΣ ΕΙΔΗΣΕΙΣ:

Πηγή: businessinsider.com