Σε μια πρωτοποριακή μελέτη, μια ομάδα από το Πανεπιστήμιο της Βόρειας Καρολίνας, Chapel Hill, έριξε φως στο πιεστικό ζήτημα της διατήρησης δεδομένων σε μεγάλα γλωσσικά μοντέλα (LLM) όπως το ChatGPT του OpenAI και το Bard της Google.
Παρά τις προσπάθειες διαγραφής, οι περιπλοκές αυτών των μοντέλων τεχνητής νοημοσύνης συνεχίζουν να αναβοσβήνουν ευαίσθητα δεδομένα, πυροδοτώντας μια σοβαρή συζήτηση για την ασφάλεια των πληροφοριών και την ηθική της τεχνητής νοημοσύνης.
Το αίνιγμα των «μη διαγραφών» δεδομένων
Οι ερευνητές ξεκίνησαν μια αναζήτηση για να διερευνήσουν την εξάλειψη ευαίσθητων πληροφοριών από LLMs. Ωστόσο, έπεσαν πάνω σε μια αποκάλυψη. Η διαγραφή τέτοιων δεδομένων είναι επίπονη, αλλά η επαλήθευση της διαγραφής αποτελεί εξίσου πρόκληση. Μόλις εκπαιδευτούν σε εκτεταμένα σύνολα δεδομένων, αυτά τα μεγαθήρια τεχνητής νοημοσύνης φιλοξενούν τα δεδομένα στον περίπλοκο λαβύρινθο των παραμέτρων και των βαρών τους.
Αυτή η δυσάρεστη κατάσταση γίνεται δυσοίωνη όταν το Μοντέλα AI διαχέουν ακούσια ευαίσθητα δεδομένα, όπως προσωπικά αναγνωριστικά ή οικονομικά αρχεία, θέτοντας ενδεχομένως τις βάσεις για κακόβουλες χρήσεις.
Οι ερευνητές βρίσκουν LLM όπως το ChatGPT εξάγουν ευαίσθητα δεδομένα ακόμα και μετά τη «διαγραφή» τους – https://t.co/P5QG8eGxwE
— ⚡️John The Collector⚡️ (@JohnTheCollectr) Οκτώβριος 2, 2023
Επιπλέον, ο πυρήνας του ζητήματος βρίσκεται στο σχεδιαστικό σχέδιο αυτών των μοντέλων. Η προκαταρκτική φάση περιλαμβάνει εκπαίδευση σε τεράστιες βάσεις δεδομένων και τελειοποίηση για την εξασφάλιση συνεκτικών αποτελεσμάτων. Η ορολογία "Generative Pretrained Transformer", ενσωματωμένη σε GPT, προσφέρει μια ματιά σε αυτόν τον μηχανισμό.
Οι μελετητές του UNC διευκρίνισαν ένα υποθετικό σενάριο όπου ένας LLM, έχοντας τροφοδοτήσει έναν θησαυρό ευαίσθητων τραπεζικών δεδομένων, γίνεται μια πιθανή απειλή. Τα σύγχρονα προστατευτικά κιγκλιδώματα που χρησιμοποιούνται από τους προγραμματιστές τεχνητής νοημοσύνης δεν μπορούν να κατευνάσουν αυτήν την ανησυχία.
Αυτά τα προστατευτικά μέτρα, όπως τα σκληρά κωδικοποιημένα μηνύματα προτροπής ή ένα παράδειγμα γνωστό ως Ενισχυτική μάθηση από την ανθρώπινη ανατροφοδότηση (RLHF), διαδραματίζουν ζωτικό ρόλο στον περιορισμό των ανεπιθύμητων αποτελεσμάτων. Ωστόσο, εξακολουθούν να αφήνουν τα δεδομένα να κρύβονται στην άβυσσο του μοντέλου, έτοιμα να κληθούν με μια απλή αναδιατύπωση μιας προτροπής.
Γεφύρωση του Κενού Ασφαλείας
Παρά την ανάπτυξη μεθόδων επεξεργασίας μοντέλων αιχμής, όπως το Rank-One Model Editing, η ομάδα του UNC ανακάλυψε ότι εξακολουθούσαν να είναι προσβάσιμες ουσιαστικές πραγματικές πληροφορίες. Τα ευρήματά τους αποκάλυψαν ότι τα γεγονότα θα μπορούσαν να αναστηθούν γύρω στο 38% και το 29% των περιπτώσεων μέσω επιθέσεων whitebox και blackbox, αντίστοιχα.
Στην αναζήτησή τους, οι ερευνητές χρησιμοποίησαν ένα μοντέλο γνωστό ως GPT-J. Με τις 6 δισεκατομμύρια παραμέτρους του, είναι νάνος σε σύγκριση με το κολοσσιαίο GPT-3.5, ένα βασικό μοντέλο για το ChatGPT με 170 δισεκατομμύρια παραμέτρους. Αυτή η έντονη αντίθεση υποδηλώνει τη μνημειώδη πρόκληση της απολύμανσης μεγαλύτερων μοντέλων όπως το GPT-3.5 από αδικαιολόγητα δεδομένα.
Επιπλέον, οι μελετητές του UNC δημιούργησαν νέες αμυντικές μεθόδους για να προστατεύσουν τα LLM από συγκεκριμένες «επιθέσεις εξαγωγής». Αυτά τα άθλια σχέδια εκμεταλλεύονται τα προστατευτικά κιγκλιδώματα του μοντέλου για να εξαλείψουν ευαίσθητα δεδομένα. Ωστόσο, η εφημερίδα υπαινίχθηκε δυσοίωνα για ένα διαρκές παιχνίδι γάτας και ποντικιού, όπου οι αμυντικές στρατηγικές θα κυνηγούσαν για πάντα τις εξελισσόμενες επιθετικές τακτικές.
Η Microsoft αναθέτει μια πυρηνική ομάδα για την ενίσχυση της τεχνητής νοημοσύνης
Σε μια σχετική σημείωση, το αναπτυσσόμενο βασίλειο της τεχνητής νοημοσύνης έχει ωθήσει τεχνολογικούς μεγαθήρια όπως η Microsoft να επιχειρήσουν σε αχαρτογράφητες περιοχές. Ο πρόσφατος σχηματισμός μιας ομάδας πυρηνικής ενέργειας από τη Microsoft για την ενίσχυση των πρωτοβουλιών τεχνητής νοημοσύνης υπογραμμίζει τις κλιμακούμενες απαιτήσεις και το αλληλένδετο μέλλον της τεχνητής νοημοσύνης και των ενεργειακών πόρων. Καθώς τα μοντέλα τεχνητής νοημοσύνης εξελίσσονται, η όρεξή τους για ενέργεια αυξάνεται, ανοίγοντας το δρόμο για καινοτόμες λύσεις για την ικανοποίηση αυτής της αυξανόμενης ζήτησης.
Η Microsoft θα σχηματίσει ομάδα πυρηνικής ενέργειας για την υποστήριξη της τεχνητής νοημοσύνης: Αναφοράhttps://t.co/OvAGclfMnt#Νέα #crypto #Bitcoin #machinelearning #Microsoft #Νέα #Τεχνολογία https://t.co/OvAGclfMnt
— Έκτακτα νέα για το Crypto: Τελευταία νέα για το Crypto & Bitcoin (@CryptoBreakNews) Οκτώβριος 1, 2023
Η συζήτηση γύρω από τη διατήρηση και τη διαγραφή δεδομένων στα LLMs ξεπερνά τους ακαδημαϊκούς διαδρόμους. Υπενθυμίζει μια ενδελεχή εξέταση και έναν διάλογο σε όλο τον κλάδο για την προώθηση ενός ισχυρού πλαισίου που διασφαλίζει την ασφάλεια των δεδομένων, ενώ παράλληλα καλλιεργεί την ανάπτυξη και τις δυνατότητες της τεχνητής νοημοσύνης.
Αυτό το εγχείρημα των ερευνητών του UNC είναι ένα σημαντικό βήμα προς την κατανόηση και τελικά την επίλυση του προβλήματος των «μη διαγράψιμων» δεδομένων, ένα βήμα πιο κοντά στο να γίνει η τεχνητή νοημοσύνη ασφαλέστερο εργαλείο στην ψηφιακή εποχή.
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
- PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- PlatoESG. Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
- PlatoHealth. Ευφυΐα βιοτεχνολογίας και κλινικών δοκιμών. Πρόσβαση εδώ.
- πηγή: https://metanews.com/llms-like-chatgpt-persistently-leak-sensitive-data-despite-deletion-efforts/
- :έχει
- :είναι
- :που
- 1
- 7
- a
- ακαδημαϊκής
- προσιτός
- Μετά το
- την ηλικία του
- AI
- Μοντέλα AI
- an
- και
- όρεξη
- γύρω
- AS
- At
- Επιθέσεις
- Προσπάθειες
- Τράπεζες
- BE
- γίνεται
- ήταν
- Μεγαθήρια
- Δισεκατομμύριο
- Bitcoin
- Bitcoin News
- προσχέδιο
- μαξιλάρα
- Σπάζοντας
- σπάζοντας ειδήσεις
- εκρηκτική
- αλλά
- by
- CAT
- πρόκληση
- κυνηγητό
- ChatGPT
- πιο κοντά
- ΣΥΝΑΦΗΣ
- σύγκριση
- συγκρότημα
- Ανησυχία
- σύγχρονος
- ΣΥΝΕΧΕΙΑ
- αντίθεση
- Συνομιλία
- πυρήνας
- θα μπορούσε να
- δημιουργημένο
- κρυπτο
- περιορισμός
- ημερομηνία
- την ασφάλεια των δεδομένων
- βάσεις δεδομένων
- σύνολα δεδομένων
- Άμυνα
- αμυντικός
- πρόσβαση εκπρόσωπος
- Ζήτηση
- απαιτήσεις
- ανάπτυξη
- Υπηρεσίες
- προγραμματιστές
- Διάλογος
- ψηφιακό
- ψηφιακή εποχή
- ομιλία
- ανακάλυψαν
- ξεκίνησε
- μισθωτών
- έγκλειστα
- ενέργεια
- εξασφαλίζω
- εξασφαλίζει
- ίσος
- δεοντολογία
- Even
- τελικά
- εξελίσσονται
- εξελίσσεται
- επεκτατικός
- Εκμεταλλεύομαι
- γεγονότα
- Πτώση
- ανατροφοδότηση
- οικονομικός
- Εύρεση
- ευρήματα
- Ψάρι
- Για
- για πάντα
- μορφή
- σχηματισμός
- Προώθηση
- Πλαίσιο
- από
- μελλοντικός
- παιχνίδι
- Ματιά
- Της Google
- βάση
- Μεγαλώνοντας
- Ανάπτυξη
- λιμάνι
- που έχει
- υποδείξεις
- Ωστόσο
- HTTPS
- ανθρώπινος
- αναγνωριστικά
- in
- ακούσια
- πληροφορίες
- την ασφάλεια των πληροφοριών
- πρωτοβουλίες
- καινοτόμες
- συνυφασμένη
- σε
- περιπλοκές
- διερευνήσει
- ζήτημα
- IT
- ΤΟΥ
- γνωστός
- Γλώσσα
- large
- μεγαλύτερος
- αργότερο
- διαρροή
- μάθηση
- Άδεια
- φως
- Μου αρέσει
- LLM
- Κατασκευή
- μέτρα
- μηχανισμός
- καταναλωτές
- μέθοδοι
- Microsoft
- μοντέλο
- μοντέλα
- μνημειώδης
- Νέα
- νέα
- Βόρειος
- βόρεια carolina
- πυρηνικών
- Πυρηνική δύναμη
- ανατροφή
- of
- προσβλητικός
- προσφορές
- on
- μια φορά
- or
- έξω
- παραγωγή
- Χαρτί
- παράδειγμα
- παράμετροι
- Λιθόστρωση
- Διαρκής
- επιμονώς
- προσωπικός
- φάση
- Πρωτοποριακή
- Πλάτων
- Πληροφορία δεδομένων Plato
- Πλάτωνα δεδομένα
- Δοκιμάστε να παίξετε
- θέτει
- δυναμικού
- ενδεχομένως
- δύναμη
- πιέζοντας
- Πρόβλημα
- ωθείται
- Προστατευτικός
- αναζήτηση
- έτοιμος
- βασίλειο
- πρόσφατος
- αρχεία
- σχετίζεται με
- παρέμεινε
- ερευνητές
- Υποστηρικτικό υλικό
- αντίστοιχα
- κράτηση
- Αποκαλυφθε'ντα
- αποκάλυψη
- εύρωστος
- Ρόλος
- Ασφαλέστερο
- σενάριο
- συστήματα
- Μελετητές
- ασφάλεια
- ευαίσθητος
- αυστηρός
- υπόστεγο
- Ασπίδα
- Κοντά
- σημαντικός
- Λύσεις
- Επίλυση
- συγκεκριμένες
- έντονα
- state-of-the-art
- Βήμα
- Ακόμη
- στρατηγικές
- δρασκελιά
- Μελέτη
- ουσιώδης
- τέτοιος
- υποστήριξη
- τακτική
- tech
- ορολογία
- εδάφη
- ότι
- Η
- τους
- Αυτοί
- αυτοί
- αυτό
- απειλή
- Μέσω
- ώρα
- προς την
- εργαλείο
- προς
- εκπαιδευμένο
- Εκπαίδευση
- υπερβαίνει
- μετασχηματιστής
- αληθής
- μετατρέπει
- αχαρτογράφητος
- υπογράμμισης
- κατανόηση
- πανεπιστήμιο
- επάνω σε
- χρησιμοποιεί
- χρησιμοποιούνται
- Σταθερή
- επιχείρηση
- επαληθεύοντας
- ζωτικής σημασίας
- Τρόπος..
- πότε
- ενώ
- με
- εντός
- θα
- zephyrnet