Θεμελιώδης προστασία δεδομένων για την επιτάχυνση LLM για επιχειρήσεις με το Protopia AI | Υπηρεσίες Ιστού της Amazon

Θεμελιώδης προστασία δεδομένων για την επιτάχυνση LLM για επιχειρήσεις με το Protopia AI | Υπηρεσίες Ιστού της Amazon

Αυτή η ανάρτηση γράφτηκε σε συνεργασία με τους Balaji Chandrasekaran, Jennifer Cwagenberg και Andrew Sansom και Eiman Ebrahimi από την Protopia AI.

Νέα και ισχυρά μοντέλα μεγάλων γλωσσών (LLM) αλλάζουν τις επιχειρήσεις με ταχείς ρυθμούς, βελτιώνοντας την αποδοτικότητα και την αποτελεσματικότητα για μια ποικιλία περιπτώσεων εταιρικής χρήσης. Η ταχύτητα είναι η ουσία και η υιοθέτηση των τεχνολογιών LLM μπορεί να κάνει ή να σπάσει το ανταγωνιστικό πλεονέκτημα μιας επιχείρησης. Το AWS είναι ιδιαίτερα κατάλληλο για να παρέχει στις επιχειρήσεις τα απαραίτητα εργαλεία για την ανάπτυξη LLM σε κλίμακα ώστε να είναι δυνατή η λήψη κρίσιμων αποφάσεων.

Κατά την εφαρμογή της γενετικής τεχνολογίας AI, οι επιχειρήσεις έχουν πραγματικές ανησυχίες σχετικά με την έκθεση δεδομένων και την ιδιοκτησία εμπιστευτικών πληροφοριών που ενδέχεται να αποστέλλονται σε LLM. Αυτές οι ανησυχίες για το απόρρητο και την προστασία δεδομένων μπορούν να επιβραδύνουν ή να περιορίσουν τη χρήση των LLM σε οργανισμούς. Οι επιχειρήσεις χρειάζονται έναν υπεύθυνο και ασφαλέστερο τρόπο για να στέλνουν ευαίσθητες πληροφορίες στα μοντέλα χωρίς να χρειάζεται να αναλαμβάνουν τα συχνά απαγορευτικά υψηλά γενικά έξοδα των εσωτερικών DevOps.

Η ανάρτηση περιγράφει πώς μπορείτε να ξεπεράσετε τις προκλήσεις της διατήρησης της ιδιοκτησίας δεδομένων και της διατήρησης του απορρήτου των δεδομένων κατά τη χρήση LLM με την ανάπτυξη του Stained Glass Transform της Protopia AI για την προστασία των δεδομένων σας. Protopia AI έχει συνεργαστεί με την AWS για την παροχή του κρίσιμου στοιχείου της προστασίας δεδομένων και της ιδιοκτησίας για την ασφαλή και αποτελεσματική υιοθέτηση της γενετικής τεχνητής νοημοσύνης από τις επιχειρήσεις. Αυτή η ανάρτηση περιγράφει τη λύση και δείχνει πώς μπορεί να χρησιμοποιηθεί στο AWS για δημοφιλείς περιπτώσεις εταιρικής χρήσης όπως Ανάκτηση επαυξημένης γενιάς (RAG) και με LLM τελευταίας τεχνολογίας όπως Λάμα 2.

Επισκόπηση βιτρό Μετασχηματισμού

Οι οργανισμοί επιδιώκουν να διατηρήσουν την πλήρη ιδιοκτησία και τον έλεγχο των ευαίσθητων εταιρικών τους δεδομένων. Αυτός είναι ένας πυλώνας υπεύθυνης τεχνητής νοημοσύνης και μια αναδυόμενη απαίτηση προστασίας δεδομένων και απορρήτου πάνω και πέρα ​​από τη βασική ασφάλεια και τις νομικές εγγυήσεις των παρόχων LLM.

Αν και οι επιχειρηματικές μονάδες θέλουν να χρησιμοποιούν LLM για διάφορες εργασίες, ανησυχούν επίσης για εμπορικά μυστικά, πνευματική ιδιοκτησία και άλλες ιδιόκτητες πληροφορίες που διαρρέουν μέσω δεδομένων που αποστέλλονται σε αυτά τα μοντέλα. Ταυτόχρονα, τα γραφεία ασφάλειας, συμμόρφωσης, διαχείρισης δεδομένων και πληροφοριών της επιχείρησης ανησυχούν για την έκθεση ή τη διαρροή πληροφοριών πελάτη απλού κειμένου ή άλλων ελεγχόμενων δεδομένων εκτός της επιχείρησης. Η AWS και η Protopia AI συνεργάζονται για να παραδώσουν το κρίσιμο στοιχείο που λύνει αυτήν την κοινή ανάγκη των εταιρικών πελατών.

Το Stained Glass Transform (SGT) της Protopia AI επιλύει αυτές τις προκλήσεις μετατρέποντας μη προστατευμένα εταιρικά δεδομένα σε μια τυχαία αναπαράσταση, που αναφέρεται ως δεδομένα RmoRed, όπως φαίνεται στο παρακάτω σχήμα. Αυτή η αναπαράσταση είναι μια στοχαστική ενσωμάτωση των αρχικών δεδομένων, διατηρώντας τις πληροφορίες που χρειάζεται το LLM-στόχος για να λειτουργήσει χωρίς να εκτίθενται ευαίσθητα μηνύματα ή ερωτήματα, πλαίσιο ή δεδομένα λεπτομέρειας. Αυτή η αναπαράσταση είναι ένας μονόδρομος μετασχηματισμός που δεν μπορεί να αντιστραφεί, διασφαλίζοντας ολιστικό απόρρητο των εταιρικών δεδομένων και προστασία από τη διαρροή ευαίσθητων πληροφοριών απλού κειμένου σε LLM. Η δυνατότητα εφαρμογής του SGT δεν περιορίζεται στα γλωσσικά μοντέλα. Μπορούν επίσης να δημιουργηθούν τυχαιοποιημένες αναπαραστάσεις για οπτικά και δομημένα δεδομένα. Το όνομα Stained Glass Transform έχει τις ρίζες του στην οπτική εμφάνιση τυχαιοποιημένων αναπαραστάσεων οπτικών δεδομένων που μπορεί να μοιάζουν με την προβολή των δεδομένων μέσω βιτρό, όπως αποδεικνύεται σε αυτό Θήκη χρήσης του αμερικανικού ναυτικού.

Θεμελιώδης προστασία δεδομένων για την επιτάχυνση LLM για επιχειρήσεις με το Protopia AI | Υπηρεσίες Ιστού Amazon PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Το SGT λειτουργεί με LLM τελευταίας τεχνολογίας όπως το Llama 2. Το παρακάτω σχήμα δείχνει ένα παράδειγμα εφαρμογής του SGT σε ένα μοντέλο Llama 2 για παρακολούθηση εντολών ενώ προσθέτει ένα επίπεδο προστασίας στην οδηγία και το περιβάλλον. Η αριστερή πλευρά του σχήματος δείχνει ένα παράδειγμα ενός χρηματοοικονομικού εγγράφου ως πλαίσιο, με την οδηγία να ζητά από το μοντέλο να συνοψίσει το έγγραφο. Στο κάτω αριστερό μέρος, εμφανίζεται η απόκριση που δημιουργείται από το Llama 2 κατά τη λειτουργία του raw prompt. Όταν χρησιμοποιείτε το SGT, οι ενσωματώσεις που σχετίζονται με αυτήν την προτροπή μετατρέπονται από την πλευρά του πελάτη σε στοχαστικές ενσωματώσεις, όπως περιγράφεται με περισσότερες λεπτομέρειες αργότερα σε αυτήν την ανάρτηση. Κάτω δεξιά δείχνει ότι το Llama 2 μπορεί ακόμα να δημιουργήσει μια σωστή απόκριση εάν αποστέλλονται τα δεδομένα RmoRed (ενσωματώσεις μετά τον μετασχηματισμό) αντί για τις μη προστατευμένες ενσωματώσεις. Η επάνω δεξιά γωνία δείχνει ότι εάν τα δεδομένα RmoRed διέρρευσαν, μια ανακατασκευή της αρχικής προτροπής θα είχε ως αποτέλεσμα ακατάληπτο κείμενο.

Θεμελιώδης προστασία δεδομένων για την επιτάχυνση LLM για επιχειρήσεις με το Protopia AI | Υπηρεσίες Ιστού Amazon PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Για να δημιουργήσετε ένα SGT για ένα συγκεκριμένο μοντέλο όπως το Llama 2, η Protopia AI παρέχει μια ελαφριά βιβλιοθήκη που ονομάζεται Stained Glass SDK, η οποία είναι μια επέκταση του PyTorch. Όπως φαίνεται στο παρακάτω σχήμα, μετά τη δημιουργία ενός SGT, μπορεί να ενσωματωθεί σε αγωγούς ανάπτυξης με πολλούς τρόπους. Ο μετασχηματισμός που δημιουργείται από το SDK μπορεί να αναπτυχθεί τοπικά, σε υβριδική εγκατάσταση ή εντελώς στο cloud. Αυτό είναι δυνατό επειδή το SGT έχει σχεδιαστεί για να είναι μια ελαφριά διαδικασία που απαιτεί πολύ λίγους υπολογιστικούς πόρους και ως εκ τούτου έχει ελάχιστο αντίκτυπο στην κρίσιμη διαδρομή συμπερασμάτων. Μια άλλη βασική αξιολόγηση είναι η διατήρηση της ακρίβειας του μοντέλου χρησιμοποιώντας αναπαρασταθέντα δεδομένα. Παρατηρούμε ότι σε διαφορετικούς τύπους δεδομένων και παραλλαγές μοντέλων, η ακρίβεια διατηρείται εντός των επιθυμητών ορίων ανοχής όταν χρησιμοποιούνται δεδομένα που αναπαρίστανται εκ νέου.

Θεμελιώδης προστασία δεδομένων για την επιτάχυνση LLM για επιχειρήσεις με το Protopia AI | Υπηρεσίες Ιστού Amazon PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Αυτές οι επιλογές για την ανάπτυξη και τη διατήρηση της ακρίβειας επιτρέπουν τη σίγουρη υιοθέτηση του SGT από όλα τα ενδιαφερόμενα μέρη σε έναν οργανισμό επιχείρησης. Για την περαιτέρω προστασία της εξόδου του LLM, η Protopia AI μπορεί να κωδικοποιήσει τις εξόδους ερωτημάτων σε μια αναπαράσταση της οποίας ο αποκωδικοποιητής είναι διαθέσιμος μόνο στον κάτοχο δεδομένων της επιχείρησης.

Επισκόπηση λύσεων

Η προηγούμενη ενότητα περιέγραψε πώς μπορείτε να χρησιμοποιήσετε το Stained Glass Transform σε μια ποικιλία αρχιτεκτονικών. Το παρακάτω σχήμα περιγράφει τα βήματα που απαιτούνται για τη δημιουργία, την ανάπτυξη και τη χρήση SGT για LLMs:

  • Δημιουργία SGT – Η ομάδα που εκπαιδεύει το βασικό μοντέλο LLM (πάροχοι ιδιόκτητων LLM, πάροχος υπηρεσιών cloud ή εταιρικές ομάδες ML που δημιουργούν τα δικά τους LLM) τρέχει το λογισμικό Stained Glass SDK της Protopia AI χωρίς να τροποποιεί τις υπάρχουσες πρακτικές τους για εκπαίδευση και ανάπτυξη του LLM. Αφού ολοκληρωθεί η εκπαίδευση του βασικού μοντέλου, το SDK εκτελείται ως πέρασμα βελτιστοποίησης πάνω από το μοντέλο γλώσσας για τον υπολογισμό του SGT. Αυτό το πάσο βελτιστοποίησης παραδίδεται μέσω μιας επέκτασης στο PyTorch. Το SDK αναδιπλώνει το μοντέλο θεμελίωσης και ανακαλύπτει μαθηματικά έναν μοναδικό μετασχηματισμό βιτρό για αυτό το LLM. Περισσότερες λεπτομέρειες για τα υποκείμενα μαθηματικά μπορείτε να βρείτε στο συνοδευτικό λευκό χαρτί. Σημειώστε ότι επειδή η ομάδα που εκπαιδεύει το LLM εκτελεί επίσης το Stained Glass SDK, δεν απαιτείται έκθεση ή αποστολή βαρών μοντέλου για την ολοκλήρωση αυτού του βήματος.
  • Αποδέσμευση και ανάπτυξη SGT – Το SGT που εξάγεται από το προηγούμενο βήμα βελτιστοποίησης αναπτύσσεται ως μέρος της γραμμής δεδομένων που τροφοδοτεί το εκπαιδευμένο LLM. Όπως περιγράφεται στην προηγούμενη ενότητα, το SGT βρίσκεται στην πλευρά του εταιρικού πελάτη.
  • Χρήση SGT – Το SGT εκτελείται στις προτροπές που δημιουργούνται από την επιχείρηση και δημιουργεί προστατευμένα μηνύματα, τα οποία αποστέλλονται στο αναπτυσσόμενο LLM. Αυτό δίνει τη δυνατότητα στην επιχείρηση να διατηρήσει την κυριότητα των ευαίσθητων ερωτημάτων και του πλαισίου της. Χρησιμοποιώντας το βιτρό Protopia AI, τα μη προστατευμένα ευαίσθητα δεδομένα δεν φεύγουν από τον ιστότοπο ή τη ζώνη εμπιστοσύνης της επιχείρησης.

Θεμελιώδης προστασία δεδομένων για την επιτάχυνση LLM για επιχειρήσεις με το Protopia AI | Υπηρεσίες Ιστού Amazon PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Μπορείτε να χρησιμοποιήσετε το Stained Glass SDK για να δημιουργήσετε ένα SGT με πολλούς τρόπους. Για παράδειγμα, μπορείτε να χρησιμοποιήσετε το Stained Glass SDK σε περιβάλλοντα αυτοδιαχειριζόμενης μηχανικής εκμάθησης (ML) με Υπηρεσία Amazon Elastic Kubernetes (Amazon EKS) για εκπαίδευση και εξαγωγή συμπερασμάτων ή εντός Amazon Elastic Compute Cloud (Amazon EC2) απευθείας. Μια άλλη επιλογή είναι ότι μπορεί να τρέξει μέσα Amazon Sage Maker για να δημιουργήσετε ένα SGT για ένα συγκεκριμένο εκπαιδευμένο μοντέλο. Ο μετασχηματισμός της εισόδου για ανάπτυξη κατά την εξαγωγή συμπερασμάτων από τον πελάτη είναι ανεξάρτητος από την επιλεγμένη υλοποίηση ανάπτυξης.

Το παρακάτω σχήμα απεικονίζει μια πιθανή υλοποίηση σε ένα αυτοδιαχειριζόμενο περιβάλλον ML όπου η εκπαίδευση ενός Stained Glass Transform εκτελείται στο Amazon EKS.

Θεμελιώδης προστασία δεδομένων για την επιτάχυνση LLM για επιχειρήσεις με το Protopia AI | Υπηρεσίες Ιστού Amazon PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Σε αυτήν τη ροή εργασίας, δημιουργείται ένα κοντέινερ χρησιμοποιώντας το Stained Glass SDK και αναπτύσσεται σε Μητρώο εμπορευματοκιβωτίων Amazon Elastic (Amazon ECR). Αυτό το κοντέινερ στη συνέχεια αναπτύσσεται στο Amazon EKS για να εκπαιδεύσει ένα SGT στο οποίο είναι αποθηκευμένο Απλή υπηρεσία αποθήκευσης Amazon (Amazon S3). Εάν χρησιμοποιείτε το Amazon EC2, μπορείτε να εκπαιδεύσετε έναν μετασχηματισμό απευθείας στην παρουσία σας ως μέρος της ρύθμισης ML. Το Stained Glass SDK μπορεί να εκτελεστεί σε διάφορους τύπους παρουσιών, συμπεριλαμβανομένων των οικογενειών παρουσιών Amazon P5, P4 ή G5, βάσει των βασικών σας απαιτήσεων LLM. Αφού αναπτυχθεί το LLM για να χρησιμοποιηθεί για συμπέρασμα, η εφαρμογή-πελάτης χρησιμοποιεί το SGT που δημιουργήθηκε, το οποίο είναι μια ελαφριά λειτουργία, για να μετασχηματίσει τις προτροπές και το περιβάλλον πριν τα στείλει στο LLM. Με αυτόν τον τρόπο, μόνο τα μετασχηματισμένα δεδομένα εκτίθενται στο LLM και η ιδιοκτησία της αρχικής εισόδου διατηρείται στην πλευρά του πελάτη.

Το παρακάτω σχήμα δείχνει πώς μπορείτε να εκπαιδεύσετε έναν μετασχηματισμό και να εκτελέσετε εξαγωγή συμπερασμάτων στο SageMaker.

Θεμελιώδης προστασία δεδομένων για την επιτάχυνση LLM για επιχειρήσεις με το Protopia AI | Υπηρεσίες Ιστού Amazon PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Η δημιουργία του SGT ακολουθεί μια παρόμοια διαδρομή με τη ρύθμιση του Amazon EKS, απορροφώντας τα δεδομένα εκπαίδευσης από το Amazon S3, εκπαιδεύοντας ένα SGT σε ένα κοντέινερ και αποθηκεύοντάς το στο Amazon S3. Μπορείτε να χρησιμοποιήσετε το Stained Glass SDK στην υπάρχουσα ρύθμιση του SageMaker με Στούντιο Amazon SageMaker, Σημειωματάρια SageMaker, και ένα Εργασία εκπαίδευσης SageMaker. Το LLM φιλοξενείται ως τελικό σημείο του SageMaker που είναι προσβάσιμο από την εφαρμογή πελάτη. Το συμπέρασμα για την εφαρμογή πελάτη είναι επίσης πανομοιότυπο με τη ρύθμιση του Amazon EKS, εκτός από αυτό που εξυπηρετεί το μοντέλο.

Τυχαιοποιημένες αναπαραστάσεις για την προστασία των μηνυμάτων LLM και τη βελτίωση των δεδομένων

Αυτή η ενότητα καλύπτει μια ποικιλία περιπτώσεων χρήσης που καταδεικνύουν πώς η τυχαία αναπαράσταση προστατεύει τα μηνύματα LLM. Τα παραδείγματα καταδεικνύουν σημαντικές συνέπειες για τις προσπάθειες δημιουργίας τεχνητής νοημοσύνης για επιχειρήσεις: ανοίγοντας νέες πόρτες σε περιπτώσεις χρήσης τεχνητής νοημοσύνης, επιτάχυνση της ταχύτητας στην αγορά, ενώ παράλληλα προστατεύονται κατάλληλα τα εταιρικά δεδομένα και διατηρώντας την ιδιοκτησία των ευαίσθητων δεδομένων που απαιτούνται για χρήση σε προτροπές LLM.

Θήκη χρήσης RAG

Μια δημοφιλής περίπτωση εταιρικής χρήσης για LLMs είναι το Retrieval Augmented Generation (RAG). Το παρακάτω σχήμα δείχνει ένα ενδεικτικό παράδειγμα όπου οι προτροπές και οι πηγές προστατεύονται με χρήση βιτρό. Η αριστερή πλευρά του σχήματος δείχνει τις μη προστατευμένες προτροπές και πληροφορίες πηγής. Σε μια επιχειρηματική εφαρμογή του RAG, οι πηγές θα μπορούσαν να περιλαμβάνουν ευαίσθητες πληροφορίες, όπως επιχειρηματικά μυστικά, πνευματική ιδιοκτησία ή οικονομικές πληροφορίες. Η δεξιά πλευρά δείχνει την καλύτερη δυνατή ανακατασκευή σε αναγνώσιμο από τον άνθρωπο κείμενο από τις προτροπές RmoRed που δημιουργήθηκαν από το SGT.

Θεμελιώδης προστασία δεδομένων για την επιτάχυνση LLM για επιχειρήσεις με το Protopia AI | Υπηρεσίες Ιστού Amazon PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Μπορούμε να παρατηρήσουμε ότι ακόμη και στην καλύτερη δυνατή ανακατασκευή, οι πληροφορίες είναι εντελώς συγκεχυμένες. Ωστόσο, η απάντηση από το μοντέλο με και χωρίς τον μετασχηματισμό είναι η ίδια, με δείκτες προς τα πρωτότυπα έγγραφα προέλευσης, διατηρώντας έτσι την ακρίβεια τόσο της ερώτησης όσο και των εγγράφων πηγής κατά την εκτέλεση αυτής της δημοφιλής περίπτωσης εταιρικής χρήσης.

Ευρεία εφαρμογή σε LLM και γλώσσες

Ένα από τα κυριότερα σημεία του Stained Glass SDK είναι ότι είναι εξαιρετικά ανθεκτικό στις εξελίξεις των μοντέλων και προσαρμόσιμο σε μοντέλα τελευταίας τεχνολογίας όπως π.χ. Λάμα 2. Το παρακάτω σχήμα δείχνει ένα SGT που δημιουργήθηκε σε ένα Llama 2 LLM που είχε προηγουμένως βελτιωθεί για εργασία με ιαπωνικό κείμενο. Αυτό το παράδειγμα δείχνει περαιτέρω ότι τα SGT μπορούν να δημιουργηθούν και να εφαρμοστούν για οποιαδήποτε γλώσσα και ότι ακόμη και οι είσοδοι για τα βελτιωμένα μοντέλα μπορούν να μετασχηματιστούν. Η γενική εφαρμογή του SGT καθοδηγείται από τη στιβαρή βάση του βιτρό SDK που είναι αγνωστικιστική για μοντέλα και δεδομένα.

Θεμελιώδης προστασία δεδομένων για την επιτάχυνση LLM για επιχειρήσεις με το Protopia AI | Υπηρεσίες Ιστού Amazon PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Προστασία δεδομένων μικρορύθμισης καθώς και προτροπών

Το Stained Glass Transform δεν περιορίζεται αποκλειστικά στην προστασία των δεδομένων κατά το χρόνο συμπερασμάτων. Μπορεί επίσης να προστατεύσει τα δεδομένα που χρησιμοποιούνται για την τελειοποίηση ενός μοντέλου θεμελίωσης. Η διαδικασία για τη δημιουργία του μετασχηματισμού για τη λεπτομερή ρύθμιση συνόλων δεδομένων είναι η ίδια με αυτή που εξηγήθηκε στην ενότητα αρχιτεκτονικής λύσεων νωρίτερα σε αυτήν την ανάρτηση. Ο μετασχηματισμός δημιουργείται για να βελτιστοποιηθεί το μοντέλο θεμελίωσης χωρίς πρόσβαση στα δεδομένα μικρορύθμισης. Αφού δημιουργηθεί και εκπαιδευτεί το SGT για το θεμελιώδες μοντέλο, το σύνολο δεδομένων λεπτομέρειας μετασχηματίζεται σε τυχαιοποιημένες αναπαραστάσεις που στη συνέχεια θα χρησιμοποιηθούν για την τελειοποίηση του βασικού μοντέλου. Αυτή η διαδικασία εξηγείται με περισσότερες λεπτομέρειες στο συνοδευτικό λευκό χαρτί.

Στο ακόλουθο παράδειγμα, ένας εταιρικός πελάτης χρειάστηκε να ρυθμίσει με ακρίβεια ένα υπάρχον μοντέλο για τον εντοπισμό ανωμαλιών καταγραφής δικτύου. Χρησιμοποίησαν βιτρό για να μετατρέψουν το ευαίσθητο σύνολο δεδομένων λεπτομέρειας σε τυχαιοποιημένες ενσωματώσεις, οι οποίες χρησιμοποιήθηκαν για να τελειοποιήσουν το μοντέλο θεμελίωσης τους. Βρήκαν ότι το μοντέλο ανίχνευσης που είχε βελτιστοποιηθεί στις μετασχηματισμένες αναπαραστάσεις εκτελέστηκε με σχεδόν ίδια ακρίβεια σε σύγκριση με το υποθετικό σενάριο της λεπτομέρειας του μοντέλου θεμελίωσης στο μη προστατευμένο σύνολο δεδομένων μικρορύθμισης. Ο παρακάτω πίνακας δείχνει δύο παραδείγματα εγγραφών δεδομένων απλού κειμένου από το σύνολο δεδομένων λεπτομέρειας και μια ανακατασκευή σε κείμενο αυτών των ίδιων εγγραφών δεδομένων από το σύνολο δεδομένων μικρορύθμισης.

Θεμελιώδης προστασία δεδομένων για την επιτάχυνση LLM για επιχειρήσεις με το Protopia AI | Υπηρεσίες Ιστού Amazon PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Κάτω από την κουκούλα του Stained Glass Transform για LLMs

Όταν εφαρμόζεται στην όραση υπολογιστή, το SGT λειτουργεί σε χαρακτηριστικά pixel εισόδου και για LLM λειτουργεί σε επίπεδο ενσωμάτωσης. Για να επισημάνετε πώς λειτουργεί ο Μετασχηματισμός Βιτρώ, φανταστείτε τις άμεσες ενσωματώσεις ως μήτρα, όπως φαίνεται στα αριστερά του παρακάτω σχήματος. Σε κάθε καταχώρηση, υπάρχει μια ντετερμινιστική τιμή. Αυτή η τιμή μπορεί να αντιστοιχιστεί στα αρχικά δεδομένα, εκθέτοντας το μη προστατευμένο μήνυμα. Το Stained Glass Transform μετατρέπει αυτόν τον πίνακα ντετερμινιστικών τιμών σε έναν πίνακα του οποίου τα στοιχεία είναι ένα σύννεφο πιθανοτήτων.

Θεμελιώδης προστασία δεδομένων για την επιτάχυνση LLM για επιχειρήσεις με το Protopia AI | Υπηρεσίες Ιστού Amazon PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Η μετασχηματισμένη προτροπή αποδίδεται με δειγματοληψία θορύβου από κατανομές πιθανοτήτων που ορίζονται από το SGT και προσθέτοντας τον θόρυβο του δείγματος στις ντετερμινιστικές ενσωματώσεις, οι οποίες τυχαιοποιούν τις αρχικές τιμές προτροπής μη αναστρέψιμα. Το μοντέλο εξακολουθεί να κατανοεί την τυχαιοποιημένη επανεκπροσωπούμενη προτροπή σε μαθηματικό επίπεδο και μπορεί να εκτελέσει την εργασία του με ακρίβεια.

Συμπέρασμα

Αυτή η ανάρτηση εξέτασε τον τρόπο με τον οποίο το Stained Glass Transform της Protopia AI αποσυνδέει την ιδιοκτησία και την προστασία των ακατέργαστων δεδομένων από τη διαδικασία λειτουργιών ML, επιτρέποντας στις επιχειρήσεις να διατηρήσουν την ιδιοκτησία και να διατηρήσουν το απόρρητο των ευαίσθητων πληροφοριών στα μηνύματα προτροπής LLM και τη βελτίωση των δεδομένων. Χρησιμοποιώντας αυτήν την υπερσύγχρονη προστασία δεδομένων για χρήση LLM, οι επιχειρήσεις μπορούν να επιταχύνουν την υιοθέτηση μοντέλων θεμελίωσης και LLM ανησυχώντας λιγότερο για την έκθεση ευαίσθητων πληροφοριών. Ξεκλειδώνοντας με ασφάλεια την αξία σε πραγματικά εταιρικά δεδομένα, οι οργανισμοί μπορούν να ενεργοποιήσουν την αποτελεσματικότητα και τα επιχειρηματικά αποτελέσματα των LLM πιο αποτελεσματικά και γρήγορα. Για να μάθετε περισσότερα σχετικά με αυτήν την τεχνολογία, μπορείτε να βρείτε περαιτέρω ανάγνωση στο συνοδευτικό λευκό χαρτί και συνδεθείτε με το Protopia AI για να αποκτήσετε πρόσβαση και να το δοκιμάσετε στα δεδομένα της επιχείρησής σας.

Σχετικά με την Protopia AI

Η Protopia AI είναι πρωτοπόρος στην προστασία δεδομένων και τις τεχνολογίες AI/ML που διατηρούν το απόρρητο με βάση το Ώστιν του Τέξας και ειδικεύεται στο να επιτρέπει σε αλγόριθμους τεχνητής νοημοσύνης και πλατφόρμες λογισμικού να λειτουργούν χωρίς την ανάγκη πρόσβασης σε πληροφορίες απλού κειμένου. Τα τελευταία 2 χρόνια, η Protopia AI έχει επιδείξει με επιτυχία το εμβληματικό προϊόν Stained Glass Transform σε μια ποικιλία περιπτώσεων χρήσης ML και τύπων δεδομένων με το Ναυτικό των ΗΠΑ, κορυφαίες χρηματοοικονομικές υπηρεσίες και παγκόσμιους παρόχους τεχνολογίας.

Η Protopia AI συνεργάζεται με επιχειρήσεις, παρόχους γενετικής τεχνητής νοημοσύνης και LLM και παρόχους υπηρεσιών Cloud (CSP) για να επιτρέψει τη διατήρηση της ιδιοκτησίας και του απορρήτου των εταιρικών δεδομένων κατά τη χρήση λύσεων AI/ML. Η Protopia AI συνεργάστηκε με την AWS για να προσφέρει ένα κρίσιμο στοιχείο της προστασίας δεδομένων και της ιδιοκτησίας για την υιοθέτηση της παραγωγικής τεχνητής νοημοσύνης από τις επιχειρήσεις και ήταν μία από τις 21 νεοσύστατες επιχειρήσεις που επιλέχθηκαν για την έναρξη AWS Generative AI Accelerator το 2023.


Σχετικά με τους συγγραφείς

Θεμελιώδης προστασία δεδομένων για την επιτάχυνση LLM για επιχειρήσεις με το Protopia AI | Υπηρεσίες Ιστού Amazon PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται. Balaji Chandrasekaran είναι ο αντιπρόεδρος του Go-to-Market & Customer Enablement στην Protopia AI, συνεργάζεται στενά με τους πελάτες για να αξιοποιήσουν την τεχνητή νοημοσύνη στην επιχείρησή τους, δίνοντας παράλληλα προτεραιότητα στην προστασία των δεδομένων και το απόρρητο. Πριν από την Protopia AI, ο Balaji ήταν ο επικεφαλής προϊόντος για τις λύσεις AI στην Infor, αναπτύσσοντας προϊόντα με επίκεντρο την αξία ενώ ενεργούσε ως αξιόπιστος συνεργάτης για εταιρικούς πελάτες σε διάφορους κλάδους. Εκτός δουλειάς, του αρέσει η μουσική, η πεζοπορία και τα ταξίδια με την οικογένεια.

Θεμελιώδης προστασία δεδομένων για την επιτάχυνση LLM για επιχειρήσεις με το Protopia AI | Υπηρεσίες Ιστού Amazon PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Jennifer Cwagenberg ηγείται της ομάδας μηχανικών της Protopia AI και εργάζεται για να διασφαλίσει ότι η τεχνολογία Stained Glass καλύπτει τις ανάγκες των πελατών τους για την προστασία των δεδομένων τους. Η Jennifer έχει προηγούμενη εμπειρία με την ασφάλεια που εργάζεται στην Toyota στο Product Cybersecurity Group της, διαχείριση φόρτου εργασίας στο Cloud στο N-able και υπεύθυνη για δεδομένα στο Match.com.

Θεμελιώδης προστασία δεδομένων για την επιτάχυνση LLM για επιχειρήσεις με το Protopia AI | Υπηρεσίες Ιστού Amazon PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Άντριου Σάνσομ είναι Μηχανικός Λύσεων AI στην Protopia AI όπου βοηθά τις επιχειρήσεις να χρησιμοποιούν την τεχνητή νοημοσύνη διατηρώντας παράλληλα ιδιωτικές και ευαίσθητες πληροφορίες στα δεδομένα τους. Πριν από την Protopia AI, εργάστηκε ως Τεχνικός Σύμβουλος με επίκεντρο την παροχή λύσεων τεχνητής νοημοσύνης για πελάτες σε πολλούς κλάδους, συμπεριλαμβανομένων των Οικονομικών, της Μεταποίησης, της Υγείας και της Εκπαίδευσης. Δίδαξε επίσης Πληροφορική και Μαθηματικά σε μαθητές Λυκείου, Πανεπιστημίου και Επαγγελματίες.

Θεμελιώδης προστασία δεδομένων για την επιτάχυνση LLM για επιχειρήσεις με το Protopia AI | Υπηρεσίες Ιστού Amazon PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Eiman Ebrahimi, PhD, είναι συνιδρυτής και Διευθύνων Σύμβουλος της Protopia AI. Ο Δρ. Ebrahimi είναι παθιασμένος με το να δώσει τη δυνατότητα στην τεχνητή νοημοσύνη να εμπλουτίσει την ανθρώπινη εμπειρία σε διαφορετικούς κλάδους της κοινωνίας και της βιομηχανίας. Το Protopia AI είναι ένα όραμα για τη βελτίωση του φακού μέσω του οποίου η τεχνητή νοημοσύνη παρατηρεί τα απαραίτητα και ποιοτικά δεδομένα που χρειάζεται, δημιουργώντας παράλληλα νέες δυνατότητες για την προστασία ευαίσθητων πληροφοριών. Πριν από την Protopia AI, ήταν Ανώτερος Επιστήμονας Έρευνας στην NVIDIA για 9 χρόνια. Η εργασία του στην έρευνα NVIDIA είχε ως στόχο την επίλυση προβλημάτων πρόσβασης σε μαζικά σύνολα δεδομένων σε ML/AI. Έγραψε επίσης δημοσιεύσεις με κριτές από ομοτίμους για το πώς να αξιοποιηθεί η ισχύς χιλιάδων GPU για να γίνει εφικτή η εκπαίδευση μεγάλων γλωσσικών μοντέλων.

Θεμελιώδης προστασία δεδομένων για την επιτάχυνση LLM για επιχειρήσεις με το Protopia AI | Υπηρεσίες Ιστού Amazon PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Ροχίτ Ταλούρι είναι Generative AI GTM Specialist στο Amazon Web Services (AWS). Συνεργάζεται με κορυφαίους κατασκευαστές μοντέλων τεχνητής νοημοσύνης, στρατηγικούς πελάτες, βασικούς συνεργάτες AI/ML και ομάδες υπηρεσιών AWS για να επιτρέψει την επόμενη γενιά τεχνητής νοημοσύνης, μηχανικής μάθησης και επιταχυνόμενων υπολογιστών στο AWS. Προηγουμένως ήταν αρχιτέκτονας Enterprise Solutions και ο Υπεύθυνος Global Solutions για την AWS Mergers & Acquisitions Advisory.

Σφραγίδα ώρας:

Περισσότερα από Μηχανική εκμάθηση AWS