FMOps/LLMOps: Λειτουργία Generative AI and Differences με MLOps

Αναδημοσίευση από τον Πλάτωνα

Ακολουθούν: 0

Σήμερα, η πλειονότητα των πελατών μας είναι ενθουσιασμένος με τα μεγάλα γλωσσικά μοντέλα (LLM) και σκέφτεται πώς η γενετική τεχνητή νοημοσύνη θα μπορούσε να μεταμορφώσει την επιχείρησή τους. Ωστόσο, η εισαγωγή τέτοιων λύσεων και μοντέλων στις επιχειρηματικές δραστηριότητες δεν είναι εύκολη υπόθεση. Σε αυτήν την ανάρτηση, συζητάμε τον τρόπο λειτουργίας των γενετικών εφαρμογών τεχνητής νοημοσύνης χρησιμοποιώντας αρχές MLOps που οδηγούν σε λειτουργίες μοντέλων θεμελίωσης (FMOps). Επιπλέον, εξετάζουμε σε βάθος την πιο κοινή περίπτωση χρήσης γενετικής τεχνητής νοημοσύνης των εφαρμογών κειμένου σε κείμενο και λειτουργιών LLM (LLMOps), ένα υποσύνολο FMOps. Το παρακάτω σχήμα απεικονίζει τα θέματα που συζητάμε.

FMOps/LLMOps: Λειτουργία της γενετικής τεχνητής νοημοσύνης και των διαφορών με τα MLOps | Υπηρεσίες Ιστού Amazon PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Συγκεκριμένα, εισάγουμε εν συντομία τις αρχές MLOps και επικεντρωνόμαστε στους κύριους παράγοντες διαφοροποίησης σε σύγκριση με τα FMOps και LLMOps όσον αφορά τις διαδικασίες, τα άτομα, την επιλογή και αξιολόγηση μοντέλων, το απόρρητο δεδομένων και την ανάπτυξη μοντέλων. Αυτό ισχύει για πελάτες που τα χρησιμοποιούν εκτός συσκευασίας, δημιουργούν μοντέλα θεμελίων από την αρχή ή τα προσαρμόζουν με ακρίβεια. Η προσέγγισή μας ισχύει εξίσου τόσο για μοντέλα ανοιχτού κώδικα όσο και για ιδιόκτητα μοντέλα.

Σύνοψη λειτουργικότητας ML

Όπως ορίζεται στην ανάρτηση Ο οδικός χάρτης του θεμελίου MLOps για επιχειρήσεις με το Amazon SageMaker, ML and Operations (MLOps) είναι ο συνδυασμός ανθρώπων, διαδικασιών και τεχνολογίας για την αποτελεσματική παραγωγή λύσεων μηχανικής μάθησης (ML). Για να επιτευχθεί αυτό, ένας συνδυασμός ομάδων και προσώπων πρέπει να συνεργαστεί, όπως φαίνεται στο παρακάτω σχήμα.

Οι ομάδες αυτές είναι οι εξής:

Ομάδα προηγμένης ανάλυσης (λίμνη δεδομένων και πλέγμα δεδομένων) – Οι μηχανικοί δεδομένων είναι υπεύθυνοι για την προετοιμασία και την απορρόφηση δεδομένων από πολλαπλές πηγές, τη δημιουργία αγωγών ETL (εξαγωγή, μετασχηματισμό και φόρτωση) για την επιμέλεια και την καταλογογράφηση των δεδομένων και την προετοιμασία των απαραίτητων ιστορικών δεδομένων για τις περιπτώσεις χρήσης ML. Αυτοί οι κάτοχοι δεδομένων επικεντρώνονται στην παροχή πρόσβασης στα δεδομένα τους σε πολλές επιχειρηματικές μονάδες ή ομάδες.
Ομάδα επιστήμης δεδομένων – Οι επιστήμονες δεδομένων πρέπει να επικεντρωθούν στη δημιουργία του καλύτερου μοντέλου με βάση προκαθορισμένους βασικούς δείκτες απόδοσης (KPIs) που λειτουργούν σε σημειωματάρια. Μετά την ολοκλήρωση της ερευνητικής φάσης, οι επιστήμονες δεδομένων πρέπει να συνεργαστούν με μηχανικούς ML για τη δημιουργία αυτοματισμών για την κατασκευή (αγωγών ML) και την ανάπτυξη μοντέλων στην παραγωγή χρησιμοποιώντας αγωγούς CI/CD.
Επιχειρηματική ομάδα – Ένας ιδιοκτήτης προϊόντος είναι υπεύθυνος για τον καθορισμό της επιχειρηματικής υπόθεσης, των απαιτήσεων και των KPI που θα χρησιμοποιηθούν για την αξιολόγηση της απόδοσης του μοντέλου. Οι καταναλωτές ML είναι άλλοι επιχειρηματικοί φορείς που χρησιμοποιούν τα αποτελέσματα συμπερασμάτων (προβλέψεις) για να οδηγήσουν τις αποφάσεις.
Ομάδα πλατφόρμας – Οι αρχιτέκτονες είναι υπεύθυνοι για τη συνολική αρχιτεκτονική cloud της επιχείρησης και για το πώς όλες οι διαφορετικές υπηρεσίες συνδέονται μεταξύ τους. Ασφάλεια Οι ΜΜΕ αναθεωρούν την αρχιτεκτονική με βάση τις πολιτικές και τις ανάγκες της επιχειρηματικής ασφάλειας. Οι μηχανικοί MLOps είναι υπεύθυνοι για την παροχή ενός ασφαλούς περιβάλλοντος για τους επιστήμονες δεδομένων και τους μηχανικούς ML για την παραγωγή των περιπτώσεων χρήσης ML. Συγκεκριμένα, είναι υπεύθυνοι για την τυποποίηση των αγωγών CI/CD, των ρόλων χρηστών και υπηρεσιών και της δημιουργίας κοντέινερ, της κατανάλωσης μοντέλων, των δοκιμών και της μεθοδολογίας ανάπτυξης με βάση τις επιχειρηματικές απαιτήσεις και τις απαιτήσεις ασφάλειας.
Ομάδα κινδύνου και συμμόρφωσης – Για πιο περιοριστικά περιβάλλοντα, οι ελεγκτές είναι υπεύθυνοι για την αξιολόγηση των δεδομένων, του κώδικα και των τεχνουργημάτων μοντέλων και για τη διασφάλιση της συμμόρφωσης της επιχείρησης με κανονισμούς, όπως το απόρρητο δεδομένων.

Σημειώστε ότι πολλά πρόσωπα μπορούν να καλυφθούν από το ίδιο άτομο ανάλογα με την κλιμάκωση και την ωριμότητα των MLOps της επιχείρησης.

Αυτά τα πρόσωπα χρειάζονται ειδικά περιβάλλοντα για να εκτελέσουν τις διαφορετικές διαδικασίες, όπως φαίνεται στο παρακάτω σχήμα.

Τα περιβάλλοντα είναι τα εξής:

Διαχείριση πλατφόρμας – Το περιβάλλον διαχείρισης πλατφόρμας είναι το μέρος όπου η ομάδα της πλατφόρμας έχει πρόσβαση για τη δημιουργία λογαριασμών AWS και τη σύνδεση των σωστών χρηστών και δεδομένων
ημερομηνία – Το επίπεδο δεδομένων, συχνά γνωστό ως data lake ή data mesh, είναι το περιβάλλον που χρησιμοποιούν οι μηχανικοί δεδομένων ή οι ιδιοκτήτες και οι ενδιαφερόμενοι φορείς για να προετοιμάσουν, να αλληλεπιδράσουν και να οπτικοποιήσουν με τα δεδομένα
Πειραματισμός – Οι επιστήμονες δεδομένων χρησιμοποιούν ένα περιβάλλον δοκιμών ή πειραματισμού για να δοκιμάσουν νέες βιβλιοθήκες και τεχνικές ML για να αποδείξουν ότι η απόδειξη της ιδέας τους μπορεί να λύσει επιχειρηματικά προβλήματα
Κατασκευή μοντέλου, δοκιμή μοντέλου, ανάπτυξη μοντέλου – Το περιβάλλον κατασκευής, δοκιμής και ανάπτυξης μοντέλου είναι το επίπεδο των MLOps, όπου οι επιστήμονες δεδομένων και οι μηχανικοί ML συνεργάζονται για να αυτοματοποιήσουν και να μεταφέρουν την έρευνα στην παραγωγή
Διακυβέρνηση ML – Το τελευταίο κομμάτι του παζλ είναι το περιβάλλον διακυβέρνησης ML, όπου όλα τα μοντέλα και τα τεχνουργήματα κώδικα αποθηκεύονται, ελέγχονται και ελέγχονται από τα αντίστοιχα πρόσωπα

Το παρακάτω διάγραμμα απεικονίζει την αρχιτεκτονική αναφοράς, η οποία έχει ήδη συζητηθεί στο Ο οδικός χάρτης του θεμελίου MLOps για επιχειρήσεις με το Amazon SageMaker.

Κάθε επιχειρηματική μονάδα έχει κάθε δικό του σύνολο λογαριασμών ανάπτυξης (αυτοματοποιημένη εκπαίδευση και κατασκευή μοντέλων), προπαραγωγή (αυτόματη δοκιμή) και παραγωγή (ανάπτυξη και εξυπηρέτηση μοντέλων) για την παραγωγή περιπτώσεων χρήσης ML, οι οποίες ανακτούν δεδομένα από μια κεντρική ή αποκεντρωμένη λίμνη δεδομένων ή δεδομένα πλέγμα, αντίστοιχα. Όλα τα παραγόμενα μοντέλα και η αυτοματοποίηση κωδικών αποθηκεύονται σε έναν κεντρικό λογαριασμό εργαλείων χρησιμοποιώντας τη δυνατότητα ενός μητρώου μοντέλων. Ο κώδικας υποδομής για όλους αυτούς τους λογαριασμούς έχει εκδοθεί σε έναν κοινόχρηστο λογαριασμό υπηρεσίας (προηγμένος λογαριασμός διακυβέρνησης αναλυτικών στοιχείων) τον οποίο η ομάδα της πλατφόρμας μπορεί να αφαιρέσει, να δημιουργήσει πρότυπο, να διατηρήσει και να επαναχρησιμοποιήσει για την ενσωμάτωση στην πλατφόρμα MLOps κάθε νέας ομάδας.

Δημιουργικοί ορισμοί AI και διαφορές στα MLOps

Στην κλασική ML, ο προηγούμενος συνδυασμός ανθρώπων, διαδικασιών και τεχνολογίας μπορεί να σας βοηθήσει να δημιουργήσετε τις περιπτώσεις χρήσης ML που διαθέτετε. Ωστόσο, στη γενετική τεχνητή νοημοσύνη, η φύση των περιπτώσεων χρήσης απαιτεί είτε επέκταση αυτών των δυνατοτήτων είτε νέες δυνατότητες. Μία από αυτές τις νέες έννοιες είναι το μοντέλο θεμελίωσης (FM). Ονομάζονται ως τέτοια επειδή μπορούν να χρησιμοποιηθούν για τη δημιουργία μιας μεγάλης γκάμα άλλων μοντέλων τεχνητής νοημοσύνης, όπως φαίνεται στο παρακάτω σχήμα.

Τα FM έχουν εκπαιδευτεί με βάση τα terabyte δεδομένων και έχουν εκατοντάδες δισεκατομμύρια παραμέτρους για να μπορούν να προβλέψουν την επόμενη καλύτερη απάντηση με βάση τρεις κύριες κατηγορίες περιπτώσεων χρήσης γενετικής τεχνητής νοημοσύνης:

Κείμενο σε κείμενο – Τα FM (LLM) έχουν εκπαιδευτεί με βάση δεδομένα χωρίς ετικέτα (όπως το ελεύθερο κείμενο) και είναι σε θέση να προβλέψουν την επόμενη καλύτερη λέξη ή ακολουθία λέξεων (παραγράφους ή μεγάλες εκθέσεις). Οι κύριες περιπτώσεις χρήσης αφορούν ανθρώπινα chatbot, σύνοψη ή άλλου είδους δημιουργία περιεχομένου, όπως κώδικα προγραμματισμού.
Κείμενο σε εικόνα – Δεδομένα με ετικέτα, όπως ζεύγη , έχει χρησιμοποιηθεί για την εκπαίδευση FM, τα οποία είναι σε θέση να προβλέψουν τον καλύτερο συνδυασμό pixel. Παραδείγματα περιπτώσεων χρήσης είναι η δημιουργία σχεδίου ρούχων ή οι φανταστικές εξατομικευμένες εικόνες.
Κείμενο σε ήχο ή βίντεο – Τα δεδομένα με ετικέτα και χωρίς ετικέτα μπορούν να χρησιμοποιηθούν για εκπαίδευση FM. Ένα από τα κύρια παραδείγματα χρήσης τεχνητής νοημοσύνης είναι η σύνθεση μουσικής.

Για να παράγουμε αυτές τις γενετικές περιπτώσεις χρήσης τεχνητής νοημοσύνης, πρέπει να δανειστούμε και να επεκτείνουμε τον τομέα MLOps ώστε να περιλαμβάνει τα ακόλουθα:

Λειτουργίες FM (FMOps) – Αυτό μπορεί να παράγει παραγωγικές λύσεις τεχνητής νοημοσύνης, συμπεριλαμβανομένων οποιουδήποτε τύπου περίπτωσης χρήσης
Λειτουργίες LLM (LLMOps) – Αυτό είναι ένα υποσύνολο FMOps που εστιάζει στην παραγωγή λύσεων που βασίζονται σε LLM, όπως κείμενο σε κείμενο

Το παρακάτω σχήμα απεικονίζει την επικάλυψη αυτών των περιπτώσεων χρήσης.

Σε σύγκριση με τα κλασικά ML και MLOps, τα FMOps και LLMOps αναβάλλονται με βάση τέσσερις κύριες κατηγορίες που καλύπτουμε στις ακόλουθες ενότητες: άτομα και διαδικασία, επιλογή και προσαρμογή FM, αξιολόγηση και παρακολούθηση FM, απόρρητο δεδομένων και ανάπτυξη μοντέλου και ανάγκες τεχνολογίας. Θα καλύψουμε την παρακολούθηση σε ξεχωριστή ανάρτηση.

Ταξίδι λειτουργίας ανά τύπο χρήστη τεχνητής νοημοσύνης

Για να απλοποιήσουμε την περιγραφή των διαδικασιών, πρέπει να κατηγοριοποιήσουμε τους κύριους τύπους χρηστών τεχνητής νοημοσύνης που δημιουργούνται, όπως φαίνεται στο παρακάτω σχήμα.

Οι τύποι χρηστών είναι οι εξής:

Προμηθευτές – Χρήστες που κατασκευάζουν FM από την αρχή και τα παρέχουν ως προϊόν σε άλλους χρήστες (fine-tuner και καταναλωτές). Έχουν βαθιά τεχνογνωσία και δεξιότητες επιστήμης δεδομένων από άκρο σε άκρο ML και επεξεργασίας φυσικής γλώσσας (NLP), καθώς και τεράστιες ομάδες ετικετών και επεξεργασίας δεδομένων.
μικροσυντονιστές – Χρήστες που επανεκπαιδεύουν (βελτιστοποιούν) τα FM από παρόχους ώστε να ανταποκρίνονται στις προσαρμοσμένες απαιτήσεις. Ενορχηστρώνουν την ανάπτυξη του μοντέλου ως υπηρεσία για χρήση από τους καταναλωτές. Αυτοί οι χρήστες χρειάζονται ισχυρή τεχνογνωσία από άκρο σε άκρο ML και επιστήμης δεδομένων και γνώση της ανάπτυξης και των συμπερασμάτων μοντέλων. Απαιτείται επίσης ισχυρή γνώση τομέα για συντονισμό, συμπεριλαμβανομένης της άμεσης μηχανικής.
Καταναλωτές – Χρήστες που αλληλεπιδρούν με παραγωγικές υπηρεσίες τεχνητής νοημοσύνης από παρόχους ή βελτιστοποιητές μέσω προτροπής κειμένου ή οπτικής διεπαφής για την ολοκλήρωση των επιθυμητών ενεργειών. Δεν απαιτείται τεχνογνωσία ML, αλλά, κυρίως, προγραμματιστές εφαρμογών ή τελικοί χρήστες με κατανόηση των δυνατοτήτων της υπηρεσίας. Μόνο έγκαιρη μηχανική είναι απαραίτητη για καλύτερα αποτελέσματα.

Σύμφωνα με τον ορισμό και την απαιτούμενη τεχνογνωσία ML, τα MLOps απαιτούνται κυρίως για παρόχους και τελειοποιητές, ενώ οι καταναλωτές μπορούν να χρησιμοποιήσουν αρχές παραγωγής εφαρμογών, όπως DevOps και AppDev για να δημιουργήσουν τις παραγωγικές εφαρμογές AI. Επιπλέον, παρατηρήσαμε μια κίνηση μεταξύ των τύπων χρηστών, όπου οι πάροχοι μπορεί να γίνουν μικροβελτιωτές για να υποστηρίξουν περιπτώσεις χρήσης που βασίζονται σε συγκεκριμένο κλάδο (όπως ο χρηματοπιστωτικός τομέας) ή οι καταναλωτές να γίνουν συντονιστές για να επιτύχουν πιο ακριβή αποτελέσματα. Ας παρατηρήσουμε όμως τις κύριες διαδικασίες ανά τύπο χρήστη.

Το ταξίδι των καταναλωτών

Το παρακάτω σχήμα απεικονίζει το ταξίδι του καταναλωτή.

Όπως αναφέρθηκε προηγουμένως, οι καταναλωτές πρέπει να επιλέξουν, να δοκιμάσουν και να χρησιμοποιήσουν ένα FM, αλληλεπιδρώντας μαζί του παρέχοντας συγκεκριμένες εισόδους, γνωστές αλλιώς ως προτρέπει. Οι προτροπές, στο πλαίσιο του προγραμματισμού υπολογιστών και της τεχνητής νοημοσύνης, αναφέρονται στην είσοδο που δίνεται σε ένα μοντέλο ή σύστημα για να δημιουργήσει μια απόκριση. Αυτό μπορεί να έχει τη μορφή κειμένου, εντολής ή ερώτησης, το οποίο χρησιμοποιεί το σύστημα για να επεξεργαστεί και να δημιουργήσει μια έξοδο. Η έξοδος που παράγεται από το FM μπορεί στη συνέχεια να χρησιμοποιηθεί από τους τελικούς χρήστες, οι οποίοι θα πρέπει επίσης να είναι σε θέση να βαθμολογήσουν αυτές τις εξόδους για να βελτιώσουν τις μελλοντικές αποκρίσεις του μοντέλου.

Πέρα από αυτές τις θεμελιώδεις διαδικασίες, έχουμε παρατηρήσει καταναλωτές που εκφράζουν την επιθυμία να βελτιστοποιήσουν ένα μοντέλο αξιοποιώντας τη λειτουργικότητα που προσφέρουν οι μικροσυντονιστές. Πάρτε, για παράδειγμα, έναν ιστότοπο που δημιουργεί εικόνες. Εδώ, οι τελικοί χρήστες μπορούν να δημιουργήσουν ιδιωτικούς λογαριασμούς, να ανεβάσουν προσωπικές φωτογραφίες και, στη συνέχεια, να δημιουργήσουν περιεχόμενο σχετικό με αυτές τις εικόνες (για παράδειγμα, να δημιουργήσουν μια εικόνα που απεικονίζει τον τελικό χρήστη σε μια μοτοσικλέτα που κρατά ένα σπαθί ή βρίσκεται σε μια εξωτική τοποθεσία). Σε αυτό το σενάριο, η γενετική εφαρμογή τεχνητής νοημοσύνης, που έχει σχεδιαστεί από τον καταναλωτή, πρέπει να αλληλεπιδρά με το backend του μικροδέκτη μέσω API για να παραδώσει αυτή τη λειτουργία στους τελικούς χρήστες.

Ωστόσο, προτού εμβαθύνουμε σε αυτό, ας επικεντρωθούμε πρώτα στο ταξίδι επιλογής μοντέλου, δοκιμής, χρήσης, αλληλεπίδρασης εισόδου και εξόδου και βαθμολογίας, όπως φαίνεται στο παρακάτω σχήμα.

*15K διαθέσιμη αναφορά FM

Βήμα 1. Κατανοήστε τις κορυφαίες δυνατότητες FM

Υπάρχουν πολλές διαστάσεις που πρέπει να ληφθούν υπόψη κατά την επιλογή μοντέλων θεμελίωσης, ανάλογα με την περίπτωση χρήσης, τα διαθέσιμα δεδομένα, τους κανονισμούς κ.λπ. Μια καλή λίστα ελέγχου, αν και δεν είναι πλήρης, μπορεί να είναι η εξής:

Ιδιόκτητο ή ανοιχτού κώδικα FM – Τα ιδιόκτητα μοντέλα έχουν συχνά οικονομικό κόστος, αλλά συνήθως προσφέρουν καλύτερη απόδοση (όσον αφορά την ποιότητα του παραγόμενου κειμένου ή εικόνας), συχνά αναπτύσσονται και συντηρούνται από εξειδικευμένες ομάδες παρόχων μοντέλων που διασφαλίζουν τη βέλτιστη απόδοση και αξιοπιστία. Από την άλλη πλευρά, βλέπουμε επίσης την υιοθέτηση μοντέλων ανοιχτού κώδικα που, εκτός από το ότι είναι δωρεάν, προσφέρουν πρόσθετα πλεονεκτήματα ως προς το ότι είναι προσβάσιμα και ευέλικτα (για παράδειγμα, κάθε μοντέλο ανοιχτού κώδικα μπορεί να ρυθμιστεί με ακρίβεια). Ένα παράδειγμα ιδιόκτητου μοντέλου είναι το μοντέλο Claude της Anthropic και ένα παράδειγμα μοντέλου ανοιχτού κώδικα υψηλής απόδοσης είναι το Falcon-40B, από τον Ιούλιο του 2023.
Εμπορική άδεια – Τα ζητήματα αδειοδότησης είναι ζωτικής σημασίας όταν αποφασίζετε για ένα FM. Είναι σημαντικό να σημειωθεί ότι ορισμένα μοντέλα είναι ανοιχτού κώδικα, αλλά δεν μπορούν να χρησιμοποιηθούν για εμπορικούς σκοπούς, λόγω περιορισμών ή προϋποθέσεων αδειοδότησης. Οι διαφορές μπορεί να είναι λεπτές: Το νέο που κυκλοφόρησε xgen-7b-8k-βάση το μοντέλο, για παράδειγμα, είναι ανοιχτού κώδικα και είναι εμπορικά χρησιμοποιήσιμο (άδεια Apache-2.0), ενώ η έκδοση του μοντέλου έχει τελειοποιήσει τις οδηγίες xgen-7b-8k-inst κυκλοφορεί μόνο για ερευνητικούς σκοπούς. Όταν επιλέγετε ένα FM για μια εμπορική εφαρμογή, είναι απαραίτητο να επαληθεύσετε τη συμφωνία άδειας χρήσης, να κατανοήσετε τους περιορισμούς της και να διασφαλίσετε ότι ευθυγραμμίζεται με την προβλεπόμενη χρήση του έργου.
παράμετροι – Ο αριθμός των παραμέτρων, που αποτελούνται από τα βάρη και τις προκαταλήψεις στο νευρωνικό δίκτυο, είναι ένας άλλος βασικός παράγοντας. Περισσότερες παράμετροι γενικά σημαίνει ένα πιο περίπλοκο και δυνητικά ισχυρό μοντέλο, επειδή μπορεί να καταγράψει πιο περίπλοκα μοτίβα και συσχετίσεις στα δεδομένα. Ωστόσο, η αντιστάθμιση είναι ότι απαιτεί περισσότερους υπολογιστικούς πόρους και, ως εκ τούτου, κοστίζει περισσότερο για να εκτελεστεί. Επιπλέον, βλέπουμε μια τάση προς μικρότερα μοντέλα, ειδικά στον χώρο ανοιχτού κώδικα (μοντέλα που κυμαίνονται από 7 έως 40 δισεκατομμύρια) που αποδίδουν καλά, ειδικά όταν ρυθμίζονται με ακρίβεια.
Ταχύτητα – Η ταχύτητα ενός μοντέλου επηρεάζεται από το μέγεθός του. Τα μεγαλύτερα μοντέλα τείνουν να επεξεργάζονται δεδομένα πιο αργά (μεγαλύτερη καθυστέρηση) λόγω της αυξημένης υπολογιστικής πολυπλοκότητας. Επομένως, είναι σημαντικό να εξισορροπήσετε την ανάγκη για ένα μοντέλο με υψηλή προγνωστική ισχύ (συχνά μεγαλύτερα μοντέλα) με τις πρακτικές απαιτήσεις για ταχύτητα, ειδικά σε εφαρμογές, όπως τα chat bots, που απαιτούν απαντήσεις σε πραγματικό χρόνο ή σχεδόν σε πραγματικό χρόνο.
Μέγεθος παραθύρου περιβάλλοντος (αριθμός διακριτικών) – Το παράθυρο περιβάλλοντος, που ορίζεται από τον μέγιστο αριθμό διακριτικών που μπορούν να εισαχθούν ή να εξάγονται ανά προτροπή, είναι κρίσιμο για τον καθορισμό του περιεχομένου που μπορεί να λάβει το μοντέλο κάθε φορά (ένα διακριτικό μεταφράζεται χονδρικά σε 0.75 λέξεις για τα αγγλικά). Τα μοντέλα με μεγαλύτερα παράθυρα περιβάλλοντος μπορούν να κατανοήσουν και να δημιουργήσουν μεγαλύτερες ακολουθίες κειμένου, οι οποίες μπορεί να είναι χρήσιμες για εργασίες που περιλαμβάνουν μεγαλύτερες συνομιλίες ή έγγραφα.
Δεδομένα εκπαίδευσης – Είναι επίσης σημαντικό να κατανοήσουμε σε τι είδους δεδομένα εκπαιδεύτηκε το FM. Ορισμένα μοντέλα ενδέχεται να εκπαιδεύονται σε διαφορετικά σύνολα δεδομένων κειμένου, όπως δεδομένα Διαδικτύου, σενάρια κωδικοποίησης, οδηγίες ή ανθρώπινα σχόλια. Άλλοι μπορεί επίσης να εκπαιδευτούν σε πολυτροπικά σύνολα δεδομένων, όπως συνδυασμούς δεδομένων κειμένου και εικόνας. Αυτό μπορεί να επηρεάσει την καταλληλότητα του μοντέλου για διαφορετικές εργασίες. Επιπλέον, ένας οργανισμός μπορεί να έχει ανησυχίες σχετικά με τα πνευματικά δικαιώματα ανάλογα με τις ακριβείς πηγές στις οποίες έχει εκπαιδευτεί ένα μοντέλο—επομένως, είναι υποχρεωτικό να επιθεωρείται προσεκτικά το σύνολο δεδομένων εκπαίδευσης.
Ποιότητα – Η ποιότητα ενός FM μπορεί να ποικίλλει ανάλογα με τον τύπο του (ιδιόκτητο έναντι ανοιχτού κώδικα), το μέγεθος και το είδος στο οποίο εκπαιδεύτηκε. Η ποιότητα εξαρτάται από το πλαίσιο, που σημαίνει ότι αυτό που θεωρείται υψηλής ποιότητας για μια εφαρμογή μπορεί να μην είναι για μια άλλη. Για παράδειγμα, ένα μοντέλο που εκπαιδεύεται σε δεδομένα Διαδικτύου μπορεί να θεωρείται υψηλής ποιότητας για τη δημιουργία κειμένου συνομιλίας, αλλά λιγότερο για τεχνικές ή εξειδικευμένες εργασίες.
λεπτομέρεια – Η δυνατότητα λεπτομέρειας ενός FM προσαρμόζοντας τα βάρη ή τα επίπεδα του μοντέλου μπορεί να είναι ένας κρίσιμος παράγοντας. Η λεπτή ρύθμιση επιτρέπει στο μοντέλο να προσαρμόζεται καλύτερα στο συγκεκριμένο πλαίσιο της εφαρμογής, βελτιώνοντας την απόδοση στη συγκεκριμένη εργασία. Ωστόσο, η λεπτομέρεια απαιτεί πρόσθετους υπολογιστικούς πόρους και τεχνική εξειδίκευση και δεν υποστηρίζουν όλα τα μοντέλα αυτήν τη δυνατότητα. Τα μοντέλα ανοιχτού κώδικα είναι (γενικά) πάντα με δυνατότητα λεπτομέρειας, επειδή τα τεχνουργήματα μοντέλων είναι διαθέσιμα για λήψη και οι χρήστες μπορούν να τα επεκτείνουν και να τα χρησιμοποιήσουν κατά βούληση. Τα ιδιόκτητα μοντέλα ενδέχεται μερικές φορές να προσφέρουν την επιλογή λεπτομέρειας.
Οι υπάρχουσες δεξιότητες πελατών – Η επιλογή ενός FM μπορεί επίσης να επηρεαστεί από τις δεξιότητες και την εξοικείωση του πελάτη ή της ομάδας ανάπτυξης. Εάν ένας οργανισμός δεν έχει εμπειρογνώμονες AI/ML στην ομάδα του, τότε μια υπηρεσία API μπορεί να είναι πιο κατάλληλη για αυτόν. Επίσης, εάν μια ομάδα έχει εκτενή εμπειρία με ένα συγκεκριμένο FM, μπορεί να είναι πιο αποτελεσματικό να συνεχίσει να το χρησιμοποιεί παρά να επενδύσει χρόνο και πόρους για να μάθει και να προσαρμοστεί σε ένα νέο.

Το παρακάτω είναι ένα παράδειγμα δύο σύντομων λιστών, μία για ιδιόκτητα μοντέλα και μία για μοντέλα ανοιχτού κώδικα. Μπορείτε να συντάξετε παρόμοιους πίνακες με βάση τις συγκεκριμένες ανάγκες σας για να έχετε μια γρήγορη επισκόπηση των διαθέσιμων επιλογών. Λάβετε υπόψη ότι οι επιδόσεις και οι παράμετροι αυτών των μοντέλων αλλάζουν γρήγορα και ενδέχεται να είναι ξεπερασμένες κατά τη στιγμή της ανάγνωσης, ενώ άλλες δυνατότητες μπορεί να είναι σημαντικές για συγκεκριμένους πελάτες, όπως η υποστηριζόμενη γλώσσα.

Το παρακάτω είναι ένα παράδειγμα αξιοσημείωτων ιδιόκτητων FM που διατίθενται στο AWS (Ιούλιος 2023).

Το παρακάτω είναι ένα παράδειγμα αξιοσημείωτων FM ανοιχτού κώδικα που διατίθενται στο AWS (Ιούλιος 2023).

Αφού συντάξετε μια επισκόπηση 10-20 πιθανών υποψήφιων μοντέλων, καθίσταται απαραίτητο να κάνετε περαιτέρω πιο συγκεκριμένη αυτή τη σύντομη λίστα. Σε αυτήν την ενότητα, προτείνουμε έναν γρήγορο μηχανισμό που θα δώσει δύο ή τρία βιώσιμα τελικά μοντέλα ως υποψήφια για τον επόμενο γύρο.

Το παρακάτω διάγραμμα απεικονίζει την αρχική διαδικασία επιλογής.

Συνήθως, οι μηχανικοί άμεσης επικοινωνίας, οι οποίοι είναι ειδικοί στη δημιουργία προτροπών υψηλής ποιότητας που επιτρέπουν στα μοντέλα τεχνητής νοημοσύνης να κατανοούν και να επεξεργάζονται τις εισροές των χρηστών, πειραματίζονται με διάφορες μεθόδους για να εκτελέσουν την ίδια εργασία (όπως η σύνοψη) σε ένα μοντέλο. Προτείνουμε αυτά τα μηνύματα να μην δημιουργούνται αμέσως, αλλά να εξάγονται συστηματικά από έναν κατάλογο προτροπών. Αυτός ο κατάλογος προτροπών είναι μια κεντρική τοποθεσία για την αποθήκευση προτροπών για την αποφυγή επαναλήψεων, την ενεργοποίηση του ελέγχου έκδοσης και την κοινή χρήση προτροπών εντός της ομάδας για τη διασφάλιση της συνέπειας μεταξύ διαφορετικών ελεγκτών προτροπής στα διαφορετικά στάδια ανάπτυξης, τα οποία παρουσιάζουμε στην επόμενη ενότητα. Αυτός ο κατάλογος εντολών είναι ανάλογος με ένα αποθετήριο Git ενός καταστήματος χαρακτηριστικών. Ο προγραμματιστής γενετικής τεχνητής νοημοσύνης, ο οποίος θα μπορούσε δυνητικά να είναι το ίδιο άτομο με τον μηχανικό άμεσης επικοινωνίας, πρέπει στη συνέχεια να αξιολογήσει την έξοδο για να καθορίσει εάν θα ήταν κατάλληλη για τη γενετική εφαρμογή τεχνητής νοημοσύνης που επιδιώκουν να αναπτύξουν.

Βήμα 2. Δοκιμάστε και αξιολογήστε το κορυφαίο FM

Αφού η σύντομη λίστα μειωθεί σε περίπου τρία FM, συνιστούμε ένα βήμα αξιολόγησης για τον περαιτέρω έλεγχο των δυνατοτήτων και της καταλληλότητας των FM για την περίπτωση χρήσης. Ανάλογα με τη διαθεσιμότητα και τη φύση των δεδομένων αξιολόγησης, προτείνουμε διαφορετικές μεθόδους, όπως φαίνεται στο παρακάτω σχήμα.

Η μέθοδος που θα χρησιμοποιήσετε πρώτα εξαρτάται από το εάν έχετε επισημάνει τα δεδομένα δοκιμής ή όχι.

Εάν έχετε επισημασμένα δεδομένα, μπορείτε να τα χρησιμοποιήσετε για να πραγματοποιήσετε μια αξιολόγηση μοντέλων, όπως κάνουμε με τα παραδοσιακά μοντέλα ML (εισαγάγετε μερικά δείγματα και συγκρίνετε την έξοδο με τις ετικέτες). Ανάλογα με το αν τα δεδομένα της δοκιμής έχουν διακριτές ετικέτες (όπως θετική, αρνητική ή ουδέτερη ανάλυση συναισθήματος) ή είναι μη δομημένο κείμενο (όπως η περίληψη), προτείνουμε διαφορετικές μεθόδους αξιολόγησης:

Μετρήσεις ακρίβειας – Σε περίπτωση διακριτών αποτελεσμάτων (όπως η ανάλυση συναισθήματος), μπορούμε να χρησιμοποιήσουμε τυπικές μετρήσεις ακρίβειας όπως ακρίβεια, ανάκληση και βαθμολογία F1
Μετρήσεις ομοιότητας – Εάν η έξοδος δεν είναι δομημένη (όπως μια περίληψη), προτείνουμε μετρήσεις ομοιότητας όπως ROUGE και ομοιότητα συνημιτόνου

Ορισμένες περιπτώσεις χρήσης δεν μπορούν να έχουν μια αληθινή απάντηση (για παράδειγμα, «Δημιουργήστε μια σύντομη παιδική ιστορία για την 5χρονη κόρη μου»). Σε τέτοιες περιπτώσεις, γίνεται πιο δύσκολη η αξιολόγηση των μοντέλων επειδή δεν διαθέτετε δεδομένα δοκιμής με ετικέτα. Προτείνουμε δύο προσεγγίσεις, ανάλογα με τη σημασία της ανθρώπινης αναθεώρησης του μοντέλου έναντι της αυτοματοποιημένης αξιολόγησης:

Human-in-the-Loop (HIL) – Σε αυτήν την περίπτωση, μια ομάδα έγκαιρων ελεγκτών θα εξετάσει τις απαντήσεις από ένα μοντέλο. Ανάλογα με το πόσο κρίσιμη είναι η εφαρμογή, οι υπεύθυνοι δοκιμών μπορεί να ελέγξουν το 100% των εξόδων του μοντέλου ή απλώς ένα δείγμα.
Αξιολόγηση βάσει LLM – Σε αυτό το σενάριο, τα prompt testers αντικαθίστανται από ένα LLM, ιδανικά ένα πιο ισχυρό (αν και ίσως πιο αργό και δαπανηρό) από αυτά που δοκιμάζονται. Το LLM θα εξετάσει όλες τις απαντήσεις που δημιουργούνται από το μοντέλο και θα τις βαθμολογήσει. Αυτή η μέθοδος μπορεί να έχει ως αποτέλεσμα χαμηλότερη ποιότητα, αλλά είναι μια φθηνότερη και ταχύτερη επιλογή αξιολόγησης που μπορεί να παρέχει ένα καλό αρχικό όργανο για την απόδοση των μοντέλων.

Για παράδειγμα, μπορούμε να χρησιμοποιήσουμε το ακόλουθο παράδειγμα προτροπής σε ένα LLM, το οποίο περιλαμβάνει το ερώτημα εισαγωγής, την απάντηση LLM και οδηγίες: «Θα θέλαμε να ζητήσουμε τα σχόλιά σας σχετικά με την απόδοση ενός βοηθού AI ως απάντηση στην ερώτηση χρήστη που εμφανίζεται παραπάνω . Αξιολογήστε τη χρησιμότητα, τη συνάφεια, την ακρίβεια, το επίπεδο λεπτομερειών της απάντησης του βοηθού. Ο βοηθός θα λάβει συνολική βαθμολογία σε μια κλίμακα από το 1 έως το 10, όπου υψηλότερη βαθμολογία υποδηλώνει καλύτερη συνολική απόδοση.»

Αυτή η προτροπή θα σταλεί σε άλλο LLM (το EvalLLM) για αξιολόγηση. Το παρακάτω είναι ένα παράδειγμα όπου η απόκριση του μοντέλου Falcon-40B έχει αξιολογηθεί από έναν EvalLLM (στην περίπτωση αυτή τον Claude). Χρησιμοποιούμε την ερώτηση "Τι θα γινόταν αν η Διώρυγα του Σουέζ δεν είχε κατασκευαστεί ποτέ;" Η απάντηση είναι η εξής:

Ερώτηση: Τι θα γινόταν αν η Διώρυγα του Σουέζ δεν είχε κατασκευαστεί ποτέ;

Falcon-40b-instruct

Εάν η διώρυγα του Σουέζ δεν είχε κατασκευαστεί ποτέ, τα πλοία θα έπρεπε να ταξιδέψουν στην Αφρική για να πλεύσουν μεταξύ της Μεσογείου και της Ερυθράς Θάλασσας. Αυτό θα πρόσθετε σημαντικό χρόνο και απόσταση στο ταξίδι, καθιστώντας το λιγότερο αποτελεσματικό και πιο ακριβό. Επιπλέον, χωρίς τη Διώρυγα του Σουέζ, πολλές χώρες στη Μέση Ανατολή και τη Βόρεια Αφρική θα ήταν πολύ λιγότερο συνδεδεμένες με τον υπόλοιπο κόσμο, εμποδίζοντας την οικονομική και πολιτιστική ανάπτυξη.

Αξιολόγηση (Βαθμολογία: 9/10)

Η απάντηση του βοηθού είναι πολύ σχετική, ακριβής και λεπτομερής. Δίνει μια εξαιρετική απάντηση στην υποθετική ερώτηση του χρήστη για την ανυπαρξία της Διώρυγας του Σουέζ. Ο βοηθός επισημαίνει σωστά τις επιπτώσεις στα θαλάσσια ταξίδια και τον οικονομικό και πολιτιστικό αντίκτυπο στη Μέση Ανατολή και τη Βόρεια Αφρική. Ωστόσο, θα μπορούσε να έχει επεξεργαστεί περαιτέρω τις γεωπολιτικές επιπτώσεις ή τον αντίκτυπο στα πρότυπα του παγκόσμιου εμπορίου για μια πιο ολοκληρωμένη απάντηση.

Το παρακάτω σχήμα απεικονίζει το παράδειγμα της διαδικασίας αξιολόγησης από άκρο σε άκρο.

Με βάση αυτό το παράδειγμα, για να πραγματοποιήσουμε αξιολόγηση, πρέπει να παρέχουμε τα παραδείγματα προτροπών, τα οποία αποθηκεύουμε στον κατάλογο προτροπών, και ένα σύνολο δεδομένων αξιολόγησης με ετικέτα ή χωρίς ετικέτα με βάση τις συγκεκριμένες εφαρμογές μας. Για παράδειγμα, με ένα σύνολο δεδομένων αξιολόγησης με ετικέτα, μπορούμε να παρέχουμε προτροπές (εισαγωγή και ερώτημα) όπως "Δώστε μου το πλήρες όνομα του πρωθυπουργού του Ηνωμένου Βασιλείου το 2023" και αποτελέσματα και απαντήσεις, όπως "Rishi Sunak". Με ένα σύνολο δεδομένων χωρίς ετικέτα, παρέχουμε μόνο την ερώτηση ή την οδηγία, όπως "Δημιουργήστε τον πηγαίο κώδικα για έναν ιστότοπο λιανικής". Ονομάζουμε τον συνδυασμό του γρήγορου καταλόγου και του συνόλου δεδομένων αξιολόγησης άμεσος κατάλογος αξιολόγησης. Ο λόγος που διαφοροποιούμε τον κατάλογο προτροπής και τον κατάλογο προτροπής αξιολόγησης είναι επειδή ο τελευταίος είναι αφιερωμένος σε μια συγκεκριμένη περίπτωση χρήσης αντί για γενικές προτροπές και οδηγίες (όπως η απάντηση ερωτήσεων) που περιέχει ο κατάλογος προτροπής.

Με αυτόν τον κατάλογο προτροπών αξιολόγησης, το επόμενο βήμα είναι να τροφοδοτήσετε τα μηνύματα αξιολόγησης στα κορυφαία FM. Το αποτέλεσμα είναι ένα σύνολο δεδομένων αποτελεσμάτων αξιολόγησης που περιέχει τις προτροπές, τις εξόδους κάθε FM και την έξοδο με ετικέτα μαζί με μια βαθμολογία (αν υπάρχει). Στην περίπτωση ενός καταλόγου εντολών αξιολόγησης χωρίς ετικέτα, υπάρχει ένα πρόσθετο βήμα για έναν HIL ή LLM να επανεξετάσει τα αποτελέσματα και να παράσχει βαθμολογία και ανατροφοδότηση (όπως περιγράψαμε προηγουμένως). Το τελικό αποτέλεσμα θα είναι συγκεντρωτικά αποτελέσματα που συνδυάζουν τις βαθμολογίες όλων των αποτελεσμάτων (υπολογισμός της μέσης ακρίβειας ή της ανθρώπινης βαθμολογίας) και θα επιτρέπουν στους χρήστες να συγκρίνουν την ποιότητα των μοντέλων.

Αφού συλλεχθούν τα αποτελέσματα της αξιολόγησης, προτείνουμε την επιλογή ενός μοντέλου με βάση πολλές διαστάσεις. Αυτά συνήθως οφείλονται σε παράγοντες όπως η ακρίβεια, η ταχύτητα και το κόστος. Το παρακάτω σχήμα δείχνει ένα παράδειγμα.

Κάθε μοντέλο θα έχει πλεονεκτήματα και ορισμένες συμβιβασμούς σε αυτές τις διαστάσεις. Ανάλογα με την περίπτωση χρήσης, θα πρέπει να εκχωρήσουμε διαφορετικές προτεραιότητες σε αυτές τις διαστάσεις. Στο προηγούμενο παράδειγμα, επιλέξαμε να δώσουμε προτεραιότητα στο κόστος ως τον πιο σημαντικό παράγοντα, ακολουθούμενο από την ακρίβεια και μετά την ταχύτητα. Παρόλο που είναι πιο αργό και όχι τόσο αποδοτικό όσο το FM1, παραμένει αρκετά αποτελεσματικό και πολύ φθηνότερο στη φιλοξενία. Κατά συνέπεια, μπορεί να επιλέξουμε το FM2 ως την κορυφαία επιλογή.

Βήμα 3. Αναπτύξτε το γενετικό backend και frontend εφαρμογών AI

Σε αυτό το σημείο, οι παραγωγοί προγραμματιστές AI έχουν επιλέξει το σωστό FM για τη συγκεκριμένη εφαρμογή μαζί με τη βοήθεια έγκαιρων μηχανικών και δοκιμαστών. Το επόμενο βήμα είναι να ξεκινήσετε την ανάπτυξη της γενετικής εφαρμογής AI. Διαχωρίσαμε την ανάπτυξη της γενετικής εφαρμογής AI σε δύο επίπεδα, ένα backend και ένα front end, όπως φαίνεται στο παρακάτω σχήμα.

Στο backend, οι παραγωγοί προγραμματιστές AI ενσωματώνουν το επιλεγμένο FM στις λύσεις και συνεργάζονται με τους μηχανικούς προτροπής για να δημιουργήσουν τον αυτοματισμό για να μετατρέψουν την είσοδο του τελικού χρήστη σε κατάλληλες προτροπές FM. Οι δοκιμαστές προτροπής δημιουργούν τις απαραίτητες καταχωρήσεις στον κατάλογο προτροπής για αυτόματη ή χειροκίνητη δοκιμή (HIL ή LLM). Στη συνέχεια, οι παραγωγοί προγραμματιστές τεχνητής νοημοσύνης δημιουργούν τον μηχανισμό άμεσης αλυσίδας και εφαρμογής για να παρέχουν το τελικό αποτέλεσμα. Το Prompt Chaining, σε αυτό το πλαίσιο, είναι μια τεχνική για τη δημιουργία πιο δυναμικών και συναφών εφαρμογών LLM. Λειτουργεί αναλύοντας μια σύνθετη εργασία σε μια σειρά από μικρότερες, πιο διαχειρίσιμες υπο-εργασίες. Για παράδειγμα, αν θέσουμε σε έναν LLM την ερώτηση "Πού γεννήθηκε ο πρωθυπουργός του Ηνωμένου Βασιλείου και πόσο μακριά είναι αυτό το μέρος από το Λονδίνο", η εργασία μπορεί να αναλυθεί σε μεμονωμένες προτροπές, όπου μπορεί να δημιουργηθεί μια προτροπή με βάση την απάντηση μιας προηγούμενης άμεσης αξιολόγησης, όπως «Ποιος είναι ο πρωθυπουργός του Ηνωμένου Βασιλείου», «Ποια είναι η γενέτειρά τους» και «Πόσο απέχει αυτό το μέρος από το Λονδίνο;» Για να διασφαλιστεί μια ορισμένη ποιότητα εισόδου και εξόδου, οι παραγωγοί προγραμματιστές τεχνητής νοημοσύνης πρέπει επίσης να δημιουργήσουν τον μηχανισμό παρακολούθησης και φιλτραρίσματος των εισόδων και των εξόδων εφαρμογών του τελικού χρήστη. Εάν, για παράδειγμα, η εφαρμογή LLM υποτίθεται ότι αποφεύγει τοξικά αιτήματα και απαντήσεις, θα μπορούσαν να εφαρμόσουν έναν ανιχνευτή τοξικότητας για είσοδο και έξοδο και να τα φιλτράρουν. Τέλος, πρέπει να παράσχουν έναν μηχανισμό αξιολόγησης, ο οποίος θα υποστηρίξει την αύξηση του καταλόγου εντολών αξιολόγησης με καλά και κακά παραδείγματα. Μια πιο λεπτομερής αναπαράσταση αυτών των μηχανισμών θα παρουσιαστεί σε μελλοντικές αναρτήσεις.

Για να παρέχεται η λειτουργικότητα στον παραγωγικό τελικό χρήστη τεχνητής νοημοσύνης, είναι απαραίτητη η ανάπτυξη ενός ιστότοπου frontend που αλληλεπιδρά με το backend. Επομένως, οι προσωπικότητες DevOps και AppDevs (προγραμματιστές εφαρμογών στο cloud) πρέπει να ακολουθούν τις βέλτιστες πρακτικές ανάπτυξης για να εφαρμόσουν τη λειτουργικότητα της εισόδου/εξόδου και της αξιολόγησης.

Εκτός από αυτήν τη βασική λειτουργία, το frontend και το backend πρέπει να ενσωματώνουν τη δυνατότητα δημιουργίας προσωπικών λογαριασμών χρηστών, αποστολής δεδομένων, έναρξης λεπτομέρειας ως μαύρο κουτί και χρήσης του εξατομικευμένου μοντέλου αντί του βασικού FM. Η παραγωγή μιας γενετικής εφαρμογής AI είναι παρόμοια με μια κανονική εφαρμογή. Το παρακάτω σχήμα απεικονίζει ένα παράδειγμα αρχιτεκτονικής.

Σε αυτήν την αρχιτεκτονική, οι προγραμματιστές τεχνητής νοημοσύνης, οι μηχανικοί προτροπής και οι DevOps ή AppDevs δημιουργούν και δοκιμάζουν την εφαρμογή με μη αυτόματο τρόπο, αναπτύσσοντάς την μέσω CI/CD σε ένα περιβάλλον ανάπτυξης (γενικό AI App Dev στο προηγούμενο σχήμα) χρησιμοποιώντας αποκλειστικούς χώρους αποθήκευσης κώδικα και συγχώνευση με τον κλάδο dev. Σε αυτό το στάδιο, οι παραγωγοί προγραμματιστές τεχνητής νοημοσύνης θα χρησιμοποιήσουν το αντίστοιχο FM καλώντας το API όπως παρέχεται από τους παρόχους FM των βελτιστοποιητών. Στη συνέχεια, για να δοκιμάσουν την εφαρμογή εκτενώς, πρέπει να προωθήσουν τον κώδικα στον κλάδο δοκιμής, ο οποίος θα ενεργοποιήσει την ανάπτυξη μέσω CI/CD στο περιβάλλον προπαραγωγής (γεννητικό AI App Pre-prod). Σε αυτό το περιβάλλον, οι ελεγκτές προτροπής πρέπει να δοκιμάσουν μεγάλο αριθμό συνδυασμών προτροπής και να ελέγξουν τα αποτελέσματα. Ο συνδυασμός προτροπών, αποτελεσμάτων και αναθεώρησης πρέπει να μετακινηθεί στον κατάλογο προτροπών αξιολόγησης για να αυτοματοποιηθεί η διαδικασία δοκιμών στο μέλλον. Μετά από αυτήν την εκτεταμένη δοκιμή, το τελευταίο βήμα είναι η προώθηση της γενετικής εφαρμογής AI στην παραγωγή μέσω CI/CD με τη συγχώνευση με τον κύριο κλάδο (generative AI App Prod). Λάβετε υπόψη ότι όλα τα δεδομένα, συμπεριλαμβανομένου του καταλόγου εντολών, των δεδομένων και των αποτελεσμάτων αξιολόγησης, των δεδομένων και των μεταδεδομένων τελικού χρήστη και των μεταδεδομένων μοντέλων με ακρίβεια, πρέπει να αποθηκευτούν στη λίμνη δεδομένων ή στο επίπεδο πλέγματος δεδομένων. Οι αγωγοί CI/CD και τα αποθετήρια πρέπει να αποθηκευτούν σε ξεχωριστό λογαριασμό εργαλείων (παρόμοιο με αυτόν που περιγράφεται για τα MLOps).

Το ταξίδι των παρόχων

Οι πάροχοι FM πρέπει να εκπαιδεύουν FM, όπως μοντέλα βαθιάς εκμάθησης. Για αυτούς, ο κύκλος ζωής και η υποδομή των MLOps από άκρο σε άκρο είναι απαραίτητα. Απαιτούνται προσθήκες στην προετοιμασία ιστορικών δεδομένων, την αξιολόγηση μοντέλων και την παρακολούθηση. Το παρακάτω σχήμα απεικονίζει το ταξίδι τους.

Στην κλασική ML, τα ιστορικά δεδομένα δημιουργούνται συχνότερα με την τροφοδοσία της βασικής αλήθειας μέσω αγωγών ETL. Για παράδειγμα, σε μια περίπτωση χρήσης πρόβλεψης διακοπής, ένας αυτοματισμός ενημερώνει έναν πίνακα βάσης δεδομένων βάσει της νέας κατάστασης ενός πελάτη ώστε να αναστέλλεται/δεν αναβάλλεται αυτόματα. Στην περίπτωση των FM, χρειάζονται είτε δισεκατομμύρια σημεία δεδομένων με ετικέτα είτε χωρίς ετικέτα. Σε περιπτώσεις χρήσης κειμένου σε εικόνα, μια ομάδα ετικετών δεδομένων πρέπει να κάνει ετικέτες ζεύγη χειροκίνητα. Αυτή είναι μια δαπανηρή άσκηση που απαιτεί μεγάλο αριθμό ανθρώπων. Amazon SageMaker Ground Truth Plus μπορεί να παρέχει μια ομάδα ετικετών για να εκτελέσει αυτήν τη δραστηριότητα για εσάς. Για ορισμένες περιπτώσεις χρήσης, αυτή η διαδικασία μπορεί επίσης να αυτοματοποιηθεί μερικώς, για παράδειγμα χρησιμοποιώντας μοντέλα που μοιάζουν με CLIP. Στην περίπτωση ενός LLM, όπως το κείμενο σε κείμενο, τα δεδομένα δεν φέρουν ετικέτα. Ωστόσο, πρέπει να προετοιμαστούν και να ακολουθήσουν τη μορφή των υπαρχόντων ιστορικών δεδομένων χωρίς ετικέτα. Ως εκ τούτου, απαιτούνται συντάκτες δεδομένων για την εκτέλεση της απαραίτητης προετοιμασίας δεδομένων και τη διασφάλιση της συνέπειας.

Με τα ιστορικά στοιχεία που έχουν προετοιμαστεί, το επόμενο βήμα είναι η εκπαίδευση και η παραγωγή του μοντέλου. Σημειώστε ότι μπορούν να χρησιμοποιηθούν οι ίδιες τεχνικές αξιολόγησης που περιγράψαμε για τους καταναλωτές.

Το ταξίδι των τελειοποιητών

Οι μικροσυντονιστές στοχεύουν να προσαρμόσουν ένα υπάρχον FM στο συγκεκριμένο περιβάλλον τους. Για παράδειγμα, ένα μοντέλο FM μπορεί να συνοψίσει ένα κείμενο γενικής χρήσης αλλά όχι μια οικονομική αναφορά με ακρίβεια ή δεν μπορεί να δημιουργήσει πηγαίο κώδικα για μια μη κοινή γλώσσα προγραμματισμού. Σε αυτές τις περιπτώσεις, οι μικροσυντονιστές πρέπει να επισημάνουν τα δεδομένα, να προσαρμόσουν με ακρίβεια ένα μοντέλο εκτελώντας μια εργασία εκπαίδευσης, να αναπτύξουν το μοντέλο, να το δοκιμάσουν με βάση τις διαδικασίες των καταναλωτών και να παρακολουθήσουν το μοντέλο. Το παρακάτω διάγραμμα απεικονίζει αυτή τη διαδικασία.

Προς το παρόν, υπάρχουν δύο μηχανισμοί μικρορύθμισης:

Βελτιστοποίηση – Χρησιμοποιώντας ένα FM και δεδομένα με ετικέτα, μια εργασία εκπαίδευσης υπολογίζει εκ νέου τα βάρη και τις προκαταλήψεις των επιπέδων του μοντέλου βαθιάς μάθησης. Αυτή η διαδικασία μπορεί να είναι υπολογιστικά εντατική και απαιτεί αντιπροσωπευτικό όγκο δεδομένων, αλλά μπορεί να παράγει ακριβή αποτελέσματα.
Μικροσυντονισμός αποδοτικής παραμέτρου (PEFT) – Αντί να υπολογίζουν εκ νέου όλα τα βάρη και τις προκαταλήψεις, οι ερευνητές έχουν δείξει ότι προσθέτοντας επιπλέον μικρά επίπεδα στα μοντέλα βαθιάς μάθησης, μπορούν να επιτύχουν ικανοποιητικά αποτελέσματα (για παράδειγμα, LoRA). Το PEFT απαιτεί χαμηλότερη υπολογιστική ισχύ από τη βαθιά λεπτομέρεια και μια εργασία εκπαίδευσης με λιγότερα δεδομένα εισόδου. Το μειονέκτημα είναι η πιθανή χαμηλότερη ακρίβεια.

Το παρακάτω διάγραμμα απεικονίζει αυτούς τους μηχανισμούς.

Τώρα που έχουμε ορίσει τις δύο κύριες μεθόδους μικρορύθμισης, το επόμενο βήμα είναι να καθορίσουμε πώς μπορούμε να αναπτύξουμε και να χρησιμοποιήσουμε το ανοιχτού κώδικα και το ιδιόκτητο FM.

Με τα FM ανοιχτού κώδικα, οι βελτιστοποιητές μπορούν να κατεβάσουν το τεχνούργημα του μοντέλου και τον πηγαίο κώδικα από τον Ιστό, για παράδειγμα, χρησιμοποιώντας το Hub Model Hugging Face. Αυτό σας δίνει την ευελιξία να προσαρμόσετε σε βάθος το μοντέλο, να το αποθηκεύσετε σε ένα τοπικό μητρώο μοντέλων και να το αναπτύξετε σε Amazon Sage Maker τελικό σημείο. Αυτή η διαδικασία απαιτεί σύνδεση στο Διαδίκτυο. Για να υποστηρίξετε πιο ασφαλή περιβάλλοντα (όπως για πελάτες στον χρηματοοικονομικό τομέα), μπορείτε να κάνετε λήψη του μοντέλου στις εγκαταστάσεις, να εκτελέσετε όλους τους απαραίτητους ελέγχους ασφαλείας και να τα ανεβάσετε σε έναν τοπικό κάδο σε έναν λογαριασμό AWS. Στη συνέχεια, οι μικροδέκτες χρησιμοποιούν τα FM από τον τοπικό κάδο χωρίς σύνδεση στο Διαδίκτυο. Αυτό διασφαλίζει το απόρρητο των δεδομένων και τα δεδομένα δεν μεταδίδονται μέσω του Διαδικτύου. Το παρακάτω διάγραμμα απεικονίζει αυτή τη μέθοδο.

Με τα ιδιόκτητα FM, η διαδικασία ανάπτυξης είναι διαφορετική επειδή οι μικροδέκτες δεν έχουν πρόσβαση στο τεχνούργημα του μοντέλου ή στον πηγαίο κώδικα. Τα μοντέλα αποθηκεύονται σε ιδιόκτητους λογαριασμούς AWS παρόχου FM και μητρώα μοντέλων. Για την ανάπτυξη ενός τέτοιου μοντέλου σε ένα τελικό σημείο του SageMaker, οι μικροσυντονιστές μπορούν να ζητήσουν μόνο το πακέτο μοντέλου που θα αναπτυχθεί απευθείας σε ένα τελικό σημείο. Αυτή η διαδικασία απαιτεί τη χρήση δεδομένων πελατών στους ιδιόκτητους λογαριασμούς παρόχων FM, γεγονός που εγείρει ερωτήματα σχετικά με τα ευαίσθητα στον πελάτη δεδομένα που χρησιμοποιούνται σε έναν απομακρυσμένο λογαριασμό για την εκτέλεση λεπτομέρειας και τα μοντέλα που φιλοξενούνται σε ένα μητρώο μοντέλων που είναι κοινόχρηστο μεταξύ πολλών πελατών . Αυτό οδηγεί σε ένα πρόβλημα πολλαπλών μισθώσεων που γίνεται πιο δύσκολο εάν οι ιδιόκτητοι πάροχοι FM χρειαστεί να εξυπηρετήσουν αυτά τα μοντέλα. Εάν οι μικροσυντονιστές χρησιμοποιούν Θεμέλιο του Αμαζονίου, αυτές οι προκλήσεις επιλύθηκαν—τα δεδομένα δεν μεταδίδονται μέσω του Διαδικτύου και οι πάροχοι FM δεν έχουν πρόσβαση στα δεδομένα των βελτιστοποιητών. Οι ίδιες προκλήσεις ισχύουν για τα μοντέλα ανοιχτού κώδικα, εάν οι βελτιστοποιητές θέλουν να εξυπηρετήσουν μοντέλα από πολλούς πελάτες, όπως το παράδειγμα που δώσαμε νωρίτερα με τον ιστότοπο στον οποίο χιλιάδες πελάτες θα ανεβάζουν εξατομικευμένες εικόνες. Ωστόσο, αυτά τα σενάρια μπορούν να θεωρηθούν ελεγχόμενα επειδή εμπλέκεται μόνο ο βελτιωτικός συντονισμός. Το παρακάτω διάγραμμα απεικονίζει αυτή τη μέθοδο.

Από τεχνολογική άποψη, η αρχιτεκτονική που πρέπει να υποστηρίξει ένας βελτιστοποιητής είναι όπως αυτή των MLOps (δείτε την παρακάτω εικόνα). Η λεπτομέρεια πρέπει να διεξαχθεί σε dev με τη δημιουργία αγωγών ML, όπως η χρήση Αγωγοί Amazon SageMaker; εκτέλεση προεπεξεργασίας, τελειοποίησης (εργασία εκπαίδευσης) και μεταεπεξεργασίας. και αποστολή των βελτιστοποιημένων μοντέλων σε ένα τοπικό μητρώο μοντέλων στην περίπτωση ενός FM ανοιχτού κώδικα (διαφορετικά, το νέο μοντέλο θα αποθηκευτεί στο ιδιόκτητο περιβάλλον παροχής FM). Στη συνέχεια, στην προπαραγωγή, πρέπει να δοκιμάσουμε το μοντέλο όπως περιγράφουμε για το σενάριο των καταναλωτών. Τέλος, το μοντέλο θα εξυπηρετηθεί και θα παρακολουθηθεί σε προτ. Λάβετε υπόψη ότι το τρέχον (βελτιστοποιημένο) FM απαιτεί τελικά σημεία παρουσίας GPU. Αν χρειαστεί να αναπτύξουμε κάθε βελτιωμένο μοντέλο σε ξεχωριστό τελικό σημείο, αυτό μπορεί να αυξήσει το κόστος στην περίπτωση εκατοντάδων μοντέλων. Επομένως, πρέπει να χρησιμοποιήσουμε τελικά σημεία πολλαπλών μοντέλων και να επιλύσουμε την πρόκληση πολλαπλών μισθώσεων.

Οι μικροδέκτης προσαρμόζουν ένα μοντέλο FM με βάση ένα συγκεκριμένο πλαίσιο για να το χρησιμοποιήσουν για τον επιχειρηματικό τους σκοπό. Αυτό σημαίνει ότι τις περισσότερες φορές, οι μικροδέκτες είναι επίσης καταναλωτές που απαιτείται να υποστηρίξουν όλα τα επίπεδα, όπως περιγράψαμε στις προηγούμενες ενότητες, συμπεριλαμβανομένης της ανάπτυξης εφαρμογών τεχνητής νοημοσύνης, της λίμνης δεδομένων και του πλέγματος δεδομένων και των MLOps.

Το παρακάτω σχήμα απεικονίζει τον πλήρη κύκλο ζωής μικρορύθμισης FM που χρειάζονται οι βελτιστοποιητές για να παρέχουν στον παραγωγικό τελικό χρήστη τεχνητής νοημοσύνης.

Το παρακάτω σχήμα απεικονίζει τα βασικά βήματα.

Τα βασικά βήματα είναι τα εξής:

Ο τελικός χρήστης δημιουργεί έναν προσωπικό λογαριασμό και ανεβάζει προσωπικά δεδομένα.
Τα δεδομένα αποθηκεύονται στη λίμνη δεδομένων και υποβάλλονται σε προεπεξεργασία για να ακολουθήσει τη μορφή που αναμένει το FM.
Αυτό ενεργοποιεί μια διοχέτευση ML βελτιστοποίησης που προσθέτει το μοντέλο στο μητρώο μοντέλων,
Από εκεί, είτε το μοντέλο αναπτύσσεται στην παραγωγή με ελάχιστες δοκιμές είτε το μοντέλο προωθεί εκτεταμένες δοκιμές με HIL και χειροκίνητες πύλες έγκρισης.
Το τελειοποιημένο μοντέλο διατίθεται για τους τελικούς χρήστες.

Επειδή αυτή η υποδομή είναι πολύπλοκη για μη επιχειρηματικούς πελάτες, η AWS κυκλοφόρησε το Amazon Bedrock για να ξεφορτώσει την προσπάθεια δημιουργίας τέτοιων αρχιτεκτονικών και να φέρει τα βελτιωμένα FM πιο κοντά στην παραγωγή.

FMOps και LLMOps πρόσωπα και διαφοροποιητές διεργασιών

Με βάση τα προηγούμενα ταξίδια τύπου χρήστη (καταναλωτής, παραγωγός και συντονιστής), απαιτούνται νέα πρόσωπα με συγκεκριμένες δεξιότητες, όπως φαίνεται στο παρακάτω σχήμα.

Τα νέα πρόσωπα είναι τα εξής:

Ετικέτες και συντάκτες δεδομένων – Αυτοί οι χρήστες επισημαίνουν δεδομένα, όπως π.χ ζεύγη ή προετοιμάστε δεδομένα χωρίς ετικέτα, όπως ελεύθερο κείμενο, και επεκτείνετε την ομάδα προηγμένων αναλυτικών στοιχείων και τα περιβάλλοντα λίμνης δεδομένων.
μικροσυντονιστές – Αυτοί οι χρήστες έχουν βαθιά γνώση στα FM και ξέρουν να τα συντονίζουν, επεκτείνοντας την ομάδα επιστήμης δεδομένων που θα επικεντρωθεί στην κλασική ML.
Δημιουργικοί προγραμματιστές AI – Έχουν βαθιές γνώσεις σχετικά με την επιλογή FM, την αλυσίδα προτροπών και εφαρμογών και το φιλτράρισμα εισόδων και εξόδων. Ανήκουν σε μια νέα ομάδα - τη γενετική ομάδα εφαρμογών AI.
Άμεσοι μηχανικοί – Αυτοί οι χρήστες σχεδιάζουν τις προτροπές εισόδου και εξόδου για να προσαρμόσουν τη λύση στο πλαίσιο και να δοκιμάσουν και να δημιουργήσουν την αρχική έκδοση του καταλόγου εντολών. Η ομάδα τους είναι η παραγωγική ομάδα εφαρμογών AI.
Άμεσοι δοκιμαστές – Δοκιμάζουν σε κλίμακα τη γενετική λύση AI (backend και frontend) και τροφοδοτούν τα αποτελέσματά τους για να αυξήσουν τον γρήγορο κατάλογο και το σύνολο δεδομένων αξιολόγησης. Η ομάδα τους είναι η παραγωγική ομάδα εφαρμογών AI.
AppDev και DevOps – Αναπτύσσουν το μπροστινό μέρος (όπως έναν ιστότοπο) της γενετικής εφαρμογής AI. Η ομάδα τους είναι η παραγωγική ομάδα εφαρμογών AI.
Τελικοί χρήστες τεχνητής νοημοσύνης που δημιουργούνται – Αυτοί οι χρήστες καταναλώνουν παραγωγικές εφαρμογές AI ως μαύρα κουτιά, μοιράζονται δεδομένα και βαθμολογούν την ποιότητα της εξόδου.

Η εκτεταμένη έκδοση του χάρτη διεργασιών MLOps για την ενσωμάτωση της γενετικής τεχνητής νοημοσύνης μπορεί να απεικονιστεί στο παρακάτω σχήμα.

Ένα νέο επίπεδο εφαρμογών είναι το περιβάλλον όπου οι παραγωγοί προγραμματιστές τεχνητής νοημοσύνης, οι μηχανικοί και οι δοκιμαστές, καθώς και οι AppDevs δημιούργησαν το backend και το front end των γενετικών εφαρμογών AI. Οι τελικοί χρήστες της γενετικής τεχνητής νοημοσύνης αλληλεπιδρούν με τη διεπαφή εφαρμογών τεχνητής νοημοσύνης που δημιουργούνται μέσω του διαδικτύου (όπως μια διεπαφή ιστού). Από την άλλη πλευρά, οι ετικέτες δεδομένων και οι επεξεργαστές πρέπει να προεπεξεργάζονται τα δεδομένα χωρίς να έχουν πρόσβαση στο backend της λίμνης δεδομένων ή του πλέγματος δεδομένων. Επομένως, μια διεπαφή ιστού (ιστότοπος) με πρόγραμμα επεξεργασίας είναι απαραίτητη για την ασφαλή αλληλεπίδραση με τα δεδομένα. Το SageMaker Ground Truth παρέχει αυτήν τη λειτουργία εκτός συσκευασίας.

Συμπέρασμα

Τα MLO μπορούν να μας βοηθήσουν να παράγουμε αποτελεσματικά μοντέλα ML. Ωστόσο, για να λειτουργήσουν παραγωγικές εφαρμογές τεχνητής νοημοσύνης, χρειάζεστε πρόσθετες δεξιότητες, διαδικασίες και τεχνολογίες, που οδηγούν σε FMOps και LLMOps. Σε αυτήν την ανάρτηση, ορίσαμε τις κύριες έννοιες των FMOps και LLMOps και περιγράψαμε τους βασικούς παράγοντες διαφοροποίησης σε σύγκριση με τις δυνατότητες των MLOps όσον αφορά τους ανθρώπους, τις διαδικασίες, την τεχνολογία, την επιλογή μοντέλων FM και την αξιολόγηση. Επιπλέον, απεικονίσαμε τη διαδικασία σκέψης ενός παραγωγού προγραμματιστή τεχνητής νοημοσύνης και τον κύκλο ζωής ανάπτυξης μιας γενετικής εφαρμογής AI.

Στο μέλλον, θα επικεντρωθούμε στην παροχή λύσεων για τον τομέα που συζητήσαμε και θα παρέχουμε περισσότερες λεπτομέρειες σχετικά με τον τρόπο ενσωμάτωσης της παρακολούθησης FM (όπως τοξικότητα, μεροληψία και παραισθήσεις) και αρχιτεκτονικά μοτίβα πηγών δεδομένων τρίτων ή ιδιωτικών, όπως π.χ. Ανάκτηση επαυξημένης γενιάς (RAG), σε FMOps/LLMOps.

Για να μάθετε περισσότερα, ανατρέξτε στο Ο οδικός χάρτης του θεμελίου MLOps για επιχειρήσεις με το Amazon SageMaker και δοκιμάστε τη λύση από άκρο σε άκρο Εφαρμογή πρακτικών MLOps με προεκπαιδευμένα μοντέλα Amazon SageMaker JumpStart.

Αν έχετε σχόλια ή ερωτήσεις, αφήστε τα στην ενότητα σχολίων.

Σχετικά με τους Συγγραφείς

Δρ Σωκράτης Καρτάκης είναι Senior Machine Learning and Operations Specialist Solutions Architect για τις υπηρεσίες Web της Amazon. Ο Σωκράτης εστιάζει στο να δώσει τη δυνατότητα στους εταιρικούς πελάτες να βιομηχανοποιήσουν τις λύσεις Μηχανικής Μάθησης (ML) αξιοποιώντας τις υπηρεσίες AWS και διαμορφώνοντας το μοντέλο λειτουργίας τους, π.χ. το ίδρυμα MLOps και τον οδικό χάρτη μετασχηματισμού αξιοποιώντας βέλτιστες πρακτικές ανάπτυξης. Έχει ξοδέψει 15+ χρόνια για την εφεύρεση, το σχεδιασμό, την ηγεσία και την εφαρμογή καινοτόμων λύσεων ML και Internet of Things (IoT) σε επίπεδο παραγωγής από άκρο σε άκρο στους τομείς της ενέργειας, του λιανικού εμπορίου, της υγείας, των χρηματοοικονομικών/τραπεζικών, των μηχανοκίνητων αθλημάτων κ.λπ. Ο Σωκράτης αρέσκεται να περνά τον ελεύθερο χρόνο του με την οικογένεια και τους φίλους του ή να οδηγεί μηχανάκια.

Heiko Hotz είναι Senior Solutions Architect για AI & Machine Learning με ιδιαίτερη έμφαση στην επεξεργασία φυσικής γλώσσας, τα μεγάλα γλωσσικά μοντέλα και τη γενετική τεχνητή νοημοσύνη. Πριν από αυτόν τον ρόλο, ήταν επικεφαλής της Επιστήμης Δεδομένων για την Εξυπηρέτηση Πελατών στην ΕΕ της Amazon. Η Heiko βοηθά τους πελάτες μας να είναι επιτυχημένοι στο ταξίδι τους AI/ML στο AWS και έχει συνεργαστεί με οργανισμούς σε πολλούς κλάδους, συμπεριλαμβανομένων των ασφαλίσεων, των χρηματοοικονομικών υπηρεσιών, των μέσων ενημέρωσης και της ψυχαγωγίας, της υγειονομικής περίθαλψης, των υπηρεσιών κοινής ωφελείας και της κατασκευής. Στον ελεύθερο χρόνο του, ο Heiko ταξιδεύει όσο περισσότερο μπορεί.

SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
PlatoESG. Αυτοκίνητο / EVs, Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
PlatoHealth. Ευφυΐα βιοτεχνολογίας και κλινικών δοκιμών. Πρόσβαση εδώ.
ChartPrime. Ανεβάστε το Trading Game σας με το ChartPrime. Πρόσβαση εδώ.
BlockOffsets. Εκσυγχρονισμός της περιβαλλοντικής αντιστάθμισης ιδιοκτησίας. Πρόσβαση εδώ.
πηγή: https://aws.amazon.com/blogs/machine-learning/fmops-llmops-operationalize-generative-ai-and-differences-with-mlops/

Σφραγίδα ώρας: Σεπτέμβριος 1, 2023

Σφραγίδα ώρας: 2 Φεβρουαρίου 2023

Αναδημοσίευση από τον Πλάτωνα

Δημιουργήστε μια πολύγλωσση ροή εργασίας μετάφρασης εγγράφων με προσαρμογή για συγκεκριμένο τομέα και γλώσσα

Βελτιώστε τη διακυβέρνηση των μοντέλων μηχανικής εκμάθησης με το Amazon SageMaker

Αποκτήστε περισσότερο έλεγχο των φόρτων εργασίας σας στο Amazon SageMaker Data Wrangler με παραμετροποιημένα σύνολα δεδομένων και προγραμματισμένες εργασίες

Το μοντέλο βάσης AI21 Jurassic-1 είναι πλέον διαθέσιμο στο Amazon SageMaker

Πώς η Αναζήτηση Amazon επιτυγχάνει συμπέρασμα T5 χαμηλής καθυστέρησης και υψηλής απόδοσης με το NVIDIA Triton στο AWS

Σχετικά με μας

Κάθετη αναζήτηση & Ai

Πλατφόρμα

Μείνετε συνδεδεμένοι

Λογαριασμός