Σήμερα, η πλειονότητα των πελατών μας είναι ενθουσιασμένος με τα μεγάλα γλωσσικά μοντέλα (LLM) και σκέφτεται πώς η γενετική τεχνητή νοημοσύνη θα μπορούσε να μεταμορφώσει την επιχείρησή τους. Ωστόσο, η εισαγωγή τέτοιων λύσεων και μοντέλων στις επιχειρηματικές δραστηριότητες δεν είναι εύκολη υπόθεση. Σε αυτήν την ανάρτηση, συζητάμε τον τρόπο λειτουργίας των γενετικών εφαρμογών τεχνητής νοημοσύνης χρησιμοποιώντας αρχές MLOps που οδηγούν σε λειτουργίες μοντέλων θεμελίωσης (FMOps). Επιπλέον, εξετάζουμε σε βάθος την πιο κοινή περίπτωση χρήσης γενετικής τεχνητής νοημοσύνης των εφαρμογών κειμένου σε κείμενο και λειτουργιών LLM (LLMOps), ένα υποσύνολο FMOps. Το παρακάτω σχήμα απεικονίζει τα θέματα που συζητάμε.
Συγκεκριμένα, εισάγουμε εν συντομία τις αρχές MLOps και επικεντρωνόμαστε στους κύριους παράγοντες διαφοροποίησης σε σύγκριση με τα FMOps και LLMOps όσον αφορά τις διαδικασίες, τα άτομα, την επιλογή και αξιολόγηση μοντέλων, το απόρρητο δεδομένων και την ανάπτυξη μοντέλων. Αυτό ισχύει για πελάτες που τα χρησιμοποιούν εκτός συσκευασίας, δημιουργούν μοντέλα θεμελίων από την αρχή ή τα προσαρμόζουν με ακρίβεια. Η προσέγγισή μας ισχύει εξίσου τόσο για μοντέλα ανοιχτού κώδικα όσο και για ιδιόκτητα μοντέλα.
Σύνοψη λειτουργικότητας ML
Όπως ορίζεται στην ανάρτηση Ο οδικός χάρτης του θεμελίου MLOps για επιχειρήσεις με το Amazon SageMaker, ML and Operations (MLOps) είναι ο συνδυασμός ανθρώπων, διαδικασιών και τεχνολογίας για την αποτελεσματική παραγωγή λύσεων μηχανικής μάθησης (ML). Για να επιτευχθεί αυτό, ένας συνδυασμός ομάδων και προσώπων πρέπει να συνεργαστεί, όπως φαίνεται στο παρακάτω σχήμα.
Οι ομάδες αυτές είναι οι εξής:
- Ομάδα προηγμένης ανάλυσης (λίμνη δεδομένων και πλέγμα δεδομένων) – Οι μηχανικοί δεδομένων είναι υπεύθυνοι για την προετοιμασία και την απορρόφηση δεδομένων από πολλαπλές πηγές, τη δημιουργία αγωγών ETL (εξαγωγή, μετασχηματισμό και φόρτωση) για την επιμέλεια και την καταλογογράφηση των δεδομένων και την προετοιμασία των απαραίτητων ιστορικών δεδομένων για τις περιπτώσεις χρήσης ML. Αυτοί οι κάτοχοι δεδομένων επικεντρώνονται στην παροχή πρόσβασης στα δεδομένα τους σε πολλές επιχειρηματικές μονάδες ή ομάδες.
- Ομάδα επιστήμης δεδομένων – Οι επιστήμονες δεδομένων πρέπει να επικεντρωθούν στη δημιουργία του καλύτερου μοντέλου με βάση προκαθορισμένους βασικούς δείκτες απόδοσης (KPIs) που λειτουργούν σε σημειωματάρια. Μετά την ολοκλήρωση της ερευνητικής φάσης, οι επιστήμονες δεδομένων πρέπει να συνεργαστούν με μηχανικούς ML για τη δημιουργία αυτοματισμών για την κατασκευή (αγωγών ML) και την ανάπτυξη μοντέλων στην παραγωγή χρησιμοποιώντας αγωγούς CI/CD.
- Επιχειρηματική ομάδα – Ένας ιδιοκτήτης προϊόντος είναι υπεύθυνος για τον καθορισμό της επιχειρηματικής υπόθεσης, των απαιτήσεων και των KPI που θα χρησιμοποιηθούν για την αξιολόγηση της απόδοσης του μοντέλου. Οι καταναλωτές ML είναι άλλοι επιχειρηματικοί φορείς που χρησιμοποιούν τα αποτελέσματα συμπερασμάτων (προβλέψεις) για να οδηγήσουν τις αποφάσεις.
- Ομάδα πλατφόρμας – Οι αρχιτέκτονες είναι υπεύθυνοι για τη συνολική αρχιτεκτονική cloud της επιχείρησης και για το πώς όλες οι διαφορετικές υπηρεσίες συνδέονται μεταξύ τους. Ασφάλεια Οι ΜΜΕ αναθεωρούν την αρχιτεκτονική με βάση τις πολιτικές και τις ανάγκες της επιχειρηματικής ασφάλειας. Οι μηχανικοί MLOps είναι υπεύθυνοι για την παροχή ενός ασφαλούς περιβάλλοντος για τους επιστήμονες δεδομένων και τους μηχανικούς ML για την παραγωγή των περιπτώσεων χρήσης ML. Συγκεκριμένα, είναι υπεύθυνοι για την τυποποίηση των αγωγών CI/CD, των ρόλων χρηστών και υπηρεσιών και της δημιουργίας κοντέινερ, της κατανάλωσης μοντέλων, των δοκιμών και της μεθοδολογίας ανάπτυξης με βάση τις επιχειρηματικές απαιτήσεις και τις απαιτήσεις ασφάλειας.
- Ομάδα κινδύνου και συμμόρφωσης – Για πιο περιοριστικά περιβάλλοντα, οι ελεγκτές είναι υπεύθυνοι για την αξιολόγηση των δεδομένων, του κώδικα και των τεχνουργημάτων μοντέλων και για τη διασφάλιση της συμμόρφωσης της επιχείρησης με κανονισμούς, όπως το απόρρητο δεδομένων.
Σημειώστε ότι πολλά πρόσωπα μπορούν να καλυφθούν από το ίδιο άτομο ανάλογα με την κλιμάκωση και την ωριμότητα των MLOps της επιχείρησης.
Αυτά τα πρόσωπα χρειάζονται ειδικά περιβάλλοντα για να εκτελέσουν τις διαφορετικές διαδικασίες, όπως φαίνεται στο παρακάτω σχήμα.
Τα περιβάλλοντα είναι τα εξής:
- Διαχείριση πλατφόρμας – Το περιβάλλον διαχείρισης πλατφόρμας είναι το μέρος όπου η ομάδα της πλατφόρμας έχει πρόσβαση για τη δημιουργία λογαριασμών AWS και τη σύνδεση των σωστών χρηστών και δεδομένων
- ημερομηνία – Το επίπεδο δεδομένων, συχνά γνωστό ως data lake ή data mesh, είναι το περιβάλλον που χρησιμοποιούν οι μηχανικοί δεδομένων ή οι ιδιοκτήτες και οι ενδιαφερόμενοι φορείς για να προετοιμάσουν, να αλληλεπιδράσουν και να οπτικοποιήσουν με τα δεδομένα
- Πειραματισμός – Οι επιστήμονες δεδομένων χρησιμοποιούν ένα περιβάλλον δοκιμών ή πειραματισμού για να δοκιμάσουν νέες βιβλιοθήκες και τεχνικές ML για να αποδείξουν ότι η απόδειξη της ιδέας τους μπορεί να λύσει επιχειρηματικά προβλήματα
- Κατασκευή μοντέλου, δοκιμή μοντέλου, ανάπτυξη μοντέλου – Το περιβάλλον κατασκευής, δοκιμής και ανάπτυξης μοντέλου είναι το επίπεδο των MLOps, όπου οι επιστήμονες δεδομένων και οι μηχανικοί ML συνεργάζονται για να αυτοματοποιήσουν και να μεταφέρουν την έρευνα στην παραγωγή
- Διακυβέρνηση ML – Το τελευταίο κομμάτι του παζλ είναι το περιβάλλον διακυβέρνησης ML, όπου όλα τα μοντέλα και τα τεχνουργήματα κώδικα αποθηκεύονται, ελέγχονται και ελέγχονται από τα αντίστοιχα πρόσωπα
Το παρακάτω διάγραμμα απεικονίζει την αρχιτεκτονική αναφοράς, η οποία έχει ήδη συζητηθεί στο Ο οδικός χάρτης του θεμελίου MLOps για επιχειρήσεις με το Amazon SageMaker.
Κάθε επιχειρηματική μονάδα έχει κάθε δικό του σύνολο λογαριασμών ανάπτυξης (αυτοματοποιημένη εκπαίδευση και κατασκευή μοντέλων), προπαραγωγή (αυτόματη δοκιμή) και παραγωγή (ανάπτυξη και εξυπηρέτηση μοντέλων) για την παραγωγή περιπτώσεων χρήσης ML, οι οποίες ανακτούν δεδομένα από μια κεντρική ή αποκεντρωμένη λίμνη δεδομένων ή δεδομένα πλέγμα, αντίστοιχα. Όλα τα παραγόμενα μοντέλα και η αυτοματοποίηση κωδικών αποθηκεύονται σε έναν κεντρικό λογαριασμό εργαλείων χρησιμοποιώντας τη δυνατότητα ενός μητρώου μοντέλων. Ο κώδικας υποδομής για όλους αυτούς τους λογαριασμούς έχει εκδοθεί σε έναν κοινόχρηστο λογαριασμό υπηρεσίας (προηγμένος λογαριασμός διακυβέρνησης αναλυτικών στοιχείων) τον οποίο η ομάδα της πλατφόρμας μπορεί να αφαιρέσει, να δημιουργήσει πρότυπο, να διατηρήσει και να επαναχρησιμοποιήσει για την ενσωμάτωση στην πλατφόρμα MLOps κάθε νέας ομάδας.
Δημιουργικοί ορισμοί AI και διαφορές στα MLOps
Στην κλασική ML, ο προηγούμενος συνδυασμός ανθρώπων, διαδικασιών και τεχνολογίας μπορεί να σας βοηθήσει να δημιουργήσετε τις περιπτώσεις χρήσης ML που διαθέτετε. Ωστόσο, στη γενετική τεχνητή νοημοσύνη, η φύση των περιπτώσεων χρήσης απαιτεί είτε επέκταση αυτών των δυνατοτήτων είτε νέες δυνατότητες. Μία από αυτές τις νέες έννοιες είναι το μοντέλο θεμελίωσης (FM). Ονομάζονται ως τέτοια επειδή μπορούν να χρησιμοποιηθούν για τη δημιουργία μιας μεγάλης γκάμα άλλων μοντέλων τεχνητής νοημοσύνης, όπως φαίνεται στο παρακάτω σχήμα.
Τα FM έχουν εκπαιδευτεί με βάση τα terabyte δεδομένων και έχουν εκατοντάδες δισεκατομμύρια παραμέτρους για να μπορούν να προβλέψουν την επόμενη καλύτερη απάντηση με βάση τρεις κύριες κατηγορίες περιπτώσεων χρήσης γενετικής τεχνητής νοημοσύνης:
- Κείμενο σε κείμενο – Τα FM (LLM) έχουν εκπαιδευτεί με βάση δεδομένα χωρίς ετικέτα (όπως το ελεύθερο κείμενο) και είναι σε θέση να προβλέψουν την επόμενη καλύτερη λέξη ή ακολουθία λέξεων (παραγράφους ή μεγάλες εκθέσεις). Οι κύριες περιπτώσεις χρήσης αφορούν ανθρώπινα chatbot, σύνοψη ή άλλου είδους δημιουργία περιεχομένου, όπως κώδικα προγραμματισμού.
- Κείμενο σε εικόνα – Δεδομένα με ετικέτα, όπως ζεύγη , έχει χρησιμοποιηθεί για την εκπαίδευση FM, τα οποία είναι σε θέση να προβλέψουν τον καλύτερο συνδυασμό pixel. Παραδείγματα περιπτώσεων χρήσης είναι η δημιουργία σχεδίου ρούχων ή οι φανταστικές εξατομικευμένες εικόνες.
- Κείμενο σε ήχο ή βίντεο – Τα δεδομένα με ετικέτα και χωρίς ετικέτα μπορούν να χρησιμοποιηθούν για εκπαίδευση FM. Ένα από τα κύρια παραδείγματα χρήσης τεχνητής νοημοσύνης είναι η σύνθεση μουσικής.
Για να παράγουμε αυτές τις γενετικές περιπτώσεις χρήσης τεχνητής νοημοσύνης, πρέπει να δανειστούμε και να επεκτείνουμε τον τομέα MLOps ώστε να περιλαμβάνει τα ακόλουθα:
- Λειτουργίες FM (FMOps) – Αυτό μπορεί να παράγει παραγωγικές λύσεις τεχνητής νοημοσύνης, συμπεριλαμβανομένων οποιουδήποτε τύπου περίπτωσης χρήσης
- Λειτουργίες LLM (LLMOps) – Αυτό είναι ένα υποσύνολο FMOps που εστιάζει στην παραγωγή λύσεων που βασίζονται σε LLM, όπως κείμενο σε κείμενο
Το παρακάτω σχήμα απεικονίζει την επικάλυψη αυτών των περιπτώσεων χρήσης.
Σε σύγκριση με τα κλασικά ML και MLOps, τα FMOps και LLMOps αναβάλλονται με βάση τέσσερις κύριες κατηγορίες που καλύπτουμε στις ακόλουθες ενότητες: άτομα και διαδικασία, επιλογή και προσαρμογή FM, αξιολόγηση και παρακολούθηση FM, απόρρητο δεδομένων και ανάπτυξη μοντέλου και ανάγκες τεχνολογίας. Θα καλύψουμε την παρακολούθηση σε ξεχωριστή ανάρτηση.
Ταξίδι λειτουργίας ανά τύπο χρήστη τεχνητής νοημοσύνης
Για να απλοποιήσουμε την περιγραφή των διαδικασιών, πρέπει να κατηγοριοποιήσουμε τους κύριους τύπους χρηστών τεχνητής νοημοσύνης που δημιουργούνται, όπως φαίνεται στο παρακάτω σχήμα.
Οι τύποι χρηστών είναι οι εξής:
- Προμηθευτές – Χρήστες που κατασκευάζουν FM από την αρχή και τα παρέχουν ως προϊόν σε άλλους χρήστες (fine-tuner και καταναλωτές). Έχουν βαθιά τεχνογνωσία και δεξιότητες επιστήμης δεδομένων από άκρο σε άκρο ML και επεξεργασίας φυσικής γλώσσας (NLP), καθώς και τεράστιες ομάδες ετικετών και επεξεργασίας δεδομένων.
- μικροσυντονιστές – Χρήστες που επανεκπαιδεύουν (βελτιστοποιούν) τα FM από παρόχους ώστε να ανταποκρίνονται στις προσαρμοσμένες απαιτήσεις. Ενορχηστρώνουν την ανάπτυξη του μοντέλου ως υπηρεσία για χρήση από τους καταναλωτές. Αυτοί οι χρήστες χρειάζονται ισχυρή τεχνογνωσία από άκρο σε άκρο ML και επιστήμης δεδομένων και γνώση της ανάπτυξης και των συμπερασμάτων μοντέλων. Απαιτείται επίσης ισχυρή γνώση τομέα για συντονισμό, συμπεριλαμβανομένης της άμεσης μηχανικής.
- Καταναλωτές – Χρήστες που αλληλεπιδρούν με παραγωγικές υπηρεσίες τεχνητής νοημοσύνης από παρόχους ή βελτιστοποιητές μέσω προτροπής κειμένου ή οπτικής διεπαφής για την ολοκλήρωση των επιθυμητών ενεργειών. Δεν απαιτείται τεχνογνωσία ML, αλλά, κυρίως, προγραμματιστές εφαρμογών ή τελικοί χρήστες με κατανόηση των δυνατοτήτων της υπηρεσίας. Μόνο έγκαιρη μηχανική είναι απαραίτητη για καλύτερα αποτελέσματα.
Σύμφωνα με τον ορισμό και την απαιτούμενη τεχνογνωσία ML, τα MLOps απαιτούνται κυρίως για παρόχους και τελειοποιητές, ενώ οι καταναλωτές μπορούν να χρησιμοποιήσουν αρχές παραγωγής εφαρμογών, όπως DevOps και AppDev για να δημιουργήσουν τις παραγωγικές εφαρμογές AI. Επιπλέον, παρατηρήσαμε μια κίνηση μεταξύ των τύπων χρηστών, όπου οι πάροχοι μπορεί να γίνουν μικροβελτιωτές για να υποστηρίξουν περιπτώσεις χρήσης που βασίζονται σε συγκεκριμένο κλάδο (όπως ο χρηματοπιστωτικός τομέας) ή οι καταναλωτές να γίνουν συντονιστές για να επιτύχουν πιο ακριβή αποτελέσματα. Ας παρατηρήσουμε όμως τις κύριες διαδικασίες ανά τύπο χρήστη.
Το ταξίδι των καταναλωτών
Το παρακάτω σχήμα απεικονίζει το ταξίδι του καταναλωτή.
Όπως αναφέρθηκε προηγουμένως, οι καταναλωτές πρέπει να επιλέξουν, να δοκιμάσουν και να χρησιμοποιήσουν ένα FM, αλληλεπιδρώντας μαζί του παρέχοντας συγκεκριμένες εισόδους, γνωστές αλλιώς ως προτρέπει. Οι προτροπές, στο πλαίσιο του προγραμματισμού υπολογιστών και της τεχνητής νοημοσύνης, αναφέρονται στην είσοδο που δίνεται σε ένα μοντέλο ή σύστημα για να δημιουργήσει μια απόκριση. Αυτό μπορεί να έχει τη μορφή κειμένου, εντολής ή ερώτησης, το οποίο χρησιμοποιεί το σύστημα για να επεξεργαστεί και να δημιουργήσει μια έξοδο. Η έξοδος που παράγεται από το FM μπορεί στη συνέχεια να χρησιμοποιηθεί από τους τελικούς χρήστες, οι οποίοι θα πρέπει επίσης να είναι σε θέση να βαθμολογήσουν αυτές τις εξόδους για να βελτιώσουν τις μελλοντικές αποκρίσεις του μοντέλου.
Πέρα από αυτές τις θεμελιώδεις διαδικασίες, έχουμε παρατηρήσει καταναλωτές που εκφράζουν την επιθυμία να βελτιστοποιήσουν ένα μοντέλο αξιοποιώντας τη λειτουργικότητα που προσφέρουν οι μικροσυντονιστές. Πάρτε, για παράδειγμα, έναν ιστότοπο που δημιουργεί εικόνες. Εδώ, οι τελικοί χρήστες μπορούν να δημιουργήσουν ιδιωτικούς λογαριασμούς, να ανεβάσουν προσωπικές φωτογραφίες και, στη συνέχεια, να δημιουργήσουν περιεχόμενο σχετικό με αυτές τις εικόνες (για παράδειγμα, να δημιουργήσουν μια εικόνα που απεικονίζει τον τελικό χρήστη σε μια μοτοσικλέτα που κρατά ένα σπαθί ή βρίσκεται σε μια εξωτική τοποθεσία). Σε αυτό το σενάριο, η γενετική εφαρμογή τεχνητής νοημοσύνης, που έχει σχεδιαστεί από τον καταναλωτή, πρέπει να αλληλεπιδρά με το backend του μικροδέκτη μέσω API για να παραδώσει αυτή τη λειτουργία στους τελικούς χρήστες.
Ωστόσο, προτού εμβαθύνουμε σε αυτό, ας επικεντρωθούμε πρώτα στο ταξίδι επιλογής μοντέλου, δοκιμής, χρήσης, αλληλεπίδρασης εισόδου και εξόδου και βαθμολογίας, όπως φαίνεται στο παρακάτω σχήμα.
Βήμα 1. Κατανοήστε τις κορυφαίες δυνατότητες FM
Υπάρχουν πολλές διαστάσεις που πρέπει να ληφθούν υπόψη κατά την επιλογή μοντέλων θεμελίωσης, ανάλογα με την περίπτωση χρήσης, τα διαθέσιμα δεδομένα, τους κανονισμούς κ.λπ. Μια καλή λίστα ελέγχου, αν και δεν είναι πλήρης, μπορεί να είναι η εξής:
- Ιδιόκτητο ή ανοιχτού κώδικα FM – Τα ιδιόκτητα μοντέλα έχουν συχνά οικονομικό κόστος, αλλά συνήθως προσφέρουν καλύτερη απόδοση (όσον αφορά την ποιότητα του παραγόμενου κειμένου ή εικόνας), συχνά αναπτύσσονται και συντηρούνται από εξειδικευμένες ομάδες παρόχων μοντέλων που διασφαλίζουν τη βέλτιστη απόδοση και αξιοπιστία. Από την άλλη πλευρά, βλέπουμε επίσης την υιοθέτηση μοντέλων ανοιχτού κώδικα που, εκτός από το ότι είναι δωρεάν, προσφέρουν πρόσθετα πλεονεκτήματα ως προς το ότι είναι προσβάσιμα και ευέλικτα (για παράδειγμα, κάθε μοντέλο ανοιχτού κώδικα μπορεί να ρυθμιστεί με ακρίβεια). Ένα παράδειγμα ιδιόκτητου μοντέλου είναι το μοντέλο Claude της Anthropic και ένα παράδειγμα μοντέλου ανοιχτού κώδικα υψηλής απόδοσης είναι το Falcon-40B, από τον Ιούλιο του 2023.
- Εμπορική άδεια – Τα ζητήματα αδειοδότησης είναι ζωτικής σημασίας όταν αποφασίζετε για ένα FM. Είναι σημαντικό να σημειωθεί ότι ορισμένα μοντέλα είναι ανοιχτού κώδικα, αλλά δεν μπορούν να χρησιμοποιηθούν για εμπορικούς σκοπούς, λόγω περιορισμών ή προϋποθέσεων αδειοδότησης. Οι διαφορές μπορεί να είναι λεπτές: Το νέο που κυκλοφόρησε xgen-7b-8k-βάση το μοντέλο, για παράδειγμα, είναι ανοιχτού κώδικα και είναι εμπορικά χρησιμοποιήσιμο (άδεια Apache-2.0), ενώ η έκδοση του μοντέλου έχει τελειοποιήσει τις οδηγίες xgen-7b-8k-inst κυκλοφορεί μόνο για ερευνητικούς σκοπούς. Όταν επιλέγετε ένα FM για μια εμπορική εφαρμογή, είναι απαραίτητο να επαληθεύσετε τη συμφωνία άδειας χρήσης, να κατανοήσετε τους περιορισμούς της και να διασφαλίσετε ότι ευθυγραμμίζεται με την προβλεπόμενη χρήση του έργου.
- παράμετροι – Ο αριθμός των παραμέτρων, που αποτελούνται από τα βάρη και τις προκαταλήψεις στο νευρωνικό δίκτυο, είναι ένας άλλος βασικός παράγοντας. Περισσότερες παράμετροι γενικά σημαίνει ένα πιο περίπλοκο και δυνητικά ισχυρό μοντέλο, επειδή μπορεί να καταγράψει πιο περίπλοκα μοτίβα και συσχετίσεις στα δεδομένα. Ωστόσο, η αντιστάθμιση είναι ότι απαιτεί περισσότερους υπολογιστικούς πόρους και, ως εκ τούτου, κοστίζει περισσότερο για να εκτελεστεί. Επιπλέον, βλέπουμε μια τάση προς μικρότερα μοντέλα, ειδικά στον χώρο ανοιχτού κώδικα (μοντέλα που κυμαίνονται από 7 έως 40 δισεκατομμύρια) που αποδίδουν καλά, ειδικά όταν ρυθμίζονται με ακρίβεια.
- Ταχύτητα – Η ταχύτητα ενός μοντέλου επηρεάζεται από το μέγεθός του. Τα μεγαλύτερα μοντέλα τείνουν να επεξεργάζονται δεδομένα πιο αργά (μεγαλύτερη καθυστέρηση) λόγω της αυξημένης υπολογιστικής πολυπλοκότητας. Επομένως, είναι σημαντικό να εξισορροπήσετε την ανάγκη για ένα μοντέλο με υψηλή προγνωστική ισχύ (συχνά μεγαλύτερα μοντέλα) με τις πρακτικές απαιτήσεις για ταχύτητα, ειδικά σε εφαρμογές, όπως τα chat bots, που απαιτούν απαντήσεις σε πραγματικό χρόνο ή σχεδόν σε πραγματικό χρόνο.
- Μέγεθος παραθύρου περιβάλλοντος (αριθμός διακριτικών) – Το παράθυρο περιβάλλοντος, που ορίζεται από τον μέγιστο αριθμό διακριτικών που μπορούν να εισαχθούν ή να εξάγονται ανά προτροπή, είναι κρίσιμο για τον καθορισμό του περιεχομένου που μπορεί να λάβει το μοντέλο κάθε φορά (ένα διακριτικό μεταφράζεται χονδρικά σε 0.75 λέξεις για τα αγγλικά). Τα μοντέλα με μεγαλύτερα παράθυρα περιβάλλοντος μπορούν να κατανοήσουν και να δημιουργήσουν μεγαλύτερες ακολουθίες κειμένου, οι οποίες μπορεί να είναι χρήσιμες για εργασίες που περιλαμβάνουν μεγαλύτερες συνομιλίες ή έγγραφα.
- Δεδομένα εκπαίδευσης – Είναι επίσης σημαντικό να κατανοήσουμε σε τι είδους δεδομένα εκπαιδεύτηκε το FM. Ορισμένα μοντέλα ενδέχεται να εκπαιδεύονται σε διαφορετικά σύνολα δεδομένων κειμένου, όπως δεδομένα Διαδικτύου, σενάρια κωδικοποίησης, οδηγίες ή ανθρώπινα σχόλια. Άλλοι μπορεί επίσης να εκπαιδευτούν σε πολυτροπικά σύνολα δεδομένων, όπως συνδυασμούς δεδομένων κειμένου και εικόνας. Αυτό μπορεί να επηρεάσει την καταλληλότητα του μοντέλου για διαφορετικές εργασίες. Επιπλέον, ένας οργανισμός μπορεί να έχει ανησυχίες σχετικά με τα πνευματικά δικαιώματα ανάλογα με τις ακριβείς πηγές στις οποίες έχει εκπαιδευτεί ένα μοντέλο—επομένως, είναι υποχρεωτικό να επιθεωρείται προσεκτικά το σύνολο δεδομένων εκπαίδευσης.
- Ποιότητα – Η ποιότητα ενός FM μπορεί να ποικίλλει ανάλογα με τον τύπο του (ιδιόκτητο έναντι ανοιχτού κώδικα), το μέγεθος και το είδος στο οποίο εκπαιδεύτηκε. Η ποιότητα εξαρτάται από το πλαίσιο, που σημαίνει ότι αυτό που θεωρείται υψηλής ποιότητας για μια εφαρμογή μπορεί να μην είναι για μια άλλη. Για παράδειγμα, ένα μοντέλο που εκπαιδεύεται σε δεδομένα Διαδικτύου μπορεί να θεωρείται υψηλής ποιότητας για τη δημιουργία κειμένου συνομιλίας, αλλά λιγότερο για τεχνικές ή εξειδικευμένες εργασίες.
- λεπτομέρεια – Η δυνατότητα λεπτομέρειας ενός FM προσαρμόζοντας τα βάρη ή τα επίπεδα του μοντέλου μπορεί να είναι ένας κρίσιμος παράγοντας. Η λεπτή ρύθμιση επιτρέπει στο μοντέλο να προσαρμόζεται καλύτερα στο συγκεκριμένο πλαίσιο της εφαρμογής, βελτιώνοντας την απόδοση στη συγκεκριμένη εργασία. Ωστόσο, η λεπτομέρεια απαιτεί πρόσθετους υπολογιστικούς πόρους και τεχνική εξειδίκευση και δεν υποστηρίζουν όλα τα μοντέλα αυτήν τη δυνατότητα. Τα μοντέλα ανοιχτού κώδικα είναι (γενικά) πάντα με δυνατότητα λεπτομέρειας, επειδή τα τεχνουργήματα μοντέλων είναι διαθέσιμα για λήψη και οι χρήστες μπορούν να τα επεκτείνουν και να τα χρησιμοποιήσουν κατά βούληση. Τα ιδιόκτητα μοντέλα ενδέχεται μερικές φορές να προσφέρουν την επιλογή λεπτομέρειας.
- Οι υπάρχουσες δεξιότητες πελατών – Η επιλογή ενός FM μπορεί επίσης να επηρεαστεί από τις δεξιότητες και την εξοικείωση του πελάτη ή της ομάδας ανάπτυξης. Εάν ένας οργανισμός δεν έχει εμπειρογνώμονες AI/ML στην ομάδα του, τότε μια υπηρεσία API μπορεί να είναι πιο κατάλληλη για αυτόν. Επίσης, εάν μια ομάδα έχει εκτενή εμπειρία με ένα συγκεκριμένο FM, μπορεί να είναι πιο αποτελεσματικό να συνεχίσει να το χρησιμοποιεί παρά να επενδύσει χρόνο και πόρους για να μάθει και να προσαρμοστεί σε ένα νέο.
Το παρακάτω είναι ένα παράδειγμα δύο σύντομων λιστών, μία για ιδιόκτητα μοντέλα και μία για μοντέλα ανοιχτού κώδικα. Μπορείτε να συντάξετε παρόμοιους πίνακες με βάση τις συγκεκριμένες ανάγκες σας για να έχετε μια γρήγορη επισκόπηση των διαθέσιμων επιλογών. Λάβετε υπόψη ότι οι επιδόσεις και οι παράμετροι αυτών των μοντέλων αλλάζουν γρήγορα και ενδέχεται να είναι ξεπερασμένες κατά τη στιγμή της ανάγνωσης, ενώ άλλες δυνατότητες μπορεί να είναι σημαντικές για συγκεκριμένους πελάτες, όπως η υποστηριζόμενη γλώσσα.
Το παρακάτω είναι ένα παράδειγμα αξιοσημείωτων ιδιόκτητων FM που διατίθενται στο AWS (Ιούλιος 2023).
Το παρακάτω είναι ένα παράδειγμα αξιοσημείωτων FM ανοιχτού κώδικα που διατίθενται στο AWS (Ιούλιος 2023).
Αφού συντάξετε μια επισκόπηση 10-20 πιθανών υποψήφιων μοντέλων, καθίσταται απαραίτητο να κάνετε περαιτέρω πιο συγκεκριμένη αυτή τη σύντομη λίστα. Σε αυτήν την ενότητα, προτείνουμε έναν γρήγορο μηχανισμό που θα δώσει δύο ή τρία βιώσιμα τελικά μοντέλα ως υποψήφια για τον επόμενο γύρο.
Το παρακάτω διάγραμμα απεικονίζει την αρχική διαδικασία επιλογής.
Συνήθως, οι μηχανικοί άμεσης επικοινωνίας, οι οποίοι είναι ειδικοί στη δημιουργία προτροπών υψηλής ποιότητας που επιτρέπουν στα μοντέλα τεχνητής νοημοσύνης να κατανοούν και να επεξεργάζονται τις εισροές των χρηστών, πειραματίζονται με διάφορες μεθόδους για να εκτελέσουν την ίδια εργασία (όπως η σύνοψη) σε ένα μοντέλο. Προτείνουμε αυτά τα μηνύματα να μην δημιουργούνται αμέσως, αλλά να εξάγονται συστηματικά από έναν κατάλογο προτροπών. Αυτός ο κατάλογος προτροπών είναι μια κεντρική τοποθεσία για την αποθήκευση προτροπών για την αποφυγή επαναλήψεων, την ενεργοποίηση του ελέγχου έκδοσης και την κοινή χρήση προτροπών εντός της ομάδας για τη διασφάλιση της συνέπειας μεταξύ διαφορετικών ελεγκτών προτροπής στα διαφορετικά στάδια ανάπτυξης, τα οποία παρουσιάζουμε στην επόμενη ενότητα. Αυτός ο κατάλογος εντολών είναι ανάλογος με ένα αποθετήριο Git ενός καταστήματος χαρακτηριστικών. Ο προγραμματιστής γενετικής τεχνητής νοημοσύνης, ο οποίος θα μπορούσε δυνητικά να είναι το ίδιο άτομο με τον μηχανικό άμεσης επικοινωνίας, πρέπει στη συνέχεια να αξιολογήσει την έξοδο για να καθορίσει εάν θα ήταν κατάλληλη για τη γενετική εφαρμογή τεχνητής νοημοσύνης που επιδιώκουν να αναπτύξουν.
Βήμα 2. Δοκιμάστε και αξιολογήστε το κορυφαίο FM
Αφού η σύντομη λίστα μειωθεί σε περίπου τρία FM, συνιστούμε ένα βήμα αξιολόγησης για τον περαιτέρω έλεγχο των δυνατοτήτων και της καταλληλότητας των FM για την περίπτωση χρήσης. Ανάλογα με τη διαθεσιμότητα και τη φύση των δεδομένων αξιολόγησης, προτείνουμε διαφορετικές μεθόδους, όπως φαίνεται στο παρακάτω σχήμα.
Η μέθοδος που θα χρησιμοποιήσετε πρώτα εξαρτάται από το εάν έχετε επισημάνει τα δεδομένα δοκιμής ή όχι.
Εάν έχετε επισημασμένα δεδομένα, μπορείτε να τα χρησιμοποιήσετε για να πραγματοποιήσετε μια αξιολόγηση μοντέλων, όπως κάνουμε με τα παραδοσιακά μοντέλα ML (εισαγάγετε μερικά δείγματα και συγκρίνετε την έξοδο με τις ετικέτες). Ανάλογα με το αν τα δεδομένα της δοκιμής έχουν διακριτές ετικέτες (όπως θετική, αρνητική ή ουδέτερη ανάλυση συναισθήματος) ή είναι μη δομημένο κείμενο (όπως η περίληψη), προτείνουμε διαφορετικές μεθόδους αξιολόγησης:
- Μετρήσεις ακρίβειας – Σε περίπτωση διακριτών αποτελεσμάτων (όπως η ανάλυση συναισθήματος), μπορούμε να χρησιμοποιήσουμε τυπικές μετρήσεις ακρίβειας όπως ακρίβεια, ανάκληση και βαθμολογία F1
- Μετρήσεις ομοιότητας – Εάν η έξοδος δεν είναι δομημένη (όπως μια περίληψη), προτείνουμε μετρήσεις ομοιότητας όπως ROUGE και ομοιότητα συνημιτόνου
Ορισμένες περιπτώσεις χρήσης δεν μπορούν να έχουν μια αληθινή απάντηση (για παράδειγμα, «Δημιουργήστε μια σύντομη παιδική ιστορία για την 5χρονη κόρη μου»). Σε τέτοιες περιπτώσεις, γίνεται πιο δύσκολη η αξιολόγηση των μοντέλων επειδή δεν διαθέτετε δεδομένα δοκιμής με ετικέτα. Προτείνουμε δύο προσεγγίσεις, ανάλογα με τη σημασία της ανθρώπινης αναθεώρησης του μοντέλου έναντι της αυτοματοποιημένης αξιολόγησης:
- Human-in-the-Loop (HIL) – Σε αυτήν την περίπτωση, μια ομάδα έγκαιρων ελεγκτών θα εξετάσει τις απαντήσεις από ένα μοντέλο. Ανάλογα με το πόσο κρίσιμη είναι η εφαρμογή, οι υπεύθυνοι δοκιμών μπορεί να ελέγξουν το 100% των εξόδων του μοντέλου ή απλώς ένα δείγμα.
- Αξιολόγηση βάσει LLM – Σε αυτό το σενάριο, τα prompt testers αντικαθίστανται από ένα LLM, ιδανικά ένα πιο ισχυρό (αν και ίσως πιο αργό και δαπανηρό) από αυτά που δοκιμάζονται. Το LLM θα εξετάσει όλες τις απαντήσεις που δημιουργούνται από το μοντέλο και θα τις βαθμολογήσει. Αυτή η μέθοδος μπορεί να έχει ως αποτέλεσμα χαμηλότερη ποιότητα, αλλά είναι μια φθηνότερη και ταχύτερη επιλογή αξιολόγησης που μπορεί να παρέχει ένα καλό αρχικό όργανο για την απόδοση των μοντέλων.
Για παράδειγμα, μπορούμε να χρησιμοποιήσουμε το ακόλουθο παράδειγμα προτροπής σε ένα LLM, το οποίο περιλαμβάνει το ερώτημα εισαγωγής, την απάντηση LLM και οδηγίες: «Θα θέλαμε να ζητήσουμε τα σχόλιά σας σχετικά με την απόδοση ενός βοηθού AI ως απάντηση στην ερώτηση χρήστη που εμφανίζεται παραπάνω . Αξιολογήστε τη χρησιμότητα, τη συνάφεια, την ακρίβεια, το επίπεδο λεπτομερειών της απάντησης του βοηθού. Ο βοηθός θα λάβει συνολική βαθμολογία σε μια κλίμακα από το 1 έως το 10, όπου υψηλότερη βαθμολογία υποδηλώνει καλύτερη συνολική απόδοση.»
Αυτή η προτροπή θα σταλεί σε άλλο LLM (το EvalLLM) για αξιολόγηση. Το παρακάτω είναι ένα παράδειγμα όπου η απόκριση του μοντέλου Falcon-40B έχει αξιολογηθεί από έναν EvalLLM (στην περίπτωση αυτή τον Claude). Χρησιμοποιούμε την ερώτηση "Τι θα γινόταν αν η Διώρυγα του Σουέζ δεν είχε κατασκευαστεί ποτέ;" Η απάντηση είναι η εξής:
Ερώτηση: Τι θα γινόταν αν η Διώρυγα του Σουέζ δεν είχε κατασκευαστεί ποτέ;
Falcon-40b-instruct
Εάν η διώρυγα του Σουέζ δεν είχε κατασκευαστεί ποτέ, τα πλοία θα έπρεπε να ταξιδέψουν στην Αφρική για να πλεύσουν μεταξύ της Μεσογείου και της Ερυθράς Θάλασσας. Αυτό θα πρόσθετε σημαντικό χρόνο και απόσταση στο ταξίδι, καθιστώντας το λιγότερο αποτελεσματικό και πιο ακριβό. Επιπλέον, χωρίς τη Διώρυγα του Σουέζ, πολλές χώρες στη Μέση Ανατολή και τη Βόρεια Αφρική θα ήταν πολύ λιγότερο συνδεδεμένες με τον υπόλοιπο κόσμο, εμποδίζοντας την οικονομική και πολιτιστική ανάπτυξη.
Αξιολόγηση (Βαθμολογία: 9/10)
Η απάντηση του βοηθού είναι πολύ σχετική, ακριβής και λεπτομερής. Δίνει μια εξαιρετική απάντηση στην υποθετική ερώτηση του χρήστη για την ανυπαρξία της Διώρυγας του Σουέζ. Ο βοηθός επισημαίνει σωστά τις επιπτώσεις στα θαλάσσια ταξίδια και τον οικονομικό και πολιτιστικό αντίκτυπο στη Μέση Ανατολή και τη Βόρεια Αφρική. Ωστόσο, θα μπορούσε να έχει επεξεργαστεί περαιτέρω τις γεωπολιτικές επιπτώσεις ή τον αντίκτυπο στα πρότυπα του παγκόσμιου εμπορίου για μια πιο ολοκληρωμένη απάντηση.
Το παρακάτω σχήμα απεικονίζει το παράδειγμα της διαδικασίας αξιολόγησης από άκρο σε άκρο.
Με βάση αυτό το παράδειγμα, για να πραγματοποιήσουμε αξιολόγηση, πρέπει να παρέχουμε τα παραδείγματα προτροπών, τα οποία αποθηκεύουμε στον κατάλογο προτροπών, και ένα σύνολο δεδομένων αξιολόγησης με ετικέτα ή χωρίς ετικέτα με βάση τις συγκεκριμένες εφαρμογές μας. Για παράδειγμα, με ένα σύνολο δεδομένων αξιολόγησης με ετικέτα, μπορούμε να παρέχουμε προτροπές (εισαγωγή και ερώτημα) όπως "Δώστε μου το πλήρες όνομα του πρωθυπουργού του Ηνωμένου Βασιλείου το 2023" και αποτελέσματα και απαντήσεις, όπως "Rishi Sunak". Με ένα σύνολο δεδομένων χωρίς ετικέτα, παρέχουμε μόνο την ερώτηση ή την οδηγία, όπως "Δημιουργήστε τον πηγαίο κώδικα για έναν ιστότοπο λιανικής". Ονομάζουμε τον συνδυασμό του γρήγορου καταλόγου και του συνόλου δεδομένων αξιολόγησης άμεσος κατάλογος αξιολόγησης. Ο λόγος που διαφοροποιούμε τον κατάλογο προτροπής και τον κατάλογο προτροπής αξιολόγησης είναι επειδή ο τελευταίος είναι αφιερωμένος σε μια συγκεκριμένη περίπτωση χρήσης αντί για γενικές προτροπές και οδηγίες (όπως η απάντηση ερωτήσεων) που περιέχει ο κατάλογος προτροπής.
Με αυτόν τον κατάλογο προτροπών αξιολόγησης, το επόμενο βήμα είναι να τροφοδοτήσετε τα μηνύματα αξιολόγησης στα κορυφαία FM. Το αποτέλεσμα είναι ένα σύνολο δεδομένων αποτελεσμάτων αξιολόγησης που περιέχει τις προτροπές, τις εξόδους κάθε FM και την έξοδο με ετικέτα μαζί με μια βαθμολογία (αν υπάρχει). Στην περίπτωση ενός καταλόγου εντολών αξιολόγησης χωρίς ετικέτα, υπάρχει ένα πρόσθετο βήμα για έναν HIL ή LLM να επανεξετάσει τα αποτελέσματα και να παράσχει βαθμολογία και ανατροφοδότηση (όπως περιγράψαμε προηγουμένως). Το τελικό αποτέλεσμα θα είναι συγκεντρωτικά αποτελέσματα που συνδυάζουν τις βαθμολογίες όλων των αποτελεσμάτων (υπολογισμός της μέσης ακρίβειας ή της ανθρώπινης βαθμολογίας) και θα επιτρέπουν στους χρήστες να συγκρίνουν την ποιότητα των μοντέλων.
Αφού συλλεχθούν τα αποτελέσματα της αξιολόγησης, προτείνουμε την επιλογή ενός μοντέλου με βάση πολλές διαστάσεις. Αυτά συνήθως οφείλονται σε παράγοντες όπως η ακρίβεια, η ταχύτητα και το κόστος. Το παρακάτω σχήμα δείχνει ένα παράδειγμα.
Κάθε μοντέλο θα έχει πλεονεκτήματα και ορισμένες συμβιβασμούς σε αυτές τις διαστάσεις. Ανάλογα με την περίπτωση χρήσης, θα πρέπει να εκχωρήσουμε διαφορετικές προτεραιότητες σε αυτές τις διαστάσεις. Στο προηγούμενο παράδειγμα, επιλέξαμε να δώσουμε προτεραιότητα στο κόστος ως τον πιο σημαντικό παράγοντα, ακολουθούμενο από την ακρίβεια και μετά την ταχύτητα. Παρόλο που είναι πιο αργό και όχι τόσο αποδοτικό όσο το FM1, παραμένει αρκετά αποτελεσματικό και πολύ φθηνότερο στη φιλοξενία. Κατά συνέπεια, μπορεί να επιλέξουμε το FM2 ως την κορυφαία επιλογή.
Βήμα 3. Αναπτύξτε το γενετικό backend και frontend εφαρμογών AI
Σε αυτό το σημείο, οι παραγωγοί προγραμματιστές AI έχουν επιλέξει το σωστό FM για τη συγκεκριμένη εφαρμογή μαζί με τη βοήθεια έγκαιρων μηχανικών και δοκιμαστών. Το επόμενο βήμα είναι να ξεκινήσετε την ανάπτυξη της γενετικής εφαρμογής AI. Διαχωρίσαμε την ανάπτυξη της γενετικής εφαρμογής AI σε δύο επίπεδα, ένα backend και ένα front end, όπως φαίνεται στο παρακάτω σχήμα.
Στο backend, οι παραγωγοί προγραμματιστές AI ενσωματώνουν το επιλεγμένο FM στις λύσεις και συνεργάζονται με τους μηχανικούς προτροπής για να δημιουργήσουν τον αυτοματισμό για να μετατρέψουν την είσοδο του τελικού χρήστη σε κατάλληλες προτροπές FM. Οι δοκιμαστές προτροπής δημιουργούν τις απαραίτητες καταχωρήσεις στον κατάλογο προτροπής για αυτόματη ή χειροκίνητη δοκιμή (HIL ή LLM). Στη συνέχεια, οι παραγωγοί προγραμματιστές τεχνητής νοημοσύνης δημιουργούν τον μηχανισμό άμεσης αλυσίδας και εφαρμογής για να παρέχουν το τελικό αποτέλεσμα. Το Prompt Chaining, σε αυτό το πλαίσιο, είναι μια τεχνική για τη δημιουργία πιο δυναμικών και συναφών εφαρμογών LLM. Λειτουργεί αναλύοντας μια σύνθετη εργασία σε μια σειρά από μικρότερες, πιο διαχειρίσιμες υπο-εργασίες. Για παράδειγμα, αν θέσουμε σε έναν LLM την ερώτηση "Πού γεννήθηκε ο πρωθυπουργός του Ηνωμένου Βασιλείου και πόσο μακριά είναι αυτό το μέρος από το Λονδίνο", η εργασία μπορεί να αναλυθεί σε μεμονωμένες προτροπές, όπου μπορεί να δημιουργηθεί μια προτροπή με βάση την απάντηση μιας προηγούμενης άμεσης αξιολόγησης, όπως «Ποιος είναι ο πρωθυπουργός του Ηνωμένου Βασιλείου», «Ποια είναι η γενέτειρά τους» και «Πόσο απέχει αυτό το μέρος από το Λονδίνο;» Για να διασφαλιστεί μια ορισμένη ποιότητα εισόδου και εξόδου, οι παραγωγοί προγραμματιστές τεχνητής νοημοσύνης πρέπει επίσης να δημιουργήσουν τον μηχανισμό παρακολούθησης και φιλτραρίσματος των εισόδων και των εξόδων εφαρμογών του τελικού χρήστη. Εάν, για παράδειγμα, η εφαρμογή LLM υποτίθεται ότι αποφεύγει τοξικά αιτήματα και απαντήσεις, θα μπορούσαν να εφαρμόσουν έναν ανιχνευτή τοξικότητας για είσοδο και έξοδο και να τα φιλτράρουν. Τέλος, πρέπει να παράσχουν έναν μηχανισμό αξιολόγησης, ο οποίος θα υποστηρίξει την αύξηση του καταλόγου εντολών αξιολόγησης με καλά και κακά παραδείγματα. Μια πιο λεπτομερής αναπαράσταση αυτών των μηχανισμών θα παρουσιαστεί σε μελλοντικές αναρτήσεις.
Για να παρέχεται η λειτουργικότητα στον παραγωγικό τελικό χρήστη τεχνητής νοημοσύνης, είναι απαραίτητη η ανάπτυξη ενός ιστότοπου frontend που αλληλεπιδρά με το backend. Επομένως, οι προσωπικότητες DevOps και AppDevs (προγραμματιστές εφαρμογών στο cloud) πρέπει να ακολουθούν τις βέλτιστες πρακτικές ανάπτυξης για να εφαρμόσουν τη λειτουργικότητα της εισόδου/εξόδου και της αξιολόγησης.
Εκτός από αυτήν τη βασική λειτουργία, το frontend και το backend πρέπει να ενσωματώνουν τη δυνατότητα δημιουργίας προσωπικών λογαριασμών χρηστών, αποστολής δεδομένων, έναρξης λεπτομέρειας ως μαύρο κουτί και χρήσης του εξατομικευμένου μοντέλου αντί του βασικού FM. Η παραγωγή μιας γενετικής εφαρμογής AI είναι παρόμοια με μια κανονική εφαρμογή. Το παρακάτω σχήμα απεικονίζει ένα παράδειγμα αρχιτεκτονικής.
Σε αυτήν την αρχιτεκτονική, οι προγραμματιστές τεχνητής νοημοσύνης, οι μηχανικοί προτροπής και οι DevOps ή AppDevs δημιουργούν και δοκιμάζουν την εφαρμογή με μη αυτόματο τρόπο, αναπτύσσοντάς την μέσω CI/CD σε ένα περιβάλλον ανάπτυξης (γενικό AI App Dev στο προηγούμενο σχήμα) χρησιμοποιώντας αποκλειστικούς χώρους αποθήκευσης κώδικα και συγχώνευση με τον κλάδο dev. Σε αυτό το στάδιο, οι παραγωγοί προγραμματιστές τεχνητής νοημοσύνης θα χρησιμοποιήσουν το αντίστοιχο FM καλώντας το API όπως παρέχεται από τους παρόχους FM των βελτιστοποιητών. Στη συνέχεια, για να δοκιμάσουν την εφαρμογή εκτενώς, πρέπει να προωθήσουν τον κώδικα στον κλάδο δοκιμής, ο οποίος θα ενεργοποιήσει την ανάπτυξη μέσω CI/CD στο περιβάλλον προπαραγωγής (γεννητικό AI App Pre-prod). Σε αυτό το περιβάλλον, οι ελεγκτές προτροπής πρέπει να δοκιμάσουν μεγάλο αριθμό συνδυασμών προτροπής και να ελέγξουν τα αποτελέσματα. Ο συνδυασμός προτροπών, αποτελεσμάτων και αναθεώρησης πρέπει να μετακινηθεί στον κατάλογο προτροπών αξιολόγησης για να αυτοματοποιηθεί η διαδικασία δοκιμών στο μέλλον. Μετά από αυτήν την εκτεταμένη δοκιμή, το τελευταίο βήμα είναι η προώθηση της γενετικής εφαρμογής AI στην παραγωγή μέσω CI/CD με τη συγχώνευση με τον κύριο κλάδο (generative AI App Prod). Λάβετε υπόψη ότι όλα τα δεδομένα, συμπεριλαμβανομένου του καταλόγου εντολών, των δεδομένων και των αποτελεσμάτων αξιολόγησης, των δεδομένων και των μεταδεδομένων τελικού χρήστη και των μεταδεδομένων μοντέλων με ακρίβεια, πρέπει να αποθηκευτούν στη λίμνη δεδομένων ή στο επίπεδο πλέγματος δεδομένων. Οι αγωγοί CI/CD και τα αποθετήρια πρέπει να αποθηκευτούν σε ξεχωριστό λογαριασμό εργαλείων (παρόμοιο με αυτόν που περιγράφεται για τα MLOps).
Το ταξίδι των παρόχων
Οι πάροχοι FM πρέπει να εκπαιδεύουν FM, όπως μοντέλα βαθιάς εκμάθησης. Για αυτούς, ο κύκλος ζωής και η υποδομή των MLOps από άκρο σε άκρο είναι απαραίτητα. Απαιτούνται προσθήκες στην προετοιμασία ιστορικών δεδομένων, την αξιολόγηση μοντέλων και την παρακολούθηση. Το παρακάτω σχήμα απεικονίζει το ταξίδι τους.
Στην κλασική ML, τα ιστορικά δεδομένα δημιουργούνται συχνότερα με την τροφοδοσία της βασικής αλήθειας μέσω αγωγών ETL. Για παράδειγμα, σε μια περίπτωση χρήσης πρόβλεψης διακοπής, ένας αυτοματισμός ενημερώνει έναν πίνακα βάσης δεδομένων βάσει της νέας κατάστασης ενός πελάτη ώστε να αναστέλλεται/δεν αναβάλλεται αυτόματα. Στην περίπτωση των FM, χρειάζονται είτε δισεκατομμύρια σημεία δεδομένων με ετικέτα είτε χωρίς ετικέτα. Σε περιπτώσεις χρήσης κειμένου σε εικόνα, μια ομάδα ετικετών δεδομένων πρέπει να κάνει ετικέτες ζεύγη χειροκίνητα. Αυτή είναι μια δαπανηρή άσκηση που απαιτεί μεγάλο αριθμό ανθρώπων. Amazon SageMaker Ground Truth Plus μπορεί να παρέχει μια ομάδα ετικετών για να εκτελέσει αυτήν τη δραστηριότητα για εσάς. Για ορισμένες περιπτώσεις χρήσης, αυτή η διαδικασία μπορεί επίσης να αυτοματοποιηθεί μερικώς, για παράδειγμα χρησιμοποιώντας μοντέλα που μοιάζουν με CLIP. Στην περίπτωση ενός LLM, όπως το κείμενο σε κείμενο, τα δεδομένα δεν φέρουν ετικέτα. Ωστόσο, πρέπει να προετοιμαστούν και να ακολουθήσουν τη μορφή των υπαρχόντων ιστορικών δεδομένων χωρίς ετικέτα. Ως εκ τούτου, απαιτούνται συντάκτες δεδομένων για την εκτέλεση της απαραίτητης προετοιμασίας δεδομένων και τη διασφάλιση της συνέπειας.
Με τα ιστορικά στοιχεία που έχουν προετοιμαστεί, το επόμενο βήμα είναι η εκπαίδευση και η παραγωγή του μοντέλου. Σημειώστε ότι μπορούν να χρησιμοποιηθούν οι ίδιες τεχνικές αξιολόγησης που περιγράψαμε για τους καταναλωτές.
Το ταξίδι των τελειοποιητών
Οι μικροσυντονιστές στοχεύουν να προσαρμόσουν ένα υπάρχον FM στο συγκεκριμένο περιβάλλον τους. Για παράδειγμα, ένα μοντέλο FM μπορεί να συνοψίσει ένα κείμενο γενικής χρήσης αλλά όχι μια οικονομική αναφορά με ακρίβεια ή δεν μπορεί να δημιουργήσει πηγαίο κώδικα για μια μη κοινή γλώσσα προγραμματισμού. Σε αυτές τις περιπτώσεις, οι μικροσυντονιστές πρέπει να επισημάνουν τα δεδομένα, να προσαρμόσουν με ακρίβεια ένα μοντέλο εκτελώντας μια εργασία εκπαίδευσης, να αναπτύξουν το μοντέλο, να το δοκιμάσουν με βάση τις διαδικασίες των καταναλωτών και να παρακολουθήσουν το μοντέλο. Το παρακάτω διάγραμμα απεικονίζει αυτή τη διαδικασία.
Προς το παρόν, υπάρχουν δύο μηχανισμοί μικρορύθμισης:
- Βελτιστοποίηση – Χρησιμοποιώντας ένα FM και δεδομένα με ετικέτα, μια εργασία εκπαίδευσης υπολογίζει εκ νέου τα βάρη και τις προκαταλήψεις των επιπέδων του μοντέλου βαθιάς μάθησης. Αυτή η διαδικασία μπορεί να είναι υπολογιστικά εντατική και απαιτεί αντιπροσωπευτικό όγκο δεδομένων, αλλά μπορεί να παράγει ακριβή αποτελέσματα.
- Μικροσυντονισμός αποδοτικής παραμέτρου (PEFT) – Αντί να υπολογίζουν εκ νέου όλα τα βάρη και τις προκαταλήψεις, οι ερευνητές έχουν δείξει ότι προσθέτοντας επιπλέον μικρά επίπεδα στα μοντέλα βαθιάς μάθησης, μπορούν να επιτύχουν ικανοποιητικά αποτελέσματα (για παράδειγμα, LoRA). Το PEFT απαιτεί χαμηλότερη υπολογιστική ισχύ από τη βαθιά λεπτομέρεια και μια εργασία εκπαίδευσης με λιγότερα δεδομένα εισόδου. Το μειονέκτημα είναι η πιθανή χαμηλότερη ακρίβεια.
Το παρακάτω διάγραμμα απεικονίζει αυτούς τους μηχανισμούς.
Τώρα που έχουμε ορίσει τις δύο κύριες μεθόδους μικρορύθμισης, το επόμενο βήμα είναι να καθορίσουμε πώς μπορούμε να αναπτύξουμε και να χρησιμοποιήσουμε το ανοιχτού κώδικα και το ιδιόκτητο FM.
Με τα FM ανοιχτού κώδικα, οι βελτιστοποιητές μπορούν να κατεβάσουν το τεχνούργημα του μοντέλου και τον πηγαίο κώδικα από τον Ιστό, για παράδειγμα, χρησιμοποιώντας το Hub Model Hugging Face. Αυτό σας δίνει την ευελιξία να προσαρμόσετε σε βάθος το μοντέλο, να το αποθηκεύσετε σε ένα τοπικό μητρώο μοντέλων και να το αναπτύξετε σε Amazon Sage Maker τελικό σημείο. Αυτή η διαδικασία απαιτεί σύνδεση στο Διαδίκτυο. Για να υποστηρίξετε πιο ασφαλή περιβάλλοντα (όπως για πελάτες στον χρηματοοικονομικό τομέα), μπορείτε να κάνετε λήψη του μοντέλου στις εγκαταστάσεις, να εκτελέσετε όλους τους απαραίτητους ελέγχους ασφαλείας και να τα ανεβάσετε σε έναν τοπικό κάδο σε έναν λογαριασμό AWS. Στη συνέχεια, οι μικροδέκτες χρησιμοποιούν τα FM από τον τοπικό κάδο χωρίς σύνδεση στο Διαδίκτυο. Αυτό διασφαλίζει το απόρρητο των δεδομένων και τα δεδομένα δεν μεταδίδονται μέσω του Διαδικτύου. Το παρακάτω διάγραμμα απεικονίζει αυτή τη μέθοδο.
Με τα ιδιόκτητα FM, η διαδικασία ανάπτυξης είναι διαφορετική επειδή οι μικροδέκτες δεν έχουν πρόσβαση στο τεχνούργημα του μοντέλου ή στον πηγαίο κώδικα. Τα μοντέλα αποθηκεύονται σε ιδιόκτητους λογαριασμούς AWS παρόχου FM και μητρώα μοντέλων. Για την ανάπτυξη ενός τέτοιου μοντέλου σε ένα τελικό σημείο του SageMaker, οι μικροσυντονιστές μπορούν να ζητήσουν μόνο το πακέτο μοντέλου που θα αναπτυχθεί απευθείας σε ένα τελικό σημείο. Αυτή η διαδικασία απαιτεί τη χρήση δεδομένων πελατών στους ιδιόκτητους λογαριασμούς παρόχων FM, γεγονός που εγείρει ερωτήματα σχετικά με τα ευαίσθητα στον πελάτη δεδομένα που χρησιμοποιούνται σε έναν απομακρυσμένο λογαριασμό για την εκτέλεση λεπτομέρειας και τα μοντέλα που φιλοξενούνται σε ένα μητρώο μοντέλων που είναι κοινόχρηστο μεταξύ πολλών πελατών . Αυτό οδηγεί σε ένα πρόβλημα πολλαπλών μισθώσεων που γίνεται πιο δύσκολο εάν οι ιδιόκτητοι πάροχοι FM χρειαστεί να εξυπηρετήσουν αυτά τα μοντέλα. Εάν οι μικροσυντονιστές χρησιμοποιούν Θεμέλιο του Αμαζονίου, αυτές οι προκλήσεις επιλύθηκαν—τα δεδομένα δεν μεταδίδονται μέσω του Διαδικτύου και οι πάροχοι FM δεν έχουν πρόσβαση στα δεδομένα των βελτιστοποιητών. Οι ίδιες προκλήσεις ισχύουν για τα μοντέλα ανοιχτού κώδικα, εάν οι βελτιστοποιητές θέλουν να εξυπηρετήσουν μοντέλα από πολλούς πελάτες, όπως το παράδειγμα που δώσαμε νωρίτερα με τον ιστότοπο στον οποίο χιλιάδες πελάτες θα ανεβάζουν εξατομικευμένες εικόνες. Ωστόσο, αυτά τα σενάρια μπορούν να θεωρηθούν ελεγχόμενα επειδή εμπλέκεται μόνο ο βελτιωτικός συντονισμός. Το παρακάτω διάγραμμα απεικονίζει αυτή τη μέθοδο.
Από τεχνολογική άποψη, η αρχιτεκτονική που πρέπει να υποστηρίξει ένας βελτιστοποιητής είναι όπως αυτή των MLOps (δείτε την παρακάτω εικόνα). Η λεπτομέρεια πρέπει να διεξαχθεί σε dev με τη δημιουργία αγωγών ML, όπως η χρήση Αγωγοί Amazon SageMaker; εκτέλεση προεπεξεργασίας, τελειοποίησης (εργασία εκπαίδευσης) και μεταεπεξεργασίας. και αποστολή των βελτιστοποιημένων μοντέλων σε ένα τοπικό μητρώο μοντέλων στην περίπτωση ενός FM ανοιχτού κώδικα (διαφορετικά, το νέο μοντέλο θα αποθηκευτεί στο ιδιόκτητο περιβάλλον παροχής FM). Στη συνέχεια, στην προπαραγωγή, πρέπει να δοκιμάσουμε το μοντέλο όπως περιγράφουμε για το σενάριο των καταναλωτών. Τέλος, το μοντέλο θα εξυπηρετηθεί και θα παρακολουθηθεί σε προτ. Λάβετε υπόψη ότι το τρέχον (βελτιστοποιημένο) FM απαιτεί τελικά σημεία παρουσίας GPU. Αν χρειαστεί να αναπτύξουμε κάθε βελτιωμένο μοντέλο σε ξεχωριστό τελικό σημείο, αυτό μπορεί να αυξήσει το κόστος στην περίπτωση εκατοντάδων μοντέλων. Επομένως, πρέπει να χρησιμοποιήσουμε τελικά σημεία πολλαπλών μοντέλων και να επιλύσουμε την πρόκληση πολλαπλών μισθώσεων.
Οι μικροδέκτης προσαρμόζουν ένα μοντέλο FM με βάση ένα συγκεκριμένο πλαίσιο για να το χρησιμοποιήσουν για τον επιχειρηματικό τους σκοπό. Αυτό σημαίνει ότι τις περισσότερες φορές, οι μικροδέκτες είναι επίσης καταναλωτές που απαιτείται να υποστηρίξουν όλα τα επίπεδα, όπως περιγράψαμε στις προηγούμενες ενότητες, συμπεριλαμβανομένης της ανάπτυξης εφαρμογών τεχνητής νοημοσύνης, της λίμνης δεδομένων και του πλέγματος δεδομένων και των MLOps.
Το παρακάτω σχήμα απεικονίζει τον πλήρη κύκλο ζωής μικρορύθμισης FM που χρειάζονται οι βελτιστοποιητές για να παρέχουν στον παραγωγικό τελικό χρήστη τεχνητής νοημοσύνης.
Το παρακάτω σχήμα απεικονίζει τα βασικά βήματα.
Τα βασικά βήματα είναι τα εξής:
- Ο τελικός χρήστης δημιουργεί έναν προσωπικό λογαριασμό και ανεβάζει προσωπικά δεδομένα.
- Τα δεδομένα αποθηκεύονται στη λίμνη δεδομένων και υποβάλλονται σε προεπεξεργασία για να ακολουθήσει τη μορφή που αναμένει το FM.
- Αυτό ενεργοποιεί μια διοχέτευση ML βελτιστοποίησης που προσθέτει το μοντέλο στο μητρώο μοντέλων,
- Από εκεί, είτε το μοντέλο αναπτύσσεται στην παραγωγή με ελάχιστες δοκιμές είτε το μοντέλο προωθεί εκτεταμένες δοκιμές με HIL και χειροκίνητες πύλες έγκρισης.
- Το τελειοποιημένο μοντέλο διατίθεται για τους τελικούς χρήστες.
Επειδή αυτή η υποδομή είναι πολύπλοκη για μη επιχειρηματικούς πελάτες, η AWS κυκλοφόρησε το Amazon Bedrock για να ξεφορτώσει την προσπάθεια δημιουργίας τέτοιων αρχιτεκτονικών και να φέρει τα βελτιωμένα FM πιο κοντά στην παραγωγή.
FMOps και LLMOps πρόσωπα και διαφοροποιητές διεργασιών
Με βάση τα προηγούμενα ταξίδια τύπου χρήστη (καταναλωτής, παραγωγός και συντονιστής), απαιτούνται νέα πρόσωπα με συγκεκριμένες δεξιότητες, όπως φαίνεται στο παρακάτω σχήμα.
Τα νέα πρόσωπα είναι τα εξής:
- Ετικέτες και συντάκτες δεδομένων – Αυτοί οι χρήστες επισημαίνουν δεδομένα, όπως π.χ ζεύγη ή προετοιμάστε δεδομένα χωρίς ετικέτα, όπως ελεύθερο κείμενο, και επεκτείνετε την ομάδα προηγμένων αναλυτικών στοιχείων και τα περιβάλλοντα λίμνης δεδομένων.
- μικροσυντονιστές – Αυτοί οι χρήστες έχουν βαθιά γνώση στα FM και ξέρουν να τα συντονίζουν, επεκτείνοντας την ομάδα επιστήμης δεδομένων που θα επικεντρωθεί στην κλασική ML.
- Δημιουργικοί προγραμματιστές AI – Έχουν βαθιές γνώσεις σχετικά με την επιλογή FM, την αλυσίδα προτροπών και εφαρμογών και το φιλτράρισμα εισόδων και εξόδων. Ανήκουν σε μια νέα ομάδα - τη γενετική ομάδα εφαρμογών AI.
- Άμεσοι μηχανικοί – Αυτοί οι χρήστες σχεδιάζουν τις προτροπές εισόδου και εξόδου για να προσαρμόσουν τη λύση στο πλαίσιο και να δοκιμάσουν και να δημιουργήσουν την αρχική έκδοση του καταλόγου εντολών. Η ομάδα τους είναι η παραγωγική ομάδα εφαρμογών AI.
- Άμεσοι δοκιμαστές – Δοκιμάζουν σε κλίμακα τη γενετική λύση AI (backend και frontend) και τροφοδοτούν τα αποτελέσματά τους για να αυξήσουν τον γρήγορο κατάλογο και το σύνολο δεδομένων αξιολόγησης. Η ομάδα τους είναι η παραγωγική ομάδα εφαρμογών AI.
- AppDev και DevOps – Αναπτύσσουν το μπροστινό μέρος (όπως έναν ιστότοπο) της γενετικής εφαρμογής AI. Η ομάδα τους είναι η παραγωγική ομάδα εφαρμογών AI.
- Τελικοί χρήστες τεχνητής νοημοσύνης που δημιουργούνται – Αυτοί οι χρήστες καταναλώνουν παραγωγικές εφαρμογές AI ως μαύρα κουτιά, μοιράζονται δεδομένα και βαθμολογούν την ποιότητα της εξόδου.
Η εκτεταμένη έκδοση του χάρτη διεργασιών MLOps για την ενσωμάτωση της γενετικής τεχνητής νοημοσύνης μπορεί να απεικονιστεί στο παρακάτω σχήμα.
Ένα νέο επίπεδο εφαρμογών είναι το περιβάλλον όπου οι παραγωγοί προγραμματιστές τεχνητής νοημοσύνης, οι μηχανικοί και οι δοκιμαστές, καθώς και οι AppDevs δημιούργησαν το backend και το front end των γενετικών εφαρμογών AI. Οι τελικοί χρήστες της γενετικής τεχνητής νοημοσύνης αλληλεπιδρούν με τη διεπαφή εφαρμογών τεχνητής νοημοσύνης που δημιουργούνται μέσω του διαδικτύου (όπως μια διεπαφή ιστού). Από την άλλη πλευρά, οι ετικέτες δεδομένων και οι επεξεργαστές πρέπει να προεπεξεργάζονται τα δεδομένα χωρίς να έχουν πρόσβαση στο backend της λίμνης δεδομένων ή του πλέγματος δεδομένων. Επομένως, μια διεπαφή ιστού (ιστότοπος) με πρόγραμμα επεξεργασίας είναι απαραίτητη για την ασφαλή αλληλεπίδραση με τα δεδομένα. Το SageMaker Ground Truth παρέχει αυτήν τη λειτουργία εκτός συσκευασίας.
Συμπέρασμα
Τα MLO μπορούν να μας βοηθήσουν να παράγουμε αποτελεσματικά μοντέλα ML. Ωστόσο, για να λειτουργήσουν παραγωγικές εφαρμογές τεχνητής νοημοσύνης, χρειάζεστε πρόσθετες δεξιότητες, διαδικασίες και τεχνολογίες, που οδηγούν σε FMOps και LLMOps. Σε αυτήν την ανάρτηση, ορίσαμε τις κύριες έννοιες των FMOps και LLMOps και περιγράψαμε τους βασικούς παράγοντες διαφοροποίησης σε σύγκριση με τις δυνατότητες των MLOps όσον αφορά τους ανθρώπους, τις διαδικασίες, την τεχνολογία, την επιλογή μοντέλων FM και την αξιολόγηση. Επιπλέον, απεικονίσαμε τη διαδικασία σκέψης ενός παραγωγού προγραμματιστή τεχνητής νοημοσύνης και τον κύκλο ζωής ανάπτυξης μιας γενετικής εφαρμογής AI.
Στο μέλλον, θα επικεντρωθούμε στην παροχή λύσεων για τον τομέα που συζητήσαμε και θα παρέχουμε περισσότερες λεπτομέρειες σχετικά με τον τρόπο ενσωμάτωσης της παρακολούθησης FM (όπως τοξικότητα, μεροληψία και παραισθήσεις) και αρχιτεκτονικά μοτίβα πηγών δεδομένων τρίτων ή ιδιωτικών, όπως π.χ. Ανάκτηση επαυξημένης γενιάς (RAG), σε FMOps/LLMOps.
Για να μάθετε περισσότερα, ανατρέξτε στο Ο οδικός χάρτης του θεμελίου MLOps για επιχειρήσεις με το Amazon SageMaker και δοκιμάστε τη λύση από άκρο σε άκρο Εφαρμογή πρακτικών MLOps με προεκπαιδευμένα μοντέλα Amazon SageMaker JumpStart.
Αν έχετε σχόλια ή ερωτήσεις, αφήστε τα στην ενότητα σχολίων.
Σχετικά με τους Συγγραφείς
Δρ Σωκράτης Καρτάκης είναι Senior Machine Learning and Operations Specialist Solutions Architect για τις υπηρεσίες Web της Amazon. Ο Σωκράτης εστιάζει στο να δώσει τη δυνατότητα στους εταιρικούς πελάτες να βιομηχανοποιήσουν τις λύσεις Μηχανικής Μάθησης (ML) αξιοποιώντας τις υπηρεσίες AWS και διαμορφώνοντας το μοντέλο λειτουργίας τους, π.χ. το ίδρυμα MLOps και τον οδικό χάρτη μετασχηματισμού αξιοποιώντας βέλτιστες πρακτικές ανάπτυξης. Έχει ξοδέψει 15+ χρόνια για την εφεύρεση, το σχεδιασμό, την ηγεσία και την εφαρμογή καινοτόμων λύσεων ML και Internet of Things (IoT) σε επίπεδο παραγωγής από άκρο σε άκρο στους τομείς της ενέργειας, του λιανικού εμπορίου, της υγείας, των χρηματοοικονομικών/τραπεζικών, των μηχανοκίνητων αθλημάτων κ.λπ. Ο Σωκράτης αρέσκεται να περνά τον ελεύθερο χρόνο του με την οικογένεια και τους φίλους του ή να οδηγεί μηχανάκια.
Heiko Hotz είναι Senior Solutions Architect για AI & Machine Learning με ιδιαίτερη έμφαση στην επεξεργασία φυσικής γλώσσας, τα μεγάλα γλωσσικά μοντέλα και τη γενετική τεχνητή νοημοσύνη. Πριν από αυτόν τον ρόλο, ήταν επικεφαλής της Επιστήμης Δεδομένων για την Εξυπηρέτηση Πελατών στην ΕΕ της Amazon. Η Heiko βοηθά τους πελάτες μας να είναι επιτυχημένοι στο ταξίδι τους AI/ML στο AWS και έχει συνεργαστεί με οργανισμούς σε πολλούς κλάδους, συμπεριλαμβανομένων των ασφαλίσεων, των χρηματοοικονομικών υπηρεσιών, των μέσων ενημέρωσης και της ψυχαγωγίας, της υγειονομικής περίθαλψης, των υπηρεσιών κοινής ωφελείας και της κατασκευής. Στον ελεύθερο χρόνο του, ο Heiko ταξιδεύει όσο περισσότερο μπορεί.
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
- PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- PlatoESG. Αυτοκίνητο / EVs, Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
- PlatoHealth. Ευφυΐα βιοτεχνολογίας και κλινικών δοκιμών. Πρόσβαση εδώ.
- ChartPrime. Ανεβάστε το Trading Game σας με το ChartPrime. Πρόσβαση εδώ.
- BlockOffsets. Εκσυγχρονισμός της περιβαλλοντικής αντιστάθμισης ιδιοκτησίας. Πρόσβαση εδώ.
- πηγή: https://aws.amazon.com/blogs/machine-learning/fmops-llmops-operationalize-generative-ai-and-differences-with-mlops/
- :έχει
- :είναι
- :δεν
- :που
- $UP
- 1
- 10
- 100
- 2023
- 23
- 7
- 75
- a
- ικανότητα
- Ικανός
- Σχετικα
- πάνω από
- ΠΕΡΙΛΗΨΗ
- πρόσβαση
- προσιτός
- πρόσβαση
- Λογαριασμός
- Λογαριασμοί
- ακρίβεια
- ακριβής
- με ακρίβεια
- Κατορθώνω
- ενεργειών
- δραστηριότητα
- προσαρμόσει
- προσαρμογή
- προσθέτω
- προσθήκη
- Επιπλέον
- Πρόσθετος
- Επιπλέον
- προσθήκες
- Προσθέτει
- διαχείριση
- Υιοθεσία
- προηγμένες
- Αφρική
- Μετά το
- Συμφωνία
- AI
- AI και μηχανική μάθηση
- Βοηθός AI
- Μοντέλα AI
- Υπηρεσίες AI
- αι περιπτώσεις χρήσης
- AI / ML
- στοχεύουν
- Ευθυγραμμίζει
- Όλα
- επιτρέπουν
- επιτρέπει
- κατά μήκος
- ήδη
- Επίσης
- Αν και
- πάντοτε
- Amazon
- Amazon Sage Maker
- Amazon SageMaker JumpStart
- Amazon υπηρεσίες Web
- μεταξύ των
- ποσό
- an
- ανάλυση
- analytics
- και
- και την υποδομή
- Άλλος
- απάντηση
- απαντήσεις
- κάθε
- api
- APIs
- app
- Εφαρμογή
- Ανάπτυξη Εφαρμογών
- εφαρμογές
- Εφαρμογή
- πλησιάζω
- προσεγγίσεις
- κατάλληλος
- έγκριση
- περίπου
- αρχιτέκτονες
- αρχιτεκτονική
- αρχιτεκτονική
- ΕΙΝΑΙ
- γύρω
- AS
- Αξιολόγηση
- Βοηθός
- At
- ελεγχθεί
- ελεγκτών
- επαυξημένης
- αυτοματοποίηση
- Αυτοματοποιημένη
- Αυτόματο
- αυτομάτως
- Αυτοματοποίηση
- διαθεσιμότητα
- διαθέσιμος
- μέσος
- αποφύγετε
- AWS
- Backend
- Κακός
- Υπόλοιπο
- βασίζονται
- βασικός
- BE
- επειδή
- γίνονται
- γίνεται
- ήταν
- πριν
- είναι
- αναφοράς
- οφέλη
- ΚΑΛΎΤΕΡΟΣ
- Καλύτερα
- μεταξύ
- προκατάληψη
- μεροληψίες
- Δισεκατομμύριο
- δισεκατομμύρια
- Μαύρη
- γεννημένος
- δανείζομαι
- και οι δύο
- bots
- Κουτί
- κουτιά
- Υποκατάστημα
- Σπάζοντας
- εν συντομία
- Φέρνοντας
- Σπασμένος
- χτίζω
- Κτίριο
- χτισμένο
- επιχείρηση
- αλλά
- by
- υπολογίσει
- κλήση
- που ονομάζεται
- κλήση
- CAN
- υποψήφιος
- υποψηφίους
- δυνατότητες
- ικανότητα
- πιάνω
- περίπτωση
- περιπτώσεις
- κατάλογος
- κατηγορίες
- κεντρικός
- κεντρική
- ορισμένες
- πρόκληση
- προκλήσεις
- πρόκληση
- αλλαγή
- chatbots
- φτηνότερος
- έλεγχοι
- επιλογή
- επιλέγοντας
- κλασικό
- στενά
- πιο κοντά
- ΡΟΥΧΑ
- Backup
- κωδικός
- Κωδικοποίηση
- συνεργάζομαι
- συνδυασμός
- συνδυασμοί
- συνδυασμός
- Ελάτε
- σχόλια
- εμπορικός
- εμπορικώς
- Κοινός
- συγκρίνουν
- σύγκριση
- πλήρης
- ολοκλήρωση
- συγκρότημα
- περίπλοκο
- Συμμόρφωση
- υποχωρητικός
- σύνθεση
- περιεκτικός
- υπολογιστική δύναμη
- υπολογιστή
- επικεντρωθούν
- έννοια
- έννοιες
- Πιθανά ερωτήματα
- Συνθήκες
- Διεξαγωγή
- διενεργούνται
- συνδεδεμένος
- σύνδεση
- συνεπώς
- Εξετάστε
- θεωρήσεις
- θεωρούνται
- καταναλώνουν
- καταναλωτής
- Καταναλωτές
- κατανάλωση
- Δοχείο
- Περιέχει
- περιεχόμενο
- δημιουργία περιεχομένου
- συμφραζόμενα
- ΣΥΝΕΧΕΙΑ
- έλεγχος
- ομιλητικός
- συνομιλίες
- πνευματική ιδιοκτησία
- Αντίστοιχος
- Κόστος
- δαπανηρός
- Δικαστικά έξοδα
- θα μπορούσε να
- χώρες
- κάλυμμα
- καλύπτονται
- δημιουργία
- δημιουργήθηκε
- δημιουργεί
- δημιουργία
- δημιουργία
- κρίσιμης
- κρίσιμος
- πολιτιστικός
- Ρεύμα
- έθιμο
- πελάτης
- στοιχεία πελάτη
- Εξυπηρέτηση πελατών
- Πελάτες
- ημερομηνία
- Λίμνη δεδομένων
- σημεία δεδομένων
- Προετοιμασία δεδομένων
- Προστασία προσωπικών δεδομένων
- επιστημονικά δεδομένα
- βάση δεδομένων
- σύνολα δεδομένων
- Αποκεντρωμένη
- Αποφασίζοντας
- αποφάσεις
- αφιερωμένο
- βαθύς
- βαθιά κατάδυση
- βαθιά μάθηση
- ορίζεται
- καθορίζοντας
- ορισμός
- ορισμοί
- παραδώσει
- σκάβω
- Ζήτηση
- Σε συνάρτηση
- εξαρτάται
- που απεικονίζει
- παρατάσσω
- αναπτυχθεί
- ανάπτυξη
- ανάπτυξη
- περιγράφουν
- περιγράφεται
- περιγραφή
- Υπηρεσίες
- σχεδιασμένα
- σχέδιο
- επιθυμία
- επιθυμητή
- λεπτομερής
- καθέκαστα
- Προσδιορίστε
- καθορίζοντας
- Dev
- ανάπτυξη
- αναπτύχθηκε
- Εργολάβος
- προγραμματιστές
- ανάπτυξη
- Ανάπτυξη
- ομάδα ανάπτυξης
- διαφορές
- διαφορετικές
- διαφοροποιούν
- Διαστάσεις
- κατευθείαν
- συζητήσουν
- συζήτηση
- εκτεθειμένος
- απόσταση
- κατάδυση
- διάφορα
- do
- έγγραφα
- Όχι
- τομέα
- domains
- Μην
- κάτω
- κατεβάσετε
- αυτοκίνητο
- δυο
- δυναμικός
- e
- κάθε
- Νωρίτερα
- Ανατολή
- εύκολος
- Οικονομικός
- συντάκτης
- Αποτελεσματικός
- αποτελεσματικός
- αποτελεσματικά
- προσπάθεια
- είτε
- επεξεργασμένη
- εκλεγμένα
- ενεργοποιήσετε
- ενεργοποίηση
- τέλος
- από άκρη σε άκρη
- Τελικό σημείο
- ενέργεια
- μηχανικός
- Μηχανική
- Μηχανικοί
- Αγγλικά
- ενίσχυση
- εξασφαλίζω
- εξασφαλίζει
- Εταιρεία
- επιχειρήσεις
- Ψυχαγωγία
- Περιβάλλον
- περιβάλλοντα
- εξίσου
- ειδικά
- ουσιώδης
- κ.λπ.
- EU
- αξιολογήσει
- αξιολόγηση
- εκτίμηση
- Even
- Κάθε
- παράδειγμα
- παραδείγματα
- έξοχος
- ενθουσιασμένοι
- Άσκηση
- υφιστάμενα
- υπάρχει
- Εξωτικός
- αναμένει
- ακριβά
- εμπειρία
- πείραμα
- εξειδίκευση
- εμπειρογνώμονες
- εκμετάλλευση
- επεκτείνουν
- επέκταση
- επέκταση
- εκτενής
- Εκτεταμένη εμπειρία
- εκτεταμένα
- εκχύλισμα
- f1
- Πρόσωπο
- παράγοντας
- παράγοντες
- Εξοικείωση
- οικογένεια
- μακριά
- γρηγορότερα
- Χαρακτηριστικό
- ανατροφοδότηση
- σίτιση
- Εικόνα
- φιλτράρισμα
- φιλτράρισμα
- τελικός
- Τελικά
- οικονομικός
- οικονομική αναφορά
- Χρηματοοικονομικός τομέας
- των χρηματοπιστωτικών υπηρεσιών
- Όνομα
- ταιριάζουν
- Ευελιξία
- εύκαμπτος
- Συγκέντρωση
- επικεντρώθηκε
- εστιάζει
- εστιάζοντας
- ακολουθήστε
- ακολουθείται
- Εξής
- εξής
- Για
- Για τους καταναλωτές
- μορφή
- μορφή
- Θεμέλιο
- τέσσερα
- Δωρεάν
- φίλους
- από
- εμπρός
- εμπρόσθιο άκρο
- frontend
- πλήρη
- λειτουργικότητα
- θεμελιώδης
- περαιτέρω
- Επί πλέον
- μελλοντικός
- Πύλες
- μετρητής
- General
- γενικού σκοπού
- γενικά
- παράγουν
- παράγεται
- δημιουργεί
- παραγωγής
- γενεά
- γενετική
- Παραγωγική τεχνητή νοημοσύνη
- γεωπολιτικό
- παίρνω
- Git
- δεδομένου
- δίνει
- Παγκόσμιο
- παγκόσμιο εμπόριο
- καλός
- διακυβέρνησης
- GPU
- Έδαφος
- είχε
- χέρι
- Αξιοποίηση
- Έχω
- που έχει
- he
- κεφάλι
- Υγεία
- υγειονομική περίθαλψη
- βοήθεια
- βοηθά
- εδώ
- Ψηλά
- υψηλής ποιότητας
- υψηλότερο
- υψηλά
- του
- ιστορικών
- κρατήστε
- οικοδεσπότης
- φιλοξενείται
- Πως
- Πώς να
- Ωστόσο
- HTML
- HTTPS
- ανθρώπινος
- Εκατοντάδες
- i
- ιδανικά
- if
- απεικονίζει
- εικόνα
- εικόνες
- φανταστικός
- Επίπτωση
- εφαρμογή
- εκτελεστικών
- επιπτώσεις
- σπουδαιότητα
- σημαντικό
- βελτίωση
- in
- περιλαμβάνουν
- περιλαμβάνει
- Συμπεριλαμβανομένου
- ενσωματώνω
- Αυξάνουν
- αυξημένη
- υποδηλώνει
- δείκτες
- ατομικές
- βιομηχανίες
- επιρροή
- επηρεάζονται
- Υποδομή
- αρχικός
- καινοτόμες
- εισαγωγή
- είσοδοι
- παράδειγμα
- αντί
- οδηγίες
- ασφάλιση
- ενσωματώσει
- προορίζονται
- αλληλεπιδρούν
- αλληλεπιδρώντας
- αλληλεπίδραση
- διαδραστικός
- περιβάλλον λειτουργίας
- Internet
- σύνδεση στο Internet
- Ίντερνετ των πραγμάτων
- σε
- εισαγάγει
- επενδύοντας
- συμμετέχουν
- συμμετοχή
- IoT
- IT
- ΤΟΥ
- Δουλειά
- ταξίδι
- Ταξίδια
- Ιούλιος
- μόλις
- Κλειδί
- παράγοντας κλειδί
- Είδος
- Ξέρω
- γνώση
- γνωστός
- επιγραφή
- Ετικέτες
- λίμνη
- Γλώσσα
- large
- μεγαλύτερος
- Επίθετο
- Αφάνεια
- στρώμα
- στρώματα
- που οδηγεί
- Οδηγεί
- ΜΑΘΑΊΝΩ
- μάθηση
- Άδεια
- δανείζω
- μείον
- Επίπεδο
- μόχλευσης
- βιβλιοθήκες
- Άδεια
- αδειοδότηση
- κύκλος ζωής
- Μου αρέσει
- συμπαθεί
- περιορισμούς
- LINK
- LLM
- φορτίο
- τοπικός
- που βρίσκεται
- τοποθεσία
- Λονδίνο
- Μακριά
- πλέον
- χαμηλότερα
- μηχανή
- μάθηση μηχανής
- που
- Κυρίως
- διατηρήσουν
- Η πλειοψηφία
- Κατασκευή
- ευχείριστος
- υποχρεωτικό
- Ταχύτητες
- χειροκίνητα
- κατασκευής
- πολοί
- χάρτη
- μαζική
- ωριμότητα
- ανώτατο όριο
- Ενδέχεται..
- me
- νόημα
- μέσα
- μηχανισμός
- μηχανισμούς
- Εικόνες / Βίντεο
- Mediterranean
- που αναφέρθηκαν
- συγχώνευση
- ματιών
- Μεταδεδομένα
- μέθοδος
- Μεθοδολογία
- μέθοδοι
- Metrics
- Μέσο
- Μέση Ανατολή
- ενδέχεται να
- ελάχιστο
- ML
- MLOps
- μοντέλο
- μοντέλα
- Παρακολούθηση
- παρακολούθηση
- παρακολούθηση
- περισσότερο
- πιο αποτελεσματικό
- πλέον
- ως επί το πλείστον
- Motorsports
- μετακινήσετε
- μετακινηθεί
- κίνηση
- πολύ
- πολλαπλούς
- Μουσική
- πρέπει
- my
- όνομα
- Φυσικό
- Επεξεργασία φυσικής γλώσσας
- Φύση
- Πλοηγηθείτε
- απαραίτητος
- Ανάγκη
- που απαιτούνται
- ανάγκες
- αρνητικός
- δίκτυο
- νευρικό σύστημα
- Ουδέτερος
- ποτέ
- Νέα
- πρόσφατα
- επόμενη
- nlp
- Όχι.
- κανονικός
- Βόρειος
- αξιοσημείωτο
- αριθμός
- παρατηρούμε
- of
- προσφορά
- προσφέρονται
- συχνά
- on
- Επί του σκάφους
- ONE
- αυτά
- αποκλειστικά
- ανοίξτε
- ανοικτού κώδικα
- λειτουργίας
- λειτουργίες
- βέλτιστη
- Επιλογή
- Επιλογές
- or
- επιχειρήσεις
- οργανώσεις
- ΑΛΛΑ
- Άλλα
- αλλιώς
- δικός μας
- έξω
- Αποτέλεσμα
- παραγωγή
- επί
- φόρμες
- επισκόπηση
- δική
- ιδιοκτήτης
- ιδιοκτήτες
- πακέτο
- ζεύγη
- παράμετροι
- πρότυπα
- People
- για
- Εκτελέστε
- επίδοση
- εκτέλεση
- ίσως
- person
- προσωπικός
- Εξατομικευμένη
- προοπτική
- φάση
- Φωτογραφίες
- κομμάτι
- αγωγού
- Μέρος
- πλατφόρμες
- Πλάτων
- Πληροφορία δεδομένων Plato
- Πλάτωνα δεδομένα
- σας παρακαλούμε
- Σημείο
- σημεία
- Πολιτικές
- θετικός
- έχουν
- δυνατός
- Θέση
- Δημοσιεύσεις
- δυναμικού
- ενδεχομένως
- δύναμη
- ισχυρός
- Πρακτικός
- πρακτικές
- Ακρίβεια
- προβλέψει
- πρόβλεψη
- Προβλέψεις
- προετοιμασία
- Προετοιμάστε
- έτοιμος
- προετοιμασία
- παρουσιάζονται
- προηγούμενος
- προηγουμένως
- Ακμή
- πρωθυπουργός
- αρχές
- Πριν
- Δώστε προτεραιότητα
- μυστικότητα
- ιδιωτικός
- Πρόβλημα
- διαδικασια μας
- Διεργασίες
- μεταποίηση
- Παράγεται
- παραγωγός
- Προϊόν
- παραγωγή
- Προγραμματισμός
- σχέδιο
- email marketing
- απόδειξη
- απόδειξη της έννοιας
- προτείνω
- ιδιόκτητο
- Αποδείξτε
- παρέχουν
- παρέχεται
- προμηθευτής
- Παρόχους υπηρεσιών
- παρέχει
- χορήγηση
- σκοπός
- σκοποί
- ωθεί
- παζλ
- ποιότητα
- ερώτηση
- Ερωτήσεις
- Γρήγορα
- αυξήσεις
- σειρά
- κυμαίνεται
- ταχέως
- Τιμή
- μάλλον
- εκτίμηση
- Ανάγνωση
- σε πραγματικό χρόνο
- λόγος
- λαμβάνω
- συνιστώ
- Red
- Μειωμένος
- τελειοποίηση
- σχετικά με
- μητρώα
- μητρώου
- κανονισμοί
- σχετίζεται με
- κυκλοφόρησε
- συνάφεια
- αξιοπιστία
- λείψανα
- μακρινός
- αντικατασταθούν
- αναφέρουν
- Αποθήκη
- αντιπροσώπευση
- εκπρόσωπος
- ζητήσει
- αιτήματα
- απαιτείται
- απαιτήσεις
- Απαιτεί
- έρευνα
- ερευνητές
- Υποστηρικτικό υλικό
- αντίστοιχα
- απάντησης
- απαντήσεις
- υπεύθυνος
- ΠΕΡΙΦΕΡΕΙΑ
- περιορισμούς
- Περιοριστικός
- αποτέλεσμα
- Αποτελέσματα
- λιανική πώληση
- επαναχρησιμοποίηση
- ανασκόπηση
- αξιολόγηση
- ιππασία
- δεξιά
- οδικός χάρτης
- Ρόλος
- ρόλους
- περίπου
- γύρος
- τρέξιμο
- τρέξιμο
- σοφός
- ίδιο
- sandbox
- Κλίμακα
- απολέπιση
- σενάριο
- σενάρια
- Επιστήμη
- επιστήμονες
- σκορ
- μηδέν
- Εφαρμογές
- ΘΆΛΑΣΣΑ
- Τμήμα
- τμήματα
- τομέας
- προστατευμένο περιβάλλον
- ασφαλώς
- ασφάλεια
- πολιτικές ασφάλειας
- δείτε
- αναζήτηση
- επιλέγονται
- επιλογή
- επιλογή
- αποστολή
- αρχαιότερος
- αποστέλλονται
- συναίσθημα
- ξεχωριστό
- Ακολουθία
- Σειρές
- εξυπηρετούν
- υπηρεσία
- Υπηρεσίες
- εξυπηρετούν
- σειρά
- διάφοροι
- διάπλαση
- Κοινοποίηση
- Shared
- πλοία
- Κοντά
- θα πρέπει να
- παρουσιάζεται
- Δείχνει
- πλευρά
- σημαντικός
- σημαντικά
- παρόμοιες
- απλοποίηση
- Μέγεθος
- δεξιότητες
- small
- μικρότερος
- ΜΜΕ
- So
- λύση
- Λύσεις
- SOLVE
- μερικοί
- Πηγή
- πρωτογενής κώδικας
- Πηγές
- Χώρος
- ειδική
- ειδικός
- ειδικευμένος
- συγκεκριμένες
- ειδικά
- ταχύτητα
- δαπανήσει
- πέρασε
- Στάδιο
- στάδια
- ενδιαφερόμενα μέρη
- πρότυπο
- τυποποίηση
- Εκκίνηση
- Κατάσταση
- Βήμα
- Βήματα
- κατάστημα
- αποθηκεύονται
- εναποθήκευση
- Ιστορία
- δυνατά
- ισχυρός
- Ακολούθως
- επιτυχής
- τέτοιος
- προτείνω
- επιτηδειότητα
- κατάλληλος
- συνοψίζω
- ΠΕΡΙΛΗΨΗ
- υποστήριξη
- υποστηριζόνται!
- υποτιθεμένος
- βέβαιος
- SWIFT
- σύστημα
- τραπέζι
- Πάρτε
- Έργο
- εργασίες
- ομάδες
- Τεχνικός
- τεχνικές
- Τεχνολογίες
- Τεχνολογία
- όροι
- δοκιμή
- δοκιμαστεί
- δοκιμαστές
- Δοκιμές
- από
- ότι
- Η
- Το μέλλον
- Η Πηγη
- το Ηνωμένο Βασίλειο
- ο κόσμος
- τους
- Τους
- τους
- τότε
- Εκεί.
- επομένως
- Αυτοί
- αυτοί
- πράγματα
- Σκέψη
- τρίτους
- αυτό
- εκείνοι
- αν και?
- σκέψη
- χιλιάδες
- τρία
- ώρα
- προς την
- μαζι
- ένδειξη
- κουπόνια
- κορυφή
- Θέματα
- προς
- εμπόριο
- παραδοσιακός
- Τρένο
- εκπαιδευμένο
- Εκπαίδευση
- Μεταμορφώστε
- Μεταμόρφωση
- ταξίδι
- Ταξιδεύει
- τάση
- ενεργοποιούν
- αληθής
- Αλήθεια
- προσπαθώ
- δύο
- τύπος
- τύποι
- συνήθως
- ui
- Uk
- καταλαβαίνω
- κατανόηση
- μονάδα
- μονάδες
- ενημερώσεις
- Ανέβασμα
- us
- χρησιμοποιήσιμος
- Χρήση
- χρήση
- περίπτωση χρήσης
- μεταχειρισμένος
- Χρήστες
- Χρήστες
- χρησιμοποιεί
- χρησιμοποιώντας
- επιχειρήσεις κοινής ωφέλειας
- χρησιμοποιούνται
- διάφορα
- επαληθεύει
- εκδοχή
- Εναντίον
- κατακόρυφος
- μέσω
- βιώσιμος
- φαντάζομαι
- vs
- θέλω
- ήταν
- we
- ιστός
- διαδικτυακές υπηρεσίες
- Ιστοσελίδα : www.example.gr
- ΛΟΙΠΌΝ
- Τι
- Τι είναι
- πότε
- ενώ
- αν
- Ποιό
- ενώ
- Ο ΟΠΟΊΟΣ
- ευρύς
- Ευρύ φάσμα
- θα
- παράθυρο
- παράθυρα
- με
- εντός
- χωρίς
- λέξη
- λόγια
- Εργασία
- συνεργαστούν
- εργάστηκαν
- εργαζόμενος
- λειτουργεί
- κόσμος
- θα
- χρόνια
- Βελτιστοποίηση
- Εσείς
- Σας
- zephyrnet