«Τα δεδομένα που κλειδώνονται σε κείμενο, ήχο, μέσα κοινωνικής δικτύωσης και άλλες μη δομημένες πηγές μπορούν να αποτελέσουν ανταγωνιστικό πλεονέκτημα για τις εταιρείες που καταλαβαίνουν πώς να τα χρησιμοποιήσουν».
Μόνο το 18% των οργανισμών σε α Έρευνα 2019 από την Deloitte ανέφερε ότι είναι σε θέση να επωφεληθεί από μη δομημένα δεδομένα. Η πλειοψηφία των δεδομένων, μεταξύ 80% και 90%, είναι μη δομημένα δεδομένα. Αυτός είναι ένας μεγάλος αναξιοποίητος πόρος που έχει τη δυνατότητα να δώσει στις επιχειρήσεις ανταγωνιστικό πλεονέκτημα εάν μπορούν να μάθουν πώς να τον χρησιμοποιήσουν. Μπορεί να είναι δύσκολο να βρείτε πληροφορίες από αυτά τα δεδομένα, ιδιαίτερα εάν απαιτούνται προσπάθειες για την ταξινόμηση, την προσθήκη ετικετών ή την επισήμανση τους. Κατανοήστε το Amazon Η προσαρμοσμένη ταξινόμηση μπορεί να είναι χρήσιμη σε αυτήν την περίπτωση. Κατανοήστε το Amazon είναι μια υπηρεσία επεξεργασίας φυσικής γλώσσας (NLP) που χρησιμοποιεί μηχανική εκμάθηση για να αποκαλύψει πολύτιμες πληροφορίες και συνδέσεις σε κείμενο.
Η κατηγοριοποίηση ή ταξινόμηση εγγράφων έχει σημαντικά οφέλη σε όλους τους επιχειρηματικούς τομείς –
- Βελτιωμένη αναζήτηση και ανάκτηση – Με την κατηγοριοποίηση των εγγράφων σε σχετικά θέματα ή κατηγορίες, διευκολύνει πολύ τους χρήστες να αναζητήσουν και να ανακτήσουν τα έγγραφα που χρειάζονται. Μπορούν να κάνουν αναζήτηση σε συγκεκριμένες κατηγορίες για να περιορίσουν τα αποτελέσματα.
- Διαχείριση γνώσης – Η κατηγοριοποίηση των εγγράφων με συστηματικό τρόπο βοηθά στην οργάνωση της βάσης γνώσεων ενός οργανισμού. Διευκολύνει τον εντοπισμό σχετικών πληροφοριών και την προβολή συνδέσεων μεταξύ σχετικού περιεχομένου.
- Βελτιωμένες ροές εργασίας – Η αυτόματη ταξινόμηση εγγράφων μπορεί να βοηθήσει στον εξορθολογισμό πολλών επιχειρηματικών διαδικασιών, όπως η επεξεργασία τιμολογίων, η υποστήριξη πελατών ή η συμμόρφωση με τους κανονισμούς. Τα έγγραφα μπορούν να δρομολογηθούν αυτόματα στα σωστά άτομα ή ροές εργασίας.
- Εξοικονόμηση κόστους και χρόνου – Η μη αυτόματη ταξινόμηση εγγράφων είναι κουραστική, χρονοβόρα και δαπανηρή. Οι τεχνικές τεχνητής νοημοσύνης μπορούν να αναλάβουν αυτό το εγκόσμιο έργο και να κατηγοριοποιήσουν χιλιάδες έγγραφα σε σύντομο χρονικό διάστημα με πολύ χαμηλότερο κόστος.
- Γενιά ενόρασης – Η ανάλυση των τάσεων στις κατηγορίες εγγράφων μπορεί να προσφέρει χρήσιμες επιχειρηματικές πληροφορίες. Για παράδειγμα, μια αύξηση στα παράπονα πελατών σε μια κατηγορία προϊόντων θα μπορούσε να σημαίνει ορισμένα ζητήματα που πρέπει να αντιμετωπιστούν.
- Διακυβέρνηση και επιβολή πολιτικών – Η ρύθμιση κανόνων κατηγοριοποίησης εγγράφων βοηθά στη διασφάλιση της σωστής ταξινόμησης των εγγράφων σύμφωνα με τις πολιτικές και τα πρότυπα διακυβέρνησης ενός οργανισμού. Αυτό επιτρέπει την καλύτερη παρακολούθηση και έλεγχο.
- Εξατομικευμένες εμπειρίες – Σε περιβάλλοντα όπως το περιεχόμενο ιστότοπου, η κατηγοριοποίηση εγγράφων επιτρέπει την εμφάνιση προσαρμοσμένου περιεχομένου στους χρήστες με βάση τα ενδιαφέροντα και τις προτιμήσεις τους, όπως καθορίζεται από τη συμπεριφορά περιήγησής τους. Αυτό μπορεί να αυξήσει την αφοσίωση των χρηστών.
Η πολυπλοκότητα της ανάπτυξης ενός μοντέλου μηχανικής εκμάθησης κατά παραγγελία ταξινόμησης ποικίλλει ανάλογα με μια ποικιλία πτυχών όπως η ποιότητα των δεδομένων, ο αλγόριθμος, η επεκτασιμότητα και η γνώση τομέα, για να αναφέρουμε μερικές. Είναι σημαντικό να ξεκινήσετε με έναν σαφή ορισμό του προβλήματος, καθαρά και σχετικά δεδομένα και σταδιακά να εργαστείτε στα διάφορα στάδια ανάπτυξης του μοντέλου. Ωστόσο, οι επιχειρήσεις μπορούν να δημιουργήσουν τα δικά τους μοναδικά μοντέλα μηχανικής εκμάθησης χρησιμοποιώντας προσαρμοσμένη ταξινόμηση Amazon Comprehend για αυτόματη ταξινόμηση εγγράφων κειμένου σε κατηγορίες ή ετικέτες, για να ανταποκρίνονται στις συγκεκριμένες απαιτήσεις της επιχείρησης και να αντιστοιχίζονται σε επιχειρηματική τεχνολογία και κατηγορίες εγγράφων. Καθώς η επισήμανση ή η κατηγοριοποίηση του ανθρώπου δεν είναι πλέον απαραίτητη, αυτό μπορεί να εξοικονομήσει πολύ χρόνο, χρήμα και εργασία στις επιχειρήσεις. Κάναμε αυτή τη διαδικασία απλή αυτοματοποιώντας ολόκληρο τον αγωγό εκπαίδευσης.
Στο πρώτο μέρος αυτής της ανάρτησης ιστολογίου πολλών σειρών, θα μάθετε πώς να δημιουργείτε μια κλιμακούμενη διοχέτευση εκπαίδευσης και να προετοιμάζετε δεδομένα εκπαίδευσης για μοντέλα Comprehend Custom Classification. Θα εισαγάγουμε μια προσαρμοσμένη γραμμή εκπαίδευσης ταξινομητή που μπορεί να αναπτυχθεί στον λογαριασμό σας AWS με λίγα κλικ. Χρησιμοποιούμε το σύνολο δεδομένων ειδήσεων του BBC και θα εκπαιδεύσουμε έναν ταξινομητή για να προσδιορίσει την τάξη (π.χ. πολιτική, αθλητική) στην οποία ανήκει ένα έγγραφο. Ο αγωγός θα επιτρέψει στον οργανισμό σας να ανταποκρίνεται γρήγορα στις αλλαγές και να εκπαιδεύει νέα μοντέλα χωρίς να χρειάζεται να ξεκινά από το μηδέν κάθε φορά. Μπορείτε να αναβαθμίσετε και να εκπαιδεύσετε πολλά μοντέλα με βάση τη ζήτηση σας εύκολα.
Προϋποθέσεις
- Ένας ενεργός λογαριασμός AWS (Κάντε κλικ εδώ για να δημιουργήσετε έναν νέο λογαριασμό AWS)
- Πρόσβαση στο Amazon Comprehend, Amazon S3, Amazon Lambda, Amazon Step Function, Amazon SNS και Amazon CloudFormation
- Δεδομένα εκπαίδευσης (ημιδομή ή κείμενο) που προετοιμάζονται στην επόμενη ενότητα
- Βασικές γνώσεις για την Python και τη Μηχανική Μάθηση γενικότερα
Προετοιμάστε δεδομένα εκπαίδευσης
Αυτή η λύση μπορεί να λάβει είσοδο ως οποιαδήποτε μορφή κειμένου (π.χ. CSV) ή ημιδομημένη μορφή (π.χ. PDF).
Εισαγωγή κειμένου
Κατανοήστε το Amazon Η προσαρμοσμένη ταξινόμηση υποστηρίζει δύο λειτουργίες: multi-class και multi-label.
Σε λειτουργία πολλαπλών κλάσεων, κάθε έγγραφο μπορεί να έχει μία και μόνο μία κλάση που του έχει εκχωρηθεί. Τα δεδομένα εκπαίδευσης θα πρέπει να προετοιμαστούν ως αρχείο CSV δύο στηλών με κάθε γραμμή του αρχείου να περιέχει μία κλάση και το κείμενο ενός εγγράφου που δείχνει την κλάση.
Παράδειγμα για Δεδομένα ειδήσεων του BBC:
Στη λειτουργία πολλαπλών ετικετών, κάθε έγγραφο έχει τουλάχιστον μία κλάση που του έχει εκχωρηθεί, αλλά μπορεί να έχει περισσότερες. Τα δεδομένα εκπαίδευσης πρέπει να είναι ένα αρχείο CSV δύο στηλών, το οποίο κάθε γραμμή του αρχείου περιέχει μία ή περισσότερες κλάσεις και το κείμενο του εκπαιδευτικού εγγράφου. Περισσότερες από μία κλάσεις πρέπει να υποδεικνύονται χρησιμοποιώντας έναν οριοθέτη μεταξύ κάθε κλάσης.
Δεν πρέπει να περιλαμβάνεται κεφαλίδα στο αρχείο CSV για καμία από τις λειτουργίες εκπαίδευσης.
Ημιδομημένη είσοδος
Από το 2023, Κατανοήστε το Amazon υποστηρίζει πλέον μοντέλα εκπαίδευσης που χρησιμοποιούν ημι-δομημένα έγγραφα. Τα δεδομένα εκπαίδευσης για την εισαγωγή ημι-δομής αποτελούνται από ένα σύνολο εγγράφων με ετικέτα, τα οποία μπορούν να είναι προκαθορισμένα έγγραφα από ένα χώρο αποθήκευσης εγγράφων στον οποίο έχετε ήδη πρόσβαση. Το παρακάτω είναι ένα παράδειγμα ενός αρχείου σχολιασμών δεδομένων CSV που απαιτούνται για εκπαίδευση (Δειγμα δεδομένων):
Το αρχείο CSV σχολιασμών περιέχει τρεις στήλες: Η πρώτη στήλη περιέχει την ετικέτα για το έγγραφο, η δεύτερη στήλη είναι το όνομα του εγγράφου (δηλ. όνομα αρχείου) και η τελευταία στήλη είναι ο αριθμός σελίδας του εγγράφου που θέλετε να συμπεριλάβετε στο σύνολο δεδομένων εκπαίδευσης. Στις περισσότερες περιπτώσεις, εάν το αρχείο CSV σχολιασμών βρίσκεται στον ίδιο φάκελο με όλα τα άλλα έγγραφα, τότε απλώς πρέπει να καθορίσετε το όνομα του εγγράφου στη δεύτερη στήλη. Ωστόσο, εάν το αρχείο CSV βρίσκεται σε διαφορετική θέση, τότε θα πρέπει να καθορίσετε τη διαδρομή προς την τοποθεσία στη δεύτερη στήλη, όπως π.χ. path/to/prefix/document1.pdf
.
Για λεπτομέρειες, πώς να προετοιμάσετε τα δεδομένα προπόνησής σας, ανατρέξτε στο εδώ.
Επισκόπηση λύσεων
- Κατανοήστε το Amazon Η διοχέτευση εκπαίδευσης ξεκινά όταν τα δεδομένα εκπαίδευσης (αρχείο .csv για εισαγωγή κειμένου και σχολιασμός αρχείο .csv για εισαγωγή ημι-δομής) μεταφορτώνονται σε μια αποκλειστική υπηρεσία απλής αποθήκευσης της Amazon (Amazon S3) κουβά.
- An AWS Lambda η λειτουργία καλείται από Amazon S3 ενεργοποίηση έτσι ώστε κάθε φορά που ένα αντικείμενο μεταφορτώνεται σε καθορισμένο Amazon S3 τοποθεσία, η συνάρτηση AWS Lambda ανακτά το όνομα του κάδου προέλευσης και το όνομα κλειδιού του μεταφορτωμένου αντικειμένου και το μεταβιβάζει στην εκπαίδευση λειτουργία βήματος ροή εργασίας.
- Στη συνάρτηση βήματος εκπαίδευσης, αφού λάβετε το όνομα του κάδου δεδομένων εκπαίδευσης και το όνομα κλειδιού αντικειμένου ως παραμέτρους εισόδου, ξεκινά μια προσαρμοσμένη ροή εργασίας εκπαίδευσης μοντέλου ως μια σειρά από λειτουργίες λάμδα όπως περιγράφεται:
StartComprehendTraining
: Αυτή η συνάρτηση AWS Lambda ορίζει αComprehendClassifier
αντικείμενο ανάλογα με τον τύπο των αρχείων εισαγωγής (δηλαδή, κείμενο ή ημι-δομημένο) και στη συνέχεια ξεκινά ένα Κατανοήστε το Amazon Προσαρμοσμένη εργασία εκπαίδευσης ταξινόμησης καλώντας create_document_classifier Διασύνδεση προγραμματισμού εφαρμογών (API), που επιστρέφει μια εκπαιδευτική εργασία Ονόματα πόρων Amazon (ARN) . Στη συνέχεια, αυτή η λειτουργία ελέγχει την κατάσταση της εργασίας εκπαίδευσης με επίκληση describe_document_classifier API. Τέλος, επιστρέφει ένα εκπαιδευτικό Job ARN και την κατάσταση εργασίας, ως έξοδο στο επόμενο στάδιο της ροής εργασιών εκπαίδευσης.GetTrainingJobStatus
: Αυτό το AWS Lambda ελέγχει την κατάσταση εργασίας της εργασίας εκπαίδευσης κάθε 15 λεπτά, καλώντας describe_document_classifier API, έως ότου η κατάσταση της εργασίας εκπαίδευσης αλλάξει σε Ολοκληρώθηκε ή Απέτυχε.GenerateMultiClass
orGenerateMultiLabel
: Αν επιλέξετε Ναί για αναφορά απόδοσης κατά την εκκίνηση της στοίβας, ένα από αυτά τα δύο AWS Lambda θα εκτελέσει ανάλυση σύμφωνα με τις εξόδους του μοντέλου Amazon Comprehend, το οποίο δημιουργεί ανάλυση απόδοσης ανά κατηγορία και το αποθηκεύει στο Amazon S3.GenerateMultiClass
: Αυτό το AWS Lambda θα κληθεί εάν η εισαγωγή σας είναι MultiClass και επιλέγεις Ναί για την έκθεση απόδοσης.GenerateMultiLabel
: Αυτό το AWS Lambda θα κληθεί εάν η εισαγωγή σας είναι MultiLabel και επιλέγεις Ναί για την έκθεση απόδοσης.
- Μόλις ολοκληρωθεί με επιτυχία η εκπαίδευση, η λύση παράγει τα ακόλουθα αποτελέσματα:
- Μοντέλο προσαρμοσμένης ταξινόμησης: Ένα εκπαιδευμένο μοντέλο ARN θα είναι διαθέσιμο στον λογαριασμό σας για μελλοντικές εργασίες συμπερασμάτων.
- Μήτρα σύγχυσης [Επιλογήl]: Ένας πίνακας σύγχυσης (
confusion_matrix
.json) θα είναι διαθέσιμο σε έξοδο που ορίζεται από το χρήστη Amazon S3 διαδρομή, ανάλογα με την επιλογή του χρήστη. - Υπηρεσία απλών ειδοποιήσεων Amazon Γνωστοποίηση [Επιλογήl]: Θα σταλεί ένα μήνυμα ηλεκτρονικού ταχυδρομείου ειδοποίησης σχετικά με την κατάσταση της εργασίας εκπαίδευσης στους συνδρομητές, ανάλογα με την αρχική επιλογή του χρήστη.
Walkthrough
Εκκίνηση της λύσης
Για να αναπτύξετε τη διοχέτευσή σας, ολοκληρώστε τα ακόλουθα βήματα:
- Επιλέξτε Εκκίνηση στοίβας κουμπί:
- Επιλέξτε Επόμενο
- Καθορίστε τις λεπτομέρειες του αγωγού με τις επιλογές που ταιριάζουν στην περίπτωση χρήσης σας:
Πληροφορίες για κάθε λεπτομέρεια στοίβας:
- Όνομα στοίβας (Απαιτείται) – το όνομα που καθορίσατε για αυτό AWS CloudFormation σωρός. Το όνομα πρέπει να είναι μοναδικό στην περιοχή στην οποία το δημιουργείτε.
- Q01ClassifierInputBucketName (Απαιτείται) – Το όνομα του κάδου Amazon S3 για την αποθήκευση των δεδομένων εισόδου σας. Θα πρέπει να είναι ένα παγκοσμίως μοναδικό όνομα και η στοίβα AWS CloudFormation σάς βοηθά να δημιουργήσετε τον κάδο ενώ εκκινείται.
- Q02ClassifierOutputBucketName (Απαιτείται) – Το όνομα του κάδου Amazon S3 για την αποθήκευση των αποτελεσμάτων από το Amazon Comprehend και το pipeline. Θα πρέπει επίσης να είναι ένα παγκοσμίως μοναδικό όνομα.
- Q03InputFormat – Μια αναπτυσσόμενη επιλογή, μπορείτε να επιλέξετε κείμενο (εάν τα δεδομένα εκπαίδευσης σας είναι αρχεία csv) ή ημιδομή (εάν τα δεδομένα προπόνησής σας είναι ημι-δομικά [π.χ. αρχεία PDF]) με βάση τη μορφή εισαγωγής δεδομένων σας.
- Q04 Γλώσσα – Μια αναπτυσσόμενη επιλογή, επιλέγοντας τη γλώσσα των εγγράφων από τη λίστα που υποστηρίζεται. Λάβετε υπόψη ότι προς το παρόν υποστηρίζονται μόνο τα Αγγλικά εάν η μορφή εισόδου σας είναι ημι-δομική.
- Q05 MultiClass – Μια αναπτυσσόμενη επιλογή, επιλέξτε Ναί εάν η εισαγωγή σας είναι λειτουργία MultiClass. Διαφορετικά, επιλέξτε Όχι..
- Q06Οριοθέτης ετικέτας – Απαιτείται μόνο εάν η απάντησή σας στο Q05 MultiClass είναι Όχι.. Αυτός ο οριοθέτης χρησιμοποιείται στα δεδομένα εκπαίδευσης για τον διαχωρισμό κάθε κλάσης.
- Q07ValidationDataset – Μια αναπτυσσόμενη επιλογή, αλλάξτε την απάντηση σε Ναί εάν θέλετε να δοκιμάσετε την απόδοση του εκπαιδευμένου ταξινομητή με τα δικά σας δεδομένα δοκιμής.
- Q08S3ValidationPath – Απαιτείται μόνο εάν η απάντηση Q07ValidationDataset είναι Ναί.
- Ε09Αναφορά απόδοσης – Μια αναπτυσσόμενη επιλογή, επιλέξτε Ναί εάν θέλετε να δημιουργήσετε την αναφορά απόδοσης σε επίπεδο τάξης μετά την εκπαίδευση μοντέλου. Η αναφορά θα αποθηκευτεί στον κάδο εξόδου που έχετε καθορίσει στο Q02ClassifierOutputBucketName.
- Q10Ειδοποίηση Email – Μια αναπτυσσόμενη επιλογή. Επιλέγω Ναί εάν θέλετε να λαμβάνετε ειδοποίηση μετά την εκπαίδευση του μοντέλου.
- Q11 Αναγνωριστικό email – Εισαγάγετε έγκυρη διεύθυνση email για τη λήψη ειδοποίησης αναφοράς απόδοσης. Λάβετε υπόψη ότι πρέπει να επιβεβαιώσετε τη συνδρομή από το email σας μετά την εκκίνηση της στοίβας AWS CloudFormation, για να μπορέσετε να λάβετε ειδοποίηση όταν ολοκληρωθεί η εκπαίδευση.
- Στην ενότητα Amazon Configure stack options, προσθέστε προαιρετικές ετικέτες, δικαιώματα και άλλες σύνθετες ρυθμίσεις.
- Επιλέξτε Επόμενο
- Ελέγξτε τις λεπτομέρειες της στοίβας και επιλέξτε Το αναγνωρίζω AWS CloudFormation μπορεί να δημιουργήσει AWS IAM πόροι.
- Επιλέξτε Υποβολη. Αυτό ξεκινά την ανάπτυξη διοχέτευσης στον λογαριασμό σας AWS.
- Μετά την επιτυχή ανάπτυξη της στοίβας, μπορείτε να αρχίσετε να χρησιμοποιείτε τη διοχέτευση. Δημιουργώ ένα
/training-data
φάκελο κάτω από την καθορισμένη θέση Amazon S3 για εισαγωγή. Σημείωση: Amazon S3 εφαρμόζει αυτόματα κρυπτογράφηση διακομιστή (SSE-S3) για κάθε νέο αντικείμενο, εκτός εάν καθορίσετε διαφορετική επιλογή κρυπτογράφησης. Παρακαλώ αναφερθείτε Προστασία δεδομένων στο Amazon S3 για περισσότερες λεπτομέρειες σχετικά με την προστασία δεδομένων και την κρυπτογράφηση στο Amazon S3.
- Ανεβάστε τα δεδομένα της προπόνησής σας στο φάκελο. (Εάν τα δεδομένα εκπαίδευσης είναι ημι-δομικά, τότε μεταφορτώστε όλα τα αρχεία PDF πριν ανεβάσετε πληροφορίες ετικέτας σε μορφή .csv).
Τελείωσες! Αναπτύξατε με επιτυχία τη διοχέτευσή σας και μπορείτε να ελέγξετε την κατάσταση του αγωγού στη λειτουργία αναπτυγμένου βήματος. (Θα έχετε ένα εκπαιδευμένο μοντέλο στον προσαρμοσμένο πίνακα ταξινόμησης του Amazon Comprehend).
Εάν επιλέξετε το μοντέλο και την έκδοσή του μέσα Κατανοήστε το Amazon Κονσόλα, τότε μπορείτε πλέον να δείτε περισσότερες λεπτομέρειες σχετικά με το μοντέλο που μόλις εκπαιδεύσατε. Περιλαμβάνει τη λειτουργία που επιλέγετε, η οποία αντιστοιχεί στην επιλογή Q05MultiClass, τον αριθμό των ετικετών και τον αριθμό των εκπαιδευμένων και δοκιμαστικών εγγράφων μέσα στα δεδομένα εκπαίδευσης σας. Μπορείτε επίσης να ελέγξετε τη συνολική απόδοση παρακάτω. Ωστόσο, εάν θέλετε να ελέγξετε τη λεπτομερή απόδοση για κάθε κλάση, τότε ανατρέξτε στην Αναφορά απόδοσης που δημιουργήθηκε από τον αναπτυγμένο αγωγό.
ποσοστώσεις υπηρεσιών
Ο λογαριασμός σας AWS έχει προεπιλεγμένα όρια για Κατανοήστε το Amazon και AmazonTextract, εάν οι είσοδοι είναι σε μορφή ημι-δομής. Για να δείτε τα ποσοστά υπηρεσιών, ανατρέξτε εδώ for Κατανοήστε το Amazon και εδώ for AmazonTextract.
εκκαθάριση
Για να αποφύγετε τις τρέχουσες χρεώσεις, διαγράψτε τους πόρους που δημιουργήσατε ως μέρος αυτής της λύσης όταν τελειώσετε.
- Στις Amazon S3 κονσόλα, διαγράψτε μη αυτόματα τα περιεχόμενα μέσα στους κάδους που δημιουργήσατε για δεδομένα εισόδου και εξόδου.
- Στις AWS CloudFormation κονσόλα, επιλέξτε Στοίβες στο παράθυρο πλοήγησης.
- Επιλέξτε την κύρια στοίβα και επιλέξτε Διαγραφή.
Αυτό διαγράφει αυτόματα την αναπτυγμένη στοίβα.
- Είσαι εκπαιδευμένος Κατανοήστε το Amazon Το προσαρμοσμένο μοντέλο ταξινόμησης θα παραμείνει στον λογαριασμό σας. Αν δεν το χρειάζεστε πια, μέσα Κατανοήστε το Amazon κονσόλα, διαγράψτε το μοντέλο που δημιουργήθηκε.
Συμπέρασμα
Σε αυτήν την ανάρτηση, σας δείξαμε την ιδέα ενός κλιμακούμενου αγωγού εκπαίδευσης για Κατανοήστε το Amazon προσαρμοσμένα μοντέλα ταξινόμησης και παροχή μιας αυτοματοποιημένης λύσης για την αποτελεσματική εκπαίδευση νέων μοντέλων. ο AWS CloudFormation Το παρεχόμενο πρότυπο σάς δίνει τη δυνατότητα να δημιουργήσετε τα δικά σας μοντέλα ταξινόμησης κειμένου χωρίς κόπο, καλύπτοντας τις κλίμακες ζήτησης. Η λύση υιοθετεί το χαρακτηριστικό Ευκλείδη που ανακοινώθηκε πρόσφατα και δέχεται εισόδους σε μορφή κειμένου ή ημιδομημένης μορφής.
Τώρα, σας ενθαρρύνουμε, τους αναγνώστες μας, να δοκιμάσετε αυτά τα εργαλεία. Μπορείτε να βρείτε περισσότερες λεπτομέρειες για προετοιμασία δεδομένων εκπαίδευσης και κατανοήστε το προσαρμοσμένες μετρήσεις ταξινομητή. Δοκιμάστε το και δείτε από πρώτο χέρι πώς μπορεί να βελτιστοποιήσει τη διαδικασία εκπαίδευσης του μοντέλου σας και να βελτιώσει την αποτελεσματικότητα. Μοιραστείτε μας τα σχόλιά σας!
Σχετικά με τους Συγγραφείς
Sandeep Singh είναι Senior Data Scientist με AWS Professional Services. Είναι παθιασμένος με το να βοηθά τους πελάτες να καινοτομούν και να επιτύχουν τους επιχειρηματικούς τους στόχους αναπτύσσοντας σύγχρονες λύσεις που υποστηρίζονται από AI/ML. Αυτήν τη στιγμή επικεντρώνεται στην Generative AI, τα LLMs, την άμεση μηχανική και την κλιμάκωση της Machine Learning σε όλες τις επιχειρήσεις. Φέρνει πρόσφατες εξελίξεις AI για να δημιουργήσει αξία για τους πελάτες.
Yanyan Zhang είναι Senior Data Scientist στην ομάδα Energy Delivery με τις AWS Professional Services. Είναι παθιασμένη να βοηθά τους πελάτες να λύσουν πραγματικά προβλήματα με τη γνώση AI/ML. Πρόσφατα, η εστίασή της ήταν στην εξερεύνηση των δυνατοτήτων του Generative AI και LLM. Εκτός δουλειάς, της αρέσει να ταξιδεύει, να γυμνάζεται και να εξερευνά νέα πράγματα.
Γράφω Talukdar είναι Senior Architect με την ομάδα Amazon Comprehend Service. Συνεργάζεται με πελάτες AWS για να τους βοηθήσει να υιοθετήσουν τη μηχανική εκμάθηση σε μεγάλη κλίμακα. Εκτός δουλειάς, του αρέσει το διάβασμα και η φωτογραφία.
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
- PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- PlatoESG. Αυτοκίνητο / EVs, Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
- PlatoHealth. Ευφυΐα βιοτεχνολογίας και κλινικών δοκιμών. Πρόσβαση εδώ.
- ChartPrime. Ανεβάστε το Trading Game σας με το ChartPrime. Πρόσβαση εδώ.
- BlockOffsets. Εκσυγχρονισμός της περιβαλλοντικής αντιστάθμισης ιδιοκτησίας. Πρόσβαση εδώ.
- πηγή: https://aws.amazon.com/blogs/machine-learning/build-a-classification-pipeline-with-amazon-comprehend-custom-classification-part-i/
- :έχει
- :είναι
- $UP
- 1
- 100
- 11
- 15%
- 2023
- 24
- 26%
- 7
- 9
- a
- Ικανός
- Σχετικα
- Αποδέχεται
- πρόσβαση
- Σύμφωνα με
- Λογαριασμός
- Κατορθώνω
- αναγνωρίζω
- απέναντι
- ενεργός
- προσθέτω
- διεύθυνση
- απευθύνεται
- ενστερνίζομαι
- προηγμένες
- εξελίξεις
- Πλεονέκτημα
- Μετά το
- AI
- AI / ML
- αλγόριθμος
- Όλα
- επιτρέπει
- ήδη
- Επίσης
- Amazon
- Κατανοήστε το Amazon
- Amazon υπηρεσίες Web
- an
- ανάλυση
- αναλύοντας
- και
- ανακοίνωσε
- απάντηση
- πια
- api
- Εφαρμογή
- ισχύει
- ΕΙΝΑΙ
- AS
- πτυχές
- ανατεθεί
- At
- ήχου
- λογιστικού ελέγχου
- Αυτοματοποιημένη
- Αυτόματο
- αυτομάτως
- αυτοματοποίηση
- διαθέσιμος
- αποφύγετε
- μακριά
- AWS
- AWS CloudFormation
- AWS Lambda
- Επαγγελματικές υπηρεσίες AWS
- βάση
- βασίζονται
- bbc
- BE
- ήταν
- πριν
- συμπεριφορά
- είναι
- ανήκει
- παρακάτω
- οφέλη
- προπαραγγελία
- Καλύτερα
- μεταξύ
- Μεγάλος
- Μπλοκ
- Φέρνει
- Περιήγηση
- χτίζω
- επιχείρηση
- επιχειρήσεις
- αλλά
- κουμπί
- by
- που ονομάζεται
- κλήση
- CAN
- περίπτωση
- περιπτώσεις
- κατηγορίες
- κατηγοριοποιώντας
- κατηγορία
- αλλαγή
- Αλλαγές
- φορτία
- έλεγχος
- έλεγχοι
- Επιλέξτε
- επιλέγοντας
- τάξη
- τάξεις
- ταξινόμηση
- ταξινομούνται
- Ταξινόμηση
- καθαρός
- κλικ
- συλλέγουν
- Στήλη
- Στήλες
- ανταγωνιστική
- παραπόνων
- πλήρης
- Ολοκληρώθηκε το
- περίπλοκο
- Συμμόρφωση
- κατανοώ
- Αποτελείται
- έννοια
- Επιβεβαιώνω
- σύγχυση
- Διασυνδέσεις
- πρόξενος
- Περιέχει
- περιεχόμενο
- περιεχόμενα
- πλαίσια
- αντιστοιχεί
- Κόστος
- θα μπορούσε να
- δημιουργία
- Δημιουργία αξίας
- δημιουργήθηκε
- δημιουργία
- Τη στιγμή
- έθιμο
- πελάτης
- Εξυπηρέτηση πελατών
- Πελάτες
- ημερομηνία
- την προστασία των δεδομένων
- επιστήμονας δεδομένων
- αφιερωμένο
- Προεπιλογή
- ορίζεται
- Ορίζει
- ορισμός
- διανομή
- Deloitte
- Ζήτηση
- καταδεικνύει
- Σε συνάρτηση
- παρατάσσω
- αναπτυχθεί
- ανάπτυξη
- περιγράφεται
- λεπτομέρεια
- λεπτομερής
- καθέκαστα
- αποφασισμένος
- ανάπτυξη
- Ανάπτυξη
- διαφορετικές
- δύσκολος
- έγγραφο
- έγγραφα
- Δολάριο
- τομέα
- domains
- γίνεται
- Μην
- κάτω
- e
- κάθε
- ευκολότερη
- εύκολα
- άκρη
- αποδοτικότητα
- αποτελεσματικά
- αβίαστα
- προσπάθειες
- είτε
- ΗΛΕΚΤΡΟΝΙΚΗ ΔΙΕΥΘΥΝΣΗ
- ενεργοποιήσετε
- ενθαρρύνει
- κρυπτογράφηση
- ενέργεια
- δέσμευση
- Μηχανική
- Αγγλικά
- ενίσχυση
- εξασφαλίζω
- εισάγετε
- επιχειρήσεις
- ουσιώδης
- Ευρώπη
- Κάθε
- παράδειγμα
- ακριβά
- Εξερευνώντας
- Απέτυχε
- Χαρακτηριστικό
- ανατροφοδότηση
- λίγοι
- Εικόνα
- Αρχεία
- Αρχεία
- Τελικά
- Εύρεση
- επιχειρήσεις
- Όνομα
- προσαρμογή
- Συγκέντρωση
- επικεντρώθηκε
- Εξής
- Για
- μορφή
- από
- λειτουργία
- λειτουργίες
- μελλοντικός
- παράγουν
- παράγεται
- δημιουργεί
- γενετική
- Παραγωγική τεχνητή νοημοσύνη
- Δώστε
- Παγκόσμια
- διακυβέρνησης
- σταδιακά
- Έχω
- που έχει
- he
- βοήθεια
- βοήθεια
- βοηθά
- αυτήν
- Πως
- Πώς να
- Ωστόσο
- HTML
- HTTPS
- ανθρώπινος
- i
- προσδιορίσει
- if
- in
- περιλαμβάνουν
- περιλαμβάνονται
- περιλαμβάνει
- Αυξάνουν
- υποδεικνύεται
- πληροφορίες
- αρχικός
- Αρχίζει
- νεωτερίζω
- εισαγωγή
- είσοδοι
- μέσα
- ιδέες
- συμφέροντα
- σε
- εισαγάγει
- επικαλείται
- θέματα
- IT
- ΤΟΥ
- Δουλειά
- jpg
- json
- μόλις
- Κλειδί
- γνώση
- επιγραφή
- Ετικέτες
- εργασία
- Γλώσσα
- large
- Επίθετο
- ξεκίνησε
- δρομολόγηση
- ΜΑΘΑΊΝΩ
- μάθηση
- ελάχιστα
- Μου αρέσει
- γραμμή
- Λιστα
- LLM
- που βρίσκεται
- τοποθεσία
- κλειδωμένη
- πλέον
- Παρτίδα
- αγαπά
- χαμηλότερα
- μηχανή
- μάθηση μηχανής
- που
- Κυρίως
- Η πλειοψηφία
- ΚΑΝΕΙ
- Ταχύτητες
- χειροκίνητα
- πολοί
- χάρτη
- Μήτρα
- Ενδέχεται..
- Εικόνες / Βίντεο
- Γνωρίστε
- ενδέχεται να
- Λεπτ.
- Τρόπος
- μοντέλο
- μοντέλα
- τρόπων
- χρήματα
- παρακολούθηση
- περισσότερο
- πλέον
- Βουνό
- πολύ
- πολλαπλούς
- πρέπει
- όνομα
- ονόματα
- στενός
- Πλοήγηση
- απαραίτητος
- Ανάγκη
- που απαιτούνται
- Νέα
- νέα
- επόμενη
- nlp
- Όχι.
- κοινοποίηση
- τώρα
- αριθμός
- αντικείμενο
- στόχοι
- of
- on
- ONE
- συνεχή
- αποκλειστικά
- Επιλογή
- Επιλογές
- or
- επιχειρήσεις
- οργανώσεις
- ΑΛΛΑ
- αλλιώς
- δικός μας
- έξω
- παραγωγή
- εκτός
- επί
- φόρμες
- δική
- σελίδα
- παράθυρο
- πίνακας
- παράμετροι
- μέρος
- ιδιαίτερα
- passieren
- παθιασμένος
- μονοπάτι
- People
- για
- επίδοση
- δικαιώματα
- φωτογραφία
- αγωγού
- Πλάτων
- Πληροφορία δεδομένων Plato
- Πλάτωνα δεδομένα
- σας παρακαλούμε
- Πολιτικές
- πολιτική
- πολιτική
- δυνατός
- Θέση
- δυναμικού
- τροφοδοτείται
- προτιμήσεις
- Προετοιμάστε
- έτοιμος
- Πρόβλημα
- προβλήματα
- διαδικασια μας
- Διεργασίες
- μεταποίηση
- Προϊόν
- επαγγελματίας
- Προγραμματισμός
- προστασία
- παρέχουν
- παρέχεται
- χορήγηση
- Python
- ποιότητα
- ταχέως
- αναγνώστες
- Ανάγνωση
- πραγματικός
- λαμβάνω
- λήψη
- πρόσφατος
- πρόσφατα
- παραπέμπω
- περιοχή
- ρυθμιστές
- Κανονιστική Συμμόρφωση
- σχετίζεται με
- παραμένουν
- αναφέρουν
- αναφέρθηκαν
- Αποθήκη
- απαιτείται
- απαιτήσεις
- πόρος
- Υποστηρικτικό υλικό
- Απάντηση
- Αποτελέσματα
- Επιστροφές
- δεξιά
- κανόνες
- τρέξιμο
- ίδιο
- Αποθήκευση
- αποθηκεύονται
- Απεριόριστες δυνατότητες
- επεκτάσιμη
- Κλίμακα
- Ζυγός
- απολέπιση
- Επιστήμονας
- μηδέν
- Αναζήτηση
- Δεύτερος
- Τμήμα
- δείτε
- επιλογή
- αρχαιότερος
- αποστέλλονται
- ξεχωριστό
- Σειρές
- υπηρεσία
- Υπηρεσίες
- σειρά
- τον καθορισμό
- ρυθμίσεις
- Κοινοποίηση
- αυτή
- Κοντά
- θα πρέπει να
- έδειξε
- παρουσιάζεται
- σημαντικός
- δηλώ
- Απλούς
- ενιαίας
- κατάσταση
- Μ.Κ.Δ
- social media
- λύση
- Λύσεις
- SOLVE
- μερικοί
- Πηγή
- Πηγές
- συγκεκριμένες
- καθορίζεται
- Αθλητισμός
- σωρός
- Στάδιο
- στάδια
- πρότυπα
- Εκκίνηση
- ξεκινά
- state-of-the-art
- Κατάσταση
- Βήμα
- Βήματα
- χώρος στο δίσκο
- κατάστημα
- εξορθολογισμό
- συνδρομητές
- συνδρομή
- Ακολούθως
- Επιτυχώς
- τέτοιος
- υποστήριξη
- υποστηριζόνται!
- Υποστηρίζει
- Έρευνες
- TAG
- επειξειργασμένος από ραπτήν
- Πάρτε
- Έργο
- tech
- τεχνικές
- Τεχνολογία
- πρότυπο
- δοκιμή
- κείμενο
- Ταξινόμηση κειμένου
- από
- ότι
- Η
- Η Πηγη
- τους
- Τους
- τότε
- Αυτοί
- αυτοί
- πράγματα
- αυτό
- χιλιάδες
- τρία
- Μέσω
- ώρα
- χρονοβόρος
- προς την
- εργαλεία
- Θέματα
- Τρένο
- εκπαιδευμένο
- Εκπαίδευση
- Ταξίδια
- Τάσεις
- ενεργοποιούν
- προσπαθώ
- δύο
- τύπος
- αποκαλύπτω
- υπό
- καταλαβαίνω
- μοναδικός
- αναξιοποίητο
- μέχρι
- Φορτώθηκε
- Ανέβασμα
- us
- χρήση
- περίπτωση χρήσης
- μεταχειρισμένος
- Χρήστες
- Χρήστες
- χρησιμοποιεί
- χρησιμοποιώντας
- Πολύτιμος
- αξία
- ποικιλία
- εκδοχή
- Δες
- θέλω
- Τρόπος..
- we
- ιστός
- διαδικτυακές υπηρεσίες
- Ιστοσελίδα : www.example.gr
- πότε
- Ποιό
- ενώ
- ολόκληρο
- θα
- με
- εντός
- χωρίς
- Εργασία
- ροής εργασίας
- ροές εργασίας
- εργαζόμενος
- εκτέλεση
- λειτουργεί
- Εσείς
- Σας
- zephyrnet
- Zip