Το Amazon SageMaker JumpStart προσφέρει τώρα φορητούς υπολογιστές Amazon Comprehend για προσαρμοσμένη ταξινόμηση και προσαρμοσμένη ανίχνευση οντοτήτων PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Το Amazon SageMaker JumpStart προσφέρει τώρα φορητούς υπολογιστές Amazon Comprehend για προσαρμοσμένη ταξινόμηση και εντοπισμό προσαρμοσμένων οντοτήτων

Κατανοήστε το Amazon είναι μια υπηρεσία επεξεργασίας φυσικής γλώσσας (NLP) που χρησιμοποιεί μηχανική εκμάθηση (ML) για να ανακαλύψει πληροφορίες από κείμενο. Το Amazon Comprehend παρέχει προσαρμοσμένες δυνατότητες, προσαρμοσμένη αναγνώριση οντότητας, προσαρμοσμένη ταξινόμηση, να προεκπαιδευμένα API όπως εξαγωγή φράσεων-κλειδιών, ανάλυση συναισθήματος, αναγνώριση οντοτήτων και πολλά άλλα, ώστε να μπορείτε εύκολα να ενσωματώσετε το NLP στις εφαρμογές σας.

Πρόσφατα προσθέσαμε σημειωματάρια που σχετίζονται με το Amazon Comprehend Amazon SageMaker JumpStart σημειωματάρια που μπορούν να σας βοηθήσουν να ξεκινήσετε γρήγορα τη χρήση του προσαρμοσμένου ταξινομητή Amazon Comprehend και του προσαρμοσμένου αναγνωριστικού οντοτήτων. Μπορείτε να χρησιμοποιήσετε προσαρμοσμένη ταξινόμηση για να οργανώσετε έγγραφα σε κατηγορίες (τάξεις) που ορίζετε εσείς. Η προσαρμοσμένη αναγνώριση οντοτήτων επεκτείνει τη δυνατότητα του προεκπαιδευμένου API εντοπισμού οντοτήτων του Amazon Comprehend, βοηθώντας σας να προσδιορίσετε τύπους οντοτήτων που είναι μοναδικοί για τον τομέα ή την επιχείρησή σας και δεν περιλαμβάνονται στο προκαθορισμένο γενικό τύποι οντοτήτων.

Σε αυτήν την ανάρτηση, σας δείχνουμε πώς να χρησιμοποιήσετε το JumpStart για τη δημιουργία προσαρμοσμένων μοντέλων ταξινόμησης και προσαρμοσμένων οντοτήτων του Amazon Comprehend ως μέρος των αναγκών της επιχείρησής σας NLP.

SageMaker JumpStart

Η Στούντιο Amazon SageMaker Η σελίδα προορισμού παρέχει την επιλογή χρήσης του JumpStart. Το JumpStart παρέχει έναν γρήγορο τρόπο για να ξεκινήσετε παρέχοντας προεκπαιδευμένα μοντέλα για διάφορους τύπους προβλημάτων. Μπορείτε να εκπαιδεύσετε και να συντονίσετε αυτά τα μοντέλα. Το JumpStart παρέχει επίσης άλλους πόρους, όπως σημειωματάρια, ιστολόγια και βίντεο.

Τα σημειωματάρια JumpStart είναι ουσιαστικά δείγμα κώδικα που μπορείτε να χρησιμοποιήσετε ως σημείο εκκίνησης για να ξεκινήσετε γρήγορα. Επί του παρόντος, σας παρέχουμε πάνω από 40 σημειωματάρια που μπορείτε να χρησιμοποιήσετε ως έχουν ή να προσαρμόσετε όπως απαιτείται. Μπορείτε να βρείτε τα σημειωματάριά σας χρησιμοποιώντας την αναζήτηση ή τον πίνακα προβολής με καρτέλες. Αφού βρείτε το σημειωματάριο που θέλετε να χρησιμοποιήσετε, μπορείτε να εισαγάγετε το σημειωματάριο, να το προσαρμόσετε για τις απαιτήσεις σας και να επιλέξετε την υποδομή και το περιβάλλον στο οποίο θα εκτελείται το σημειωματάριο.

Ξεκινήστε με τα σημειωματάρια JumpStart

Για να ξεκινήσετε με το JumpStart, μεταβείτε στο Amazon Sage Maker κονσόλα και ανοιχτό Studio. Αναφέρομαι σε Ξεκινήστε με το SageMaker Studio για οδηγίες σχετικά με το πώς να ξεκινήσετε με το Studio. Στη συνέχεια, ολοκληρώστε τα παρακάτω βήματα:

  1. Στο Studio, μεταβείτε στη σελίδα εκκίνησης του JumpStart και επιλέξτε Μεταβείτε στο SageMaker JumpStart.

Σας προσφέρονται πολλοί τρόποι αναζήτησης. Μπορείτε είτε να χρησιμοποιήσετε καρτέλες στο επάνω μέρος για να φτάσετε σε αυτό που θέλετε είτε να χρησιμοποιήσετε το πλαίσιο αναζήτησης όπως φαίνεται στο παρακάτω στιγμιότυπο οθόνης.

  1. Για να βρούμε σημειωματάρια, πηγαίνουμε στο Φορητοί υπολογιστές Tab.

Μεταβείτε στην καρτέλα Σημειωματάρια

Κατά τη στιγμή της γραφής, το JumpStart προσφέρει 47 σημειωματάρια. Μπορείτε να χρησιμοποιήσετε φίλτρα για να βρείτε σημειωματάρια που σχετίζονται με το Amazon Comprehend.

  1. Στις Τύπος περιεχομένου αναπτυσσόμενο μενού, επιλέξτε σημειωματάριο.

Όπως μπορείτε να δείτε στο παρακάτω στιγμιότυπο οθόνης, αυτή τη στιγμή διαθέτουμε δύο φορητούς υπολογιστές Amazon Comprehend.

Βρείτε Comprehend Notebooks

Στις επόμενες ενότητες, εξερευνούμε και τα δύο σημειωματάρια.

Amazon Comprehend Custom Classifier

Σε αυτό το σημειωματάριο, δείχνουμε πώς να χρησιμοποιήσετε το προσαρμοσμένο API ταξινομητή για τη δημιουργία ενός μοντέλου ταξινόμησης εγγράφων.

Ο προσαρμοσμένος ταξινομητής είναι μια πλήρως διαχειριζόμενη λειτουργία του Amazon Comprehend που σας επιτρέπει να δημιουργήσετε προσαρμοσμένα μοντέλα ταξινόμησης κειμένου που είναι μοναδικά για την επιχείρησή σας, ακόμα κι αν έχετε λίγη ή καθόλου τεχνογνωσία σε ML. Ο προσαρμοσμένος ταξινομητής βασίζεται στις υπάρχουσες δυνατότητες του Amazon Comprehend, οι οποίες έχουν ήδη εκπαιδευτεί σε δεκάδες εκατομμύρια έγγραφα. Αφαιρεί μεγάλο μέρος της πολυπλοκότητας που απαιτείται για τη δημιουργία ενός μοντέλου ταξινόμησης NLP. Ο προσαρμοσμένος ταξινομητής φορτώνει και επιθεωρεί αυτόματα τα δεδομένα εκπαίδευσης, επιλέγει τους σωστούς αλγόριθμους ML, εκπαιδεύει το μοντέλο σας, βρίσκει τις βέλτιστες υπερπαραμέτρους, δοκιμάζει το μοντέλο και παρέχει μετρήσεις απόδοσης μοντέλου. Ο προσαρμοσμένος ταξινομητής Amazon Comprehend παρέχει επίσης μια εύχρηστη κονσόλα για ολόκληρη τη ροή εργασίας ML, συμπεριλαμβανομένης της επισήμανσης κειμένου με χρήση Amazon SageMaker Ground Αλήθεια, εκπαίδευση και ανάπτυξη ενός μοντέλου και οπτικοποίηση των αποτελεσμάτων της δοκιμής. Με έναν προσαρμοσμένο ταξινομητή Amazon Comprehend, μπορείτε να δημιουργήσετε τα ακόλουθα μοντέλα:

  • Μοντέλο ταξινόμησης πολλαπλών τάξεων – Στην ταξινόμηση πολλαπλών τάξεων, κάθε έγγραφο μπορεί να έχει μία και μόνο μία κλάση που του εκχωρείται. Οι μεμονωμένες τάξεις αλληλοαποκλείονται. Για παράδειγμα, μια ταινία μπορεί να χαρακτηριστεί ως ντοκιμαντέρ ή ως επιστημονική φαντασία, αλλά όχι και τα δύο ταυτόχρονα.
  • Μοντέλο ταξινόμησης πολλαπλών ετικετών – Στην ταξινόμηση πολλαπλών ετικετών, οι μεμονωμένες κατηγορίες αντιπροσωπεύουν διαφορετικές κατηγορίες, αλλά αυτές οι κατηγορίες σχετίζονται κατά κάποιο τρόπο και δεν αποκλείουν αμοιβαία. Ως αποτέλεσμα, κάθε έγγραφο έχει τουλάχιστον μία κλάση που του έχει εκχωρηθεί, αλλά μπορεί να έχει περισσότερες. Για παράδειγμα, μια ταινία μπορεί απλώς να είναι μια ταινία δράσης ή μπορεί να είναι μια ταινία δράσης, μια ταινία επιστημονικής φαντασίας και μια κωμωδία, όλα ταυτόχρονα.

Αυτό το σημειωματάριο δεν απαιτεί τεχνογνωσία ML για την εκπαίδευση ενός μοντέλου με το παράδειγμα δεδομένων ή με το δικό σας σύνολο δεδομένων για συγκεκριμένη επιχείρηση. Μπορείτε να χρησιμοποιήσετε τις λειτουργίες API που αναφέρονται σε αυτό το σημειωματάριο στις δικές σας εφαρμογές.

Amazon Custom Entity Recognizer

Σε αυτό το σημειωματάριο, δείχνουμε πώς να χρησιμοποιήσετε το προσαρμοσμένο API αναγνώρισης οντοτήτων για τη δημιουργία ενός μοντέλου αναγνώρισης οντοτήτων.

Η προσαρμοσμένη αναγνώριση οντοτήτων επεκτείνει τις δυνατότητες του Amazon Comprehend βοηθώντας σας να προσδιορίσετε τους συγκεκριμένους τύπους οντοτήτων που δεν περιλαμβάνονται στους προκαθορισμένους γενικούς τύπους οντοτήτων. Αυτό σημαίνει ότι μπορείτε να αναλύσετε έγγραφα και να εξαγάγετε οντότητες όπως κωδικούς προϊόντων ή οντότητες για συγκεκριμένες επιχειρήσεις που ταιριάζουν στις ιδιαίτερες ανάγκες σας.

Η δημιουργία ενός ακριβούς προσαρμοσμένου αναγνωριστικού οντοτήτων από μόνος σας μπορεί να είναι μια πολύπλοκη διαδικασία, που απαιτεί προετοιμασία μεγάλων συνόλων εκπαιδευτικών εγγράφων με μη αυτόματο σχολιασμό και επιλογή των σωστών αλγορίθμων και παραμέτρων για εκπαίδευση μοντέλων. Το Amazon Comprehend συμβάλλει στη μείωση της πολυπλοκότητας παρέχοντας αυτόματο σχολιασμό και ανάπτυξη μοντέλου για τη δημιουργία ενός προσαρμοσμένου μοντέλου αναγνώρισης οντοτήτων.

Το παράδειγμα σημειωματάριο παίρνει το σύνολο δεδομένων εκπαίδευσης σε μορφή CSV και εκτελεί συμπεράσματα έναντι της εισαγωγής κειμένου. Το Amazon Comprehend υποστηρίζει επίσης μια προηγμένη περίπτωση χρήσης που λαμβάνει σχολιασμένα δεδομένα του Ground Truth για εκπαίδευση και σας επιτρέπει να εκτελείτε απευθείας συμπεράσματα σε αρχεία PDF και έγγραφα Word. Για περισσότερες πληροφορίες, ανατρέξτε στο Δημιουργήστε ένα προσαρμοσμένο αναγνωριστικό οντοτήτων για έγγραφα PDF χρησιμοποιώντας το Amazon Comprehend.

Το Amazon Comprehend μείωσε τα όρια σχολιασμού και σας επέτρεψε να έχετε πιο σταθερά αποτελέσματα, ειδικά για δευτερεύοντα δείγματα λίγων λήψεων. Για περισσότερες πληροφορίες σχετικά με αυτήν τη βελτίωση, ανατρέξτε στο Η Amazon Comprehend ανακοινώνει χαμηλότερα όρια σχολιασμού για προσαρμοσμένη αναγνώριση οντοτήτων.

Αυτό το σημειωματάριο δεν απαιτεί τεχνογνωσία ML για την εκπαίδευση ενός μοντέλου με το παράδειγμα δεδομένων ή με το δικό σας σύνολο δεδομένων για συγκεκριμένη επιχείρηση. Μπορείτε να χρησιμοποιήσετε τις λειτουργίες API που αναφέρονται σε αυτό το σημειωματάριο στις δικές σας εφαρμογές.

Χρησιμοποιήστε, προσαρμόστε και αναπτύξτε φορητούς υπολογιστές Amazon Comprehend JumpStart

Αφού επιλέξετε το σημειωματάριο Amazon Comprehend που θέλετε να χρησιμοποιήσετε, επιλέξτε Εισαγωγή σημειωματάριου. Καθώς το κάνετε αυτό, μπορείτε να δείτε τον πυρήνα του σημειωματάριου να ξεκινά.

Εισαγωγή σημειωματάριου

Η εισαγωγή του σημειωματάριου σας ενεργοποιεί την επιλογή της παρουσίας, του πυρήνα και της εικόνας του σημειωματάριου που χρησιμοποιούνται για την εκτέλεση του σημειωματάριου. Αφού παρέχεται η προεπιλεγμένη υποδομή, μπορείτε να αλλάξετε τις επιλογές σύμφωνα με τις απαιτήσεις σας.

Σημειωματάριο στο SageMaker Studio σας

Τώρα, διαβάστε το περίγραμμα του σημειωματάριου και διαβάστε προσεκτικά τις ενότητες για τη ρύθμιση προαπαιτούμενων, τη ρύθμιση δεδομένων, την εκπαίδευση του μοντέλου, την εκτέλεση συμπερασμάτων και τη διακοπή του μοντέλου. Μη διστάσετε να προσαρμόσετε τον κώδικα που δημιουργείται σύμφωνα με τις ανάγκες σας.

Με βάση τις απαιτήσεις σας, μπορεί να θέλετε να προσαρμόσετε τις ακόλουθες ενότητες:

  • Δικαιώματα – Για μια εφαρμογή παραγωγής, συνιστούμε να περιορίσετε τις πολιτικές πρόσβασης μόνο σε εκείνες που απαιτούνται για την εκτέλεση της εφαρμογής. Τα δικαιώματα μπορούν να περιοριστούν με βάση την περίπτωση χρήσης, όπως εκπαίδευση ή συμπέρασμα, και συγκεκριμένα ονόματα πόρων, όπως ένα πλήρες Απλή υπηρεσία αποθήκευσης Amazon όνομα κάδου (Amazon S3) ή μοτίβο ονόματος κάδου S3. Θα πρέπει επίσης να περιορίσετε την πρόσβαση στον προσαρμοσμένο ταξινομητή ή τις λειτουργίες SageMaker μόνο σε αυτές που χρειάζεται η εφαρμογή σας.
  • Δεδομένα και τοποθεσία – Το παράδειγμα σημειωματάριου σάς παρέχει δείγματα δεδομένων και τοποθεσίες S3. Με βάση τις απαιτήσεις σας, μπορείτε να χρησιμοποιήσετε τα δικά σας δεδομένα για εκπαίδευση, επικύρωση και δοκιμές και να χρησιμοποιήσετε διαφορετικές τοποθεσίες S3 όπως απαιτείται. Ομοίως, όταν δημιουργείται το μοντέλο, μπορείτε να επιλέξετε να διατηρήσετε το μοντέλο σε διαφορετικές τοποθεσίες. Απλώς βεβαιωθείτε ότι έχετε παράσχει τα σωστά δικαιώματα πρόσβασης στους κάδους S3.
  • Βήματα προεπεξεργασίας – Εάν χρησιμοποιείτε διαφορετικά δεδομένα για εκπαίδευση και δοκιμές, μπορεί να θέλετε να προσαρμόσετε τα βήματα προεπεξεργασίας σύμφωνα με τις απαιτήσεις σας.
  • Δεδομένα δοκιμής – Μπορείτε να φέρετε τα δικά σας δεδομένα συμπερασμάτων για δοκιμή.
  • εκκαθάριση – Διαγράψτε τους πόρους που εκτοξεύτηκαν από το σημειωματάριο για να αποφύγετε επαναλαμβανόμενες χρεώσεις.

Συμπέρασμα

Σε αυτήν την ανάρτηση, σας δείξαμε πώς να χρησιμοποιείτε το JumpStart για να μαθαίνετε και να παρακολουθείτε γρήγορα χρησιμοποιώντας τα Amazon Comprehend API, διευκολύνοντας την εύρεση και εκτέλεση φορητών υπολογιστών που σχετίζονται με το Amazon Comprehend από το Studio, ενώ έχετε την επιλογή να τροποποιήσετε τον κώδικα όπως απαιτείται. Τα σημειωματάρια χρησιμοποιούν δείγματα συνόλων δεδομένων με ανακοινώσεις προϊόντων AWS και δείγματα ειδήσεων. Μπορείτε να χρησιμοποιήσετε αυτό το σημειωματάριο για να μάθετε πώς να χρησιμοποιείτε τα Amazon Comprehend API σε ένα σημειωματάριο Python ή μπορείτε να το χρησιμοποιήσετε ως σημείο εκκίνησης και να επεκτείνετε περαιτέρω τον κώδικα για τις μοναδικές σας απαιτήσεις και αναπτύξεις παραγωγής.

Μπορείτε να ξεκινήσετε να χρησιμοποιείτε το JumpStart και να επωφεληθείτε από πάνω από 40 σημειωματάρια σε διάφορα θέματα σε όλες τις Περιοχές όπου το Studio είναι διαθέσιμο χωρίς επιπλέον κόστος.


Σχετικά με τους Συγγραφείς

Συγγραφέας - Lana ZhangΛάνα Ζανγκ είναι αρχιτέκτονας λύσεων Sr. στην ομάδα Υπηρεσιών AWS WWSO AI με εξειδίκευση στην τεχνητή νοημοσύνη και την ML για την εποπτεία και την αναγνώριση περιεχομένου. Είναι παθιασμένη με την προώθηση των υπηρεσιών AWS AI και τη βοήθεια των πελατών να μεταμορφώσουν τις επιχειρηματικές τους λύσεις.

Συγγραφέας - Meenakshisundaram ThandavarayanMeenakshisundaram Thandavarayan είναι Ανώτερος ειδικός AI/ML με AWS. Βοηθά στρατηγικούς λογαριασμούς υψηλής τεχνολογίας στο ταξίδι τους σε AI και ML. Είναι πολύ παθιασμένος με την τεχνητή νοημοσύνη που βασίζεται σε δεδομένα

Συγγραφέας - Rachna ChadhaRachna Chadha είναι ένας κύριος αρχιτέκτονας λύσεων AI/ML σε στρατηγικούς λογαριασμούς στο AWS. Η Rachna είναι αισιόδοξη που πιστεύει ότι η ηθική και υπεύθυνη χρήση της τεχνητής νοημοσύνης μπορεί να βελτιώσει την κοινωνία στο μέλλον και να φέρει οικονομική και κοινωνική ευημερία. Στον ελεύθερο χρόνο της, στη Ράχνα αρέσει να περνά χρόνο με την οικογένειά της, να κάνει πεζοπορία και να ακούει μουσική.

Σφραγίδα ώρας:

Περισσότερα από Μηχανική εκμάθηση AWS