Δημιουργήστε μοντέλα ταξινόμησης εικόνων υψηλής απόδοσης χρησιμοποιώντας το Amazon SageMaker JumpStart

Αναδημοσίευση από τον Πλάτωνα

Ακολουθούν: 0

Η ταξινόμηση εικόνων είναι μια τεχνική μηχανικής μάθησης (ML) που βασίζεται στην όραση υπολογιστή που σας επιτρέπει να ταξινομείτε εικόνες. Μερικά γνωστά παραδείγματα ταξινόμησης εικόνων περιλαμβάνουν την ταξινόμηση χειρόγραφων ψηφίων, την ταξινόμηση ιατρικών εικόνων και την αναγνώριση προσώπου. Η ταξινόμηση εικόνων είναι μια χρήσιμη τεχνική με πολλές επιχειρηματικές εφαρμογές, αλλά η δημιουργία ενός καλού μοντέλου ταξινόμησης εικόνων δεν είναι ασήμαντη.

Διάφοροι παράγοντες μπορούν να παίξουν ρόλο κατά την αξιολόγηση ενός μοντέλου ML. Πέρα από την ακρίβεια του μοντέλου, άλλες πιθανές μετρήσεις σημασίας είναι ο χρόνος εκπαίδευσης του μοντέλου και ο χρόνος συμπερασμάτων. Δεδομένης της επαναληπτικής φύσης της ανάπτυξης μοντέλων ML, οι ταχύτεροι χρόνοι εκπαίδευσης επιτρέπουν στους επιστήμονες δεδομένων να ελέγχουν γρήγορα διάφορες υποθέσεις. Η ταχύτερη εξαγωγή συμπερασμάτων μπορεί να είναι κρίσιμη σε εφαρμογές σε πραγματικό χρόνο.

Amazon SageMaker JumpStart παρέχει λεπτομερή ρύθμιση με ένα κλικ και ανάπτυξη μιας μεγάλης ποικιλίας προεκπαιδευμένων μοντέλων σε δημοφιλείς εργασίες ML, καθώς και μια επιλογή λύσεων από άκρο σε άκρο που λύνουν κοινά επιχειρηματικά προβλήματα. Αυτά τα χαρακτηριστικά αφαιρούν τη βαριά ανύψωση από κάθε βήμα της διαδικασίας ML, διευκολύνοντας την ανάπτυξη μοντέλων υψηλής ποιότητας και μειώνοντας το χρόνο μέχρι την ανάπτυξη. JumpStart API σας επιτρέπει να αναπτύξετε μέσω προγραμματισμού και να ρυθμίσετε με ακρίβεια μια τεράστια ποικιλία προεκπαιδευμένων μοντέλων που υποστηρίζονται από το JumpStart στα δικά σας σύνολα δεδομένων.

Μπορείτε να εκπαιδεύσετε και να συντονίσετε σταδιακά τα μοντέλα ML που προσφέρονται στο JumpStart πριν από την ανάπτυξη. Τη στιγμή της σύνταξης, 87 μοντέλα ταξινόμησης εικόνων που βασίζονται σε βαθιά μάθηση είναι διαθέσιμα στο JumpStart.

Ποιο μοντέλο όμως θα σας δώσει τα καλύτερα αποτελέσματα; Σε αυτήν την ανάρτηση, παρουσιάζουμε μια μεθοδολογία για την εύκολη εκτέλεση πολλαπλών μοντέλων και τη σύγκριση των αποτελεσμάτων τους σε τρεις διαστάσεις ενδιαφέροντος: ακρίβεια μοντέλου, χρόνος εκπαίδευσης και χρόνος συμπερασμάτων.

Επισκόπηση λύσεων

Το JumpStart σάς επιτρέπει να εκπαιδεύετε, να συντονίζετε και να αναπτύσσετε μοντέλα είτε από την κονσόλα JumpStart χρησιμοποιώντας τη διεπαφή χρήστη του είτε με το API του. Σε αυτήν την ανάρτηση, χρησιμοποιούμε τη διαδρομή API και παρουσιάζουμε ένα σημειωματάριο με διάφορα βοηθητικά σενάρια. Μπορείτε να εκτελέσετε αυτό το σημειωματάριο και να λάβετε αποτελέσματα για εύκολη σύγκριση αυτών των μοντέλων μεταξύ τους και, στη συνέχεια, να επιλέξετε ένα μοντέλο που ταιριάζει καλύτερα στις ανάγκες της επιχείρησής σας όσον αφορά την ακρίβεια του μοντέλου, τον χρόνο εκπαίδευσης και τον χρόνο συμπερασμάτων.

Η δημόσιο σύνολο δεδομένων που χρησιμοποιείται σε αυτήν την ανάρτηση αποτελείται από σχεδόν 55,000 εικόνες άρρωστων και υγιών φύλλων φυτών που συλλέγονται υπό ελεγχόμενες συνθήκες, με ετικέτες κατηγορίας που κυμαίνονται από 0 έως 38. Αυτό το σύνολο δεδομένων χωρίζεται σε σύνολα δεδομένων αμαξοστοιχίας και επικύρωσης, με περίπου 44,000 υπό εκπαίδευση και 11,000 εικόνες υπό επικύρωση. Ακολουθούν μερικά δείγματα εικόνων.

Για αυτήν την άσκηση, επιλέξαμε μοντέλα από δύο πλαίσια—PyTorch και TensorFlow—όπως προσφέρονται από το JumpStart. Οι ακόλουθοι 15 αλγόριθμοι μοντέλων καλύπτουν ένα ευρύ φάσμα δημοφιλών αρχιτεκτονικών νευρωνικών δικτύων από αυτά τα πλαίσια:

pytorch-ic-alexnet-FT
pytorch-ic-densenet121-FT
pytorch-ic-densenet201-FT
pytorch-ic-googlenet-FT
pytorch-ic-mobilenet-v2-FT
pytorch-ic-resnet152-FT
pytorch-ic-resnet34-FT
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT
tensorflow-ic-imagenet-inception-resnet-v2-classification 4-FT
tensorflow-ic-imagenet-inception-v3-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-075-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT
tensorflow-ic-imagenet-resnet-v2-152-classification-4-FT
tensorflow-ic-tf2-preview-mobilenet-v2-classification-4-FT

Χρησιμοποιούμε το μοντέλο tensorflow-ic-imagenet-inception-v3-classification-4-FT ως βάση με την οποία συγκρίνονται τα αποτελέσματα από άλλα μοντέλα. Αυτό το βασικό μοντέλο επιλέχθηκε αυθαίρετα.

Ο κώδικας που χρησιμοποιείται για την εκτέλεση αυτής της σύγκρισης είναι διαθέσιμος στο Αποθετήριο AWS Samples GitHub.

Αποτελέσματα

Σε αυτήν την ενότητα, παρουσιάζουμε τα αποτελέσματα από αυτές τις 15 διαδρομές. Για όλες αυτές τις εκτελέσεις, οι υπερπαράμετροι που χρησιμοποιήθηκαν ήταν εποχές = 5, ρυθμός εκμάθησης = 0.001, μέγεθος παρτίδας = 16.

Ακρίβεια μοντέλου, χρόνος εκπαίδευσης και χρόνος συμπερασμάτων από το μοντέλο tensorflow-ic-imagenet-inception-v3-classification-4-FT ελήφθησαν ως βάση και τα αποτελέσματα από όλα τα άλλα μοντέλα παρουσιάζονται σε σχέση με αυτό το βασικό μοντέλο. Η πρόθεσή μας εδώ δεν είναι να δείξουμε ποιο μοντέλο είναι το καλύτερο, αλλά μάλλον να δείξουμε πώς, μέσω του JumpStart API, μπορείτε να συγκρίνετε αποτελέσματα από διάφορα μοντέλα και στη συνέχεια να επιλέξετε ένα μοντέλο που ταιριάζει καλύτερα στην περίπτωση χρήσης σας.

Το ακόλουθο στιγμιότυπο οθόνης επισημαίνει το βασικό μοντέλο με το οποίο συγκρίθηκαν όλα τα άλλα μοντέλα.

Η ακόλουθη γραφική παράσταση δείχνει μια λεπτομερή άποψη της σχετικής ακρίβειας έναντι του σχετικού χρόνου εκπαίδευσης. Τα μοντέλα PyTorch έχουν χρωματική κωδικοποίηση με κόκκινο και τα μοντέλα TensorFlow με μπλε.

Τα μοντέλα που επισημαίνονται με μια πράσινη έλλειψη στην προηγούμενη γραφική παράσταση φαίνεται να έχουν έναν καλό συνδυασμό σχετικής ακρίβειας και χαμηλού σχετικού χρόνου εκπαίδευσης. Ο παρακάτω πίνακας παρέχει περισσότερες λεπτομέρειες για αυτά τα τρία μοντέλα.

Όνομα μοντέλου	Σχετική Ακρίβεια	Σχετικός χρόνος προπόνησης
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT	1.01	0.74
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT	1.02	0.74
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT	1.04	1.16

Η ακόλουθη γραφική παράσταση συγκρίνει τη σχετική ακρίβεια με τον σχετικό χρόνο συμπερασμάτων. Τα μοντέλα PyTorch έχουν χρωματική κωδικοποίηση με κόκκινο και τα μοντέλα TensorFlow με μπλε.

Ο παρακάτω πίνακας παρέχει λεπτομέρειες για τα τρία μοντέλα στην πράσινη έλλειψη.

Όνομα μοντέλου	Σχετική Ακρίβεια	Σχετικός χρόνος συμπερασμάτων
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT	1.01	0.94
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT	1.02	0.90
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT	1.04	1.43

Οι δύο γραφικές παραστάσεις δείχνουν ξεκάθαρα ότι ορισμένοι αλγόριθμοι μοντέλων είχαν καλύτερη απόδοση από άλλους στις τρεις διαστάσεις που επιλέχθηκαν. Η ευελιξία που προσφέρεται μέσω αυτής της άσκησης μπορεί να σας βοηθήσει να επιλέξετε τον σωστό αλγόριθμο και χρησιμοποιώντας το παρεχόμενο σημειωματάριο, μπορείτε εύκολα να εκτελέσετε αυτό το είδος πειράματος σε οποιοδήποτε από τα 87 διαθέσιμα μοντέλα.

Συμπέρασμα

Σε αυτήν την ανάρτηση, δείξαμε πώς να χρησιμοποιήσετε το JumpStart για τη δημιουργία μοντέλων ταξινόμησης εικόνων υψηλής απόδοσης σε πολλαπλές διαστάσεις ενδιαφέροντος, όπως η ακρίβεια του μοντέλου, ο χρόνος εκπαίδευσης και η καθυστέρηση συμπερασμάτων. Παρέχαμε επίσης τον κώδικα για την εκτέλεση αυτής της άσκησης στο δικό σας σύνολο δεδομένων. μπορείτε να επιλέξετε οποιοδήποτε μοντέλο ενδιαφέροντος από τα 87 μοντέλα που είναι προς το παρόν διαθέσιμα για ταξινόμηση εικόνων στο κέντρο μοντέλων JumpStart. Σας ενθαρρύνουμε να το δοκιμάσετε σήμερα.

Για περισσότερες λεπτομέρειες σχετικά με το JumpStart, ανατρέξτε στο SageMaker JumpStart.

Σχετικά με τους Συγγραφείς

Δρ Raju Penmatcha είναι AI/ML Specialist Solutions Architect σε πλατφόρμες AI στο AWS. Έλαβε το διδακτορικό του από το Πανεπιστήμιο του Στάνφορντ. Εργάζεται στενά στη σουίτα υπηρεσιών χαμηλού/χωρίς κώδικα στο SageMaker, οι οποίες βοηθούν τους πελάτες να δημιουργούν και να αναπτύσσουν εύκολα μοντέλα και λύσεις μηχανικής εκμάθησης. Όταν δεν βοηθά τους πελάτες, του αρέσει να ταξιδεύει σε νέα μέρη.

Δρ Ashish Khetan είναι Ανώτερος Εφαρμοσμένος Επιστήμονας με ενσωματωμένους αλγόριθμους του Amazon SageMaker και βοηθά στην ανάπτυξη αλγορίθμων μηχανικής μάθησης. Πήρε το διδακτορικό του από το Πανεπιστήμιο του Illinois Urbana-Champaign. Είναι ενεργός ερευνητής στη μηχανική μάθηση και στα στατιστικά συμπεράσματα και έχει δημοσιεύσει πολλές εργασίες σε συνέδρια NeurIPS, ICML, ICLR, JMLR, ACL και EMNLP.