Το 2021 ξεκινήσαμε Προληπτικές Υπηρεσίες Υποστήριξης AWS ως μέρος του Υποστήριξη AWS Enterprise σχέδιο. Από την εισαγωγή του, έχουμε βοηθήσει εκατοντάδες πελάτες να βελτιστοποιήσουν τον φόρτο εργασίας τους, να θέσουν προστατευτικά κιγκλιδώματα και να βελτιώσουν την ορατότητα του κόστους και της χρήσης του φόρτου εργασίας μηχανικής εκμάθησης (ML).
Σε αυτήν τη σειρά αναρτήσεων, μοιραζόμαστε διδάγματα σχετικά με τη βελτιστοποίηση του κόστους Amazon Sage Maker. σε Μέρος 1, δείξαμε πώς να ξεκινήσετε να χρησιμοποιείτε Εξερεύνηση κόστους AWS για τον εντοπισμό ευκαιριών βελτιστοποίησης κόστους στο SageMaker. Σε αυτήν την ανάρτηση, εστιάζουμε σε περιβάλλοντα συμπερασμάτων SageMaker: συμπέρασμα σε πραγματικό χρόνο, μετασχηματισμός παρτίδας, ασύγχρονη συμπεράσματα και συμπεράσματα χωρίς διακομιστή.
SageMaker προσφέρει πολλαπλές επιλογές συμπερασμάτων για να διαλέξετε με βάση τις απαιτήσεις φόρτου εργασίας σας:
- Συμπεράσματα σε πραγματικό χρόνο για απαιτήσεις σε απευθείας σύνδεση, χαμηλή καθυστέρηση ή υψηλή απόδοση
- Μαζική μεταμόρφωση για εκτός σύνδεσης, προγραμματισμένη επεξεργασία και όταν δεν χρειάζεστε μόνιμο τελικό σημείο
- Ασύγχρονη συναγωγή για όταν έχετε μεγάλα ωφέλιμα φορτία με μεγάλους χρόνους επεξεργασίας και θέλετε να βάλετε αιτήματα στην ουρά
- Συμπεράσματα χωρίς διακομιστή για όταν έχετε διακεκομμένα ή απρόβλεπτα μοτίβα κυκλοφορίας και μπορείτε να ανεχτείτε ψυχρές εκκινήσεις
Στις επόμενες ενότητες, θα συζητήσουμε κάθε επιλογή συμπερασμάτων με περισσότερες λεπτομέρειες.
Συμπεράσματα SageMaker σε πραγματικό χρόνο
Όταν δημιουργείτε ένα τελικό σημείο, το SageMaker επισυνάπτει ένα Κατάστημα Amazon Elastic Block (Amazon EBS) όγκος αποθήκευσης στο Amazon Elastic Compute Cloud (Amazon EC2) στιγμιότυπο που φιλοξενεί το τελικό σημείο. Αυτό ισχύει για όλους τους τύπους περιπτώσεων που δεν συνοδεύονται από αποθηκευτικό χώρο SSD. Επειδή οι τύποι παρουσίας d* συνοδεύονται από αποθηκευτικό χώρο NVMe SSD, το SageMaker δεν συνδέει τόμο αποθήκευσης EBS σε αυτές τις περιπτώσεις υπολογισμού ML. Αναφέρομαι σε Τόμοι αποθήκευσης παρουσίας κεντρικού υπολογιστή για το μέγεθος των τόμων αποθήκευσης που επισυνάπτει το SageMaker για κάθε τύπο παρουσίας για ένα μόνο τελικό σημείο και για ένα τελικό σημείο πολλαπλών μοντέλων.
Το κόστος των καταληκτικών σημείων σε πραγματικό χρόνο του SageMaker βασίζεται στην ανά παρουσία-ώρα που καταναλώνεται για κάθε περίπτωση ενώ το τελικό σημείο εκτελείται, στο κόστος GB-μήνα του προβλεπόμενου αποθηκευτικού χώρου (τόμος EBS), καθώς και στα δεδομένα GB που υποβάλλονται σε επεξεργασία εντός και εκτός του στιγμιότυπου τελικού σημείου, όπως περιγράφεται στο Τιμολόγηση του Amazon SageMaker. Στην Εξερεύνηση κόστους, μπορείτε να προβάλετε το κόστος τελικού σημείου σε πραγματικό χρόνο, εφαρμόζοντας ένα φίλτρο για τον τύπο χρήσης. Τα ονόματα αυτών των τύπων χρήσης δομούνται ως εξής:
REGION-Host:instanceType
(για παράδειγμα,USE1-Host:ml.c5.9xlarge
)REGION-Host:VolumeUsage.gp2
(για παράδειγμα,USE1-Host:VolumeUsage.gp2
)REGION-Hst:Data-Bytes-Out
(για παράδειγμα,USE2-Hst:Data-Bytes-In
)REGION-Hst:Data-Bytes-Out
(για παράδειγμα,USW2-Hst:Data-Bytes-Out)
Όπως φαίνεται στο παρακάτω στιγμιότυπο οθόνης, φιλτράρισμα με βάση τον τύπο χρήσης Host:
θα εμφανίσει μια λίστα με τους τύπους χρήσης φιλοξενίας σε πραγματικό χρόνο σε έναν λογαριασμό.
Μπορείτε είτε να επιλέξετε συγκεκριμένους τύπους χρήσης είτε να επιλέξετε Επιλογή Όλων Και επιλέξτε Εφαρμογή για να εμφανίσετε την ανάλυση κόστους της χρήσης φιλοξενίας σε πραγματικό χρόνο του SageMaker. Για να δείτε αναλυτικά το κόστος και τη χρήση ανά ώρες λειτουργίας, πρέπει να αποεπιλέξετε όλα τα REGION-Host:VolumeUsage.gp2
τύπους χρήσης πριν από την εφαρμογή του φίλτρου τύπου χρήσης. Μπορείτε επίσης να εφαρμόσετε πρόσθετα φίλτρα όπως αριθμός λογαριασμού, τύπος παρουσίας EC2, ετικέτα κατανομής κόστους, Περιοχή και περισσότερο. Το παρακάτω στιγμιότυπο οθόνης δείχνει γραφήματα κόστους και χρήσης για τους επιλεγμένους τύπους χρήσης φιλοξενίας.
Επιπλέον, μπορείτε να εξερευνήσετε το κόστος που σχετίζεται με μία ή περισσότερες παρουσίες φιλοξενίας χρησιμοποιώντας το Τύπος παρουσίας φίλτρο. Το παρακάτω στιγμιότυπο οθόνης δείχνει την ανάλυση κόστους και χρήσης για το παράδειγμα φιλοξενίας ml.p2.xlarge.
Ομοίως, το κόστος για τα δεδομένα GB που υποβάλλονται σε επεξεργασία και εξέρχονται μπορεί να εμφανιστεί επιλέγοντας τους σχετικούς τύπους χρήσης ως εφαρμοζόμενο φίλτρο, όπως φαίνεται στο παρακάτω στιγμιότυπο οθόνης.
Αφού επιτύχετε τα επιθυμητά αποτελέσματα με φίλτρα και ομαδοποιήσεις, μπορείτε είτε να κάνετε λήψη των αποτελεσμάτων σας επιλέγοντας Λήψη ως CSV ή αποθηκεύστε την αναφορά επιλέγοντας Αποθήκευση στη βιβλιοθήκη αναφορών. Για γενικές οδηγίες σχετικά με τη χρήση του Cost Explorer, ανατρέξτε στο Νέα εμφάνιση και συνήθεις περιπτώσεις χρήσης του AWS Cost Explorer.
Προαιρετικά, μπορείτε να ενεργοποιήσετε Αναφορές κόστους και χρήσης AWS (AWS CUR) για να αποκτήσετε πληροφορίες σχετικά με το κόστος και τα δεδομένα χρήσης για τους λογαριασμούς σας. Το AWS CUR περιέχει ωριαίες λεπτομέρειες κατανάλωσης AWS. Είναι αποθηκευμένο σε Απλή υπηρεσία αποθήκευσης Amazon (Amazon S3) στον λογαριασμό πληρωτή, ο οποίος ενοποιεί δεδομένα για όλους τους συνδεδεμένους λογαριασμούς. Μπορείτε να εκτελέσετε ερωτήματα για να αναλύσετε τις τάσεις στη χρήση σας και να προβείτε στις κατάλληλες ενέργειες για τη βελτιστοποίηση του κόστους. Αμαζόν Αθηνά είναι μια υπηρεσία ερωτημάτων χωρίς διακομιστή που μπορείτε να χρησιμοποιήσετε για να αναλύσετε τα δεδομένα από το AWS CUR στο Amazon S3 χρησιμοποιώντας τυπική SQL. Περισσότερες πληροφορίες και παραδείγματα ερωτημάτων μπορείτε να βρείτε στο Βιβλιοθήκη ερωτημάτων AWS CUR.
Μπορείτε επίσης να τροφοδοτήσετε δεδομένα AWS CUR Amazon QuickSight, όπου μπορείτε να το κόψετε σε φέτες και σε κύβους με όποιον τρόπο θέλετε για λόγους αναφοράς ή οπτικοποίησης. Για οδηγίες, βλ Πώς μπορώ να απορροφήσω και να οπτικοποιήσω την αναφορά κόστους και χρήσης AWS (CUR) στο Amazon QuickSight.
Μπορείτε να λάβετε πληροφορίες σε επίπεδο πόρων, όπως ARN τελικού σημείου, τύπους παρουσιών τελικού σημείου, ωριαίο ρυθμό παρουσίασης, ημερήσιες ώρες χρήσης και πολλά άλλα από το AWS CUR. Μπορείτε επίσης να συμπεριλάβετε ετικέτες κατανομής κόστους στο ερώτημά σας για ένα επιπλέον επίπεδο ευαισθησίας. Το ακόλουθο παράδειγμα ερωτήματος επιστρέφει τη χρήση πόρων φιλοξενίας σε πραγματικό χρόνο για τους τελευταίους 3 μήνες για τον συγκεκριμένο λογαριασμό πληρωτή:
Το παρακάτω στιγμιότυπο οθόνης δείχνει τα αποτελέσματα που προέκυψαν από την εκτέλεση του ερωτήματος χρησιμοποιώντας το Athena. Για περισσότερες πληροφορίες, ανατρέξτε στο Ερώτηση αναφορών κόστους και χρήσης χρησιμοποιώντας το Amazon Athena.
Το αποτέλεσμα του ερωτήματος δείχνει αυτό το τελικό σημείο mme-xgboost-housing
με ml.x4.xlarge η παρουσία αναφέρει 24 ώρες χρόνου εκτέλεσης για πολλές διαδοχικές ημέρες. Η τιμή παρουσίας είναι 0.24 $/ώρα και το ημερήσιο κόστος λειτουργίας για 24 ώρες είναι 5.76 $.
Τα αποτελέσματα του AWS CUR μπορούν να σας βοηθήσουν να προσδιορίσετε μοτίβα τελικών σημείων που εκτελούνται για διαδοχικές ημέρες σε καθέναν από τους συνδεδεμένους λογαριασμούς, καθώς και τελικά σημεία με το υψηλότερο μηνιαίο κόστος. Αυτό μπορεί επίσης να σας βοηθήσει να αποφασίσετε εάν τα τελικά σημεία σε λογαριασμούς που δεν είναι παραγωγοί μπορούν να διαγραφούν για εξοικονόμηση κόστους.
Βελτιστοποιήστε το κόστος για τελικά σημεία σε πραγματικό χρόνο
Από την άποψη της διαχείρισης του κόστους, είναι σημαντικό να προσδιορίζονται υποχρησιμοποιούμενα (ή υπερμεγέθη) περιπτώσεις και να ευθυγραμμίζονται το μέγεθος και οι μετρήσεις των παρουσιών, εάν απαιτείται, με τις απαιτήσεις φόρτου εργασίας. Γράφονται κοινές μετρήσεις συστήματος, όπως η χρήση CPU/GPU και η χρήση μνήμης amazoncloudwatch για όλες τις περιπτώσεις φιλοξενίας. Για τα τελικά σημεία σε πραγματικό χρόνο, το SageMaker διαθέτει αρκετές πρόσθετες μετρήσεις στο CloudWatch. Ορισμένες από τις μετρήσεις που συνήθως παρακολουθούνται περιλαμβάνουν πλήθος επίκλησης και σφάλματα επίκλησης 4xx/5xx. Για μια πλήρη λίστα μετρήσεων, ανατρέξτε στο Παρακολουθήστε το Amazon SageMaker με το Amazon CloudWatch.
Η μετρική CPUUtilization
παρέχει το άθροισμα της χρήσης κάθε μεμονωμένου πυρήνα CPU. Η χρήση της CPU για κάθε εύρος πυρήνα είναι 0–100. Για παράδειγμα, εάν υπάρχουν τέσσερις CPU, η CPUUtilization
το εύρος είναι 0–400%. Η μετρική MemoryUtilization
είναι το ποσοστό της μνήμης που χρησιμοποιείται από τα κοντέινερ σε μια παρουσία. Αυτό το εύρος τιμών είναι 0–100%. Το παρακάτω στιγμιότυπο οθόνης δείχνει ένα παράδειγμα μετρήσεων CloudWatch CPUUtilization
και MemoryUtilization
για παράδειγμα τελικού σημείου ml.m4.10xlarge που συνοδεύεται από 40 vCPU και μνήμη 160 GiB.
Αυτά τα γραφήματα μετρήσεων δείχνουν τη μέγιστη χρήση της CPU περίπου 3,000%, που ισοδυναμεί με 30 vCPU. Αυτό σημαίνει ότι αυτό το τελικό σημείο δεν χρησιμοποιεί περισσότερες από 30 vCPU από τη συνολική χωρητικότητα των 40 vCPU. Ομοίως, η χρήση της μνήμης είναι κάτω από 6%. Χρησιμοποιώντας αυτές τις πληροφορίες, μπορείτε πιθανώς να πειραματιστείτε με μια μικρότερη παρουσία που μπορεί να καλύψει αυτήν την ανάγκη πόρων. Επιπλέον, το CPUUtilization
Η μέτρηση δείχνει ένα κλασικό μοτίβο περιοδικής υψηλής και χαμηλής ζήτησης CPU, γεγονός που καθιστά αυτό το τελικό σημείο καλό υποψήφιο για αυτόματη κλιμάκωση. Μπορείτε να ξεκινήσετε με μια μικρότερη παρουσία και να κλιμακωθείτε πρώτα καθώς αλλάζει η υπολογιστική σας ζήτηση. Για πληροφορίες, βλ Αυτόματη κλίμακα μοντέλων Amazon SageMaker.
Το SageMaker είναι εξαιρετικό για τη δοκιμή νέων μοντέλων, επειδή μπορείτε εύκολα να τα αναπτύξετε σε περιβάλλον δοκιμών A/B χρησιμοποιώντας παραλλαγές παραγωγής, και πληρώνετε μόνο για ό,τι χρησιμοποιείτε. Κάθε παραλλαγή παραγωγής εκτελείται με τη δική της υπολογιστική παρουσία και χρεώνεστε ανά παρουσία-ώρα που καταναλώνετε για κάθε παρουσίαση ενώ εκτελείται η παραλλαγή.
Το SageMaker υποστηρίζει επίσης παραλλαγές σκιάς, τα οποία έχουν τα ίδια στοιχεία με μια παραλλαγή παραγωγής και εκτελούνται στη δική τους υπολογιστική παρουσία. Με τις σκιώδεις παραλλαγές, το SageMaker αναπτύσσει αυτόματα το μοντέλο σε ένα δοκιμαστικό περιβάλλον, δρομολογεί ένα αντίγραφο των αιτημάτων συμπερασμάτων που λαμβάνονται από το μοντέλο παραγωγής στο δοκιμαστικό μοντέλο σε πραγματικό χρόνο και συλλέγει μετρήσεις απόδοσης, όπως λανθάνουσα κατάσταση και απόδοση. Αυτό σας δίνει τη δυνατότητα να επικυρώσετε οποιοδήποτε νέο υποψήφιο στοιχείο της στοίβας εξυπηρέτησης του μοντέλου σας πριν το προωθήσετε στην παραγωγή.
Όταν τελειώσετε με τις δοκιμές σας και δεν χρησιμοποιείτε πλέον εκτενώς το τελικό σημείο ή τις παραλλαγές, θα πρέπει να το διαγράψετε για να εξοικονομήσετε κόστος. Επειδή το μοντέλο είναι αποθηκευμένο στο Amazon S3, μπορείτε να το αναδημιουργήσετε όπως απαιτείται. Μπορείτε να εντοπίσετε αυτόματα αυτά τα τελικά σημεία και να προβείτε σε διορθωτικές ενέργειες (όπως η διαγραφή τους) χρησιμοποιώντας Εκδηλώσεις Amazon CloudWatch και AWS Lambda λειτουργίες. Για παράδειγμα, μπορείτε να χρησιμοποιήσετε το Invocations
μέτρηση για να λάβετε τον συνολικό αριθμό των αιτημάτων που αποστέλλονται σε ένα τελικό σημείο μοντέλου και στη συνέχεια να εντοπίσετε εάν τα τελικά σημεία ήταν αδρανή για τις τελευταίες ώρες (χωρίς κλήσεις για μια συγκεκριμένη περίοδο, όπως 24 ώρες).
Εάν έχετε πολλές υποχρησιμοποιημένες παρουσίες τελικού σημείου, εξετάστε τις επιλογές φιλοξενίας όπως π.χ τελικά σημεία πολλαπλών μοντέλων (ΜΜΕ), καταληκτικά σημεία πολλαπλών κοντέινερ (MCEs), και σειριακούς αγωγούς συμπερασμάτων για ενοποίηση της χρήσης σε λιγότερες παρουσίες τελικού σημείου.
Για ανάπτυξη μοντέλων συμπερασμάτων σε πραγματικό χρόνο και ασύγχρονη, μπορείτε να βελτιστοποιήσετε το κόστος και την απόδοση αναπτύσσοντας μοντέλα στο SageMaker χρησιμοποιώντας AWS Graviton. Το AWS Graviton είναι μια οικογένεια επεξεργαστών σχεδιασμένων από την AWS που παρέχουν την καλύτερη απόδοση τιμής και είναι πιο ενεργειακά αποδοτικοί από τους αντίστοιχους x86. Για καθοδήγηση σχετικά με την ανάπτυξη ενός μοντέλου ML σε περιπτώσεις που βασίζονται στο AWS Graviton και λεπτομέρειες σχετικά με το όφελος απόδοσης τιμής, ανατρέξτε στο Εκτελέστε φόρτους εργασίας συμπερασμάτων μηχανικής εκμάθησης σε περιπτώσεις που βασίζονται στο AWS Graviton με το Amazon SageMaker. Το SageMaker υποστηρίζει επίσης Αίσθηση AWS επιταχυντές μέσω του ml.inf2 οικογένεια περιπτώσεων για την ανάπτυξη μοντέλων ML για εξαγωγή συμπερασμάτων σε πραγματικό χρόνο και ασύγχρονη. Μπορείτε να χρησιμοποιήσετε αυτές τις περιπτώσεις στο SageMaker για να επιτύχετε υψηλή απόδοση με χαμηλό κόστος για μοντέλα παραγωγής τεχνητής νοημοσύνης (AI), συμπεριλαμβανομένων μοντέλων μεγάλων γλωσσών (LLM) και μετασχηματιστών όρασης.
Επιπλέον, μπορείτε να χρησιμοποιήσετε Amazon SageMaker Inference Recommender για να εκτελέσετε δοκιμές φόρτωσης και να αξιολογήσετε τα οφέλη απόδοσης τιμής από την ανάπτυξη του μοντέλου σας σε αυτές τις περιπτώσεις. Για πρόσθετες οδηγίες σχετικά με την αυτόματη ανίχνευση αδρανών τελικών σημείων SageMaker, καθώς και το σωστό μέγεθος και την αυτόματη κλιμάκωση για τα τελικά σημεία του SageMaker, ανατρέξτε στο Εξασφαλίστε αποτελεσματικούς υπολογιστικούς πόρους στο Amazon SageMaker.
Μετασχηματισμός παρτίδας SageMaker
Συμπέρασμα παρτίδας ή συμπέρασμα εκτός σύνδεσης, είναι η διαδικασία δημιουργίας προβλέψεων σε μια παρτίδα παρατηρήσεων. Οι προβλέψεις εκτός σύνδεσης είναι κατάλληλες για μεγαλύτερα σύνολα δεδομένων και σε περιπτώσεις όπου έχετε την πολυτέλεια να περιμένετε αρκετά λεπτά ή ώρες για μια απάντηση.
Το κόστος για το μετασχηματισμό παρτίδας του SageMaker βασίζεται στην ανά παρουσία-ώρα που καταναλώνεται για κάθε παρουσία ενώ εκτελείται η εργασία μετασχηματισμού παρτίδας, όπως περιγράφεται στο Τιμολόγηση του Amazon SageMaker. Στην Εξερεύνηση κόστους, μπορείτε να εξερευνήσετε το κόστος μετασχηματισμού παρτίδων εφαρμόζοντας ένα φίλτρο στον τύπο χρήσης. Το όνομα αυτού του τύπου χρήσης είναι δομημένο ως REGION-Tsform:instanceType
(για παράδειγμα, USE1-Tsform:ml.c5.9xlarge
).
Όπως φαίνεται στο παρακάτω στιγμιότυπο οθόνης, φιλτράρισμα ανά τύπο χρήσης Tsform:
θα εμφανίσει μια λίστα με τους τύπους χρήσης μαζικών μετασχηματισμών του SageMaker σε έναν λογαριασμό.
Μπορείτε είτε να επιλέξετε συγκεκριμένους τύπους χρήσης είτε να επιλέξετε Επιλογή Όλων Και επιλέξτε Εφαρμογή για να εμφανίσετε την ανάλυση κόστους της χρήσης παρτίδων μετασχηματισμού παρτίδας για τους επιλεγμένους τύπους. Όπως αναφέρθηκε προηγουμένως, μπορείτε επίσης να εφαρμόσετε πρόσθετα φίλτρα. Το παρακάτω στιγμιότυπο οθόνης δείχνει γραφήματα κόστους και χρήσης για τους επιλεγμένους τύπους χρήσης μετασχηματισμών παρτίδας.
Βελτιστοποιήστε το κόστος για μετασχηματισμό παρτίδας
Ο μαζικός μετασχηματισμός SageMaker σάς χρεώνει μόνο για τις περιπτώσεις που χρησιμοποιούνται ενώ εκτελούνται οι εργασίες σας. Εάν τα δεδομένα σας βρίσκονται ήδη στο Amazon S3, τότε δεν υπάρχει κόστος για την ανάγνωση δεδομένων εισόδου από το Amazon S3 και την εγγραφή δεδομένων εξόδου στο Amazon S3. Όλα τα αντικείμενα εξόδου επιχειρείται να μεταφορτωθούν στο Amazon S3. Εάν όλα είναι επιτυχή, τότε η εργασία μετασχηματισμού παρτίδας επισημαίνεται ως ολοκληρωμένη. Εάν ένα ή περισσότερα αντικείμενα αποτύχουν, η εργασία μετασχηματισμού παρτίδας επισημαίνεται ως αποτυχία.
Οι χρεώσεις για εργασίες μαζικής μετατροπής ισχύουν στα ακόλουθα σενάρια:
- Η δουλειά είναι επιτυχημένη
- Αποτυχία λόγω
ClientError
και το μοντέλο κοντέινερ είναι SageMaker ή ένα διαχειριζόμενο πλαίσιο SageMaker - Αποτυχία λόγω
AlgorithmError
orClientError
και το μοντέλο κοντέινερ είναι το δικό σας προσαρμοσμένο κοντέινερ (BYOC)
Ακολουθούν μερικές από τις βέλτιστες πρακτικές για τη βελτιστοποίηση μιας εργασίας μαζικής μετατροπής του SageMaker. Αυτές οι συστάσεις μπορούν να μειώσουν το συνολικό χρόνο εκτέλεσης της εργασίας μετασχηματισμού παρτίδας, μειώνοντας έτσι το κόστος:
- σετ Στρατηγική παρτίδας προς την
MultiRecord
καιSplitType
προς τηνLine
εάν χρειάζεστε την εργασία μετασχηματισμού παρτίδας για να δημιουργήσετε μίνι παρτίδες από το αρχείο εισόδου. Εάν δεν μπορεί να χωρίσει αυτόματα το σύνολο δεδομένων σε μίνι παρτίδες, μπορείτε να το διαιρέσετε σε μίνι παρτίδες τοποθετώντας κάθε παρτίδα σε ένα ξεχωριστό αρχείο εισόδου, που θα τοποθετηθεί στον κάδο προέλευσης δεδομένων S3. - Βεβαιωθείτε ότι το μέγεθος της παρτίδας ταιριάζει στη μνήμη. Το SageMaker συνήθως το χειρίζεται αυτόματα. Ωστόσο, κατά τη χειροκίνητη διαίρεση των παρτίδων, αυτό πρέπει να ρυθμιστεί με βάση τη μνήμη.
- Ο μαζικός μετασχηματισμός χωρίζει τα αντικείμενα S3 στην είσοδο κατά κλειδί και αντιστοιχίζει αυτά τα αντικείμενα σε στιγμιότυπα. Όταν έχετε πολλά αρχεία, μια παρουσία μπορεί να επεξεργαστεί
input1.csv
, και μια άλλη παρουσία μπορεί να επεξεργαστείinput2.csv
. Εάν έχετε ένα αρχείο εισόδου αλλά αρχικοποιείτε πολλαπλές παρουσίες υπολογισμού, μόνο μία παρουσία επεξεργάζεται το αρχείο εισόδου και οι υπόλοιπες παρουσίες είναι αδρανείς. Βεβαιωθείτε ότι ο αριθμός των αρχείων είναι ίσος ή μεγαλύτερος από τον αριθμό των παρουσιών. - Εάν έχετε μεγάλο αριθμό μικρών αρχείων, μπορεί να είναι ωφέλιμο να συνδυάσετε πολλά αρχεία σε έναν μικρό αριθμό μεγαλύτερων αρχείων για να μειώσετε τον χρόνο αλληλεπίδρασης του Amazon S3.
- Εάν χρησιμοποιείτε το CreateTransformJob API, μπορείτε να μειώσετε τον χρόνο που απαιτείται για την ολοκλήρωση εργασιών μετασχηματισμού παρτίδων χρησιμοποιώντας βέλτιστες τιμές για παραμέτρους όπως MaxPayloadInMB, MaxConcurrentTransforms, ή Στρατηγική παρτίδας:
MaxConcurrentTransforms
υποδεικνύει τον μέγιστο αριθμό παράλληλων αιτημάτων που μπορούν να σταλούν σε κάθε παρουσία σε μια εργασία μετασχηματισμού. Η ιδανική τιμή γιαMaxConcurrentTransforms
ισούται με τον αριθμό των πυρήνων vCPU σε μια περίπτωση.MaxPayloadInMB
είναι το μέγιστο επιτρεπόμενο μέγεθος του ωφέλιμου φορτίου, σε MB. Η αξία σεMaxPayloadInMB
πρέπει να είναι μεγαλύτερο ή ίσο με το μέγεθος μιας μεμονωμένης εγγραφής. Για να υπολογίσετε το μέγεθος μιας εγγραφής σε MB, διαιρέστε το μέγεθος του συνόλου δεδομένων σας με τον αριθμό των εγγραφών. Για να διασφαλίσετε ότι οι εγγραφές ταιριάζουν στο μέγιστο μέγεθος ωφέλιμου φορτίου, συνιστούμε να χρησιμοποιήσετε μια ελαφρώς μεγαλύτερη τιμή. Η προεπιλεγμένη τιμή είναι 6 MB.MaxPayloadInMB
δεν πρέπει να είναι μεγαλύτερη από 100 MB. Εάν καθορίσετε το προαιρετικόMaxConcurrentTransforms
παράμετρος και μετά η τιμή του (MaxConcurrentTransforms
*MaxPayloadInMB
) δεν πρέπει επίσης να υπερβαίνει τα 100 MB.- Για περιπτώσεις όπου το ωφέλιμο φορτίο μπορεί να είναι αυθαίρετα μεγάλο και μεταδίδεται με χρήση κωδικοποίησης HTTP, ορίστε την τιμή MaxPayloadInMB σε 0. Αυτή η δυνατότητα λειτουργεί μόνο σε υποστηριζόμενους αλγόριθμους. Επί του παρόντος, οι ενσωματωμένοι αλγόριθμοι του SageMaker δεν υποστηρίζουν τεμαχισμένη κωδικοποίηση HTTP.
- Οι εργασίες συμπερασμάτων παρτίδας είναι συνήθως καλοί υποψήφιοι για οριζόντια κλιμάκωση. Κάθε εργαζόμενος σε ένα σύμπλεγμα μπορεί να λειτουργήσει σε διαφορετικό υποσύνολο δεδομένων χωρίς την ανάγκη ανταλλαγής πληροφοριών με άλλους εργαζόμενους. Το AWS προσφέρει πολλαπλές επιλογές αποθήκευσης και υπολογισμού που επιτρέπουν την οριζόντια κλιμάκωση. Εάν μια μεμονωμένη παρουσία δεν επαρκεί για να καλύψει τις απαιτήσεις απόδοσης, εξετάστε το ενδεχόμενο να χρησιμοποιήσετε πολλές παρουσίες παράλληλα για να κατανείμετε τον φόρτο εργασίας. Για βασικά ζητήματα κατά την αρχιτεκτονική εργασιών μαζικής μετατροπής, ανατρέξτε στο Συμπεράσματα παρτίδας σε κλίμακα με το Amazon SageMaker.
- Παρακολουθήστε συνεχώς τις μετρήσεις απόδοσης των εργασιών μαζικής μετατροπής του SageMaker χρησιμοποιώντας το CloudWatch. Αναζητήστε σημεία συμφόρησης, όπως υψηλή χρήση CPU ή GPU, χρήση μνήμης ή απόδοση δικτύου, για να προσδιορίσετε εάν χρειάζεται να προσαρμόσετε τα μεγέθη ή τις διαμορφώσεις παρουσιών.
- Το SageMaker χρησιμοποιεί το Amazon S3 API μεταφόρτωσης πολλαπλών μερών για να ανεβάσετε αποτελέσματα από μια εργασία μετασχηματισμού παρτίδας στο Amazon S3. Εάν παρουσιαστεί σφάλμα, τα μεταφορτωμένα αποτελέσματα αφαιρούνται από το Amazon S3. Σε ορισμένες περιπτώσεις, όπως όταν συμβαίνει μια διακοπή δικτύου, μια ελλιπής μεταφόρτωση πολλών μερών ενδέχεται να παραμείνει στο Amazon S3. Για να αποφύγετε χρεώσεις αποθήκευσης, συνιστούμε να προσθέσετε το Πολιτική κάδου S3 στους κανόνες κύκλου ζωής του κάδου S3. Αυτή η πολιτική διαγράφει ημιτελείς μεταφορτώσεις πολλών μερών που ενδέχεται να είναι αποθηκευμένες στον κάδο S3. Για περισσότερες πληροφορίες, βλ Διαχείριση του κύκλου ζωής αποθήκευσης.
Ασύγχρονη συμπεράσματα SageMaker
Το ασύγχρονο συμπέρασμα είναι μια εξαιρετική επιλογή για φόρτους εργασίας που είναι ευαίσθητοι στο κόστος με μεγάλο ωφέλιμο φορτίο και ριπή κυκλοφορίας. Η επεξεργασία των αιτημάτων μπορεί να διαρκέσει έως και 1 ώρα και να έχουν μεγέθη ωφέλιμου φορτίου έως και 1 GB, επομένως είναι πιο κατάλληλο για φόρτους εργασίας που έχουν χαλαρές απαιτήσεις λανθάνοντος χρόνου.
Η επίκληση ασύγχρονων τελικών σημείων διαφέρει από τα τελικά σημεία σε πραγματικό χρόνο. Αντί να μεταβιβάζετε ένα ωφέλιμο φορτίο αιτήματος ταυτόχρονα με το αίτημα, μεταφορτώνετε το ωφέλιμο φορτίο στο Amazon S3 και μεταβιβάζετε ένα URI S3 ως μέρος του αιτήματος. Εσωτερικά, το SageMaker διατηρεί μια ουρά με αυτά τα αιτήματα και τα επεξεργάζεται. Κατά τη δημιουργία τελικού σημείου, μπορείτε προαιρετικά να καθορίσετε ένα Υπηρεσία απλών ειδοποιήσεων Amazon Θέμα (Amazon SNS) για να λαμβάνετε ειδοποιήσεις επιτυχίας ή σφάλματος. Όταν λάβετε την ειδοποίηση ότι το αίτημα συμπερασμάτων σας έχει υποβληθεί σε επιτυχή επεξεργασία, μπορείτε να αποκτήσετε πρόσβαση στο αποτέλεσμα στη θέση εξόδου Amazon S3.
Το κόστος για ασύγχρονα συμπεράσματα βασίζεται στην ανά παρουσία-ώρα που καταναλώνεται για κάθε παρουσία ενώ εκτελείται το τελικό σημείο, στο κόστος των GB-μήνα της προβλεπόμενης αποθήκευσης, καθώς και στα δεδομένα GB που υποβάλλονται σε επεξεργασία εντός και εκτός της παρουσίας τελικού σημείου, όπως περιγράφεται στο Τιμολόγηση του Amazon SageMaker. Στην Εξερεύνηση κόστους, μπορείτε να φιλτράρετε το ασύγχρονο κόστος συμπερασμάτων εφαρμόζοντας ένα φίλτρο στον τύπο χρήσης. Το όνομα αυτού του τύπου χρήσης είναι δομημένο ως REGION-AsyncInf:instanceType
(για παράδειγμα, USE1-AsyncInf:ml.c5.9xlarge
). Λάβετε υπόψη ότι οι τύποι χρήσης του όγκου GB και των επεξεργασμένων δεδομένων GB είναι οι ίδιοι με τα τελικά σημεία σε πραγματικό χρόνο, όπως αναφέρθηκε νωρίτερα σε αυτήν την ανάρτηση.
Όπως φαίνεται στο παρακάτω στιγμιότυπο οθόνης, φιλτράρισμα με βάση τον τύπο χρήσης AsyncInf:
στην Εξερεύνηση κόστους εμφανίζει μια ανάλυση κόστους κατά ασύγχρονους τύπους χρήσης τελικού σημείου.
Για να δείτε αναλυτικά το κόστος και τη χρήση ανά ώρες λειτουργίας, πρέπει να αποεπιλέξετε όλα τα REGION-Host:VolumeUsage.gp2
τύπους χρήσης πριν από την εφαρμογή του φίλτρου τύπου χρήσης. Μπορείτε επίσης να εφαρμόσετε πρόσθετα φίλτρα. Πληροφορίες σε επίπεδο πόρων, όπως το τελικό σημείο ARN, οι τύποι παρουσιών τελικού σημείου, ο ρυθμός ωριαίας παρουσίας και οι ημερήσιες ώρες χρήσης μπορούν να ληφθούν από το AWS CUR. Το παρακάτω είναι ένα παράδειγμα ερωτήματος AWS CUR για τη λήψη ασύγχρονης χρήσης πόρων φιλοξενίας για τους τελευταίους 3 μήνες:
Το ακόλουθο στιγμιότυπο οθόνης δείχνει τα αποτελέσματα που προέκυψαν από την εκτέλεση του ερωτήματος AWS CUR χρησιμοποιώντας το Athena.
Το αποτέλεσμα του ερωτήματος δείχνει αυτό το τελικό σημείο sagemaker-abc-model-5
με ml.m5.xlarge η παρουσία αναφέρει 24 ώρες χρόνου εκτέλεσης για πολλές διαδοχικές ημέρες. Η τιμή παρουσίας είναι 0.23 $/ώρα και το ημερήσιο κόστος λειτουργίας για 24 ώρες είναι 5.52 $.
Όπως αναφέρθηκε προηγουμένως, τα αποτελέσματα του AWS CUR μπορούν να σας βοηθήσουν να αναγνωρίσετε μοτίβα τελικών σημείων που εκτελούνται για συνεχόμενες ημέρες, καθώς και τελικά σημεία με το υψηλότερο μηνιαίο κόστος. Αυτό μπορεί επίσης να σας βοηθήσει να αποφασίσετε εάν τα τελικά σημεία σε λογαριασμούς που δεν είναι παραγωγοί μπορούν να διαγραφούν για εξοικονόμηση κόστους.
Βελτιστοποιήστε το κόστος για ασύγχρονα συμπεράσματα
Ακριβώς όπως τα τελικά σημεία σε πραγματικό χρόνο, το κόστος για τα ασύγχρονα τελικά σημεία βασίζεται στη χρήση του τύπου παρουσίας. Ως εκ τούτου, είναι σημαντικό να προσδιορίσετε περιπτώσεις που δεν χρησιμοποιούνται ελάχιστα και να αλλάξετε το μέγεθός τους με βάση τις απαιτήσεις φόρτου εργασίας. Για την παρακολούθηση των ασύγχρονων τελικών σημείων, το SageMaker δημιουργεί μερικές μετρήσεις όπως ApproximateBacklogSize
, HasBacklogWithoutCapacity
και άλλα διαθέσιμα στο CloudWatch. Αυτές οι μετρήσεις μπορούν να εμφανίζουν αιτήματα στην ουρά για παράδειγμα και μπορούν να χρησιμοποιηθούν για την αυτόματη κλιμάκωση ενός τελικού σημείου. Το ασύγχρονο συμπέρασμα του SageMaker περιλαμβάνει επίσης μετρήσεις σε επίπεδο κεντρικού υπολογιστή. Για πληροφορίες σχετικά με τις μετρήσεις σε επίπεδο κεντρικού υπολογιστή, βλ SageMaker Jobs and Endpoint Metrics. Αυτές οι μετρήσεις μπορούν να δείχνουν τη χρήση πόρων που μπορεί να σας βοηθήσει να προσαρμόσετε σωστά το μέγεθος της παρουσίας.
Υποστηρίζει το SageMaker αυτόματη κλιμάκωση για ασύγχρονα τελικά σημεία. Σε αντίθεση με τα τελικά σημεία που φιλοξενούνται σε πραγματικό χρόνο, τα ασύγχρονα τελικά σημεία συμπερασμάτων υποστηρίζουν τη μείωση των παρουσιών στο μηδέν ορίζοντας την ελάχιστη χωρητικότητα σε μηδέν. Για ασύγχρονα τελικά σημεία, το SageMaker συνιστά ανεπιφύλακτα να δημιουργήσετε μια διαμόρφωση πολιτικής για την κλιμάκωση της παρακολούθησης στόχου για ένα αναπτυγμένο μοντέλο (παραλλαγή). Πρέπει να ορίσετε την πολιτική κλιμάκωσης που κλιμακώθηκε στο ApproximateBacklogPerInstance
προσαρμοσμένη μέτρηση και ορίστε το MinCapacity
τιμή στο μηδέν.
Το ασύγχρονο συμπέρασμα σάς δίνει τη δυνατότητα να εξοικονομήσετε κόστος με την αυτόματη κλιμάκωση του αριθμού παρουσιών στο μηδέν όταν δεν υπάρχουν αιτήματα για επεξεργασία, επομένως πληρώνετε μόνο όταν το τελικό σημείο επεξεργάζεται αιτήματα. Τα αιτήματα που λαμβάνονται όταν υπάρχουν μηδέν παρουσίες βρίσκονται στην ουρά για επεξεργασία μετά την κλιμάκωση του τελικού σημείου. Επομένως, για περιπτώσεις χρήσης που μπορούν να ανεχθούν ποινή ψυχρής εκκίνησης λίγων λεπτών, μπορείτε προαιρετικά να μειώσετε τον αριθμό των παρουσιών τελικού σημείου στο μηδέν όταν δεν υπάρχουν εκκρεμή αιτήματα και να κάνετε εφεδρική κλίμακα καθώς φτάνουν νέα αιτήματα. Ο χρόνος ψυχρής εκκίνησης εξαρτάται από τον χρόνο που απαιτείται για την εκκίνηση ενός νέου τερματικού σημείου από την αρχή. Επίσης, εάν το ίδιο το μοντέλο είναι μεγάλο, τότε ο χρόνος μπορεί να είναι μεγαλύτερος. Εάν η εργασία σας αναμένεται να διαρκέσει περισσότερο από τον χρόνο επεξεργασίας της 1 ώρας, ίσως θελήσετε να εξετάσετε τη μαζική μετατροπή του SageMaker.
Επιπλέον, μπορείτε επίσης να λάβετε υπόψη τον χρόνο αναμονής του αιτήματός σας σε συνδυασμό με τον χρόνο επεξεργασίας για να επιλέξετε τον τύπο παρουσίας. Για παράδειγμα, εάν η περίπτωση χρήσης σας μπορεί να ανεχθεί ώρες αναμονής, μπορείτε να επιλέξετε μια μικρότερη περίπτωση για εξοικονόμηση κόστους.
Για πρόσθετες οδηγίες σχετικά με το δεξί μέγεθος και την αυτόματη κλιμάκωση για τα τελικά σημεία του SageMaker, ανατρέξτε στο Εξασφαλίστε αποτελεσματικούς υπολογιστικούς πόρους στο Amazon SageMaker.
Συμπεράσματα χωρίς διακομιστή
Η εξαγωγή συμπερασμάτων χωρίς διακομιστή σάς επιτρέπει να αναπτύξετε μοντέλα ML για εξαγωγή συμπερασμάτων χωρίς να χρειάζεται να διαμορφώσετε ή να διαχειριστείτε την υποκείμενη υποδομή. Με βάση τον όγκο των αιτημάτων συμπερασμάτων που λαμβάνει το μοντέλο σας, το συμπέρασμα χωρίς διακομιστή SageMaker παρέχει αυτόματα, κλιμακώνει και απενεργοποιεί την υπολογιστική ικανότητα. Ως αποτέλεσμα, πληρώνετε μόνο για τον υπολογιστικό χρόνο εκτέλεσης του κωδικού συμπερασμάτων σας και την ποσότητα των δεδομένων που υποβάλλονται σε επεξεργασία, όχι για τον χρόνο αδράνειας. Για τερματικά σημεία χωρίς διακομιστή, δεν είναι απαραίτητη η παροχή παρουσίας. Πρέπει να παρέχετε το μέγεθος μνήμης και μέγιστη ταυτόχρονη. Επειδή η παροχή τερματικών σημείων χωρίς διακομιστή υπολογίζει πόρους κατ' απαίτηση, το τελικό σημείο μπορεί να αντιμετωπίσει μερικά επιπλέον δευτερόλεπτα καθυστέρησης (ψυχρή εκκίνηση) για την πρώτη κλήση μετά από μια περίοδο αδράνειας. Πληρώνετε για την υπολογιστική χωρητικότητα που χρησιμοποιείται για την επεξεργασία αιτημάτων συμπερασμάτων, που χρεώνονται ανά χιλιοστό του δευτερολέπτου, GB-μήνα του παρεχόμενου αποθηκευτικού χώρου και την ποσότητα των δεδομένων που υποβάλλονται σε επεξεργασία. Η υπολογιστική χρέωση εξαρτάται από τη διαμόρφωση μνήμης που επιλέγετε.
Στην Εξερεύνηση κόστους, μπορείτε να φιλτράρετε το κόστος τερματικών σημείων χωρίς διακομιστή εφαρμόζοντας ένα φίλτρο στον τύπο χρήσης. Το όνομα αυτού του τύπου χρήσης είναι δομημένο ως REGION-ServerlessInf:Mem-MemorySize
(για παράδειγμα, USE2-ServerlessInf:Mem-4GB
). Λάβετε υπόψη ότι οι τύποι χρήσης του όγκου GB και των επεξεργασμένων δεδομένων GB είναι οι ίδιοι με τα τελικά σημεία σε πραγματικό χρόνο.
Μπορείτε να δείτε την ανάλυση κόστους εφαρμόζοντας πρόσθετα φίλτρα όπως αριθμός λογαριασμού, τύπος παρουσίας, Περιοχή και άλλα. Το ακόλουθο στιγμιότυπο οθόνης δείχνει την ανάλυση κόστους με την εφαρμογή φίλτρων για τον τύπο χρήσης συμπερασμάτων χωρίς διακομιστή.
Βελτιστοποιήστε το κόστος για συμπέρασμα χωρίς διακομιστή
Όταν διαμορφώνετε το τελικό σημείο χωρίς διακομιστή, μπορείτε να καθορίσετε το μέγεθος της μνήμης και τον μέγιστο αριθμό ταυτόχρονων κλήσεων. Το συμπέρασμα χωρίς διακομιστή SageMaker εκχωρεί αυτόματα υπολογιστικούς πόρους ανάλογα με τη μνήμη που επιλέγετε. Εάν επιλέξετε μεγαλύτερο μέγεθος μνήμης, το κοντέινερ σας έχει πρόσβαση σε περισσότερες vCPU. Με την εξαγωγή συμπερασμάτων χωρίς διακομιστή, πληρώνετε μόνο για την υπολογιστική χωρητικότητα που χρησιμοποιείται για την επεξεργασία αιτημάτων συμπερασμάτων, που χρεώνονται ανά χιλιοστό του δευτερολέπτου, και την ποσότητα των δεδομένων που υποβάλλονται σε επεξεργασία. Η υπολογιστική χρέωση εξαρτάται από τη διαμόρφωση μνήμης που επιλέγετε. Τα μεγέθη μνήμης που μπορείτε να επιλέξετε είναι 1024 MB, 2048 MB, 3072 MB, 4096 MB, 5120 MB και 6144 MB. Η τιμολόγηση αυξάνεται με τις αυξήσεις του μεγέθους της μνήμης, όπως εξηγείται στο Τιμολόγηση του Amazon SageMaker, επομένως είναι σημαντικό να επιλέξετε το σωστό μέγεθος μνήμης. Κατά γενικό κανόνα, το μέγεθος της μνήμης πρέπει να είναι τουλάχιστον τόσο μεγάλο όσο το μέγεθος του μοντέλου σας. Ωστόσο, είναι καλή πρακτική να αναφερόμαστε στη χρήση μνήμης όταν αποφασίζουμε το μέγεθος της μνήμης τελικού σημείου, εκτός από το ίδιο το μέγεθος του μοντέλου.
Γενικές βέλτιστες πρακτικές για τη βελτιστοποίηση του κόστους συμπερασμάτων του SageMaker
Η βελτιστοποίηση του κόστους φιλοξενίας δεν είναι μια μοναδική περίπτωση. Είναι μια συνεχής διαδικασία παρακολούθησης της αναπτυγμένης υποδομής, των μοτίβων χρήσης και της απόδοσης, καθώς και παρακολούθηση νέων καινοτόμων λύσεων που κυκλοφορεί το AWS που θα μπορούσαν να επηρεάσουν το κόστος. Εξετάστε τις ακόλουθες βέλτιστες πρακτικές:
- Επιλέξτε έναν κατάλληλο τύπο παρουσίας – Το SageMaker υποστηρίζει πολλούς τύπους παρουσιών, ο καθένας με διαφορετικούς συνδυασμούς χωρητικότητας CPU, GPU, μνήμης και αποθήκευσης. Με βάση τις απαιτήσεις πόρων του μοντέλου σας, επιλέξτε έναν τύπο παρουσίας που παρέχει τους απαραίτητους πόρους χωρίς υπερβολική παροχή. Για πληροφορίες σχετικά με τους διαθέσιμους τύπους παρουσίας SageMaker, τις προδιαγραφές τους και οδηγίες σχετικά με την επιλογή της σωστής παρουσίας, ανατρέξτε στο Εξασφαλίστε αποτελεσματικούς υπολογιστικούς πόρους στο Amazon SageMaker.
- Δοκιμή χρησιμοποιώντας τοπική λειτουργία – Προκειμένου να εντοπιστούν αποτυχίες και να εντοπιστούν σφαλμάτων πιο γρήγορα, συνιστάται να δοκιμάσετε τον κώδικα και το κοντέινερ (σε περίπτωση BYOC) στο τοπική λειτουργία πριν εκτελέσετε το φόρτο εργασίας συμπερασμάτων στην απομακρυσμένη παρουσία του SageMaker. Η τοπική λειτουργία είναι ένας πολύ καλός τρόπος για να δοκιμάσετε τα σενάρια σας πριν τα εκτελέσετε σε ένα περιβάλλον φιλοξενίας διαχειριζόμενης από το SageMaker.
- Βελτιστοποιήστε τα μοντέλα για να είναι πιο αποδοτικά – Τα μη βελτιστοποιημένα μοντέλα μπορούν να οδηγήσουν σε μεγαλύτερους χρόνους εκτέλεσης και να χρησιμοποιούν περισσότερους πόρους. Μπορείτε να επιλέξετε να χρησιμοποιήσετε περισσότερες ή μεγαλύτερες παρουσίες για να βελτιώσετε την απόδοση. Ωστόσο, αυτό οδηγεί σε υψηλότερο κόστος. Βελτιστοποιώντας τα μοντέλα σας ώστε να είναι πιο αποδοτικά, ενδέχεται να μπορείτε να μειώσετε το κόστος χρησιμοποιώντας λιγότερες ή μικρότερες παρουσίες, διατηρώντας τα ίδια ή καλύτερα χαρακτηριστικά απόδοσης. Μπορείς να χρησιμοποιήσεις Amazon SageMaker Neo με συμπέρασμα SageMaker για αυτόματη βελτιστοποίηση μοντέλων. Για περισσότερες λεπτομέρειες και δείγματα, βλ Βελτιστοποιήστε την απόδοση του μοντέλου χρησιμοποιώντας το Neo.
- Χρησιμοποιήστε ετικέτες και εργαλεία διαχείρισης κόστους – Για να διατηρήσετε την ορατότητα του φόρτου εργασίας συμπερασμάτων σας, συνιστάται η χρήση ετικετών καθώς και εργαλείων διαχείρισης κόστους AWS, όπως Προϋπολογισμοί AWS, τη Κονσόλα χρέωσης AWS, και τη δυνατότητα πρόβλεψης του Cost Explorer. Μπορείτε επίσης να εξερευνήσετε τα προγράμματα αποταμίευσης SageMaker ως ένα ευέλικτο μοντέλο τιμολόγησης. Για περισσότερες πληροφορίες σχετικά με αυτές τις επιλογές, ανατρέξτε στο Μέρος 1 της σειράς αυτής.
Συμπέρασμα
Σε αυτήν την ανάρτηση, παρέχουμε οδηγίες σχετικά με την ανάλυση κόστους και τις βέλτιστες πρακτικές κατά τη χρήση των επιλογών συμπερασμάτων του SageMaker. Καθώς η μηχανική εκμάθηση καθιερώνεται ως ισχυρό εργαλείο σε όλες τις βιομηχανίες, η εκπαίδευση και η λειτουργία μοντέλων ML πρέπει να παραμένουν οικονομικά αποδοτικές. Το SageMaker προσφέρει ένα ευρύ και βαθύ σύνολο χαρακτηριστικών για τη διευκόλυνση κάθε βήματος στη γραμμή ML και παρέχει ευκαιρίες βελτιστοποίησης κόστους χωρίς να επηρεάζει την απόδοση ή την ευελιξία. Επικοινωνήστε με την ομάδα AWS σας για καθοδήγηση κόστους σχετικά με τους φόρτους εργασίας σας στο SageMaker.
Σχετικά με τους Συγγραφείς
Deepali Rajale είναι Ανώτερος Ειδικός AI/ML στο AWS. Συνεργάζεται με εταιρικούς πελάτες παρέχοντας τεχνική καθοδήγηση με βέλτιστες πρακτικές για την ανάπτυξη και τη διατήρηση λύσεων AI/ML στο οικοσύστημα AWS. Έχει συνεργαστεί με ένα ευρύ φάσμα οργανισμών σε διάφορες περιπτώσεις χρήσης βαθιάς μάθησης που αφορούν το NLP και την όραση υπολογιστών. Είναι παθιασμένη με την ενδυνάμωση των οργανισμών να αξιοποιήσουν τη γενετική τεχνητή νοημοσύνη για να βελτιώσουν την εμπειρία χρήσης τους. Στον ελεύθερο χρόνο της, της αρέσει ο κινηματογράφος, η μουσική και η λογοτεχνία.
Ούρι Ρόζενμπεργκ είναι ο Ειδικός Τεχνικός Διευθυντής AI & ML για την Ευρώπη, τη Μέση Ανατολή και την Αφρική. Με έδρα το Ισραήλ, η Uri εργάζεται για να ενδυναμώσει τους εταιρικούς πελάτες σε όλα τα πράγματα ML ώστε να σχεδιάζουν, να κατασκευάζουν και να λειτουργούν σε κλίμακα. Στον ελεύθερο χρόνο του, του αρέσει η ποδηλασία, η πεζοπορία και η αναρρίχηση σε ροκ εν ρολ.
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- PlatoAiStream. Web3 Data Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- Minting the Future με την Adryenn Ashley. Πρόσβαση εδώ.
- Αγορά και πώληση μετοχών σε εταιρείες PRE-IPO με το PREIPO®. Πρόσβαση εδώ.
- πηγή: https://aws.amazon.com/blogs/machine-learning/part-5-analyze-amazon-sagemaker-spend-and-determine-cost-optimization-opportunities-based-on-usage-part-5-hosting/
- :έχει
- :είναι
- :δεν
- :που
- $UP
- 000
- 1
- 100
- 2021
- 24
- 30
- 40
- 500
- 7
- 8
- a
- Ικανός
- Σχετικα
- επιταχυντές
- πρόσβαση
- Λογαριασμός
- Λογαριασμοί
- Κατορθώνω
- επιτευχθεί
- απέναντι
- Ενέργειες
- ενεργειών
- προσθέτω
- Επιπλέον
- Πρόσθετος
- Αφρική
- Μετά το
- AI
- AI / ML
- αλγόριθμοι
- Όλα
- κατανομή
- επιτρέπει
- ήδη
- Επίσης
- Amazon
- Amazon EC2
- Amazon Sage Maker
- Amazon υπηρεσίες Web
- ποσό
- an
- ανάλυση
- αναλύσει
- και
- Άλλος
- κάθε
- πια
- api
- εφαρμοσμένος
- Εφαρμογή
- εφαρμόζοντας
- κατάλληλος
- περίπου
- ΕΙΝΑΙ
- τεχνητός
- τεχνητή νοημοσύνη
- Τεχνητή νοημοσύνη (AI)
- AS
- συσχετισμένη
- At
- αποδίδουν
- προσπάθεια
- αυτόματη
- αυτομάτως
- διαθέσιμος
- αποφύγετε
- AWS
- πίσω
- βασίζονται
- BE
- επειδή
- ήταν
- πριν
- παρακάτω
- ευεργετική
- όφελος
- οφέλη
- ΚΑΛΎΤΕΡΟΣ
- βέλτιστες πρακτικές
- Καλύτερα
- Μεγάλος
- μεγαλύτερος
- χρέωσης
- Αποκλεισμός
- Ανάλυση
- φέρω
- χτίζω
- ενσωματωμένο
- αλλά
- by
- CAN
- υποψήφιος
- υποψηφίους
- ικανότητες
- Χωρητικότητα
- περίπτωση
- περιπτώσεις
- ορισμένες
- Αλλαγές
- χαρακτηριστικά
- χρέωση
- φορτισμένα
- φορτία
- επιλογή
- Επιλέξτε
- επιλέγοντας
- κλασικό
- Ορειβασία
- συστάδα
- κωδικός
- κρύο
- συνδυασμοί
- συνδυασμός
- σε συνδυασμό
- Ελάτε
- έρχεται
- Κοινός
- συνήθως
- πλήρης
- συστατικό
- εξαρτήματα
- Υπολογίστε
- υπολογιστή
- Computer Vision
- ανταγωνιστής
- διαμόρφωση
- συνεχής
- Εξετάστε
- θεωρήσεις
- παγιώνω
- Εμπλουτίζει
- καταναλώνεται
- κατανάλωση
- Δοχείο
- Εμπορευματοκιβώτια
- Περιέχει
- συνεχής
- πυρήνας
- διορθώσει
- Κόστος
- Διαχείριση κόστους
- αποδοτική
- Δικαστικά έξοδα
- θα μπορούσε να
- δημιουργία
- δημιουργία
- Τη στιγμή
- έθιμο
- Πελάτες
- καθημερινά
- ημερομηνία
- σύνολα δεδομένων
- Ημ.
- αποφασίζει
- Αποφασίζοντας
- βαθύς
- βαθιά μάθηση
- Προεπιλογή
- Ζήτηση
- εξαρτάται
- παρατάσσω
- αναπτυχθεί
- ανάπτυξη
- ανάπτυξη
- αναπτύσσεται
- Υπηρεσίες
- σχεδιασμένα
- επιθυμητή
- λεπτομέρεια
- καθέκαστα
- Προσδιορίστε
- διαφορετικές
- συζητήσουν
- Display
- οθόνες
- διανέμω
- do
- Όχι
- γίνεται
- Μην
- διπλασιαστεί
- κάτω
- κατεβάσετε
- δυο
- κατά την διάρκεια
- κάθε
- Νωρίτερα
- εύκολα
- Ανατολή
- οικοσύστημα
- αποτελεσματικός
- είτε
- εξουσιοδοτώ
- ενδυνάμωση
- ενεργοποιήσετε
- δίνει τη δυνατότητα
- Τελικό σημείο
- ενέργεια
- ενίσχυση
- εξασφαλίζω
- Εταιρεία
- Περιβάλλον
- περιβάλλοντα
- ίσος
- Ισοδύναμος
- σφάλμα
- λάθη
- καθιερώνει
- εκτίμηση
- Ευρώπη
- αξιολογήσει
- Συμβάν
- παράδειγμα
- υπερβαίνω
- ανταλλαγή
- αναμένεται
- εμπειρία
- πείραμα
- εξήγησε
- διερευνήσει
- εξερευνητής
- εκτεταμένα
- επιπλέον
- μάτι
- διευκολύνοντας
- ΑΠΟΤΥΓΧΑΝΩ
- Απέτυχε
- οικογένεια
- γρηγορότερα
- Χαρακτηριστικό
- λίγοι
- λιγότερα
- Αρχεία
- Αρχεία
- φιλτράρισμα
- φιλτράρισμα
- Φίλτρα
- Όνομα
- ταιριάζουν
- εύκαμπτος
- Συγκέντρωση
- Εξής
- εξής
- Για
- Βρέθηκαν
- τέσσερα
- από
- πλήρη
- λειτουργίες
- Επί πλέον
- Κέρδος
- General
- παραγωγής
- γενετική
- Παραγωγική τεχνητή νοημοσύνη
- παίρνω
- δεδομένου
- καλός
- GPU
- γραφικές παραστάσεις
- εξαιρετική
- μεγαλύτερη
- Group
- καθοδήγηση
- Handles
- Έχω
- που έχει
- he
- βοήθεια
- βοήθησε
- αυτήν
- Ψηλά
- υψηλότερο
- υψηλότερο
- του
- Οριζόντιος
- φιλοξενείται
- φιλοξενία
- έξοδα φιλοξενίας
- οικοδεσπότες
- ώρα
- ΩΡΕΣ
- Πως
- Πώς να
- Ωστόσο
- HTML
- http
- HTTPS
- Εκατοντάδες
- i
- ιδανικό
- προσδιορίσει
- Idle
- if
- Επίπτωση
- επιπτώσεις
- σημαντικό
- βελτίωση
- in
- περιλαμβάνουν
- περιλαμβάνει
- Συμπεριλαμβανομένου
- Αυξήσεις
- υποδηλώνει
- ατομικές
- βιομηχανίες
- πληροφορίες
- Υποδομή
- καινοτόμες
- εισαγωγή
- ιδέες
- παράδειγμα
- οδηγίες
- Νοημοσύνη
- αλληλεπίδραση
- εσωτερικώς
- σε
- Εισαγωγή
- συμμετοχή
- Ισραήλ
- IT
- ΤΟΥ
- εαυτό
- Δουλειά
- Θέσεις εργασίας
- jpg
- Keen
- τήρηση
- Κλειδί
- Γλώσσα
- large
- μεγαλύτερος
- Επίθετο
- Αφάνεια
- ξεκινήσει
- ξεκίνησε
- οδηγήσει
- Οδηγεί
- μάθει
- μάθηση
- ελάχιστα
- Μαθήματα
- Διδάγματα
- Επίπεδο
- Μόχλευση
- κύκλος ζωής
- Μου αρέσει
- γραμμή
- συνδέονται
- Λιστα
- λογοτεχνία
- φορτίο
- τοπικός
- τοποθεσία
- Μακριά
- πλέον
- ματιά
- Χαμηλός
- χαμηλότερα
- Μείωση
- μηχανή
- μάθηση μηχανής
- διατηρήσουν
- Η διατήρηση
- διατηρεί
- κάνω
- ΚΑΝΕΙ
- διαχείριση
- διαχειρίζεται
- διαχείριση
- Εργαλεία διαχείρισης
- διευθυντής
- χειροκίνητα
- χάρτες
- μαρκαρισμένος
- Ταίριασμα
- ανώτατο όριο
- Ενδέχεται..
- μέσα
- Γνωρίστε
- Μνήμη
- που αναφέρθηκαν
- μετρικός
- Metrics
- Μέσο
- Μέση Ανατολή
- ενδέχεται να
- ελάχιστο
- Λεπτ.
- ML
- Τρόπος
- μοντέλο
- μοντέλα
- Παρακολούθηση
- παρακολούθηση
- παρακολούθηση
- Μηνας
- μηνιαίος
- μήνες
- περισσότερο
- Κινηματογράφος
- Τελικό σημείο πολλαπλών μοντέλων
- πολλαπλούς
- Μουσική
- πρέπει
- όνομα
- ονόματα
- απαραίτητος
- Ανάγκη
- που απαιτούνται
- ανάγκες
- δίκτυο
- ΔΙΑΚΟΠΗ ΔΙΚΤΥΟΥ
- Νέα
- nlp
- Όχι.
- κοινοποίηση
- κοινοποιήσεις
- αριθμός
- αντικειμένων
- αποκτήσει
- λαμβάνεται
- of
- off
- προσφορές
- offline
- on
- ONE
- διαδικτυακά (online)
- αποκλειστικά
- λειτουργούν
- Ευκαιρίες
- βέλτιστη
- βελτιστοποίηση
- Βελτιστοποίηση
- βελτιστοποίηση
- Επιλογή
- Επιλογές
- or
- τάξη
- οργανώσεις
- ΑΛΛΑ
- έξω
- διακοπή λειτουργίας
- σκιαγραφείται
- παραγωγή
- εκκρεμή
- επί
- δική
- Παράλληλο
- παράμετρος
- παράμετροι
- μέρος
- passieren
- Πέρασμα
- παθιασμένος
- Το παρελθόν
- πρότυπο
- πρότυπα
- Πληρωμή
- ποσοστό
- επίδοση
- περίοδος
- περιοδικός
- προοπτική
- επιλέξτε
- αγωγού
- σχέδιο
- φώναξε
- Πλάτων
- Πληροφορία δεδομένων Plato
- Πλάτωνα δεδομένα
- πολιτική
- πιθανώς
- Θέση
- Δημοσιεύσεις
- ισχυρός
- πρακτική
- πρακτικές
- Προβλέψεις
- τιμή
- τιμολόγηση
- μοντέλο τιμολόγησης
- Προληπτική
- διαδικασια μας
- Επεξεργασμένο
- Διεργασίες
- μεταποίηση
- επεξεργαστές
- παραγωγή
- την προώθηση της
- παρέχουν
- παρέχεται
- παρέχει
- χορήγηση
- πρόβλεψη
- σκοποί
- Βάζοντας
- ερωτήματα
- σειρά
- Τιμή
- μάλλον
- φθάσουν
- Ανάγνωση
- πραγματικός
- σε πραγματικό χρόνο
- λαμβάνω
- έλαβε
- λαμβάνει
- συνιστώ
- συστάσεις
- συνιστάται
- συνιστά
- ρεκόρ
- αρχεία
- μείωση
- περιοχή
- Δελτία
- παραμένουν
- μακρινός
- Καταργήθηκε
- αναφέρουν
- Αναφορά
- Εκθέσεις
- ζητήσει
- αιτήματα
- απαιτείται
- απαιτήσεις
- πόρος
- Υποστηρικτικό υλικό
- απάντησης
- ΠΕΡΙΦΕΡΕΙΑ
- αποτέλεσμα
- Αποτελέσματα
- Επιστροφές
- δεξιά
- βράχος
- Ρολό
- δρομολόγια
- Άρθρο
- κανόνες
- τρέξιμο
- τρέξιμο
- σοφός
- Συμπεράσματα SageMaker
- ίδιο
- Αποθήκευση
- Οικονομίες
- Κλίμακα
- Ζυγός
- απολέπιση
- σενάρια
- προγραμματιστεί
- μηδέν
- Εφαρμογές
- δευτερόλεπτα
- τμήματα
- δείτε
- επιλέγονται
- επιλογή
- αρχαιότερος
- αποστέλλονται
- ξεχωριστό
- Σειρές
- Χωρίς διακομιστή
- υπηρεσία
- Υπηρεσίες
- εξυπηρετούν
- σειρά
- τον καθορισμό
- διάφοροι
- σκιά
- Κοινοποίηση
- αυτή
- θα πρέπει να
- δείχνουν
- έδειξε
- παρουσιάζεται
- Δείχνει
- Ομοίως
- Απλούς
- αφού
- ενιαίας
- Μέγεθος
- μεγέθη
- Φέτα
- small
- μικρότερος
- So
- Λύσεις
- μερικοί
- Πηγή
- ειδικός
- συγκεκριμένες
- προδιαγραφές
- δαπανήσει
- διαίρεση
- σωρός
- πρότυπο
- Εκκίνηση
- ξεκίνησε
- Βήμα
- χώρος στο δίσκο
- αποθηκεύονται
- δυνατά
- δομημένος
- επιτυχία
- επιτυχής
- Επιτυχώς
- τέτοιος
- επαρκής
- κατάλληλος
- υποστήριξη
- υποστηρίζουν προληπτικά
- υποστηριζόνται!
- Υποστηρίζει
- σύστημα
- TAG
- Πάρτε
- παίρνει
- εργασίες
- Τεχνικός
- δοκιμή
- Δοκιμές
- δοκιμές
- από
- ότι
- Η
- τους
- Τους
- τότε
- Εκεί.
- εκ τούτου
- επομένως
- Αυτοί
- πράγματα
- αυτό
- εκείνοι
- Μέσω
- διακίνηση
- ώρα
- φορές
- προς την
- εργαλείο
- εργαλεία
- τοπικός
- Σύνολο
- ΚΙΝΗΣΗ στους ΔΡΟΜΟΥΣ
- Εκπαίδευση
- Μεταμορφώστε
- μετασχηματιστές
- Τάσεις
- αληθής
- μετατρέπει
- τύπος
- τύποι
- υποκείμενες
- διαφορετικός
- απρόβλεπτος
- Φορτώθηκε
- Χρήση
- χρήση
- περίπτωση χρήσης
- μεταχειρισμένος
- χρησιμοποιεί
- χρησιμοποιώντας
- συνήθως
- αξιοποιώντας
- ΕΠΙΚΥΡΩΝΩ
- αξία
- Αξίες
- Παραλλαγή
- διάφορα
- Δες
- ορατότητα
- όραμα
- οραματισμός
- τόμος
- όγκους
- περιμένετε
- θέλω
- Τρόπος..
- we
- ιστός
- διαδικτυακές υπηρεσίες
- ΛΟΙΠΌΝ
- Τι
- πότε
- αν
- Ποιό
- ενώ
- ευρύς
- Ευρύ φάσμα
- θα
- με
- εντός
- χωρίς
- εργάστηκαν
- εργάτης
- εργαζομένων
- λειτουργεί
- γραφή
- γραπτή
- Εσείς
- Σας
- zephyrnet
- μηδέν