Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Πειράματα Amazon SageMaker επόμενης γενιάς – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα

Σήμερα, είμαστε στην ευχάριστη θέση να ανακοινώσουμε ενημερώσεις στο δικό μας Πειράματα Amazon SageMaker ικανότητα του Amazon Sage Maker που σας επιτρέπει να οργανώνετε, να παρακολουθείτε, να συγκρίνετε και να αξιολογείτε πειράματα μηχανικής μάθησης (ML) και εκδόσεις μοντέλων από οποιοδήποτε ολοκληρωμένο περιβάλλον ανάπτυξης (IDE) χρησιμοποιώντας το SageMaker Python SDK ή boto3, συμπεριλαμβανομένων των τοπικών φορητών υπολογιστών Jupyter.

Η μηχανική μάθηση (ML) είναι μια επαναληπτική διαδικασία. Κατά την επίλυση μιας νέας περίπτωσης χρήσης, οι επιστήμονες δεδομένων και οι μηχανικοί ML επαναλαμβάνουν διάφορες παραμέτρους για να βρουν τις καλύτερες διαμορφώσεις μοντέλων (γνωστοί και ως υπερπαράμετροι) που μπορούν να χρησιμοποιηθούν στην παραγωγή για την επίλυση της αναγνωρισμένης επιχειρηματικής πρόκλησης. Με την πάροδο του χρόνου, μετά από πειραματισμό με πολλά μοντέλα και υπερπαραμέτρους, καθίσταται δύσκολο για τις ομάδες ML να διαχειριστούν αποτελεσματικά τις εκτελέσεις μοντέλων για να βρουν το βέλτιστο χωρίς ένα εργαλείο για την παρακολούθηση των διαφορετικών πειραμάτων. Τα πειραματικά συστήματα παρακολούθησης απλοποιούν τις διαδικασίες για τη σύγκριση διαφορετικών επαναλήψεων και συμβάλλουν στην απλοποίηση της συνεργασίας και της επικοινωνίας σε μια ομάδα, αυξάνοντας έτσι την παραγωγικότητα και εξοικονομώντας χρόνο. Αυτό επιτυγχάνεται με την οργάνωση και τη διαχείριση πειραμάτων ML με αβίαστο τρόπο για την εξαγωγή συμπερασμάτων από αυτά, για παράδειγμα, βρίσκοντας την εκπαίδευση που τρέχει με την καλύτερη ακρίβεια.

Για την επίλυση αυτής της πρόκλησης, το SageMaker παρέχει το SageMaker Experiments, μια πλήρως ενσωματωμένη δυνατότητα SageMaker. Παρέχει την ευελιξία να καταγράψετε τις μετρήσεις του μοντέλου σας, τις παραμέτρους, τα αρχεία, τα τεχνουργήματα, τα γραφήματα γραφημάτων από τις διάφορες μετρήσεις, τη λήψη διαφόρων μεταδεδομένων, την αναζήτηση μέσω αυτών και την υποστήριξη της αναπαραγωγιμότητας του μοντέλου. Οι επιστήμονες δεδομένων μπορούν να συγκρίνουν γρήγορα την απόδοση και τις υπερπαραμέτρους για την αξιολόγηση μοντέλων μέσω οπτικών διαγραμμάτων και πινάκων. Μπορούν επίσης να χρησιμοποιήσουν το SageMaker Experiments για να κατεβάσουν τα δημιουργημένα γραφήματα και να μοιραστούν την αξιολόγηση του μοντέλου με τους ενδιαφερόμενους φορείς τους.

Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Με τις νέες ενημερώσεις στο SageMaker Experiments, αποτελεί πλέον μέρος του SageMaker SDK, απλοποιώντας το έργο του επιστήμονα δεδομένων και εξαλείφοντας την ανάγκη εγκατάστασης μιας επιπλέον βιβλιοθήκης για τη διαχείριση πολλαπλών εκτελέσεων μοντέλων. Εισάγουμε τις ακόλουθες νέες βασικές έννοιες:

  • Πείραμα: Μια συλλογή από εκτελέσεις που είναι ομαδοποιημένες. Ένα πείραμα περιλαμβάνει εκτελέσεις για πολλούς τύπους που μπορούν να εκκινηθούν από οπουδήποτε χρησιμοποιώντας το SageMaker Python SDK.
  • τρέξιμο: Κάθε βήμα εκτέλεσης μιας διαδικασίας εκπαίδευσης μοντέλου. Μια εκτέλεση αποτελείται από όλες τις εισόδους, τις παραμέτρους, τις διαμορφώσεις και τα αποτελέσματα για μία επανάληψη της εκπαίδευσης του μοντέλου. Οι προσαρμοσμένες παράμετροι και μετρήσεις μπορούν να καταγραφούν χρησιμοποιώντας το log_parameter, log_parameters, να log_metric λειτουργίες. Η προσαρμοσμένη είσοδος και έξοδος μπορούν να καταγραφούν χρησιμοποιώντας το log_file λειτουργία.

Οι έννοιες που υλοποιούνται ως μέρος του α Run η κλάση διατίθεται από οποιοδήποτε IDE όπου είναι εγκατεστημένο το SageMaker Python SDK. Για SageMaker Training, Processing και

Transform Jobs, το SageMaker Experiment Run μεταβιβάζεται αυτόματα στην εργασία εάν η εργασία κληθεί σε περιβάλλον εκτέλεσης. Μπορείτε να ανακτήσετε το αντικείμενο εκτέλεσης χρησιμοποιώντας load_run() από τη δουλειά σου. Τέλος, με την ενσωμάτωση των νέων λειτουργιών, οι επιστήμονες δεδομένων μπορούν επίσης να καταγράψουν αυτόματα έναν πίνακα σύγχυσης, γραφήματα ακριβείας και ανάκλησης και μια καμπύλη ROC για περιπτώσεις χρήσης ταξινόμησης χρησιμοποιώντας το run.log_confusion_matrix, run.log_precision_recall, να run.log_roc_curve λειτουργίες, αντίστοιχα.

Σε αυτήν την ανάρτηση ιστολογίου, θα παρέχουμε παραδείγματα για το πώς να χρησιμοποιήσετε τις νέες λειτουργίες του SageMaker Experiments σε ένα σημειωματάριο Jupyter μέσω του SageMaker SDK. Θα επιδείξουμε αυτές τις δυνατότητες χρησιμοποιώντας α PyTorch παράδειγμα για να εκπαιδεύσετε ένα παράδειγμα ταξινόμησης χειρόγραφων ψηφίων MNIST. Το πείραμα θα οργανωθεί ως εξής:

  1. Δημιουργία παραμέτρων εκτέλεσης πειράματος και καταγραφής: Θα δημιουργήσουμε πρώτα ένα νέο πείραμα, θα ξεκινήσουμε μια νέα εκτέλεση για αυτό το πείραμα και θα καταγράψουμε τις παραμέτρους σε αυτό.
  2. Καταγραφή μετρήσεων απόδοσης μοντέλου: Θα καταγράψουμε μετρήσεις απόδοσης του μοντέλου και θα σχεδιάσουμε γραφήματα μετρήσεων.
  3. Σύγκριση τρεξίματος μοντέλων:Θα συγκρίνουμε διαφορετικές εκτελέσεις μοντέλων σύμφωνα με τις υπερπαραμέτρους του μοντέλου. Θα συζητήσουμε πώς να συγκρίνουμε αυτές τις εκτελέσεις και πώς να χρησιμοποιήσετε τα πειράματα SageMaker για να επιλέξετε το καλύτερο μοντέλο.
  4. Εκτέλεση πειραμάτων από εργασίες του SageMaker: Θα παρέχουμε επίσης ένα παράδειγμα για το πώς να μοιράζεστε αυτόματα το πλαίσιο του πειράματός σας με μια εργασία επεξεργασίας, εκπαίδευσης ή ομαδικής μετατροπής του SageMaker. Αυτό σας επιτρέπει να ανακτήσετε αυτόματα το περιβάλλον εκτέλεσης με το load_run λειτουργούν μέσα στη δουλειά σας.
  5. Ενσωμάτωση αναφορών SageMaker Clarify: Θα δείξουμε πώς μπορούμε τώρα να ενσωματωθούμε SageMaker Διευκρίνιση αναφορές μεροληψίας και επεξήγησης σε μία προβολή με την αναφορά εκπαιδευμένου μοντέλου.

Προϋποθέσεις

Για αυτήν την ανάρτηση ιστολογίου, θα χρησιμοποιήσουμε Στούντιο Amazon SageMaker για να παρουσιάσετε τον τρόπο καταγραφής μετρήσεων από ένα σημειωματάριο Studio χρησιμοποιώντας τις ενημερωμένες λειτουργίες του SageMaker Experiments. Για να εκτελέσετε τις εντολές που παρουσιάζονται στο παράδειγμά μας, χρειάζεστε τις ακόλουθες προϋποθέσεις:

  • Τομέας SageMaker Studio
  • Προφίλ χρήστη SageMaker Studio με πλήρη πρόσβαση στο SageMaker
  • Σημειωματάριο SageMaker Studio με τουλάχιστον ένα ml.t3.medium τύπος παρουσίας

Εάν δεν έχετε διαθέσιμο τομέα SageMaker και προφίλ χρήστη, μπορείτε να δημιουργήσετε ένα χρησιμοποιώντας αυτό γρήγορος οδηγός εγκατάστασης.

Παράμετροι καταγραφής

Για αυτήν την άσκηση, θα χρησιμοποιήσουμε δαυλός, ένα πακέτο PyTorch που παρέχει δημοφιλή σύνολα δεδομένων, αρχιτεκτονικές μοντέλων και κοινούς μετασχηματισμούς εικόνας για την όραση υπολογιστή. Το SageMaker Studio παρέχει ένα σύνολο από Εικόνες Docker για κοινές περιπτώσεις χρήσης της επιστήμης δεδομένων που διατίθενται στο Amazon ECR. Για το PyTorch, έχετε την επιλογή να επιλέξετε εικόνες βελτιστοποιημένες για εκπαίδευση CPU ή GPU. Για αυτό το παράδειγμα, θα επιλέξουμε την εικόνα PyTorch 1.12 Python 3.8 CPU Optimized και την Python 3 πυρήνας. Τα παραδείγματα που περιγράφονται παρακάτω θα επικεντρωθούν στις λειτουργίες του SageMaker Experiments και δεν είναι πλήρης κώδικας.

Ας κατεβάσουμε τα δεδομένα με το torchvision συσκευάστε και παρακολουθήστε τον αριθμό των δειγμάτων δεδομένων για τα σύνολα δεδομένων αμαξοστοιχίας και δοκιμής ως παραμέτρους με τα πειράματα SageMaker. Για αυτό το παράδειγμα, ας υποθέσουμε train_set και test_set όπως έχει ήδη ληφθεί torchvision σύνολα δεδομένων.

from sagemaker.session import Session
from sagemaker.experiments.run import Run
import os

# create an experiment and start a new run
experiment_name = "local-experiment-example"
run_name = "experiment-run"

with Run(experiment_name=experiment_name, sagemaker_session=Session(), run_name=run_name) as run:
    run.log_parameters({
        "num_train_samples": len(train_set.data),
        "num_test_samples": len(test_set.data)
    })
    for f in os.listdir(train_set.raw_folder):
        print("Logging", train_set.raw_folder+"/"+f)
        run.log_file(train_set.raw_folder+"/"+f, name=f, is_output=False)

Σε αυτό το παράδειγμα, χρησιμοποιούμε το run.log_parameters για την καταγραφή του αριθμού των δειγμάτων αμαξοστοιχιών και δεδομένων δοκιμών και run.log_file για να ανεβάσουμε τα ακατέργαστα σύνολα δεδομένων στο Amazon S3 και να τα καταγράψουμε ως εισροές στο πείραμά μας.

Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται. Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Εκπαίδευση μοντέλου και καταγραφή μετρήσεων μοντέλου

Τώρα που κατεβάσαμε το σύνολο δεδομένων MNIST, ας εκπαιδεύσουμε το α μοντέλο CNN να αναγνωρίσει τα ψηφία. Κατά την εκπαίδευση του μοντέλου, θέλουμε να φορτώσουμε την υπάρχουσα πειραματική μας εκτέλεση, να καταγράψουμε νέες παραμέτρους σε αυτό και να παρακολουθήσουμε την απόδοση του μοντέλου καταγράφοντας μετρήσεις μοντέλου.

Μπορούμε να χρησιμοποιήσουμε το load_run λειτουργία για να φορτώσει την προηγούμενη εκτέλεση και να την χρησιμοποιήσει για να καταγράψει την εκπαίδευση του μοντέλου μας

with load_run(experiment_name=experiment_name, run_name=run_name, sagemaker_session=Session()) as run:
    train_model(
        run=run,
        train_set=train_set,
        test_set=test_set,
        epochs=10,
        hidden_channels=5,
        optimizer="adam"
    )

Στη συνέχεια μπορούμε να χρησιμοποιήσουμε run.log_parameter και run.log_parameters για να καταγράψουμε μία ή πολλές παραμέτρους μοντέλου στην εκτέλεση μας.

# log the parameters of your model
run.log_parameter("device", "cpu")
run.log_parameters({
    "data_dir": data_dir,
    "optimizer": optimizer,
    "epochs": epochs,
    "hidden_channels": hidden_channels
})

Και μπορούμε να χρησιμοποιήσουμε run.log_metric για να καταγράψουμε μετρήσεις απόδοσης στο πείραμά μας.

run.log_metric(name=metric_type+":loss", value=loss, step=epoch)
run.log_metric(name=metric_type+":accuracy", value=accuracy, step=epoch)

Για μοντέλα ταξινόμησης, μπορείτε επίσης να χρησιμοποιήσετε run.log_confusion_matrix, run.log_precision_recall, να run.log_roc_curve, για να σχεδιάσετε αυτόματα τον πίνακα σύγχυσης, το γράφημα ανάκλησης ακριβείας και την καμπύλη ROC του μοντέλου σας. Εφόσον το μοντέλο μας επιλύει ένα πρόβλημα ταξινόμησης πολλαπλών κλάσεων, ας καταγράψουμε μόνο τον πίνακα σύγχυσης για αυτό.

# log confusion matrix
with torch.no_grad():
    for data, target in test_loader:
        data, target = data.to(device), target.to(device)
        output = model(data)
        pred = output.max(1, keepdim=True)[1] 
        run.log_confusion_matrix(target, pred, "Confusion-Matrix-Test-Data")

Όταν εξετάζουμε τις λεπτομέρειες εκτέλεσης, μπορούμε τώρα να δούμε τις μετρήσεις που δημιουργούνται όπως φαίνεται στο παρακάτω στιγμιότυπο οθόνης:

Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Η σελίδα λεπτομερειών εκτέλεσης παρέχει περισσότερες πληροφορίες σχετικά με τις μετρήσεις.

Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Και οι παράμετροι του νέου μοντέλου παρακολουθούνται στη σελίδα επισκόπησης παραμέτρων.

Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Μπορείτε επίσης να αναλύσετε την απόδοση του μοντέλου σας ανά τάξη χρησιμοποιώντας τον πίνακα σύγχυσης που σχεδιάζεται αυτόματα, ο οποίος μπορεί επίσης να ληφθεί και να χρησιμοποιηθεί για διαφορετικές αναφορές. Και μπορείτε να σχεδιάσετε επιπλέον γραφήματα για να αναλύσετε την απόδοση του μοντέλου σας με βάση τις καταγεγραμμένες μετρήσεις.

Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Σύγκριση πολλαπλών παραμέτρων μοντέλου

Ως επιστήμονας δεδομένων, θέλετε να βρείτε το καλύτερο δυνατό μοντέλο. Αυτό περιλαμβάνει εκπαίδευση ενός μοντέλου πολλές φορές με διαφορετικές υπερπαραμέτρους και σύγκριση της απόδοσης του μοντέλου με αυτές τις υπερπαραμέτρους. Για να γίνει αυτό, το SageMaker Experiments μας επιτρέπει να δημιουργήσουμε πολλαπλές εκτελέσεις στο ίδιο πείραμα. Ας εξερευνήσουμε αυτήν την έννοια εκπαιδεύοντας το μοντέλο μας με διαφορετικά num_hidden_channels και optimizers.

# define the list of parameters to train the model with
num_hidden_channel_param = [5, 10, 20]
optimizer_param = ["adam", "sgd"]
run_id = 0
# train the model using SageMaker Experiments to track the model parameters, 
# metrics and performance
sm_session = Session()
for i, num_hidden_channel in enumerate(num_hidden_channel_param):
    for k, optimizer in enumerate(optimizer_param):
        run_id += 1
        run_name = "experiment-run-"+str(run_id)
        print(run_name)
        print(f"Training model with: {num_hidden_channel} hidden channels and {optimizer} as optimizer")
        # Defining an experiment run for each model training run
        with Run(experiment_name=experiment_name, run_name=run_name, sagemaker_session=sm_session) as run:
            train_model(
                run=run, 
                train_set=train_set,
                test_set=test_set,
                epochs=10, 
                hidden_channels=num_hidden_channel,
                optimizer=optimizer
            )

Τώρα δημιουργούμε έξι νέες σειρές για το πείραμά μας. Κάθε ένα θα καταγράφει τις παραμέτρους του μοντέλου, τις μετρήσεις και τον πίνακα σύγχυσης. Στη συνέχεια, μπορούμε να συγκρίνουμε τις εκτελέσεις για να επιλέξουμε το μοντέλο με την καλύτερη απόδοση για το πρόβλημα. Όταν αναλύουμε τα τρεξίματα, μπορούμε να σχεδιάσουμε τα γραφήματα μετρήσεων για τις διαφορετικές εκτελέσεις ως ενιαία γραφική παράσταση, συγκρίνοντας την απόδοση των διαδρομών στα διάφορα στάδια εκπαίδευσης (ή εποχές).

Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Χρήση των πειραμάτων SageMaker με εργασίες εκπαίδευσης, επεξεργασίας και μετατροπής παρτίδων του SageMaker

Στο παραπάνω παράδειγμα, χρησιμοποιήσαμε το SageMaker Experiments για να καταγράψουμε την απόδοση του μοντέλου από ένα σημειωματάριο του SageMaker Studio όπου το μοντέλο εκπαιδεύτηκε τοπικά στο σημειωματάριο. Μπορούμε να κάνουμε το ίδιο για να καταγράψουμε την απόδοση του μοντέλου από εργασίες επεξεργασίας, εκπαίδευσης και ομαδικής μετατροπής του SageMaker. Με τις νέες δυνατότητες αυτόματης μετάδοσης περιβάλλοντος, δεν χρειάζεται να κοινοποιήσουμε συγκεκριμένα τη διαμόρφωση πειράματος με την εργασία SageMaker, καθώς θα καταγραφεί αυτόματα.

Το παρακάτω παράδειγμα θα επικεντρωθεί στις λειτουργίες του SageMaker Experiments και δεν είναι πλήρες κώδικα.

from sagemaker.pytorch import PyTorch
from sagemaker.experiments.run import Run
from sagemaker.session import Session
from sagemaker import get_execution_role
role = get_execution_role()

# set new experiment configuration
exp_name = "training-job-experiment-example"
run_name = "experiment-run-example"

# Start training job with experiment setting
with Run(experiment_name=exp_name, run_name=run_name, sagemaker_session=Session()) as run:
    est = PyTorch(
        entry_point="",
        dependencies=[""],
        role=role,
        model_dir=False,
        framework_version="1.12",
        py_version="py38",
        instance_type='ml.c5.xlarge',
        instance_count=1,
            hyperparameters={
            "epochs": 10,
            "hidden_channels":5,
            "optimizer": "adam",
        },
        keep_alive_period_in_seconds=3600
    )
    
    est.fit()

Στο αρχείο δέσμης ενεργειών μοντέλου, μπορούμε να λάβουμε το περιβάλλον εκτέλεσης χρησιμοποιώντας load_run(). Στις εργασίες επεξεργασίας και εκπαίδευσης του SageMaker, δεν χρειάζεται να παρέχουμε τη διαμόρφωση πειράματος για τη φόρτωση της διαμόρφωσης. Για εργασίες μαζικής μετατροπής, πρέπει να παρέχουμε experiment_name και run_name για να φορτώσετε τη διαμόρφωση του πειράματος.

with load_run() as run:
    run.log_parameters({...})
    train_model(run, ...)

Εκτός από τις πληροφορίες που λαμβάνουμε κατά την εκτέλεση των πειραμάτων του SageMaker από ένα σενάριο σημειωματάριου, η εκτέλεση από μια εργασία του SageMaker θα συμπληρώσει αυτόματα τις παραμέτρους και τις εξόδους εργασίας.

Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται. Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Το νέο SageMaker Experiments SDK διασφαλίζει επίσης συμβατότητα με την προηγούμενη έκδοση χρησιμοποιώντας τις έννοιες των δοκιμών και των δοκιμαστικών στοιχείων. Οποιοδήποτε πείραμα ενεργοποιείται χρησιμοποιώντας την προηγούμενη έκδοση του SageMaker Experiments θα διατίθεται αυτόματα στη νέα διεπαφή χρήστη, για την ανάλυση των πειραμάτων.

Ενσωμάτωση εκθέσεων εκπαίδευσης του SageMaker Clarify και μοντέλου

Το SageMaker Clarify συμβάλλει στη βελτίωση των μοντέλων μας ML με την ανίχνευση πιθανή προκατάληψη και βοηθώντας εξηγήσει πώς αυτά τα μοντέλα κάνουν προβλέψεις. Το Clarify παρέχει προκατασκευασμένα κοντέινερ που εκτελούνται ως εργασίες επεξεργασίας του SageMaker μετά την εκπαίδευση του μοντέλου σας, χρησιμοποιώντας πληροφορίες σχετικά με τα δεδομένα σας (διαμόρφωση δεδομένων), το μοντέλο (διαμόρφωση μοντέλου) και τις ευαίσθητες στήλες δεδομένων που θέλουμε να αναλύσουμε για πιθανή προκατάληψη (προκατάληψη διαμόρφωση). Μέχρι τώρα, το SageMaker Experiments εμφάνιζε την εκπαίδευση μοντέλων και τις αναφορές Clarify ως μεμονωμένα δοκιμαστικά στοιχεία που συνδέονταν μέσω μιας δοκιμής.

Με τα νέα πειράματα SageMaker, μπορούμε επίσης να ενσωματώσουμε τις αναφορές του SageMaker Clarify με την εκπαίδευση μοντέλων μας με μια πηγή αλήθειας που μας επιτρέπει να κατανοήσουμε περαιτέρω το μοντέλο μας. Για μια ολοκληρωμένη αναφορά, το μόνο που χρειάζεται να κάνουμε είναι να έχουμε το ίδιο όνομα εκτέλεσης για την εκπαίδευσή μας και τις θέσεις εργασίας Clarify. Το παρακάτω παράδειγμα δείχνει πώς μπορούμε να ενσωματώσουμε τις αναφορές χρησιμοποιώντας ένα Μοντέλο XGBoost να προβλέψει το εισόδημα των ενηλίκων στις Ηνωμένες Πολιτείες. Το μοντέλο χρησιμοποιεί το Δεδομένα UCI για ενήλικες. Για αυτήν την άσκηση, υποθέτουμε ότι το μοντέλο ήταν ήδη εκπαιδευμένο και ότι έχουμε ήδη υπολογίσει τις διαμορφώσεις δεδομένων, μοντέλου και προκατάληψης.

with Run(
    experiment_name='clarify-experiment',
    run_name="joint-run",
    sagemaker_session=sagemaker_session,
) as run:
    xgb.fit({"train": train_input}, logs=False)
    clarify_processor.run_bias(
        data_config=bias_data_config,
        bias_config=bias_config,
        model_config=model_config,
        model_predicted_label_config=predictions_config,
        pre_training_methods="all",
        post_training_methods="all",
    )
    clarify_processor.run_explainability(
        data_config=explainability_data_config,
        model_config=model_config,
        explainability_config=shap_config,
    )

Με αυτήν τη ρύθμιση, λαμβάνουμε μια συνδυασμένη προβολή που περιλαμβάνει τις μετρήσεις του μοντέλου, τις κοινές εισόδους και εξόδους και τις αναφορές Clarify για στατιστική μεροληψία και επεξήγηση του μοντέλου.

Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται. Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται. Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται. Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Συμπέρασμα

Σε αυτήν την ανάρτηση, εξερευνήσαμε τη νέα γενιά πειραμάτων SageMaker, ένα ενσωματωμένο τμήμα του SageMaker SDK. Δείξαμε πώς να καταγράφετε τις ροές εργασίας σας ML από οπουδήποτε με τη νέα κλάση Run. Παρουσιάσαμε τη νέα διεπαφή χρήστη πειραμάτων που σας επιτρέπει να παρακολουθείτε τα πειράματά σας και να σχεδιάζετε γραφήματα για μια μέτρηση εκτέλεσης, καθώς και να συγκρίνετε πολλαπλές εκτελέσεις με τη νέα δυνατότητα ανάλυσης. Παρέχαμε παραδείγματα πειραμάτων καταγραφής από ένα σημειωματάριο του SageMaker Studio και από μια εργασία εκπαίδευσης στο SageMaker Studio. Τέλος, δείξαμε πώς να ενσωματώνετε την εκπαίδευση μοντέλων και τις αναφορές του SageMaker Clarify σε μια ενοποιημένη προβολή, επιτρέποντάς σας να κατανοήσετε περαιτέρω το μοντέλο σας.

Σας ενθαρρύνουμε να δοκιμάσετε τις νέες λειτουργίες του πειράματος και να συνδεθείτε με το Κοινότητα Machine Learning & AI αν έχετε οποιεσδήποτε ερωτήσεις ή σχόλια!


Σχετικά με τους Συγγραφείς

Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Maira Ladeira Tanke είναι ειδικός μηχανικής μάθησης στο AWS. Με υπόβαθρο στην Επιστήμη Δεδομένων, έχει 9 χρόνια εμπειρίας στην αρχιτεκτονική και την κατασκευή εφαρμογών ML με πελάτες σε διάφορους κλάδους. Ως τεχνική επικεφαλής, βοηθά τους πελάτες να επιταχύνουν την επίτευξη επιχειρηματικής αξίας μέσω αναδυόμενων τεχνολογιών και καινοτόμων λύσεων. Στον ελεύθερο χρόνο της, η Maira απολαμβάνει να ταξιδεύει και να περνά χρόνο με την οικογένειά της κάπου ζεστά.

Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Μάνι Χανιούγια είναι Specialist Artificial Intelligence and Machine Learning SA στην Amazon Web Services (AWS). Βοηθά τους πελάτες που χρησιμοποιούν μηχανική εκμάθηση να λύσουν τις επιχειρηματικές τους προκλήσεις χρησιμοποιώντας το AWS. Ξοδεύει τον περισσότερο χρόνο της καταδύοντας βαθιά και διδάσκοντας τους πελάτες σε έργα AI/ML που σχετίζονται με την όραση υπολογιστών, την επεξεργασία φυσικής γλώσσας, την πρόβλεψη, το ML στην άκρη και πολλά άλλα. Είναι παθιασμένη με την ML στο edge, ως εκ τούτου, έχει δημιουργήσει το δικό της εργαστήριο με κιτ αυτόνομης οδήγησης και πρωτότυπη γραμμή παραγωγής, όπου περνά πολύ από τον ελεύθερο χρόνο της.

Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Dewen Qi είναι Μηχανικός Ανάπτυξης Λογισμικού στην AWS. Αυτή τη στιγμή συμμετέχει στη δημιουργία μιας συλλογής υπηρεσιών και εργαλείων πλατφόρμας στο AWS SageMaker για να βοηθήσει τους πελάτες να κάνουν επιτυχημένα τα έργα ML τους. Είναι επίσης παθιασμένη να φέρει την έννοια των MLOps στο ευρύτερο κοινό. Εκτός δουλειάς, η Dewen απολαμβάνει να εξασκεί βιολοντσέλο.

Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Abhishek Agarwal είναι Ανώτερος Διευθυντής Προϊόντων για το Amazon SageMaker. Είναι παθιασμένος να συνεργάζεται με πελάτες και να κάνει τη μηχανική μάθηση πιο προσιτή. Στον ελεύθερο χρόνο του, ο Abhishek του αρέσει να ζωγραφίζει, να κάνει ποδήλατο και να μαθαίνει για καινοτόμες τεχνολογίες.

Πειράματα επόμενης γενιάς Amazon SageMaker – Οργανώστε, παρακολουθήστε και συγκρίνετε τις εκπαιδεύσεις μηχανικής εκμάθησης σε κλίμακα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Ντάνα Μπένσον είναι Μηχανικός Λογισμικού που εργάζεται στην ομάδα του Amazon SageMaker Experiments, Lineage και Search. Πριν από την ένταξή της στο AWS, η Dana αφιέρωσε χρόνο για να ενεργοποιήσει τη λειτουργικότητα του έξυπνου σπιτιού στην Alexa και τις παραγγελίες μέσω κινητού στο Starbucks.

Σφραγίδα ώρας:

Περισσότερα από Μηχανική εκμάθηση AWS