Amazon SageMaker Data Wrangler είναι μια ενιαία οπτική διεπαφή που μειώνει τον χρόνο που απαιτείται για την προετοιμασία δεδομένων και την εκτέλεση μηχανικής λειτουργιών από εβδομάδες σε λεπτά με τη δυνατότητα επιλογής και καθαρισμού δεδομένων, δημιουργίας λειτουργιών και αυτοματοποίησης της προετοιμασίας δεδομένων σε ροές εργασιών μηχανικής εκμάθησης (ML) χωρίς εγγραφή κώδικα.
Το SageMaker Data Wrangler υποστηρίζει Νιφάδα χιονιού, μια δημοφιλής πηγή δεδομένων για χρήστες που θέλουν να εκτελέσουν ML. Ξεκινάμε την απευθείας σύνδεση Snowflake από το SageMaker Data Wrangler για να βελτιώσουμε την εμπειρία του πελάτη. Πριν από την κυκλοφορία αυτής της δυνατότητας, οι διαχειριστές έπρεπε να ρυθμίσουν την αρχική ενσωμάτωση αποθήκευσης για να συνδεθούν με το Snowflake για να δημιουργήσουν δυνατότητες για ML στο Data Wrangler. Αυτό περιλαμβάνει την παροχή Απλή υπηρεσία αποθήκευσης Amazon κάδοι (Amazon S3), Διαχείριση ταυτότητας και πρόσβασης AWS Δικαιώματα πρόσβασης (IAM), ενσωμάτωση αποθήκευσης Snowflake για μεμονωμένους χρήστες και έναν συνεχή μηχανισμό για τη διαχείριση ή τον καθαρισμό των αντιγράφων δεδομένων στο Amazon S3. Αυτή η διαδικασία δεν είναι επεκτάσιμη για πελάτες με αυστηρό έλεγχο πρόσβασης δεδομένων και μεγάλο αριθμό χρηστών.
Σε αυτήν την ανάρτηση, δείχνουμε πώς η άμεση σύνδεση του Snowflake στο SageMaker Data Wrangler απλοποιεί την εμπειρία του διαχειριστή και το ταξίδι ML του επιστήμονα δεδομένων από τα δεδομένα στις επιχειρηματικές πληροφορίες.
Επισκόπηση λύσεων
Σε αυτήν τη λύση, χρησιμοποιούμε το SageMaker Data Wrangler για να επιταχύνουμε την προετοιμασία δεδομένων για ML και Αυτόματος πιλότος Amazon SageMaker για να δημιουργήσετε αυτόματα, να εκπαιδεύσετε και να τελειοποιήσετε τα μοντέλα ML με βάση τα δεδομένα σας. Και οι δύο υπηρεσίες έχουν σχεδιαστεί ειδικά για να αυξάνουν την παραγωγικότητα και να συντομεύουν το χρόνο για να αποκτήσουν αξία για τους επαγγελματίες ML. Επιδεικνύουμε επίσης την απλοποιημένη πρόσβαση δεδομένων από το SageMaker Data Wrangler στο Snowflake με άμεση σύνδεση με το ερώτημα και τη δημιουργία λειτουργιών για ML.
Ανατρέξτε στο παρακάτω διάγραμμα για μια επισκόπηση της διαδικασίας ML χαμηλού κώδικα με το Snowflake, το SageMaker Data Wrangler και το SageMaker Autopilot.
Η ροή εργασίας περιλαμβάνει τα ακόλουθα βήματα:
- Μεταβείτε στο SageMaker Data Wrangler για την προετοιμασία των δεδομένων σας και τις εργασίες μηχανικής χαρακτηριστικών.
- Ρυθμίστε τη σύνδεση Snowflake με το SageMaker Data Wrangler.
- Εξερευνήστε τους πίνακες σας Snowflake στο SageMaker Data Wrangler, δημιουργήστε ένα σύνολο δεδομένων ML και εκτελέστε μηχανική λειτουργιών.
- Εκπαιδεύστε και δοκιμάστε τα μοντέλα χρησιμοποιώντας το SageMaker Data Wrangler και το SageMaker Autopilot.
- Φορτώστε το καλύτερο μοντέλο σε ένα τελικό σημείο συμπερασμάτων σε πραγματικό χρόνο για προβλέψεις.
- Χρησιμοποιήστε ένα σημειωματάριο Python για να καλέσετε το εκκινημένο τελικό σημείο συμπερασμάτων σε πραγματικό χρόνο.
Προϋποθέσεις
Για αυτήν την ανάρτηση, ο διαχειριστής χρειάζεται τις ακόλουθες προϋποθέσεις:
Οι επιστήμονες δεδομένων θα πρέπει να έχουν τις ακόλουθες προϋποθέσεις
Τέλος, θα πρέπει να προετοιμάσετε τα δεδομένα σας για το Snowflake
- Χρησιμοποιούμε δεδομένα συναλλαγών με πιστωτική κάρτα από Kaggle για τη δημιουργία μοντέλων ML για τον εντοπισμό δόλιων συναλλαγών με πιστωτικές κάρτες, ώστε οι πελάτες να μην χρεώνονται για αντικείμενα που δεν αγόρασαν. Το σύνολο δεδομένων περιλαμβάνει συναλλαγές με πιστωτικές κάρτες τον Σεπτέμβριο του 2013 που πραγματοποιήθηκαν από Ευρωπαίους κατόχους καρτών.
- Πρέπει να χρησιμοποιήσετε το πελάτης SnowSQL και εγκαταστήστε το στον τοπικό σας υπολογιστή, ώστε να μπορείτε να το χρησιμοποιήσετε για να ανεβάσετε το σύνολο δεδομένων σε έναν πίνακα Snowflake.
Τα παρακάτω βήματα δείχνουν πώς να προετοιμάσετε και να φορτώσετε το σύνολο δεδομένων στη βάση δεδομένων Snowflake. Αυτή είναι μια ρύθμιση μίας χρήσης.
Πίνακας νιφάδας χιονιού και προετοιμασία δεδομένων
Ολοκληρώστε τα παρακάτω βήματα για αυτήν τη ρύθμιση μίας χρήσης:
- Αρχικά, ως διαχειριστής, δημιουργήστε μια εικονική αποθήκη, χρήστη και ρόλο Snowflake και παραχωρήστε πρόσβαση σε άλλους χρήστες, όπως οι επιστήμονες δεδομένων, για να δημιουργήσουν μια βάση δεδομένων και να σκηνοθετήσουν δεδομένα για τις περιπτώσεις χρήσης ML τους:
- Ως επιστήμονας δεδομένων, ας δημιουργήσουμε τώρα μια βάση δεδομένων και ας εισαγάγουμε τις συναλλαγές με πιστωτική κάρτα στη βάση δεδομένων Snowflake για πρόσβαση στα δεδομένα από το SageMaker Data Wrangler. Για λόγους απεικόνισης, δημιουργούμε μια βάση δεδομένων Snowflake με το όνομα
SF_FIN_TRANSACTION
: - Κατεβάστε το αρχείο δεδομένων CSV στον τοπικό σας υπολογιστή και δημιουργήστε ένα στάδιο για να φορτώσετε τα δεδομένα στον πίνακα της βάσης δεδομένων. Ενημερώστε τη διαδρομή του αρχείου ώστε να οδηγεί στη θέση του ληφθέντος συνόλου δεδομένων πριν εκτελέσετε την εντολή PUT για την εισαγωγή των δεδομένων στο δημιουργημένο στάδιο:
- Δημιουργήστε έναν πίνακα με όνομα
credit_card_transactions
: - Εισαγάγετε τα δεδομένα στον πίνακα που δημιουργήθηκε από το στάδιο:
Ρυθμίστε τη σύνδεση SageMaker Data Wrangler και Snowflake
Αφού προετοιμάσουμε το σύνολο δεδομένων για χρήση με το SageMaker Data Wrangler, ας δημιουργήσουμε μια νέα σύνδεση Snowflake στο SageMaker Data Wrangler για να συνδεθούμε στο sf_fin_transaction
βάση δεδομένων στο Snowflake και ερωτήστε το credit_card_transaction
τραπέζι:
- Επιλέξτε Νιφάδα χιονιού στο SageMaker Data Wrangler σύνδεση .
- Δώστε ένα όνομα για να προσδιορίσετε τη σύνδεσή σας.
- Επιλέξτε τη μέθοδο ελέγχου ταυτότητας για να συνδεθείτε με τη βάση δεδομένων Snowflake:
- Εάν χρησιμοποιείτε βασικό έλεγχο ταυτότητας, δώστε το όνομα χρήστη και τον κωδικό πρόσβασης που μοιράζεται ο διαχειριστής του Snowflake. Για αυτήν την ανάρτηση, χρησιμοποιούμε βασικό έλεγχο ταυτότητας για να συνδεθείτε στο Snowflake χρησιμοποιώντας τα διαπιστευτήρια χρήστη που δημιουργήσαμε στο προηγούμενο βήμα.
- Εάν χρησιμοποιείτε OAuth, δώστε τα διαπιστευτήρια του παρόχου ταυτότητάς σας.
Το SageMaker Data Wrangler από προεπιλογή ζητά τα δεδομένα σας απευθείας από το Snowflake χωρίς να δημιουργεί αντίγραφα δεδομένων σε κάδους S3. Η νέα βελτίωση χρηστικότητας του SageMaker Data Wrangler χρησιμοποιεί το Apache Spark για να ενσωματωθεί με το Snowflake για να προετοιμάσει και να δημιουργήσει απρόσκοπτα ένα σύνολο δεδομένων για το ταξίδι σας στο ML.
Μέχρι στιγμής, δημιουργήσαμε τη βάση δεδομένων στο Snowflake, έχουμε εισαγάγει το αρχείο CSV στον πίνακα Snowflake, δημιουργήσαμε διαπιστευτήρια Snowflake και δημιουργήσαμε μια σύνδεση στο SageMaker Data Wrangler για σύνδεση στο Snowflake. Για να επικυρώσετε τη διαμορφωμένη σύνδεση Snowflake, εκτελέστε το ακόλουθο ερώτημα στον πίνακα Snowflake που δημιουργήθηκε:
Σημειώστε ότι η επιλογή ενσωμάτωσης αποθήκευσης που απαιτούνταν πριν είναι πλέον προαιρετική στις ρυθμίσεις για προχωρημένους.
Εξερευνήστε τα δεδομένα του Snowflake
Αφού επικυρώσετε τα αποτελέσματα του ερωτήματος, επιλέξτε εισαγωγή για να αποθηκεύσετε τα αποτελέσματα του ερωτήματος ως σύνολο δεδομένων. Χρησιμοποιούμε αυτό το εξαγόμενο σύνολο δεδομένων για διερευνητική ανάλυση δεδομένων και μηχανική χαρακτηριστικών.
Μπορείτε να επιλέξετε τη δειγματοληψία των δεδομένων από το Snowflake στη διεπαφή χρήστη SageMaker Data Wrangler. Μια άλλη επιλογή είναι να κατεβάσετε πλήρη δεδομένα για τις περιπτώσεις χρήσης εκπαιδευτικών μοντέλων ML χρησιμοποιώντας εργασίες επεξεργασίας SageMaker Data Wrangler.
Εκτελέστε διερευνητική ανάλυση δεδομένων στο SageMaker Data Wrangler
Τα δεδομένα στο Data Wrangler πρέπει να σχεδιαστούν για να μπορέσουν να εκπαιδευτούν. Σε αυτήν την ενότητα, δείχνουμε πώς να εκτελείτε μηχανική λειτουργιών στα δεδομένα από το Snowflake χρησιμοποιώντας τις ενσωματωμένες δυνατότητες του SageMaker Data Wrangler.
Αρχικά, ας χρησιμοποιήσουμε το Data Quality and Insights Report
δυνατότητα στο SageMaker Data Wrangler για τη δημιουργία αναφορών για την αυτόματη επαλήθευση της ποιότητας των δεδομένων και τον εντοπισμό ανωμαλιών στα δεδομένα από το Snowflake.
Μπορείτε να χρησιμοποιήσετε την αναφορά για να σας βοηθήσει να καθαρίσετε και να επεξεργαστείτε τα δεδομένα σας. Σας δίνει πληροφορίες όπως ο αριθμός των τιμών που λείπουν και ο αριθμός των ακραίων τιμών. Εάν αντιμετωπίζετε προβλήματα με τα δεδομένα σας, όπως διαρροή στόχου ή ανισορροπία, η αναφορά πληροφοριών μπορεί να φέρει αυτά τα ζητήματα στην προσοχή σας. Για να κατανοήσετε τις λεπτομέρειες της αναφοράς, ανατρέξτε στο Επιταχύνετε την προετοιμασία δεδομένων με ποιότητα δεδομένων και πληροφορίες στο Amazon SageMaker Data Wrangler.
Αφού ελέγξετε την αντιστοίχιση τύπων δεδομένων που εφαρμόζεται από το SageMaker Data Wrangler, ολοκληρώστε τα ακόλουθα βήματα:
- Επιλέξτε το σύμβολο συν δίπλα Τύποι δεδομένων Και επιλέξτε Προσθέστε ανάλυση.
- Για Τύπος ανάλυσης, επιλέξτε Αναφορά ποιότητας δεδομένων και πληροφοριών.
- Επιλέξτε Δημιουργία.
- Ανατρέξτε στις λεπτομέρειες της Αναφοράς ποιότητας δεδομένων και πληροφοριών για να ελέγξετε τις προειδοποιήσεις υψηλής προτεραιότητας.
Μπορείτε να επιλέξετε να επιλύσετε τις προειδοποιήσεις που αναφέρθηκαν πριν συνεχίσετε με το ταξίδι σας ML.
Η στήλη στόχος Class
να προβλεφθεί ταξινομείται ως συμβολοσειρά. Αρχικά, ας εφαρμόσουμε έναν μετασχηματισμό για να αφαιρέσουμε τους μπαγιάτικους κενούς χαρακτήρες.
- Επιλέξτε Προσθέστε βήμα Και επιλέξτε Μορφοποίηση συμβολοσειράς.
- Στη λίστα μετασχηματισμών, επιλέξτε Απογυμνώστε αριστερά και δεξιά.
- Εισαγάγετε τους χαρακτήρες που θέλετε να αφαιρέσετε και επιλέξτε Πρόσθεση.
Στη συνέχεια, μετατρέπουμε τη στήλη προορισμού Class
από τον τύπο δεδομένων συμβολοσειράς στο Boolean επειδή η συναλλαγή είναι είτε νόμιμη είτε δόλια.
- Επιλέξτε Προσθέστε βήμα.
- Επιλέξτε Αναλύστε τη στήλη ως τύπο.
- Για Στήλη, επιλέξτε
Class
. - Για Από, επιλέξτε Σπάγγος.
- Για Προς την, επιλέξτε Boolean.
- Επιλέξτε Πρόσθεση.
Μετά τον μετασχηματισμό της στήλης στόχου, μειώνουμε τον αριθμό των στηλών χαρακτηριστικών, επειδή υπάρχουν πάνω από 30 χαρακτηριστικά στο αρχικό σύνολο δεδομένων. Χρησιμοποιούμε την ανάλυση κύριου στοιχείου (PCA) για να μειώσουμε τις διαστάσεις με βάση τη σημασία των χαρακτηριστικών. Για να κατανοήσετε περισσότερα σχετικά με το PCA και τη μείωση διαστάσεων, ανατρέξτε στο Αλγόριθμος Ανάλυσης Κύριων Στοιχείων (PCA)..
- Επιλέξτε Προσθέστε βήμα.
- Επιλέξτε Μείωση διαστάσεων.
- Για Μεταμορφώστε, επιλέξτε Ανάλυση κύριων συστατικών.
- Για Στήλες εισαγωγής, επιλέξτε όλες τις στήλες εκτός από τη στήλη προορισμού
Class
. - Επιλέξτε το σύμβολο συν δίπλα Ροή δεδομένων Και επιλέξτε Προσθήκη ανάλυσης.
- Για Τύπος ανάλυσης, επιλέξτε Γρήγορο μοντέλο.
- Για Όνομα ανάλυσης, πληκτρολογήστε ένα όνομα.
- Για επιγραφή, επιλέξτε
Class
. - Επιλέξτε τρέξιμο.
Με βάση τα αποτελέσματα PCA, μπορείτε να αποφασίσετε ποιες δυνατότητες θα χρησιμοποιήσετε για την κατασκευή του μοντέλου. Στο παρακάτω στιγμιότυπο οθόνης, το γράφημα δείχνει τα χαρακτηριστικά (ή τις διαστάσεις) ταξινομημένα με βάση την υψηλότερη έως τη χαμηλότερη σημασία για την πρόβλεψη της κατηγορίας στόχου, η οποία σε αυτό το σύνολο δεδομένων είναι εάν η συναλλαγή είναι δόλια ή έγκυρη.
Μπορείτε να επιλέξετε να μειώσετε τον αριθμό των χαρακτηριστικών βάσει αυτής της ανάλυσης, αλλά για αυτήν την ανάρτηση, αφήνουμε τις προεπιλογές ως έχουν.
Αυτό ολοκληρώνει τη διαδικασία της μηχανικής μας χαρακτηριστικών, αν και μπορείτε να επιλέξετε να εκτελέσετε το γρήγορο μοντέλο και να δημιουργήσετε ξανά μια αναφορά ποιότητας δεδομένων και πληροφοριών για να κατανοήσετε τα δεδομένα προτού εκτελέσετε περαιτέρω βελτιστοποιήσεις.
Εξαγωγή δεδομένων και εκπαίδευση του μοντέλου
Στο επόμενο βήμα, χρησιμοποιούμε το SageMaker Autopilot για να δημιουργήσουμε αυτόματα, να εκπαιδεύσουμε και να συντονίσουμε τα καλύτερα μοντέλα ML με βάση τα δεδομένα σας. Με το SageMaker Autopilot, εξακολουθείτε να διατηρείτε τον πλήρη έλεγχο και την ορατότητα των δεδομένων και του μοντέλου σας.
Τώρα που ολοκληρώσαμε την εξερεύνηση και τη μηχανική χαρακτηριστικών, ας εκπαιδεύσουμε ένα μοντέλο στο σύνολο δεδομένων και ας εξάγουμε τα δεδομένα για να εκπαιδεύσουμε το μοντέλο ML χρησιμοποιώντας το SageMaker Autopilot.
- Στις Εκπαίδευση καρτέλα, επιλέξτε Εξαγωγή και τρένο.
Μπορούμε να παρακολουθούμε την πρόοδο των εξαγωγών όσο περιμένουμε να ολοκληρωθεί.
Ας διαμορφώσουμε το SageMaker Autopilot ώστε να εκτελεί μια αυτοματοποιημένη εργασία εκπαίδευσης, προσδιορίζοντας τον στόχο που θέλουμε να προβλέψουμε και τον τύπο του προβλήματος. Σε αυτήν την περίπτωση, επειδή εκπαιδεύουμε το σύνολο δεδομένων για να προβλέψουμε εάν η συναλλαγή είναι δόλια ή έγκυρη, χρησιμοποιούμε δυαδική ταξινόμηση.
- Εισαγάγετε ένα όνομα για το πείραμά σας, δώστε τα δεδομένα τοποθεσίας S3 και επιλέξτε Επόμενο: Στόχος και χαρακτηριστικά.
- Για στόχος, επιλέξτε
Class
ως η στήλη για την πρόβλεψη. - Επιλέξτε Επόμενο: Μέθοδος προπόνησης.
Ας επιτρέψουμε στο SageMaker Autopilot να αποφασίσει τη μέθοδο εκπαίδευσης με βάση το σύνολο δεδομένων.
- Για Μέθοδος και αλγόριθμοι εκπαίδευσης, Επιλέξτε AUTO.
Για να κατανοήσετε περισσότερα σχετικά με τις λειτουργίες εκπαίδευσης που υποστηρίζονται από το SageMaker Autopilot, ανατρέξτε στο Τρόποι προπόνησης και αλγόριθμος Υποστήριξη.
- Επιλέξτε Επόμενο: Ανάπτυξη και σύνθετες ρυθμίσεις.
- Για Επιλογή ανάπτυξης, επιλέξτε Αυτόματη ανάπτυξη του καλύτερου μοντέλου με μετασχηματισμούς από το Data Wrangler, το οποίο φορτώνει το καλύτερο μοντέλο για συμπέρασμα μετά την ολοκλήρωση του πειραματισμού.
- Εισαγάγετε ένα όνομα για το τελικό σημείο σας.
- Για Επιλέξτε τον τύπο προβλήματος μηχανικής εκμάθησης, επιλέξτε Δυαδική ταξινόμηση.
- Για Μετρική αντιρρήσεων, επιλέξτε F1.
- Επιλέξτε Επόμενο: Ελέγξτε και δημιουργήστε.
- Επιλέξτε Δημιουργία πειράματος.
Αυτό ξεκινά μια εργασία SageMaker Autopilot που δημιουργεί ένα σύνολο εργασιών εκπαίδευσης που χρησιμοποιεί συνδυασμούς υπερπαραμέτρων για τη βελτιστοποίηση της αντικειμενικής μέτρησης.
Περιμένετε μέχρι το SageMaker Autopilot να ολοκληρώσει την κατασκευή των μοντέλων και την αξιολόγηση του καλύτερου μοντέλου ML.
Εκκινήστε ένα τελικό σημείο συμπερασμάτων σε πραγματικό χρόνο για να δοκιμάσετε το καλύτερο μοντέλο
Το SageMaker Autopilot εκτελεί πειράματα για να προσδιορίσει το καλύτερο μοντέλο που μπορεί να ταξινομήσει τις συναλλαγές με πιστωτική κάρτα ως νόμιμες ή δόλιες.
Όταν το SageMaker Autopilot ολοκληρώσει το πείραμα, μπορούμε να προβάλουμε τα αποτελέσματα της εκπαίδευσης με τις μετρήσεις αξιολόγησης και να εξερευνήσουμε το καλύτερο μοντέλο από τη σελίδα περιγραφής εργασίας του SageMaker Autopilot.
- Επιλέξτε το καλύτερο μοντέλο και επιλέξτε Ανάπτυξη μοντέλου.
Χρησιμοποιούμε ένα τελικό σημείο συμπερασμάτων σε πραγματικό χρόνο για να δοκιμάσουμε το καλύτερο μοντέλο που δημιουργήθηκε μέσω του SageMaker Autopilot.
- Αγορά Κάντε προβλέψεις σε πραγματικό χρόνο.
Όταν το τελικό σημείο είναι διαθέσιμο, μπορούμε να περάσουμε το ωφέλιμο φορτίο και να λάβουμε αποτελέσματα συμπερασμάτων.
Ας ξεκινήσουμε ένα σημειωματάριο Python για να χρησιμοποιήσουμε το τελικό σημείο συμπερασμάτων.
- Στην κονσόλα SageMaker Studio, επιλέξτε το εικονίδιο φακέλου στο παράθυρο πλοήγησης και επιλέξτε Δημιουργήστε σημειωματάριο.
- Χρησιμοποιήστε τον ακόλουθο κώδικα Python για να καλέσετε το αναπτυγμένο τελικό σημείο συμπερασμάτων σε πραγματικό χρόνο:
Η έξοδος δείχνει το αποτέλεσμα ως false
, πράγμα που σημαίνει ότι τα δεδομένα του δείγματος χαρακτηριστικών δεν είναι δόλια.
εκκαθάριση
Για να βεβαιωθείτε ότι δεν θα επιβαρυνθείτε με χρεώσεις μετά την ολοκλήρωση αυτού του σεμιναρίου, τερματίστε την εφαρμογή SageMaker Data Wrangler και τερματίστε την παρουσία του σημειωματάριου χρησιμοποιείται για την εκτέλεση συμπερασμάτων. Θα πρέπει επίσης διαγράψτε το τελικό σημείο συμπερασμάτων δημιουργήσατε χρησιμοποιώντας το SageMaker Autopilot για να αποτρέψετε πρόσθετες χρεώσεις.
Συμπέρασμα
Σε αυτήν την ανάρτηση, δείξαμε πώς να μεταφέρετε τα δεδομένα σας απευθείας από το Snowflake χωρίς να δημιουργήσετε ενδιάμεσα αντίγραφα στη διαδικασία. Μπορείτε είτε να κάνετε δείγματα είτε να φορτώσετε το πλήρες σύνολο δεδομένων σας στο SageMaker Data Wrangler απευθείας από το Snowflake. Στη συνέχεια, μπορείτε να εξερευνήσετε τα δεδομένα, να καθαρίσετε τα δεδομένα και να εκτελέσετε τη μηχανική με τη χρήση της οπτικής διεπαφής του SageMaker Data Wrangler.
Επισημάναμε επίσης πώς μπορείτε εύκολα να εκπαιδεύσετε και να συντονίσετε ένα μοντέλο με το SageMaker Autopilot απευθείας από τη διεπαφή χρήστη του SageMaker Data Wrangler. Με την ενσωμάτωση του SageMaker Data Wrangler και του SageMaker Autopilot, μπορούμε να δημιουργήσουμε γρήγορα ένα μοντέλο μετά την ολοκλήρωση της μηχανικής των χαρακτηριστικών, χωρίς να γράψουμε κανέναν κώδικα. Στη συνέχεια, αναφερθήκαμε στο καλύτερο μοντέλο του SageMaker Autopilot για την εκτέλεση συμπερασμάτων χρησιμοποιώντας ένα τελικό σημείο σε πραγματικό χρόνο.
Δοκιμάστε τη νέα άμεση ενσωμάτωση Snowflake με το SageMaker Data Wrangler σήμερα για να δημιουργήσετε εύκολα μοντέλα ML με τα δεδομένα σας χρησιμοποιώντας το SageMaker.
Σχετικά με τους συγγραφείς
Hariharan Suresh είναι Senior Solutions Architect στην AWS. Είναι παθιασμένος με τις βάσεις δεδομένων, τη μηχανική μάθηση και το σχεδιασμό καινοτόμων λύσεων. Πριν από την ένταξή του στην AWS, ο Hariharan ήταν αρχιτέκτονας προϊόντων, βασικός ειδικός στην υλοποίηση τραπεζικών εργασιών και προγραμματιστής, και συνεργάστηκε με οργανισμούς BFSI για περισσότερα από 11 χρόνια. Εκτός τεχνολογίας, του αρέσει το αλεξίπτωτο πλαγιάς και το ποδήλατο.
Aparajithan Vaidyanathan είναι Κύριος Αρχιτέκτονας Επιχειρηματικών Λύσεων στην AWS. Υποστηρίζει εταιρικούς πελάτες να μεταναστεύσουν και να εκσυγχρονίσουν τον φόρτο εργασίας τους στο AWS cloud. Είναι Αρχιτέκτονας Cloud με 23+ χρόνια εμπειρίας στο σχεδιασμό και την ανάπτυξη εταιρικών, μεγάλης κλίμακας και κατανεμημένων συστημάτων λογισμικού. Ειδικεύεται στη Μηχανική Μάθηση & Αναλύσεις Δεδομένων με έμφαση στον τομέα Μηχανικής Δεδομένων και Χαρακτηριστικών. Είναι επίδοξος μαραθωνοδρόμος και τα χόμπι του περιλαμβάνουν πεζοπορία, ποδηλασία και να περνά χρόνο με τη γυναίκα του και τα δύο αγόρια του.
Τιμ Σονγκ είναι Μηχανικός Ανάπτυξης Λογισμικού στην AWS SageMaker, με 10+ χρόνια εμπειρίας ως προγραμματιστής λογισμικού, σύμβουλος και ηγέτης τεχνολογίας, έχει αποδείξει την ικανότητα να παρέχει κλιμακούμενα και αξιόπιστα προϊόντα και να επιλύει πολύπλοκα προβλήματα. Στον ελεύθερο χρόνο του, απολαμβάνει τη φύση, το τρέξιμο σε εξωτερικούς χώρους, την πεζοπορία κ.λπ.
Μπόσκο Αλμπουκέρκη είναι Sr. Partner Solutions Architect στην AWS και έχει πάνω από 20 χρόνια εμπειρίας στη συνεργασία με προϊόντα βάσεων δεδομένων και αναλυτικών στοιχείων από προμηθευτές εταιρικών βάσεων δεδομένων και παρόχους cloud. Έχει βοηθήσει μεγάλες εταιρείες τεχνολογίας να σχεδιάσουν λύσεις ανάλυσης δεδομένων και έχει οδηγήσει ομάδες μηχανικών στο σχεδιασμό και την υλοποίηση πλατφορμών ανάλυσης δεδομένων και προϊόντων δεδομένων.
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
- PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- PlatoESG. Αυτοκίνητο / EVs, Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
- BlockOffsets. Εκσυγχρονισμός της περιβαλλοντικής αντιστάθμισης ιδιοκτησίας. Πρόσβαση εδώ.
- πηγή: https://aws.amazon.com/blogs/machine-learning/accelerate-time-to-business-insights-with-the-amazon-sagemaker-data-wrangler-direct-connection-to-snowflake/
- :έχει
- :είναι
- :δεν
- $UP
- 1
- 10
- 100
- 11
- 12
- 14
- 15%
- 20
- 20 χρόνια
- 2013
- 27
- 30
- 40
- 500
- 7
- 9
- a
- ικανότητα
- Σχετικα
- επιταχύνουν
- πρόσβαση
- Λογαριασμός
- Πρόσθετος
- διαχειριστές
- προηγμένες
- Μετά το
- πάλι
- AI / ML
- Όλα
- επιτρέπουν
- Επίσης
- Αν και
- Amazon
- Amazon Sage Maker
- Amazon SageMaker Data Wrangler
- Amazon υπηρεσίες Web
- ποσό
- an
- ανάλυση
- analytics
- και
- Άλλος
- κάθε
- Apache
- api
- εφαρμοσμένος
- Εφαρμογή
- ΕΙΝΑΙ
- AS
- επιδιώκοντας
- At
- προσοχή
- Πιστοποίηση
- αυτοματοποίηση
- Αυτοματοποιημένη
- αυτομάτως
- διαθέσιμος
- AWS
- Τράπεζες
- βασίζονται
- βασικός
- BE
- επειδή
- πριν
- παρακάτω
- ΚΑΛΎΤΕΡΟΣ
- BFSI
- σώμα
- και οι δύο
- φέρω
- χτίζω
- Κτίριο
- ενσωματωμένο
- επιχείρηση
- αλλά
- by
- CAN
- δυνατότητες
- πιάνω
- κάρτα
- περίπτωση
- περιπτώσεις
- χαρακτήρες
- φορτισμένα
- φορτία
- έλεγχος
- Επιλέξτε
- τάξη
- ταξινόμηση
- ταξινομούνται
- Ταξινόμηση
- πελάτης
- Backup
- κωδικός
- Στήλη
- Στήλες
- συνδυασμοί
- Εταιρείες
- πλήρης
- Ολοκληρώθηκε το
- Ολοκληρώνει
- ολοκληρώνοντας
- συγκρότημα
- συστατικό
- έχει ρυθμιστεί
- Connect
- σύνδεση
- πρόξενος
- σύμβουλος
- ΣΥΝΕΧΕΙΑ
- έλεγχος
- μετατρέψετε
- πυρήνας
- Core Banking
- δημιουργία
- δημιουργήθηκε
- δημιουργεί
- δημιουργία
- Διαπιστεύσεις
- μονάδες
- πιστωτική κάρτα
- πελάτης
- εμπειρία του πελάτη
- Πελάτες
- ημερομηνία
- πρόσβαση δεδομένων
- ανάλυση δεδομένων
- Δεδομένα Analytics
- Προετοιμασία δεδομένων
- επιστήμονας δεδομένων
- βάση δεδομένων
- βάσεις δεδομένων
- αποφασίζει
- Προεπιλογή
- προεπιλογές
- παραδώσει
- αποδεικνύουν
- κατέδειξε
- παρατάσσω
- αναπτυχθεί
- ανάπτυξη
- περιγραφή
- Υπηρεσίες
- σχεδιασμένα
- σχέδιο
- καθέκαστα
- Προσδιορίστε
- Εργολάβος
- ανάπτυξη
- Ανάπτυξη
- Διαστάσεις
- κατευθύνει
- κατευθείαν
- διανέμονται
- τομέα
- Μην
- κάτω
- κατεβάσετε
- εύκολα
- είτε
- Τελικό σημείο
- μηχανικός
- Μηχανική
- εισάγετε
- Εταιρεία
- κ.λπ.
- ευρωπαϊκός
- εκτίμηση
- Εκτός
- υπάρχει
- εμπειρία
- πείραμα
- πειράματα
- εξερεύνηση
- Διερευνητική Ανάλυση Δεδομένων
- διερευνήσει
- εξαγωγή
- μακριά
- Χαρακτηριστικό
- Χαρακτηριστικά
- Χαρακτηρίζοντας
- Αρχεία
- οικονομικός
- φινίρισμα
- Όνομα
- φλοτέρ
- Συγκέντρωση
- Εξής
- Για
- μορφή
- απατηλός
- από
- πλήρη
- περαιτέρω
- παράγουν
- παίρνω
- δίνει
- χορηγεί
- γραφική παράσταση
- Έχω
- he
- βοήθεια
- βοήθησε
- υψηλότερο
- Τόνισε
- του
- Πως
- Πώς να
- HTML
- http
- HTTPS
- ICON
- προσδιορίσει
- Ταυτότητα
- if
- ανισορροπία
- εκτέλεση
- εκτελεστικών
- εισαγωγή
- σπουδαιότητα
- εισαγωγή
- εισαγωγές
- βελτίωση
- in
- περιλαμβάνουν
- περιλαμβάνει
- Αυξάνουν
- ατομικές
- πληροφορίες
- αρχικός
- καινοτόμες
- ιδέες
- εγκαθιστώ
- ενσωματώσει
- ολοκλήρωση
- περιβάλλον λειτουργίας
- εσωτερικός
- σε
- θέματα
- IT
- αντικειμένων
- Δουλειά
- Θέσεις εργασίας
- ενώνει
- ταξίδι
- jpg
- json
- large
- μεγάλης κλίμακας
- ξεκινήσει
- ξεκίνησε
- ηγέτης
- μάθηση
- Άδεια
- Led
- αριστερά
- νόμιμος
- ας
- Βιβλιοθήκη
- LIMIT
- Λιστα
- φορτίο
- φορτία
- τοπικός
- τοποθεσία
- χαμηλότερο
- μηχανή
- μάθηση μηχανής
- που
- διατηρήσουν
- κάνω
- διαχείριση
- Μαραθώνιος
- ταιριάζουν
- Ενδέχεται..
- μηχανισμός
- μέθοδος
- μετρικός
- Metrics
- μεταναστεύσουν
- Λεπτ.
- Λείπει
- ML
- μοντέλο
- μοντέλα
- εκμοντερνίζω
- τρόπων
- Παρακολούθηση
- περισσότερο
- όνομα
- Ονομάστηκε
- Φύση
- Πλοήγηση
- ανάγκες
- Νέα
- επόμενη
- σημειωματάριο
- τώρα
- αριθμός
- Ωχ
- αντικείμενο
- σκοπός
- of
- on
- συνεχή
- Βελτιστοποίηση
- Επιλογή
- or
- τάξη
- οργανώσεις
- πρωτότυπο
- OS
- ΑΛΛΑ
- δικός μας
- έξω
- παραγωγή
- εκτός
- επί
- επισκόπηση
- σελίδα
- παράθυρο
- εταίρος
- passieren
- παθιασμένος
- Κωδικός Πρόσβασης
- μονοπάτι
- Εκτελέστε
- εκτέλεση
- δικαιώματα
- Πλατφόρμες
- Πλάτων
- Πληροφορία δεδομένων Plato
- Πλάτωνα δεδομένα
- συν
- Σημείο
- Δημοφιλής
- Θέση
- προβλέψει
- προβλεπόμενη
- Προβλέψεις
- προετοιμασία
- Προετοιμάστε
- προαπαιτούμενα
- πρόληψη
- προηγούμενος
- Κύριος
- Πριν
- Πρόβλημα
- προβλήματα
- διαδικασια μας
- μεταποίηση
- Προϊόν
- παραγωγικότητα
- Προϊόντα
- Πρόοδος
- παρέχουν
- προμηθευτής
- Παρόχους υπηρεσιών
- δημόσιο
- αγορά
- σκοποί
- βάζω
- Python
- ποιότητα
- ερωτήματα
- Γρήγορα
- γρήγορα
- σε πραγματικό χρόνο
- μείωση
- μειώνει
- μείωση
- αξιόπιστος
- αφαιρέστε
- αντικαθιστώ
- αναφέρουν
- αναφέρθηκαν
- Εκθέσεις
- ζητήσει
- απαιτείται
- απάντησης
- αποτέλεσμα
- Αποτελέσματα
- ανασκόπηση
- ιππασία
- Ρόλος
- τρέξιμο
- δρομέας
- τρέξιμο
- s
- σοφός
- Αποθήκευση
- επεκτάσιμη
- Επιστήμονας
- επιστήμονες
- άψογα
- Τμήμα
- στείλετε
- αρχαιότερος
- Σεπτέμβριος
- Υπηρεσίες
- σειρά
- ρυθμίσεις
- setup
- Shared
- θα πρέπει να
- δείχνουν
- Δείχνει
- υπογράψουν
- Απλούς
- απλοποιημένη
- ενιαίας
- So
- λογισμικό
- ανάπτυξη λογισμικού
- λύση
- Λύσεις
- SOLVE
- τραγούδι
- Πηγή
- Σπινθήρας
- ειδικός
- ειδικεύεται
- ειδικά
- ταχύτητα
- Δαπάνες
- Στάδιο
- ξεκινά
- Βήμα
- Βήματα
- Ακόμη
- χώρος στο δίσκο
- κατάστημα
- Αυστηρός
- Σπάγγος
- στούντιο
- υποβάλουν
- επιτυχής
- Επιτυχώς
- τέτοιος
- υποστήριξη
- υποστηριζόνται!
- Υποστηρίζει
- συστήματα
- τραπέζι
- στόχος
- εργασίες
- ομάδες
- tech
- Τεχνολογία
- εταιρείες τεχνολογίας
- δοκιμή
- ότι
- Η
- Το γράφημα
- τους
- τότε
- Εκεί.
- αυτοί
- αυτό
- εκείνοι
- Μέσω
- ώρα
- προς την
- σήμερα
- Τρένο
- εκπαιδευμένο
- Εκπαίδευση
- συναλλαγή
- Συναλλαγές
- Μεταμόρφωση
- μετασχηματισμών
- αληθής
- φροντιστήριο
- δύο
- τύπος
- ui
- καταλαβαίνω
- Ενημέρωση
- us
- χρηστικότητα
- χρήση
- μεταχειρισμένος
- Χρήστες
- Διεπαφής χρήστη
- Χρήστες
- χρησιμοποιεί
- χρησιμοποιώντας
- v1
- ΕΠΙΚΥΡΩΝΩ
- αξία
- Αξίες
- πωλητές
- επαληθεύει
- Δες
- Πραγματικός
- ορατότητα
- περιμένετε
- θέλω
- ήταν
- we
- ιστός
- διαδικτυακές υπηρεσίες
- Εβδ.
- ήταν
- αν
- Ποιό
- ενώ
- Ο ΟΠΟΊΟΣ
- γυναίκα
- με
- εντός
- χωρίς
- Εργασία
- εργάστηκαν
- ροής εργασίας
- ροές εργασίας
- εργαζόμενος
- γραφή
- χρόνια
- Εσείς
- Σας
- zephyrnet