Ζωγραφίστε εικόνες με σταθερή διάχυση χρησιμοποιώντας το Amazon SageMaker JumpStart

Ζωγραφίστε εικόνες με σταθερή διάχυση χρησιμοποιώντας το Amazon SageMaker JumpStart

Τον Νοέμβριο του 2022, εμείς ανακοίνωσε που οι πελάτες AWS μπορούν να δημιουργήσουν εικόνες από κείμενο Σταθερή Διάχυση μοντέλα που χρησιμοποιούν Amazon SageMaker JumpStart. Σήμερα, είμαστε ενθουσιασμένοι που παρουσιάζουμε μια νέα δυνατότητα που επιτρέπει στους χρήστες να ζωγραφίζουν εικόνες με μοντέλα Stable Diffusion. Το Inpainting αναφέρεται στη διαδικασία αντικατάστασης ενός τμήματος μιας εικόνας με μια άλλη εικόνα με βάση μια προτροπή κειμένου. Παρέχοντας την αρχική εικόνα, μια εικόνα μάσκας που περιγράφει το τμήμα που πρόκειται να αντικατασταθεί και μια προτροπή κειμένου, το μοντέλο Stable Diffusion μπορεί να παράγει μια νέα εικόνα που αντικαθιστά την καλυμμένη περιοχή με το αντικείμενο, το θέμα ή το περιβάλλον που περιγράφεται στο κείμενο προτροπής.

Μπορείτε να χρησιμοποιήσετε το inpainting για να επαναφέρετε υποβαθμισμένες εικόνες ή να δημιουργήσετε νέες εικόνες με νέα θέματα ή στυλ σε ορισμένες ενότητες. Στο πεδίο του αρχιτεκτονικού σχεδιασμού, το Stable Diffusion inpainting μπορεί να εφαρμοστεί για την επισκευή ημιτελών ή κατεστραμμένων περιοχών σχεδίων κτιρίων, παρέχοντας ακριβείς πληροφορίες στα συνεργεία κατασκευής. Στην περίπτωση κλινικής απεικόνισης μαγνητικής τομογραφίας, το κεφάλι του ασθενούς πρέπει να συγκρατείται, γεγονός που μπορεί να οδηγήσει σε χαμηλότερα αποτελέσματα λόγω του τεχνητού περικοπής που προκαλεί απώλεια δεδομένων ή μειωμένη διαγνωστική ακρίβεια. Η ζωγραφική εικόνας μπορεί να βοηθήσει αποτελεσματικά στον μετριασμό αυτών των μη βέλτιστων αποτελεσμάτων.

Σε αυτήν την ανάρτηση, παρουσιάζουμε έναν ολοκληρωμένο οδηγό για την ανάπτυξη και την εκτέλεση συμπερασμάτων χρησιμοποιώντας το μοντέλο inpainting Stable Diffusion με δύο μεθόδους: μέσω της διεπαφής χρήστη (UI) του JumpStart στο Στούντιο Amazon SageMaker, και μέσω προγραμματισμού JumpStart API διαθέσιμο στο SDK SageMaker Python.

Επισκόπηση λύσεων

Οι παρακάτω εικόνες είναι παραδείγματα ζωγραφικής. Οι αρχικές εικόνες βρίσκονται στα αριστερά, η εικόνα της μάσκας βρίσκεται στο κέντρο και η ζωγραφισμένη εικόνα που δημιουργείται από το μοντέλο βρίσκεται στα δεξιά. Για το πρώτο παράδειγμα, το μοντέλο δόθηκε με την αρχική εικόνα, μια εικόνα μάσκας και το κείμενο προτροπής «μια λευκή γάτα, μπλε μάτια, που φοράει πουλόβερ, ξαπλωμένη στο πάρκο», καθώς και την αρνητική προτροπή «κακώς τραβηγμένα πόδια. ” Για το δεύτερο παράδειγμα, η προτροπή του κειμένου ήταν «Ένα γυναικείο μοντέλο προβάλλει με χάρη ένα casual μακρύ φόρεμα με ένα μείγμα ροζ και μπλε αποχρώσεων».

Ζωγραφίστε εικόνες με σταθερή διάχυση χρησιμοποιώντας το Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Η εκτέλεση μεγάλων μοντέλων όπως το Stable Diffusion απαιτεί προσαρμοσμένα σενάρια συμπερασμάτων. Πρέπει να εκτελέσετε δοκιμές από άκρο σε άκρο για να βεβαιωθείτε ότι το σενάριο, το μοντέλο και το επιθυμητό παράδειγμα συνεργάζονται αποτελεσματικά. Το JumpStart απλοποιεί αυτή τη διαδικασία παρέχοντας έτοιμα προς χρήση σενάρια που έχουν δοκιμαστεί άρτια. Μπορείτε να αποκτήσετε πρόσβαση σε αυτά τα σενάρια με ένα κλικ μέσω της διεπαφής χρήστη του Studio ή με πολύ λίγες γραμμές κώδικα μέσω του JumpStart API.

Οι παρακάτω ενότητες σάς καθοδηγούν στην ανάπτυξη του μοντέλου και στην εκτέλεση συμπερασμάτων χρησιμοποιώντας είτε τη διεπαφή χρήστη του Studio είτε τα API JumpStart.

Σημειώστε ότι χρησιμοποιώντας αυτό το μοντέλο, συμφωνείτε με το Άδεια CreativeML Open RAIL++-M.

Αποκτήστε πρόσβαση στο JumpStart μέσω της διεπαφής χρήστη του Studio

Σε αυτήν την ενότητα, παρουσιάζουμε την ανάπτυξη μοντέλων JumpStart χρησιμοποιώντας τη διεπαφή χρήστη του Studio. Το συνοδευτικό βίντεο δείχνει τον εντοπισμό του προεκπαιδευμένου μοντέλου ζωγραφικής Stable Diffusion στο JumpStart και την ανάπτυξή του. Η σελίδα μοντέλου παρέχει βασικές λεπτομέρειες σχετικά με το μοντέλο και τη χρήση του. Για την εκτέλεση συμπερασμάτων, χρησιμοποιούμε τον τύπο στιγμιότυπου ml.p3.2xlarge, ο οποίος παρέχει την απαιτούμενη επιτάχυνση GPU για συμπέρασμα χαμηλής καθυστέρησης σε προσιτή τιμή. Αφού διαμορφωθεί η παρουσία φιλοξενίας SageMaker, επιλέξτε Ανάπτυξη. Το τελικό σημείο θα είναι λειτουργικό και έτοιμο να χειριστεί αιτήματα συμπερασμάτων εντός περίπου 10 λεπτών.

Το JumpStart παρέχει ένα δείγμα σημειωματάριου που μπορεί να βοηθήσει στην επιτάχυνση του χρόνου που απαιτείται για την εκτέλεση συμπερασμάτων στο πρόσφατα δημιουργημένο τελικό σημείο. Για πρόσβαση στο σημειωματάριο στο Studio, επιλέξτε Ανοίξτε το Σημειωματάριο στο Χρησιμοποιήστε το Endpoint από το Studio ενότητα της σελίδας τελικού σημείου μοντέλου.

Χρησιμοποιήστε το JumpStart μέσω προγραμματισμού με το SageMaker SDK

Η χρήση του JumpStart UI σάς δίνει τη δυνατότητα να αναπτύξετε ένα προεκπαιδευμένο μοντέλο διαδραστικά με λίγα μόνο κλικ. Εναλλακτικά, μπορείτε να χρησιμοποιήσετε μοντέλα JumpStart μέσω προγραμματισμού χρησιμοποιώντας API που είναι ενσωματωμένα στο SageMaker Python SDK.

Σε αυτήν την ενότητα, επιλέγουμε ένα κατάλληλο προεκπαιδευμένο μοντέλο στο JumpStart, αναπτύσσουμε αυτό το μοντέλο σε ένα τελικό σημείο του SageMaker και εκτελούμε συμπέρασμα στο τελικό σημείο που έχει αναπτυχθεί, όλα χρησιμοποιώντας το SageMaker Python SDK. Τα ακόλουθα παραδείγματα περιέχουν αποσπάσματα κώδικα. Για πρόσβαση στον πλήρη κώδικα με όλα τα βήματα που περιλαμβάνονται σε αυτήν την επίδειξη, ανατρέξτε στο Εισαγωγή στην επεξεργασία εικόνας JumpStart – Stable Diffusion Inpainting παράδειγμα σημειωματάριο.

Αναπτύξτε το προεκπαιδευμένο μοντέλο

Το SageMaker χρησιμοποιεί κοντέινερ Docker για διάφορες εργασίες κατασκευής και χρόνου εκτέλεσης. Το JumpStart χρησιμοποιεί το SageMaker Deep Learning Containers (DLC) που είναι ειδικά για το πλαίσιο. Αρχικά λαμβάνουμε τυχόν πρόσθετα πακέτα, καθώς και σενάρια για τη διαχείριση της εκπαίδευσης και των συμπερασμάτων για την επιλεγμένη εργασία. Στη συνέχεια, τα προεκπαιδευμένα τεχνουργήματα μοντέλων παραλαμβάνονται ξεχωριστά model_uris, το οποίο παρέχει ευελιξία στην πλατφόρμα. Αυτό επιτρέπει τη χρήση πολλαπλών προεκπαιδευμένων μοντέλων με ένα μόνο σενάριο συμπερασμάτων. Ο παρακάτω κώδικας απεικονίζει αυτή τη διαδικασία:

model_id, model_version = "model-inpainting-stabilityai-stable-diffusion-2-inpainting-fp16", "*"
# Retrieve the inference docker container uri
deploy_image_uri = image_uris.retrieve( region=None, framework=None, # automatically inferred from model_id image_scope="inference", model_id=model_id, model_version=model_version, instance_type=inference_instance_type,
)
# Retrieve the inference script uri
deploy_source_uri = script_uris.retrieve(model_id=model_id, model_version=model_version, script_scope="inference") base_model_uri = model_uris.retrieve(model_id=model_id, model_version=model_version, model_scope="inference")

Στη συνέχεια, παρέχουμε αυτούς τους πόρους σε α Μοντέλο SageMaker παράδειγμα και αναπτύξτε ένα τελικό σημείο:

# Create the SageMaker model instance
# Create the SageMaker model instance
model = Model( image_uri=deploy_image_uri, source_dir=deploy_source_uri, model_data=base_model_uri, entry_point="inference.py", # entry point file in source_dir and present in deploy_source_uri role=aws_role, predictor_cls=Predictor, name=endpoint_name,
) # deploy the Model - note that we need to pass the Predictor class when we deploy the model through the Model class,
# in order to run inference through the SageMaker API
base_model_predictor = model.deploy( initial_instance_count=1, instance_type=inference_instance_type, predictor_cls=Predictor, endpoint_name=endpoint_name,
)

Αφού αναπτυχθεί το μοντέλο, μπορούμε να λάβουμε προβλέψεις σε πραγματικό χρόνο από αυτό!

Εισαγωγή

Η είσοδος είναι η βασική εικόνα, μια εικόνα μάσκας και η προτροπή που περιγράφει το θέμα, το αντικείμενο ή το περιβάλλον που πρόκειται να αντικατασταθεί στο καλυμμένο τμήμα. Η δημιουργία της τέλειας εικόνας μάσκας για εφέ ζωγραφικής περιλαμβάνει πολλές βέλτιστες πρακτικές. Ξεκινήστε με μια συγκεκριμένη προτροπή και μη διστάσετε να πειραματιστείτε με διάφορες ρυθμίσεις Stable Diffusion για να επιτύχετε τα επιθυμητά αποτελέσματα. Χρησιμοποιήστε μια εικόνα μάσκας που μοιάζει πολύ με την εικόνα που σκοπεύετε να ζωγραφίσετε. Αυτή η προσέγγιση βοηθά τον αλγόριθμο inpainting στη συμπλήρωση των τμημάτων της εικόνας που λείπουν, με αποτέλεσμα μια πιο φυσική εμφάνιση. Οι εικόνες υψηλής ποιότητας γενικά αποδίδουν καλύτερα αποτελέσματα, επομένως βεβαιωθείτε ότι οι εικόνες βάσης και μάσκας είναι καλής ποιότητας και μοιάζουν μεταξύ τους. Επιπλέον, επιλέξτε μια μεγάλη και ομαλή εικόνα μάσκας για να διατηρήσετε τις λεπτομέρειες και να ελαχιστοποιήσετε τα τεχνουργήματα.

Το τελικό σημείο δέχεται τη βασική εικόνα και τη μάσκα ως ακατέργαστες τιμές RGB ή μια κωδικοποιημένη εικόνα base64. Ο χειριστής συμπερασμάτων αποκωδικοποιεί την εικόνα με βάση content_type:

  • Για content_type = “application/json”, το ωφέλιμο φορτίο εισόδου πρέπει να είναι ένα λεξικό JSON με τις ακατέργαστες τιμές RGB, το κείμενο προτροπής και άλλες προαιρετικές παραμέτρους
  • Για content_type = “application/json;jpeg”, το ωφέλιμο φορτίο εισόδου πρέπει να είναι ένα λεξικό JSON με την κωδικοποιημένη εικόνα base64, μια προτροπή κειμένου και άλλες προαιρετικές παραμέτρους

Παραγωγή

Το τελικό σημείο μπορεί να δημιουργήσει δύο τύπους εξόδου: μια εικόνα RGB με κωδικοποίηση Base64 ή ένα λεξικό JSON των εικόνων που δημιουργούνται. Μπορείτε να καθορίσετε ποια μορφή εξόδου θέλετε ορίζοντας το accept κεφαλίδα προς "application/json" or "application/json;jpeg" για εικόνα JPEG ή βάση64, αντίστοιχα.

  • Για accept = “application/json”, το τελικό σημείο επιστρέφει το λεξικό JSON με τιμές RGB για την εικόνα
  • Για accept = “application/json;jpeg”, το τελικό σημείο επιστρέφει ένα λεξικό JSON με την εικόνα JPEG ως byte κωδικοποιημένα με κωδικοποίηση base64.b64

Λάβετε υπόψη ότι η αποστολή ή η λήψη του ωφέλιμου φορτίου με τις ακατέργαστες τιμές RGB μπορεί να φτάσει τα προεπιλεγμένα όρια για το ωφέλιμο φορτίο εισόδου και το μέγεθος απόκρισης. Επομένως, συνιστούμε να χρησιμοποιήσετε την κωδικοποιημένη εικόνα base64 με ρύθμιση content_type = “application/json;jpeg” και αποδοχή = "application/json;jpeg".

Ο παρακάτω κώδικας είναι ένα παράδειγμα αιτήματος συμπερασμάτων:

content_type = "application/json;jpeg" with open(input_img_file_name, "rb") as f: input_img_image_bytes = f.read()
with open(input_img_mask_file_name, "rb") as f: input_img_mask_image_bytes = f.read() encoded_input_image = base64.b64encode(bytearray(input_img_image_bytes)).decode()
encoded_mask = base64.b64encode(bytearray(input_img_mask_image_bytes)).decode() payload = { "prompt": "a white cat, blue eyes, wearing a sweater, lying in park", "image": encoded_input_image, "mask_image": encoded_mask, "num_inference_steps": 50, "guidance_scale": 7.5, "seed": 0, "negative_prompt": "poorly drawn feet",
} accept = "application/json;jpeg" def query(model_predictor, payload, content_type, accept): """Query the model predictor.""" query_response = model_predictor.predict( payload, { "ContentType": content_type, "Accept": accept, }, ) return query_response query_response = query(model_predictor, json.dumps(payload).encode("utf-8"), content_type, accept)
generated_images = parse_response(query_response)

Υποστηριζόμενες παράμετροι

Τα μοντέλα inpainting Stable Diffusion υποστηρίζουν πολλές παραμέτρους για τη δημιουργία εικόνων:

  • εικόνα – Η αρχική εικόνα.
  • μάσκα – Μια εικόνα όπου το μαυρισμένο τμήμα παραμένει αμετάβλητο κατά τη δημιουργία εικόνας και το λευκό τμήμα αντικαθίσταται.
  • έγκαιρη – Μια προτροπή για την καθοδήγηση της δημιουργίας εικόνων. Μπορεί να είναι μια συμβολοσειρά ή μια λίστα συμβολοσειρών.
  • num_inference_steps (προαιρετικό) – Ο αριθμός των βημάτων απενεργοποίησης θορύβου κατά τη δημιουργία εικόνας. Περισσότερα βήματα οδηγούν σε εικόνα υψηλότερης ποιότητας. Εάν ορίζεται, πρέπει να είναι θετικός ακέραιος. Σημειώστε ότι περισσότερα βήματα συμπερασμάτων θα οδηγήσουν σε μεγαλύτερο χρόνο απόκρισης.
  • guidance_scale (προαιρετικό) – Μια υψηλότερη κλίμακα καθοδήγησης έχει ως αποτέλεσμα μια εικόνα πιο στενά συνδεδεμένη με την προτροπή, σε βάρος της ποιότητας της εικόνας. Εάν ορίζεται, πρέπει να είναι πλωτήρας. guidance_scale<=1 αγνοείται.
  • negative_prompt (προαιρετικό) – Αυτό καθοδηγεί τη δημιουργία εικόνων έναντι αυτής της προτροπής. Εάν καθορίζεται, πρέπει να είναι μια συμβολοσειρά ή μια λίστα συμβολοσειρών και να χρησιμοποιείται με guidance_scale. Αν guidance_scale είναι απενεργοποιημένο, είναι επίσης απενεργοποιημένο. Επιπλέον, εάν η προτροπή είναι μια λίστα συμβολοσειρών, τότε το negative_prompt πρέπει επίσης να είναι μια λίστα με συμβολοσειρές.
  • σπόροι (προαιρετικά) – Αυτό διορθώνει την τυχαιοποιημένη κατάσταση για αναπαραγωγιμότητα. Εάν ορίζεται, πρέπει να είναι ακέραιος. Κάθε φορά που χρησιμοποιείτε την ίδια προτροπή με τον ίδιο σπόρο, η εικόνα που προκύπτει θα είναι πάντα η ίδια.
  • batch_size (προαιρετικό) – Ο αριθμός των εικόνων που θα δημιουργηθούν σε ένα μόνο πάσο προς τα εμπρός. Εάν χρησιμοποιείτε μικρότερη παρουσία ή δημιουργείτε πολλές εικόνες, μειώστε batch_size να είναι μικρός αριθμός (1–2). Ο αριθμός των εικόνων = αριθμός προτροπών*num_images_per_prompt.

Περιορισμοί και προκαταλήψεις

Παρόλο που το Stable Diffusion έχει εντυπωσιακές επιδόσεις στο inpainting, υποφέρει από αρκετούς περιορισμούς και προκαταλήψεις. Αυτά περιλαμβάνουν, αλλά δεν περιορίζονται σε:

  • Το μοντέλο ενδέχεται να μην δημιουργεί ακριβή πρόσωπα ή άκρα επειδή τα δεδομένα εκπαίδευσης δεν περιλαμβάνουν επαρκείς εικόνες με αυτά τα χαρακτηριστικά.
  • Το μοντέλο εκπαιδεύτηκε στο Δεδομένα LAION-5B, το οποίο έχει περιεχόμενο για ενήλικες και ενδέχεται να μην είναι κατάλληλο για χρήση προϊόντος χωρίς περαιτέρω σκέψεις.
  • Το μοντέλο ενδέχεται να μην λειτουργεί καλά με μη αγγλικές γλώσσες, επειδή το μοντέλο εκπαιδεύτηκε σε κείμενο στην αγγλική γλώσσα.
  • Το μοντέλο δεν μπορεί να δημιουργήσει καλό κείμενο μέσα στις εικόνες.
  • Το Stable Diffusion inpainting συνήθως λειτουργεί καλύτερα με εικόνες χαμηλότερης ανάλυσης, όπως 256×256 ή 512×512 pixel. Όταν εργάζεστε με εικόνες υψηλής ανάλυσης (768×768 ή υψηλότερη), η μέθοδος μπορεί να δυσκολευτεί να διατηρήσει το επιθυμητό επίπεδο ποιότητας και λεπτομέρειας.
  • Αν και η χρήση ενός σπόρου μπορεί να βοηθήσει στον έλεγχο της αναπαραγωγιμότητας, η βαφή με σταθερή διάχυση μπορεί να παράγει ποικίλα αποτελέσματα με μικρές αλλαγές στην είσοδο ή τις παραμέτρους. Αυτό μπορεί να καταστήσει δύσκολη τη λεπτομέρεια της εξόδου για συγκεκριμένες απαιτήσεις.
  • Η μέθοδος μπορεί να δυσκολεύεται να δημιουργήσει περίπλοκες υφές και μοτίβα, ειδικά όταν εκτείνονται σε μεγάλες περιοχές εντός της εικόνας ή είναι απαραίτητες για τη διατήρηση της συνολικής συνοχής και ποιότητας της βαμμένης περιοχής.

Για περισσότερες πληροφορίες σχετικά με τους περιορισμούς και την προκατάληψη, ανατρέξτε στο Κάρτα μοντέλου Stable Diffusion Inpainting.

Λύση βαφής με μάσκα που δημιουργείται μέσω προτροπής

Το CLIPseq είναι μια προηγμένη τεχνική βαθιάς εκμάθησης που χρησιμοποιεί τη δύναμη των προεκπαιδευμένων μοντέλων CLIP (Contrastive Language-Image Pretraining) για τη δημιουργία μάσκες από εικόνες εισόδου. Αυτή η προσέγγιση παρέχει έναν αποτελεσματικό τρόπο δημιουργίας μασκών για εργασίες όπως η κατάτμηση εικόνων, η ζωγραφική και ο χειρισμός. Το CLIPseq χρησιμοποιεί το CLIP για να δημιουργήσει μια περιγραφή κειμένου της εικόνας εισόδου. Στη συνέχεια, η περιγραφή κειμένου χρησιμοποιείται για τη δημιουργία μιας μάσκας που προσδιορίζει τα εικονοστοιχεία στην εικόνα που σχετίζονται με την περιγραφή του κειμένου. Στη συνέχεια, η μάσκα μπορεί να χρησιμοποιηθεί για την απομόνωση των σχετικών τμημάτων της εικόνας για περαιτέρω επεξεργασία.

Το CLIPseq έχει πολλά πλεονεκτήματα σε σχέση με άλλες μεθόδους για τη δημιουργία μασκών από εικόνες εισόδου. Πρώτον, είναι μια πιο αποτελεσματική μέθοδος, επειδή δεν απαιτεί την επεξεργασία της εικόνας από έναν ξεχωριστό αλγόριθμο τμηματοποίησης εικόνας. Δεύτερον, είναι πιο ακριβές, επειδή μπορεί να δημιουργήσει μάσκες που είναι πιο ευθυγραμμισμένες με την περιγραφή κειμένου της εικόνας. Τρίτον, είναι πιο ευέλικτο, γιατί μπορείτε να το χρησιμοποιήσετε για να δημιουργήσετε μάσκες από μια μεγάλη ποικιλία εικόνων.

Ωστόσο, το CLIPseq έχει επίσης ορισμένα μειονεκτήματα. Πρώτον, η τεχνική μπορεί να έχει περιορισμούς όσον αφορά το θέμα, επειδή βασίζεται σε προεκπαιδευμένα μοντέλα CLIP που μπορεί να μην περιλαμβάνουν συγκεκριμένους τομείς ή τομείς εξειδίκευσης. Δεύτερον, μπορεί να είναι μια ευαίσθητη μέθοδος, επειδή είναι επιρρεπής σε σφάλματα στην περιγραφή κειμένου της εικόνας.

Για περισσότερες πληροφορίες, ανατρέξτε στο Εικονικό στυλ μόδας με γενετική τεχνητή νοημοσύνη χρησιμοποιώντας το Amazon SageMaker.

εκκαθάριση

Αφού ολοκληρώσετε την εκτέλεση του σημειωματάριου, βεβαιωθείτε ότι έχετε διαγράψει όλους τους πόρους που δημιουργήθηκαν στη διαδικασία για να διασφαλίσετε ότι η χρέωση έχει διακοπεί. Ο κώδικας για την εκκαθάριση του τελικού σημείου είναι διαθέσιμος στο συσχετισμένο σημειωματάριο.

Συμπέρασμα

Σε αυτήν την ανάρτηση, δείξαμε πώς να αναπτύξετε ένα προεκπαιδευμένο μοντέλο ζωγραφικής Stable Diffusion χρησιμοποιώντας το JumpStart. Δείξαμε αποσπάσματα κώδικα σε αυτήν την ανάρτηση—ο πλήρης κώδικας με όλα τα βήματα σε αυτήν την επίδειξη είναι διαθέσιμος στο Εισαγωγή στο JumpStart – Βελτιώστε την ποιότητα της εικόνας καθοδηγούμενη από προτροπή παράδειγμα σημειωματάριο. Δοκιμάστε τη λύση μόνοι σας και στείλτε μας τα σχόλιά σας.

Για να μάθετε περισσότερα σχετικά με το μοντέλο και τον τρόπο λειτουργίας του, ανατρέξτε στους ακόλουθους πόρους:

Για να μάθετε περισσότερα σχετικά με το JumpStart, δείτε τις παρακάτω αναρτήσεις:


Σχετικά με τους Συγγραφείς

Ζωγραφίστε εικόνες με σταθερή διάχυση χρησιμοποιώντας το Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Δρ Vivek Madan είναι Εφαρμοσμένος Επιστήμονας με την ομάδα Amazon SageMaker JumpStart. Πήρε το διδακτορικό του από το Πανεπιστήμιο του Ιλινόις στο Urbana-Champaign και ήταν μεταδιδακτορικός ερευνητής στο Georgia Tech. Είναι ενεργός ερευνητής στη μηχανική μάθηση και στο σχεδιασμό αλγορίθμων και έχει δημοσιεύσει εργασίες σε συνέδρια EMNLP, ICLR, COLT, FOCS και SODA.

Ζωγραφίστε εικόνες με σταθερή διάχυση χρησιμοποιώντας το Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Άλφρεντ Σεν είναι Ανώτερος Ειδικός AI/ML στο AWS. Εργάζεται στη Silicon Valley, κατέχοντας τεχνικές και διευθυντικές θέσεις σε διάφορους τομείς, όπως η υγειονομική περίθαλψη, τα οικονομικά και η υψηλή τεχνολογία. Είναι αφοσιωμένος ερευνητής εφαρμοσμένης AI/ML, που επικεντρώνεται στο CV, το NLP και την πολυτροπικότητα. Η δουλειά του έχει παρουσιαστεί σε εκδόσεις όπως το EMNLP, το ICLR και η Δημόσια Υγεία.

Σφραγίδα ώρας:

Περισσότερα από Μηχανική εκμάθηση AWS