Θεμέλιο του Αμαζονίου παρέχει μια ευρεία γκάμα μοντέλων foundation υψηλής απόδοσης από την Amazon και άλλες κορυφαίες εταιρείες τεχνητής νοημοσύνης, συμπεριλαμβανομένων Ανθρωπικός, AI21, Meta, Συνέρχομαι, να Σταθερότητα AI, και καλύπτει ένα ευρύ φάσμα περιπτώσεων χρήσης, συμπεριλαμβανομένης της δημιουργίας κειμένου και εικόνων, αναζήτησης, συνομιλίας, συλλογισμού και ενεργειών και πολλά άλλα. Το νέο Amazon Titan Image Generator Το μοντέλο επιτρέπει στους δημιουργούς περιεχομένου να δημιουργούν γρήγορα υψηλής ποιότητας, ρεαλιστικές εικόνες χρησιμοποιώντας απλά αγγλικά μηνύματα κειμένου. Το προηγμένο μοντέλο AI κατανοεί πολύπλοκες οδηγίες με πολλά αντικείμενα και επιστρέφει εικόνες ποιότητας στούντιο κατάλληλες για διαφήμιση, ηλεκτρονικό εμπόριο και ψυχαγωγία. Τα βασικά χαρακτηριστικά περιλαμβάνουν τη δυνατότητα βελτίωσης των εικόνων με επανάληψη σε προτροπές, αυτόματη επεξεργασία φόντου και δημιουργία πολλαπλών παραλλαγών της ίδιας σκηνής. Οι δημιουργοί μπορούν επίσης να προσαρμόσουν το μοντέλο με τα δικά τους δεδομένα για την παραγωγή εικόνων της επωνυμίας σε συγκεκριμένο στυλ. Είναι σημαντικό ότι το Titan Image Generator έχει ενσωματωμένες ασφάλειες, όπως αόρατα υδατογραφήματα σε όλες τις εικόνες που δημιουργούνται από AI, για να ενθαρρύνει υπεύθυνη χρήση και να μετριάσει τη διάδοση της παραπληροφόρησης. Αυτή η καινοτόμος τεχνολογία κάνει την παραγωγή προσαρμοσμένων εικόνων σε μεγάλο όγκο για οποιαδήποτε βιομηχανία πιο προσιτό και αποτελεσματικό.
Το νέο Amazon Titan Multimodal Embeddings Το μοντέλο βοηθά στη δημιουργία ακριβέστερης αναζήτησης και προτάσεων με την κατανόηση κειμένου, εικόνων ή και των δύο. Μετατρέπει εικόνες και αγγλικό κείμενο σε σημασιολογικά διανύσματα, αποτυπώνοντας νόημα και σχέσεις στα δεδομένα σας. Μπορείτε να συνδυάσετε κείμενο και εικόνες όπως περιγραφές προϊόντων και φωτογραφίες για να προσδιορίσετε τα στοιχεία πιο αποτελεσματικά. Τα διανύσματα τροφοδοτούν γρήγορες, ακριβείς εμπειρίες αναζήτησης. Το Titan Multimodal Embeddings είναι ευέλικτο σε διανυσματικές διαστάσεις, επιτρέποντας τη βελτιστοποίηση για τις ανάγκες απόδοσης. Ένα ασύγχρονο API και Amazon OpenSearch Service Η σύνδεση διευκολύνει την ενσωμάτωση του μοντέλου στις εφαρμογές νευρικής αναζήτησης.
Σε αυτήν την ανάρτηση, περιγράφουμε πώς να χρησιμοποιήσετε τα μοντέλα Titan Image Generator και Titan Multimodal Embeddings μέσω του AWS Python SDK.
Δημιουργία και επεξεργασία εικόνων
Σε αυτήν την ενότητα, παρουσιάζουμε τα βασικά μοτίβα κωδικοποίησης για τη χρήση του AWS SDK για τη δημιουργία νέων εικόνων και την εκτέλεση επεξεργασιών με τεχνητή νοημοσύνη σε υπάρχουσες εικόνες. Παραδείγματα κώδικα παρέχονται στην Python και η JavaScript (Node.js) είναι επίσης διαθέσιμη σε αυτό Αποθετήριο GitHub.
Για να μπορέσετε να γράψετε σενάρια που χρησιμοποιούν το Amazon Bedrock API, πρέπει να εγκαταστήσετε την κατάλληλη έκδοση του AWS SDK στο περιβάλλον σας. Για σενάρια Python, μπορείτε να χρησιμοποιήσετε το AWS SDK για Python (Boto3). Οι χρήστες Python μπορεί επίσης να θέλουν να εγκαταστήσουν το Μονάδα μαξιλαριού, το οποίο διευκολύνει λειτουργίες εικόνας όπως η φόρτωση και η αποθήκευση εικόνων. Για οδηγίες ρύθμισης, ανατρέξτε στο Αποθετήριο GitHub.
Επιπλέον, ενεργοποιήστε την πρόσβαση στα μοντέλα Amazon Titan Image Generator και Titan Multimodal Embeddings. Για περισσότερες πληροφορίες, ανατρέξτε στο Πρόσβαση μοντέλου.
Βοηθητικές λειτουργίες
Η ακόλουθη συνάρτηση ρυθμίζει το πρόγραμμα-πελάτη χρόνου εκτέλεσης Amazon Bedrock Boto3 και δημιουργεί εικόνες λαμβάνοντας ωφέλιμα φορτία διαφορετικών διαμορφώσεων (τις οποίες θα συζητήσουμε αργότερα σε αυτήν την ανάρτηση):
Δημιουργήστε εικόνες από κείμενο
Τα σενάρια που δημιουργούν μια νέα εικόνα από μια προτροπή κειμένου ακολουθούν αυτό το μοτίβο υλοποίησης:
- Διαμορφώστε μια προτροπή κειμένου και προαιρετική ερώτηση αρνητικού κειμένου.
- Χρησιμοποιήστε το
BedrockRuntime
πελάτη για να επικαλεστεί το μοντέλο Titan Image Generator. - Αναλύστε και αποκωδικοποιήστε την απάντηση.
- Αποθηκεύστε τις εικόνες που προκύπτουν στο δίσκο.
Κείμενο σε εικόνα
Το παρακάτω είναι ένα τυπικό σενάριο δημιουργίας εικόνας για το μοντέλο Titan Image Generator:
Αυτό θα δημιουργήσει εικόνες παρόμοιες με τις παρακάτω.
Εικόνα απόκρισης 1 | Εικόνα απόκρισης 2 |
Παραλλαγές εικόνας
Η παραλλαγή εικόνας παρέχει έναν τρόπο δημιουργίας λεπτών παραλλαγών μιας υπάρχουσας εικόνας. Το ακόλουθο απόσπασμα κώδικα χρησιμοποιεί μία από τις εικόνες που δημιουργήθηκαν στο προηγούμενο παράδειγμα για τη δημιουργία παραλλαγών εικόνων:
Αυτό θα δημιουργήσει εικόνες παρόμοιες με τις παρακάτω.
Αρχική εικόνα | Εικόνα απόκρισης 1 | Εικόνα απόκρισης 2 |
Επεξεργαστείτε μια υπάρχουσα εικόνα
Το μοντέλο Titan Image Generator σάς επιτρέπει να προσθέσετε, να αφαιρέσετε ή να αντικαταστήσετε στοιχεία ή περιοχές σε μια υπάρχουσα εικόνα. Καθορίζετε ποια περιοχή θα επηρεάζετε παρέχοντας ένα από τα ακόλουθα:
- Εικόνα μάσκας – Μια εικόνα μάσκας είναι μια δυαδική εικόνα στην οποία τα εικονοστοιχεία αξίας 0 αντιπροσωπεύουν την περιοχή που θέλετε να επηρεάσετε και τα εικονοστοιχεία 255 τιμών αντιπροσωπεύουν την περιοχή που πρέπει να παραμείνει αμετάβλητη.
- Προτροπή μάσκας – Η προτροπή μάσκας είναι μια περιγραφή κειμένου σε φυσική γλώσσα των στοιχείων που θέλετε να επηρεάσετε, η οποία χρησιμοποιεί ένα εσωτερικό μοντέλο τμηματοποίησης κειμένου.
Για περισσότερες πληροφορίες, ανατρέξτε στο Άμεσες Οδηγίες Μηχανικής.
Τα σενάρια που εφαρμόζουν μια επεξεργασία σε μια εικόνα ακολουθούν αυτό το μοτίβο υλοποίησης:
- Φορτώστε την εικόνα που πρόκειται να επεξεργαστείτε από το δίσκο.
- Μετατρέψτε την εικόνα σε μια συμβολοσειρά με κωδικοποίηση base64.
- Διαμορφώστε τη μάσκα με μία από τις ακόλουθες μεθόδους:
- Φορτώστε μια εικόνα μάσκας από το δίσκο, κωδικοποιώντας την ως base64 και ορίζοντας την ως
maskImage
παράμετρος. - Ρυθμίστε το
maskText
παράμετρος σε μια περιγραφή κειμένου των στοιχείων που θα επηρεαστούν.
- Φορτώστε μια εικόνα μάσκας από το δίσκο, κωδικοποιώντας την ως base64 και ορίζοντας την ως
- Καθορίστε το νέο περιεχόμενο που θα δημιουργηθεί χρησιμοποιώντας μία από τις ακόλουθες επιλογές:
- Για να προσθέσετε ή να αντικαταστήσετε ένα στοιχείο, ορίστε το
text
παράμετρος για μια περιγραφή του νέου περιεχομένου. - Για να αφαιρέσετε ένα στοιχείο, παραλείψτε το
text
πλήρως.
- Για να προσθέσετε ή να αντικαταστήσετε ένα στοιχείο, ορίστε το
- Χρησιμοποιήστε το
BedrockRuntime
πελάτη για να επικαλεστεί το μοντέλο Titan Image Generator. - Αναλύστε και αποκωδικοποιήστε την απάντηση.
- Αποθηκεύστε τις εικόνες που προκύπτουν στο δίσκο.
Επεξεργασία αντικειμένου: Ζωγραφική με εικόνα μάσκας
Το παρακάτω είναι ένα τυπικό σενάριο επεξεργασίας εικόνας για το μοντέλο Titan Image Generator που χρησιμοποιεί maskImage
. Λαμβάνουμε μία από τις εικόνες που δημιουργήθηκαν νωρίτερα και παρέχουμε μια εικόνα μάσκας, όπου τα εικονοστοιχεία με τιμή 0 αποδίδονται ως μαύρα και τα εικονοστοιχεία με τιμή 255 ως λευκά. Αντικαθιστούμε επίσης ένα από τα σκυλιά της εικόνας με μια γάτα χρησιμοποιώντας μια προτροπή κειμένου.
Αυτό θα δημιουργήσει εικόνες παρόμοιες με τις παρακάτω.
Αρχική εικόνα | Εικόνα μάσκας | Επεξεργασμένη εικόνα |
Αφαίρεση αντικειμένου: Βαφή με προτροπή μάσκας
Σε άλλο παράδειγμα, χρησιμοποιούμε maskPrompt
για να καθορίσετε ένα αντικείμενο στην εικόνα, που λήφθηκε από τα προηγούμενα βήματα, για επεξεργασία. Με την παράλειψη της προτροπής κειμένου, το αντικείμενο θα αφαιρεθεί:
Αυτό θα δημιουργήσει εικόνες παρόμοιες με τις παρακάτω.
Αρχική εικόνα | Εικόνα απόκρισης |
Επιμέλεια φόντου: Outpainting
Το outpainting είναι χρήσιμο όταν θέλετε να αντικαταστήσετε το φόντο μιας εικόνας. Μπορείτε επίσης να επεκτείνετε τα όρια μιας εικόνας για ένα εφέ σμίκρυνσης. Στο παρακάτω παράδειγμα σεναρίου, χρησιμοποιούμε maskPrompt
για να καθορίσετε ποιο αντικείμενο θα κρατήσει. μπορείτε επίσης να χρησιμοποιήσετε maskImage
. Η παράμετρος outPaintingMode
καθορίζει εάν θα επιτρέπεται η τροποποίηση των pixel μέσα στη μάσκα. Εάν οριστεί ως DEFAULT
, τα εικονοστοιχεία στο εσωτερικό της μάσκας επιτρέπεται να τροποποιηθούν έτσι ώστε η ανακατασκευασμένη εικόνα να είναι συνεπής συνολικά. Αυτή η επιλογή συνιστάται εάν η maskImage
που παρέχεται δεν αντιπροσωπεύει το αντικείμενο με ακρίβεια σε επίπεδο pixel. Εάν οριστεί ως PRECISE
, αποτρέπεται η τροποποίηση των pixel στο εσωτερικό της μάσκας. Αυτή η επιλογή συνιστάται εάν χρησιμοποιείτε α maskPrompt
ή ένα maskImage
που αναπαριστά το αντικείμενο με ακρίβεια σε επίπεδο pixel.
Αυτό θα δημιουργήσει εικόνες παρόμοιες με τις παρακάτω.
Αρχική εικόνα | Κείμενο | Εικόνα απόκρισης |
"παραλία" | ||
"δάσος" |
Επιπλέον, τα αποτελέσματα των διαφορετικών τιμών για outPaintingMode
, Με maskImage
που δεν περιγράφει το αντικείμενο με ακρίβεια σε επίπεδο pixel, είναι οι εξής.
Αυτή η ενότητα σάς παρέχει μια επισκόπηση των λειτουργιών που μπορείτε να εκτελέσετε με το μοντέλο Titan Image Generator. Συγκεκριμένα, αυτά τα σενάρια επιδεικνύουν εργασίες κειμένου σε εικόνα, παραλλαγή εικόνας, inpainting και outpainting. Θα πρέπει να μπορείτε να προσαρμόσετε τα μοτίβα για τις δικές σας εφαρμογές αναφέροντας τις λεπτομέρειες παραμέτρων για αυτούς τους τύπους εργασιών που περιγράφονται λεπτομερώς στο Τεκμηρίωση Amazon Titan Image Generator.
Πολυτροπική ενσωμάτωση και αναζήτηση
Μπορείτε να χρησιμοποιήσετε το μοντέλο Amazon Titan Multimodal Embeddings για εταιρικές εργασίες, όπως η αναζήτηση εικόνων και η σύσταση βάσει ομοιοτήτων, και διαθέτει ενσωματωμένο μετριασμό που συμβάλλει στη μείωση της προκατάληψης στα αποτελέσματα αναζήτησης. Υπάρχουν πολλά μεγέθη διαστάσεων ενσωμάτωσης για βέλτιστες αντισταθμίσεις καθυστέρησης/ακρίβειας για διαφορετικές ανάγκες και όλα μπορούν να προσαρμοστούν με ένα απλό API για προσαρμογή στα δικά σας δεδομένα, διατηρώντας παράλληλα την ασφάλεια και το απόρρητο των δεδομένων. Το Amazon Titan Multimodal Embeddings παρέχεται ως απλά API για εφαρμογές αναζήτησης και σύστασης μετασχηματισμού σε πραγματικό χρόνο ή ασύγχρονου μαζικού μετασχηματισμού και μπορεί να συνδεθεί με διαφορετικές διανυσματικές βάσεις δεδομένων, όπως Amazon OpenSearch Service.
Βοηθητικές λειτουργίες
Η ακόλουθη συνάρτηση μετατρέπει μια εικόνα, και προαιρετικά κείμενο, σε πολυτροπικές ενσωματώσεις:
Η ακόλουθη συνάρτηση επιστρέφει τις κορυφαίες παρόμοιες πολυτροπικές ενσωματώσεις σε ένα ερώτημα πολυτροπικές ενσωματώσεις. Σημειώστε ότι στην πράξη, μπορείτε να χρησιμοποιήσετε μια διαχειριζόμενη διανυσματική βάση δεδομένων, όπως η Υπηρεσία OpenSearch. Το παρακάτω παράδειγμα είναι για λόγους επεξήγησης:
Συνθετικό σύνολο δεδομένων
Για λόγους απεικόνισης, χρησιμοποιούμε Το μοντέλο Claude 2.1 της Anthropic στο Amazon Bedrock για να δημιουργήσετε τυχαία επτά διαφορετικά προϊόντα, το καθένα με τρεις παραλλαγές, χρησιμοποιώντας την ακόλουθη προτροπή:
Generate a list of 7 items description for an online e-commerce shop, each comes with 3 variants of color or type. All with separate full sentence description.
Ακολουθεί η λίστα των επιστρεφόμενων εξόδων:
Αντιστοιχίστε την παραπάνω απάντηση στη μεταβλητή response_cat
. Στη συνέχεια χρησιμοποιούμε το μοντέλο Titan Image Generator για να δημιουργήσουμε εικόνες προϊόντων για κάθε αντικείμενο:
Όλες οι εικόνες που δημιουργούνται βρίσκονται στο παράρτημα στο τέλος αυτής της ανάρτησης.
Πολυτροπική ευρετηρίαση δεδομένων
Χρησιμοποιήστε τον ακόλουθο κώδικα για την ευρετηρίαση πολυτροπικών δεδομένων:
Πολυτροπική αναζήτηση
Χρησιμοποιήστε τον ακόλουθο κώδικα για πολυτροπική αναζήτηση:
Ακολουθούν ορισμένα αποτελέσματα αναζήτησης.
Συμπέρασμα
Η ανάρτηση παρουσιάζει τα μοντέλα Amazon Titan Image Generator και Amazon Titan Multimodal Embeddings. Το Titan Image Generator σάς δίνει τη δυνατότητα να δημιουργείτε προσαρμοσμένες, υψηλής ποιότητας εικόνες από μηνύματα κειμένου. Τα βασικά χαρακτηριστικά περιλαμβάνουν την επανάληψη στις προτροπές, την αυτόματη επεξεργασία φόντου και την προσαρμογή δεδομένων. Διαθέτει ασφάλειες όπως αόρατα υδατογραφήματα για να ενθαρρύνει την υπεύθυνη χρήση. Το Titan Multimodal Embeddings μετατρέπει κείμενο, εικόνες ή και τα δύο σε σημασιολογικά διανύσματα για να παρέχει ακριβή αναζήτηση και προτάσεις. Στη συνέχεια παρείχαμε δείγματα κώδικα Python για τη χρήση αυτών των υπηρεσιών και δείξαμε τη δημιουργία εικόνων από μηνύματα κειμένου και την επανάληψη σε αυτές τις εικόνες. Επεξεργασία υπαρχουσών εικόνων προσθέτοντας, αφαιρώντας ή αντικαθιστώντας στοιχεία που καθορίζονται από εικόνες μάσκας ή κείμενο μάσκας. δημιουργία πολυτροπικών ενσωματώσεων από κείμενο, εικόνες ή και τα δύο· και αναζήτηση για παρόμοιες πολυτροπικές ενσωματώσεις σε ένα ερώτημα. Επίσης, δείξαμε τη χρήση ενός συνθετικού συνόλου δεδομένων ηλεκτρονικού εμπορίου που ευρετηριάστηκε και αναζητήθηκε χρησιμοποιώντας το Titan Multimodal Embeddings. Ο στόχος αυτής της ανάρτησης είναι να επιτρέψει στους προγραμματιστές να αρχίσουν να χρησιμοποιούν αυτές τις νέες υπηρεσίες AI στις εφαρμογές τους. Τα μοτίβα κώδικα μπορούν να χρησιμεύσουν ως πρότυπα για προσαρμοσμένες υλοποιήσεις.
Όλος ο κωδικός είναι διαθέσιμος στο Αποθετήριο GitHub. Για περισσότερες πληροφορίες, ανατρέξτε στο Οδηγός χρήσης Amazon Bedrock.
Σχετικά με τους Συγγραφείς
Ροχίτ Μίτταλ είναι Κύριος Διευθυντής Προϊόντων στο Amazon AI που κατασκευάζει πολυτροπικά μοντέλα θεμελίωσης. Πρόσφατα ηγήθηκε της κυκλοφορίας του μοντέλου Amazon Titan Image Generator ως μέρος της υπηρεσίας Amazon Bedrock. Με εμπειρία σε AI/ML, NLP και Αναζήτηση, ενδιαφέρεται για την κατασκευή προϊόντων που λύνουν τα σημεία πόνου των πελατών με καινοτόμο τεχνολογία.
Δρ Ashwin Swaminathan είναι ερευνητής, μηχανικός και διευθυντής Computer Vision and Machine Learning με 12+ χρόνια εμπειρίας στον κλάδο και 5+ χρόνια ακαδημαϊκής ερευνητικής εμπειρίας. Ισχυρές θεμελιώδεις αρχές και αποδεδειγμένη ικανότητα γρήγορης απόκτησης γνώσεων και συμβολής σε νεότερους και αναδυόμενους τομείς.
Ο Δρ Γιουσένγκ Σιε είναι Κύριος Εφαρμοσμένος Επιστήμονας στο Amazon AGI. Η δουλειά του επικεντρώνεται στην κατασκευή πολυτροπικών μοντέλων θεμελίωσης. Πριν ενταχθεί στην AGI, ήταν επικεφαλής διαφόρων multi-modal AI ανάπτυξης στην AWS, όπως το Amazon Titan Image Generator και το Amazon Textract Queries.
Δρ Χάο Γιανγκ είναι Κύριος Εφαρμοσμένος Επιστήμονας στο Amazon. Τα κύρια ερευνητικά του ενδιαφέροντα είναι η ανίχνευση αντικειμένων και η εκμάθηση με περιορισμένους σχολιασμούς. Εκτός εργασίας, ο Χάο απολαμβάνει την παρακολούθηση ταινιών, τη φωτογραφία και τις υπαίθριες δραστηριότητες.
Δρ Davide Modolo είναι Διευθυντής Εφαρμοσμένων Επιστημών στο Amazon AGI, που εργάζεται για τη δημιουργία μεγάλων πολυτροπικών θεμελιωδών μοντέλων. Πριν ενταχθεί στην Amazon AGI, ήταν διευθυντής/επικεφαλής για 7 χρόνια στα AWS AI Labs (Amazon Bedrock και Amazon Rekognition). Εκτός δουλειάς, του αρέσει να ταξιδεύει και να παίζει κάθε είδους άθλημα, ειδικά το ποδόσφαιρο.
Δρ Baichuan Sun, επί του παρόντος υπηρετεί ως Sr. AI/ML Solutions Architect στην AWS, εστιάζοντας στη γενετική τεχνητή νοημοσύνη και εφαρμόζει τις γνώσεις του στην επιστήμη των δεδομένων και τη μηχανική μάθηση για να παρέχει πρακτικές επιχειρηματικές λύσεις που βασίζονται στο cloud. Με εμπειρία στη συμβουλευτική διαχείρισης και την αρχιτεκτονική λύσεων AI, αντιμετωπίζει μια σειρά από πολύπλοκες προκλήσεις, όπως η ρομποτική όραση υπολογιστών, η πρόβλεψη χρονοσειρών και η προγνωστική συντήρηση, μεταξύ άλλων. Το έργο του βασίζεται σε ένα σταθερό υπόβαθρο διαχείρισης έργων, Ε&Α λογισμικού και ακαδημαϊκών αναζητήσεων. Εκτός δουλειάς, ο Dr. Sun απολαμβάνει την ισορροπία του ταξιδιού και του χρόνου με την οικογένεια και τους φίλους.
Δρ Κάι Ζου Επί του παρόντος εργάζεται ως Μηχανικός Υποστήριξης Cloud στην AWS, βοηθώντας πελάτες με ζητήματα σε υπηρεσίες που σχετίζονται με AI/ML όπως το SageMaker, το Bedrock κ.λπ. Είναι ειδικός σε θέματα SageMaker. Έμπειρος στην επιστήμη των δεδομένων και τη μηχανική δεδομένων, ενδιαφέρεται για τη δημιουργία έργων που τροφοδοτούνται με τεχνητή νοημοσύνη.
Κρις Σουλτς έχει αφιερώσει πάνω από 25 χρόνια ζωντανεύοντας τις ελκυστικές εμπειρίες των χρηστών συνδυάζοντας τις αναδυόμενες τεχνολογίες με το σχεδιασμό παγκόσμιας κλάσης. Στο ρόλο του ως Senior Product Manager, ο Kris βοηθά στο σχεδιασμό και τη δημιουργία υπηρεσιών AWS για την ενίσχυση των Media & Entertainment, Gaming και Spatial Computing.
Παράρτημα
Στις επόμενες ενότητες, παρουσιάζουμε προκλητικές περιπτώσεις χρήσης δειγμάτων, όπως εισαγωγή κειμένου, χέρια και αντανακλάσεις για να τονίσουμε τις δυνατότητες του μοντέλου Titan Image Generator. Περιλαμβάνουμε επίσης τα δείγματα εικόνων εξόδου που παράγονται σε προηγούμενα παραδείγματα.
Κείμενο
Το μοντέλο Titan Image Generator υπερέχει σε περίπλοκες ροές εργασίας, όπως η εισαγωγή ευανάγνωστου κειμένου σε εικόνες. Αυτό το παράδειγμα δείχνει την ικανότητα του Titan να αποδίδει ξεκάθαρα κεφαλαία και πεζά γράμματα με σταθερό στυλ μέσα σε μια εικόνα.
ένα corgi που φορά ένα καπέλο του μπέιζμπολ με το κείμενο "genai" | ένα χαρούμενο αγόρι που δίνει μπράβο, φορώντας ένα μπλουζάκι με κείμενο "γεννητικό AI" |
τα χέρια
Το μοντέλο Titan Image Generator έχει επίσης τη δυνατότητα να δημιουργεί λεπτομερείς εικόνες AI. Η εικόνα δείχνει ρεαλιστικά χέρια και δάχτυλα με ορατή λεπτομέρεια, υπερβαίνοντας τη δημιουργία πιο βασικών εικόνων AI που μπορεί να μην έχουν τέτοια ιδιαιτερότητα. Στα παρακάτω παραδείγματα, παρατηρήστε την ακριβή απεικόνιση της στάσης και της ανατομίας.
το χέρι ενός ατόμου που φαίνεται από ψηλά | μια προσεκτική ματιά στα χέρια ενός ατόμου που κρατά μια κούπα καφέ |
Καθρέπτης
Οι εικόνες που δημιουργούνται από το μοντέλο Titan Image Generator τακτοποιούν χωρικά αντικείμενα και αντανακλούν με ακρίβεια τα κατοπτρικά εφέ, όπως φαίνεται στα ακόλουθα παραδείγματα.
Εικόνες συνθετικών προϊόντων
Ακολουθούν οι εικόνες προϊόντων που δημιουργήθηκαν νωρίτερα σε αυτήν την ανάρτηση για το μοντέλο Titan Multimodal Embeddings.
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
- PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- PlatoESG. Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
- PlatoHealth. Ευφυΐα βιοτεχνολογίας και κλινικών δοκιμών. Πρόσβαση εδώ.
- πηγή: https://aws.amazon.com/blogs/machine-learning/use-amazon-titan-models-for-image-generation-editing-and-searching/
- :έχει
- :είναι
- :δεν
- :που
- $UP
- 1
- 10
- 100
- 12
- 125
- 14
- 15%
- 16
- 17
- 19
- 24
- 25
- 300
- 31
- 7
- a
- ικανότητα
- Ικανός
- πάνω από
- ακαδημαϊκής
- ακαδημαϊκή έρευνα
- πρόσβαση
- προσιτός
- ακριβής
- με ακρίβεια
- ηθοποιία
- δραστηριοτήτων
- δραστηριότητα
- προσαρμόσει
- προσθέτω
- προσθήκη
- Επιπλέον
- διευθύνσεις
- ρυθμιζόμενο
- προηγμένες
- επηρεάζουν
- παράγοντες
- AGI
- AI
- Υπηρεσίες AI
- Τροφοδοτείται από AI
- AI / ML
- στοχεύουν
- Όλα
- επιτρέπουν
- επιτρέπεται
- επιτρέπει
- Επίσης
- Amazon
- Αναγνώριση Amazon
- Textract Amazon
- Amazon υπηρεσίες Web
- μεταξύ των
- an
- ανάλυση
- ανατομία
- και
- Άλλος
- κάθε
- api
- APIs
- εφαρμογές
- εφαρμοσμένος
- ισχύει
- Εφαρμογή
- κατάλληλος
- αρχιτεκτονική
- ΕΙΝΑΙ
- ΠΕΡΙΟΧΗ
- περιοχές
- Παράταξη
- AS
- At
- αυτόματη
- Αυτόματο
- διαθέσιμος
- AWS
- φόντο
- Κακός
- Υπόλοιπο
- μπέιζμπολ
- βασικός
- BE
- παραλία
- πριν
- ΚΑΛΎΤΕΡΟΣ
- Πέρα
- προκατάληψη
- Μαύρη
- Μπλε
- σώμα
- και οι δύο
- όρια
- Φέρνοντας
- ευρύς
- καστανός
- χτίζω
- Κτίριο
- ενσωματωμένο
- επιχείρηση
- by
- Ημερολογιο
- φωτογραφική μηχανή
- CAN
- καμβάς
- καπάκι
- δυνατότητες
- Καταγραφή
- κουβαλάω
- μεταφέρουν
- αυτοκίνητα
- περιπτώσεις
- CAT
- προκλήσεις
- πρόκληση
- chat
- τάξη
- κλασικό
- σαφώς
- πελάτης
- Κλεισιμο
- κλείσιμο
- Backup
- κωδικός
- Κωδικοποίηση
- Καφές
- χρώμα
- συνδυασμός
- συνδυάζοντας
- έρχεται
- συμπαγής
- Εταιρείες
- εντελώς
- συγκρότημα
- υπολογιστή
- Computer Vision
- χρήση υπολογιστή
- συνδεδεμένος
- συνεπής
- συμβουλευτικές
- περιεχόμενο
- δημιουργούς περιεχομένου
- συμβάλλει
- ελέγχους
- μετρητής
- κάλυμμα
- Καλύμματα
- δημιουργία
- δημιουργία
- δημιουργούς
- πλήρωμα
- Τη στιγμή
- έθιμο
- πελάτης
- Πελάτες
- προσαρμόσιμη
- παραμετροποίηση
- προσαρμόσετε
- προσαρμοσμένη
- ημερομηνία
- επιστημονικά δεδομένα
- την ασφάλεια των δεδομένων
- την ασφάλεια των δεδομένων και την ιδιωτική ζωή
- βάση δεδομένων
- βάσεις δεδομένων
- Προεπιλογή
- αποδεικνύουν
- κατέδειξε
- καταδεικνύει
- Τζιν
- περιγραφή
- Υπηρεσίες
- λεπτομέρεια
- λεπτομερής
- καθέκαστα
- Ανίχνευση
- προγραμματιστές
- Ανάπτυξη
- DICT
- διαφορετικές
- Διάσταση
- Διαστάσεις
- συζητήσουν
- παραπληροφόρηση
- απόσταση
- Όχι
- Σκύλος
- Don
- κάτω
- dr
- e-commerce
- κάθε
- Νωρίτερα
- εύκολος
- Οικολογικά
- ηλεκτρονικού εμπορίου
- αποτέλεσμα
- αποτελεσματικά
- αποτελέσματα
- αποτελεσματικός
- είτε
- στοιχείο
- στοιχεία
- αλλιώς
- ενσωμάτωση
- σμυριδόπετρα
- αναδυόμενες τεχνολογίες
- ενεργοποιήσετε
- δίνει τη δυνατότητα
- ενεργοποίηση
- κωδικοποίησης
- ενθαρρύνει
- τέλος
- ελκυστικός
- μηχανικός
- Μηχανική
- Αγγλικά
- Εταιρεία
- Ψυχαγωγία
- Περιβάλλον
- ειδικά
- κ.λπ.
- παράδειγμα
- παραδείγματα
- Αποκλειστικό
- υφιστάμενα
- εμπειρία
- έμπειρος
- Δραστηριοτητες
- εμπειρογνώμονας
- επεκτείνουν
- πρόσωπα
- διευκολύνει
- αντιμέτωπος
- οικογένεια
- Χαρακτηριστικό
- Χαρακτηριστικά
- ταινίες
- ταιριάζουν
- εύκαμπτος
- φλοτέρ
- εστιάζει
- εστιάζοντας
- ακολουθήστε
- Εξής
- εξής
- Για
- δάσος
- Βρέθηκαν
- Θεμέλιο
- θεμελιακών
- φίλους
- από
- εμπρός
- πλήρη
- λειτουργία
- Βασικές αρχές
- Κέρδος
- τυχερών παιχνιδιών
- παράγουν
- παράγεται
- δημιουργεί
- παραγωγής
- γενεά
- γενετική
- Παραγωγική τεχνητή νοημοσύνη
- γεννήτρια
- δεδομένου
- Δίνοντας
- ποτήρι
- μετάβαση
- Χρυσό
- Χρυσή
- gps
- γκρί
- Πράσινο
- γειωμένο
- καθοδήγηση
- καθοδηγήσει
- χέρι
- λαβή
- τα χέρια
- ευτυχισμένος
- he
- Καρδιά
- ύψος
- βοήθεια
- βοηθά
- υψηλή απόδοση
- υψηλής ποιότητας
- Επισημάνετε
- του
- κράτημα
- Πως
- Πώς να
- HTML
- HTTPS
- προσδιορίσει
- if
- εικόνα
- Αναζήτηση εικόνων
- εικόνες
- εκτέλεση
- υλοποιήσεις
- εισαγωγή
- το σημαντικότερο
- in
- περιλαμβάνουν
- περιλαμβάνονται
- Συμπεριλαμβανομένου
- ευρετήριο
- δείκτες
- βιομηχανία
- πληροφορίες
- καινοτόμες
- καινοτόμο τεχνολογία
- εισαγωγή
- μέσα
- εγκαθιστώ
- οδηγίες
- ενσωματώσει
- ενσωματωθεί
- ενδιαφερόμενος
- συμφέροντα
- εσωτερικό
- σε
- Εισάγει
- αόρατος
- θέματα
- IT
- αντικειμένων
- επαναλαμβανόμενο
- ΤΟΥ
- το JavaScript
- τζιν παντελονι
- ενώνει
- jpg
- json
- Διατήρηση
- Κλειδί
- Είδος
- γνώση
- Labs
- Έλλειψη
- λίμνη
- Γλώσσα
- laptop
- large
- αργότερα
- ξεκινήσει
- που οδηγεί
- μάθηση
- Led
- πόδια
- ζωή
- Μου αρέσει
- Περιωρισμένος
- Λιστα
- φόρτωση
- ματιά
- Χαμηλός
- μηχανή
- μάθηση μηχανής
- που
- Κυρίως
- συντήρηση
- κάνω
- κατασκευαστής
- ΚΑΝΕΙ
- διαχειρίζεται
- διαχείριση
- διευθυντής
- μάσκα
- Ταίριασμα
- σπίρτα
- υλικό
- ματ
- ύλη
- max
- ανώτατο όριο
- Ενδέχεται..
- νόημα
- Εικόνες / Βίντεο
- ματιών
- μέθοδοι
- καθρέπτης
- Μετριάζω
- μείωση
- μοντέλο
- μοντέλα
- τροποποιημένο
- Παρακολούθηση
- περισσότερο
- πολλαπλούς
- Μουσική
- Φυσικό
- Ανάγκη
- ανάγκες
- αρνητικός
- Νέο
- νευρικός
- Νέα
- νεότερα
- nlp
- κόμβος
- Node.js
- Ν/Α
- σημείωση
- Ειδοποίηση..
- κοινοποιήσεις
- αριθμός
- πολλοί
- αντικείμενο
- Ανίχνευση αντικειμένων
- αντικειμένων
- of
- on
- ONE
- διαδικτυακά (online)
- αποκλειστικά
- λειτουργίες
- βελτιστοποίηση
- Επιλογή
- Επιλογές
- or
- ΑΛΛΑ
- Άλλα
- περίγραμμα
- παραγωγή
- εξόδους
- εκτός
- επί
- φόρμες
- επισκόπηση
- δική
- Πόνος
- παράμετρος
- μέρος
- πρότυπο
- πρότυπα
- Εκτελέστε
- επίδοση
- τηλέφωνο
- φωτογραφία
- Φωτογραφίες
- Πλάτων
- Πληροφορία δεδομένων Plato
- Πλάτωνα δεδομένα
- παιχνίδι
- σας παρακαλούμε
- τσέπες
- σημεία
- ενέχουν
- Θέση
- δύναμη
- τροφοδοτείται
- Πρακτικός
- πρακτική
- ανάγκη
- Ακρίβεια
- Ανώτερο
- εμπόδισε
- προηγούμενος
- Κύριος
- μυστικότητα
- παράγει
- Παράγεται
- που παράγουν
- Προϊόν
- υπεύθυνος προϊόντων
- Προϊόντα
- προγραμματιζόμενος
- σχέδιο
- διαχείριση έργου
- έργα
- προτρέπει
- αποδεδειγμένη
- παρέχουν
- παρέχεται
- παρέχει
- χορήγηση
- σκοποί
- Python
- ποιότητα
- ερωτήματα
- απορία
- γρήγορα
- R
- Ε & Α
- τυχαίος
- σειρά
- Τιμή
- RE
- σε πραγματικό χρόνο
- ρεαλιστικός
- πρόσφατα
- Σύσταση
- συστάσεις
- συνιστάται
- Red
- μείωση
- παραπέμπω
- αναφοράς
- τελειοποίηση
- αντανακλούν
- αντανάκλαση
- σχετίζεται με
- Σχέσεις
- χαλαρή
- παραμένουν
- αφαίρεση
- αφαιρέστε
- Καταργήθηκε
- αφαίρεση
- αποδώσει
- αποδίδεται
- αντικαθιστώ
- εκπροσωπώ
- αντιπροσώπευση
- αντιπροσωπεύει
- απαιτείται
- έρευνα
- ερευνητής
- απάντησης
- υπεύθυνος
- με αποτέλεσμα
- Αποτελέσματα
- απόδοση
- Επιστροφές
- σχισμένο
- ρομποτική
- Ρόλος
- ROSE
- γύρος
- runtime
- s
- διασφαλίσεις
- σοφός
- ίδιο
- δείγμα
- οικονομία
- Κλίμακα
- σκηνή
- Επιστήμη
- Επιστήμονας
- κουτάλα
- γραφή
- Εφαρμογές
- SDK
- Αναζήτηση
- αναζήτηση
- Τμήμα
- τμήματα
- ασφάλεια
- σπόρος
- βλέπει
- σημασιολογικός
- αρχαιότερος
- ποινή
- ξεχωριστό
- Σειρές
- εξυπηρετούν
- υπηρεσία
- Υπηρεσίες
- εξυπηρετούν
- σειρά
- Σέτς
- τον καθορισμό
- setup
- επτά
- Κατάστημα
- Κοντά
- θα πρέπει να
- Δείχνει
- πλευρά
- Ασημένιο
- παρόμοιες
- Απλούς
- ενιαίας
- Μέγεθος
- μεγέθη
- Ουρανός
- ύπνος
- Sneakers
- Απόσπασμα
- So
- Ποδόσφαιρο
- λογισμικό
- στέρεο
- λύση
- Λύσεις
- Λύει
- μερικοί
- Χώρος
- χωρική
- χωρική υπολογιστική
- συγκεκριμένες
- ειδικά
- εξειδίκευση
- καθορίζεται
- Δαπάνες
- πέρασε
- Άθλημα
- διάδοση
- πρότυπο
- στέκεται
- Εκκίνηση
- Βήμα
- Βήματα
- ευθεία
- δρόμος
- Σπάγγος
- ισχυρός
- ισχυρές βασικές αρχές
- στυλ
- θέμα
- τέτοιος
- κατάλληλος
- Κυρ.
- υποστήριξη
- υποστηριζόνται!
- συνθετικός
- Πάρτε
- λαμβάνεται
- λήψη
- δεξαμενή
- Έργο
- εργασίες
- Τεχνολογίες
- Τεχνολογία
- πρότυπα
- κείμενο
- ότι
- Η
- Η περιοχή
- τους
- τότε
- Εκεί.
- Αυτοί
- αυτό
- εκείνοι
- τρία
- Μέσω
- ώρα
- Χρονική σειρά
- Τιτάν
- Τίτλος
- τίτλους
- προς την
- κουπόνια
- κορυφή
- ιχνηλάτης
- Παρακολούθηση
- Μεταμορφώστε
- ταξίδι
- Ταξίδια
- δέντρο
- δύο
- τύπος
- τύποι
- τυπικός
- κατανόηση
- καταλαβαίνει
- αστικός
- χρήση
- μεταχειρισμένος
- χρήσιμος
- Χρήστες
- Χρήστες
- χρησιμοποιεί
- χρησιμοποιώντας
- Αξίες
- μεταβλητή
- Παραλλαγή
- παραλλαγές
- διάφορα
- εκδοχή
- μέσω
- ορατός
- όραμα
- τόμος
- walk
- περπάτημα
- θέλω
- ζεστός
- ήταν
- Δες
- παρακολουθείτε
- Νερό
- υδατογραφήματα
- Τρόπος..
- we
- ιστός
- διαδικτυακές υπηρεσίες
- Τι
- πότε
- αν
- Ποιό
- ενώ
- άσπρο
- ευρύς
- Ευρύ φάσμα
- πλάτος
- θα
- με
- εντός
- Εργασία
- ροές εργασίας
- εργαζόμενος
- λειτουργεί
- κόσμος
- γράφω
- X
- χρόνια
- Yoga
- Εσείς
- Σας
- zephyrnet