Amazon Titan Image Generator G1 este un model de ultimă oră text-to-image, disponibil prin Amazon Bedrock, care este capabil să înțeleagă solicitări care descriu mai multe obiecte în diverse contexte și surprinde aceste detalii relevante în imaginile pe care le generează. Este disponibil în regiunile AWS de Est (Virginia de Nord) și de Vest din SUA (Oregon) și poate efectua sarcini avansate de editare a imaginilor, cum ar fi decuparea inteligentă, pictura în interior și modificări de fundal. Cu toate acestea, utilizatorii ar dori să adapteze modelul la caracteristici unice în seturi de date personalizate pe care modelul nu este deja instruit. Seturile de date personalizate pot include date foarte proprietare, care sunt în concordanță cu regulile mărcii dvs. sau cu stiluri specifice, cum ar fi o campanie anterioară. Pentru a aborda aceste cazuri de utilizare și a genera imagini complet personalizate, puteți ajusta Amazon Titan Image Generator cu propriile date folosind modele personalizate pentru Amazon Bedrock.
De la generarea de imagini până la editarea acestora, modelele text-to-image au aplicații largi în diverse industrii. Ele pot spori creativitatea angajaților și pot oferi posibilitatea de a imagina noi posibilități pur și simplu cu descrieri textuale. De exemplu, poate ajuta la proiectarea și planificarea podelei pentru arhitecți și poate permite o inovație mai rapidă, oferind capacitatea de a vizualiza diferite modele fără procesul manual de creare a acestora. În mod similar, poate ajuta la design în diverse industrii, cum ar fi producția, designul de modă în retail și designul de jocuri, prin eficientizarea generării de grafică și ilustrații. Modelele text-to-image îmbunătățesc, de asemenea, experiența clienților, permițând publicitate personalizată, precum și chatbot-uri vizuale interactive și imersive în cazuri de utilizare media și divertisment.
În această postare, vă ghidăm prin procesul de reglare fină a modelului Amazon Titan Image Generator pentru a învăța două categorii noi: câinele Ron și pisica Smila, animalele noastre de companie preferate. Discutam cum să vă pregătiți datele pentru sarcina de reglare fină a modelului și cum să creați o lucrare de personalizare a modelului în Amazon Bedrock. În cele din urmă, vă arătăm cum să testați și să implementați modelul dvs. fin reglat Debit asigurat.
Ron câinele | Pisica Smila |
Evaluarea capabilităților modelului înainte de a ajusta o lucrare
Modelele de fundație sunt instruite pe cantități mari de date, așa că este posibil ca modelul dvs. să funcționeze suficient de bine din cutie. De aceea, este o bună practică să verificați dacă într-adevăr trebuie să vă ajustați modelul pentru cazul dvs. de utilizare sau dacă o inginerie promptă este suficientă. Să încercăm să generăm câteva imagini cu câinele Ron și pisica Smila cu modelul de bază Amazon Titan Image Generator, așa cum se arată în capturile de ecran de mai jos.
După cum era de așteptat, modelul out-of-the-box nu îi cunoaște încă pe Ron și Smila, iar rezultatele generate arată diferiți câini și pisici. Cu o inginerie promptă, putem oferi mai multe detalii pentru a ne apropia de aspectul animalelor noastre preferate.
Deși imaginile generate sunt mai asemănătoare cu Ron și Smila, vedem că modelul nu este capabil să reproducă asemănarea deplină a acestora. Să începem acum o lucrare de reglare fină cu fotografiile de la Ron și Smila pentru a obține rezultate consistente, personalizate.
Reglarea fină a Amazon Titan Image Generator
Amazon Bedrock vă oferă o experiență fără server pentru reglarea fină a modelului dvs. Amazon Titan Image Generator. Trebuie doar să vă pregătiți datele și să vă selectați hiperparametrii, iar AWS se va ocupa de sarcinile grele pentru dvs.
Când utilizați modelul Amazon Titan Image Generator pentru a ajusta, o copie a acestui model este creată în contul de dezvoltare a modelului AWS, deținut și gestionat de AWS, și este creată o lucrare de personalizare a modelului. Această lucrare accesează apoi datele de reglare fină de la un VPC, iar modelul Amazon Titan are greutățile actualizate. Noul model este apoi salvat într-un Serviciul Amazon de stocare simplă (Amazon S3) situat în același cont de dezvoltare a modelului ca și modelul pre-antrenat. Acum poate fi folosit pentru deducere numai de contul dvs. și nu este partajat cu niciun alt cont AWS. Când rulați inferența, accesați acest model prin a capacitatea de calcul furnizată sau direct, folosind inferență în lot pentru Amazon Bedrock. Indiferent de modalitatea de inferență aleasă, datele dvs. rămân în contul dvs. și nu sunt copiate în niciun cont deținut de AWS sau utilizate pentru a îmbunătăți modelul Amazon Titan Image Generator.
Următoarea diagramă ilustrează acest flux de lucru.
Confidențialitatea datelor și securitatea rețelei
Datele dvs. utilizate pentru reglarea fină, inclusiv solicitările, precum și modelele personalizate, rămân private în contul dvs. AWS. Acestea nu sunt partajate sau utilizate pentru instruirea modelelor sau îmbunătățirea serviciilor și nu sunt partajate cu furnizorii terți de modele. Toate datele folosite pentru reglare fină sunt criptate în tranzit și în repaus. Datele rămân în aceeași regiune în care este procesat apelul API. De asemenea, puteți utiliza AWS PrivateLink pentru a crea o conexiune privată între contul AWS în care se află datele dvs. și VPC.
Pregătirea datelor
Înainte de a putea crea o lucrare de personalizare a modelului, trebuie pregătiți-vă setul de date de antrenament. Formatul setului de date de antrenament depinde de tipul de job de personalizare pe care îl creați (reglare fină sau pre-formare continuă) și de modalitatea datelor dvs. (text în text, text în imagine sau imagine în imagine). încorporare). Pentru modelul Amazon Titan Image Generator, trebuie să furnizați imaginile pe care doriți să le utilizați pentru reglaj fin și o legendă pentru fiecare imagine. Amazon Bedrock se așteaptă ca imaginile dvs. să fie stocate pe Amazon S3, iar perechile de imagini și legendele să fie furnizate într-un format JSONL cu mai multe linii JSON.
Fiecare linie JSON este un eșantion care conține o imagine-ref, URI-ul S3 pentru o imagine și o legendă care include un prompt textual pentru imagine. Imaginile dvs. trebuie să fie în format JPEG sau PNG. Următorul cod arată un exemplu de format:
{"image-ref": "s3://bucket/path/to/image001.png", "caption": ""} {"image-ref": "s3://bucket/path/to/image002.png", "caption": ""} {"image-ref": "s3://bucket/path/to/image003.png", "caption": ""}
Deoarece „Ron” și „Smila” sunt nume care ar putea fi folosite și în alte contexte, cum ar fi numele unei persoane, adăugăm identificatorii „Ron the dog” și „Smila the cat” atunci când creăm solicitarea de a ajusta modelul nostru. . Deși nu este o cerință pentru fluxul de lucru de reglare fină, aceste informații suplimentare oferă mai multă claritate contextuală pentru model atunci când este personalizat pentru noile clase și va evita confuzia „„Ron the dog” cu o persoană numită Ron și „ Pisica Smila” cu orașul Smila din Ucraina. Folosind această logică, următoarele imagini arată un eșantion al setului nostru de date de antrenament.
Ron, câinele întins pe un pat alb | Ron câinele așezat pe o podea cu gresie | Ron câinele întins pe un scaun de mașină |
Smila pisica întinsă pe o canapea | Pisica Smila se uită la camera întinsă pe o canapea | Pisica Smila întinsă într-un transport pentru animale de companie |
Când ne transformăm datele în formatul așteptat de jobul de personalizare, obținem următoarea structură eșantion:
{"image-ref": "/ron_01.jpg", "caption": "Ron, câinele întins pe un pat alb pentru câini"} {"image-ref": "/ron_02.jpg", "caption": "Ron, câinele așezat pe o podea cu gresie"} {"image-ref": "/ron_03.jpg", "caption": "Ron câinele întins pe un scaun de mașină"} {"image-ref": "/smila_01.jpg", "caption": "Smila, pisica întinsă pe o canapea"} {"image-ref": "/smila_02.jpg", "caption": "Smila pisica așezată lângă fereastră lângă o pisică statuie"} {"image-ref": "/smila_03.jpg", "caption": "Smila, pisica întinsă pe un transport pentru animale de companie"}
După ce am creat fișierul nostru JSONL, trebuie să îl stocăm într-o găleată S3 pentru a începe munca noastră de personalizare. Lucrările de reglare fină Amazon Titan Image Generator G1 vor funcționa cu 5–10,000 de imagini. Pentru exemplul discutat în această postare, folosim 60 de imagini: 30 cu câinele Ron și 30 cu pisica Smila. În general, oferirea mai multor varietăți ale stilului sau clasei pe care încercați să le învățați va îmbunătăți acuratețea modelului dvs. fin reglat. Cu toate acestea, cu cât folosiți mai multe imagini pentru reglarea fină, cu atât va fi nevoie de mai mult timp pentru finalizarea lucrării de reglare fină. Numărul de imagini utilizate influențează, de asemenea, prețul lucrării dvs. fin reglate. A se referi la Prețuri Amazon Bedrock pentru mai multe informatii.
Reglarea fină a Amazon Titan Image Generator
Acum că avem datele de antrenament pregătite, putem începe o nouă lucrare de personalizare. Acest proces poate fi realizat atât prin intermediul consolei Amazon Bedrock, cât și prin intermediul API-urilor. Pentru a utiliza consola Amazon Bedrock, parcurgeți următorii pași:
- Pe consola Amazon Bedrock, alegeți Modele personalizate în panoul de navigare.
- Pe Personalizați modelul meniu, alegeți Creați o lucrare de reglare fină.
- Pentru Numele modelului reglat fin, introduceți un nume pentru noul dvs. model.
- Pentru Configurarea jobului, introduceți un nume pentru jobul de formare.
- Pentru Date de intrare, introduceți calea S3 a datelor de intrare.
- În Hiperparametrele secțiunea, furnizați valori pentru următoarele:
- Numărul de pași – De câte ori modelul este expus fiecărui lot.
- Dimensiunea lotului – Numărul de mostre procesate înainte de actualizarea parametrilor modelului.
- Rata de învățare – Rata la care parametrii modelului sunt actualizați după fiecare lot. Alegerea acestor parametri depinde de un set de date dat. Ca un ghid general, vă recomandăm să începeți prin a fixa dimensiunea lotului la 8, rata de învățare la 1e-5 și setați numărul de pași în funcție de numărul de imagini utilizate, așa cum este detaliat în tabelul următor.
Numărul de imagini furnizate | 8 | 32 | 64 | 1,000 | 10,000 |
Numărul de pași recomandat | 1,000 | 4,000 | 8,000 | 10,000 | 12,000 |
Dacă rezultatele lucrării dvs. de reglare fină nu sunt satisfăcătoare, luați în considerare creșterea numărului de pași dacă nu observați niciun semn de stil în imaginile generate și scăderea numărului de pași dacă observați stilul din imaginile generate, dar cu artefacte sau neclaritate. Dacă modelul ajustat nu reușește să învețe stilul unic din setul de date chiar și după 40,000 de pași, luați în considerare creșterea dimensiunii lotului sau a ratei de învățare.
- În Date de ieșire secțiunea, introduceți calea de ieșire S3 în care sunt stocate ieșirile de validare, inclusiv pierderile de validare înregistrate periodic și valorile de precizie.
- În Acces la serviciu secțiune, generați o secțiune nouă Gestionarea identității și accesului AWS (IAM) sau alegeți un rol IAM existent cu permisiunile necesare pentru a vă accesa compartimentele S3.
Această autorizare permite Amazon Bedrock să preia seturi de date de intrare și de validare din compartimentul dvs. desemnat și să stocheze rezultatele de validare fără probleme în compartimentul dvs. S3.
- Alege Ajustați modelul.
Cu configurațiile corecte setate, Amazon Bedrock vă va antrena acum modelul personalizat.
Implementați generatorul de imagini Amazon Titan, reglat fin, cu debit asigurat
După ce creați un model personalizat, Provisioned Throughput vă permite să alocați o rată predeterminată, fixă de capacitate de procesare modelului personalizat. Această alocare oferă un nivel consistent de performanță și capacitate de gestionare a sarcinilor de lucru, ceea ce are ca rezultat o performanță mai bună în sarcinile de producție. Al doilea avantaj al Provisioned Throughput este controlul costurilor, deoarece prețul standard bazat pe token cu modul de inferență la cerere poate fi dificil de prezis la scară largă.
Când reglarea fină a modelului dvs. este completă, acest model va apărea pe Modele personalizate pagina de pe consola Amazon Bedrock.
Pentru a achiziționa Provisioned Throughput, selectați modelul personalizat pe care tocmai l-ați reglat și alegeți Debit asigurat de achiziție.
Aceasta completează în prealabil modelul selectat pentru care doriți să achiziționați Provisioned Throughput. Pentru a testa modelul dvs. ajustat înainte de implementare, setați unitățile model la o valoare de 1 și setați termenul de angajament la Fără angajamente. Acest lucru vă permite să începeți rapid să testați modelele dvs. cu solicitări personalizate și să verificați dacă pregătirea este adecvată. Mai mult, atunci când sunt disponibile modele noi ajustate și versiuni noi, puteți actualiza Debitul asigurat atâta timp cât îl actualizați cu alte versiuni ale aceluiași model.
Rezultate de reglare fină
Pentru sarcina noastră de a personaliza modelul pe câinele Ron și pisica Smila, experimentele au arătat că cei mai buni hiperparametri au fost 5,000 de pași cu o dimensiune a lotului de 8 și o rată de învățare de 1e-5.
Următoarele sunt câteva exemple de imagini generate de modelul personalizat.
Câinele Ron purtând o pelerină de supererou | Ron câinele de pe lună | Câinele Ron într-o piscină cu ochelari de soare |
Smila pisica de pe zăpadă | Smila, pisica în alb-negru, care se uită la cameră | Pisica Smila poartă o pălărie de Crăciun |
Concluzie
În această postare, am discutat când să folosiți reglarea fină în loc să vă proiectați solicitările pentru generarea de imagini de o calitate mai bună. Am arătat cum să ajustam modelul Amazon Titan Image Generator și să implementăm modelul personalizat pe Amazon Bedrock. De asemenea, am furnizat instrucțiuni generale despre cum să vă pregătiți datele pentru reglare fină și să setați hiperparametri optimi pentru o personalizare mai precisă a modelului.
Ca pas următor, puteți adapta următoarele exemplu la cazul dvs. de utilizare pentru a genera imagini hiper-personalizate folosind Amazon Titan Image Generator.
Despre Autori
Maira Ladeira Tanke este un senior generative AI Data Scientist la AWS. Cu experiență în învățarea automată, ea are peste 10 ani de experiență în arhitectura și construirea de aplicații AI cu clienți din diverse industrii. În calitate de lider tehnic, ea îi ajută pe clienți să-și accelereze atingerea valorii afacerii prin soluții AI generative pe Amazon Bedrock. În timpul liber, Mairei îi place să călătorească, să se joace cu pisica ei Smila și să petreacă timpul cu familia ei într-un loc cald.
Dani Mitchell este arhitect specializat în soluții AI/ML la Amazon Web Services. El se concentrează pe cazuri de utilizare a vederii computerizate și ajută clienții din EMEA să-și accelereze călătoria ML.
Bharathi Srinivasan este Data Scientist la AWS Professional Services, unde îi place să construiască lucruri interesante pe Amazon Bedrock. Este pasionată de generarea valorii afacerii din aplicațiile de învățare automată, cu accent pe inteligența artificială responsabilă. În afară de a construi noi experiențe AI pentru clienți, Bharathi îi place să scrie science fiction și să se provoace cu sporturi de anduranță.
Achin Jain este un om de știință aplicat din echipa Amazon Artificial General Intelligence (AGI). Are experiență în modele text-to-image și se concentrează pe construirea Amazon Titan Image Generator.
- Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
- PlatoData.Network Vertical Generative Ai. Împuterniciți-vă. Accesați Aici.
- PlatoAiStream. Web3 Intelligence. Cunoștințe amplificate. Accesați Aici.
- PlatoESG. carbon, CleanTech, Energie, Mediu inconjurator, Solar, Managementul deșeurilor. Accesați Aici.
- PlatoHealth. Biotehnologie și Inteligență pentru studii clinice. Accesați Aici.
- Sursa: https://aws.amazon.com/blogs/machine-learning/fine-tune-your-amazon-titan-image-generator-g1-model-using-amazon-bedrock-model-customization/
- :are
- :este
- :nu
- :Unde
- 000
- 1
- 10
- 100
- 225
- 250
- 30
- 300
- 40
- 60
- 7
- 8
- 9
- 937
- a
- capacitate
- Capabil
- Despre Noi
- accelera
- acces
- Conform
- Cont
- precizie
- precis
- realizare
- peste
- de fapt
- adapta
- adăuga
- Suplimentar
- informatii suplimentare
- adresa
- adecvat
- avansat
- Avantaj
- Promovare
- După
- AGI
- AI
- Date AI
- AI / ML
- Ajutorul
- TOATE
- aloca
- alocare
- permite
- Permiterea
- permite
- deja
- de asemenea
- Cu toate ca
- Amazon
- Amazon Web Services
- Sume
- an
- și
- Orice
- api
- API-uri
- apărea
- aplicatii
- aplicat
- arhitecți
- SUNT
- artificial
- inteligență generală artificială
- AS
- At
- autorizare
- disponibil
- evita
- AWS
- Servicii profesionale AWS
- fundal
- de bază
- BE
- deoarece
- înainte
- începe
- fiind
- CEL MAI BUN
- Mai bine
- între
- Negru
- atât
- Cutie
- marca
- larg
- construi
- Clădire
- afaceri
- dar
- by
- apel
- denumit
- aparat foto
- Campanie
- CAN
- capacități
- Capacitate
- legende
- capturi
- mașină
- caz
- cazuri
- CAT
- categorii
- Pisici
- contesta
- Modificări
- Caracteristici
- chatbots
- verifica
- alegere
- Alege
- ales
- Crăciunul
- Oraș
- claritate
- clasă
- clase
- mai aproape
- cod
- angajament
- Completă
- calculator
- Computer Vision
- confuzie
- conexiune
- Lua în considerare
- consistent
- Consoleze
- contexte
- contextual
- a continuat
- Control
- Rece
- copiaţi
- corecta
- A costat
- ar putea
- crea
- a creat
- Crearea
- creativitate
- personalizat
- client
- experienta clientului
- clienţii care
- personalizare
- personalizate
- ultima generație
- de date
- om de știință de date
- seturi de date
- depinde de
- implementa
- desfășurarea
- descriind
- Amenajări
- desemnat
- modele
- detaliat
- detalii
- Dezvoltare
- diagramă
- diferit
- dificil
- direct
- discuta
- discutat
- face
- Câine
- făcut
- Dont
- conducere
- fiecare
- Est
- EMEA
- Angajat
- permite
- criptate
- Inginerie
- spori
- suficient de
- Intrați
- Divertisment
- Chiar
- exemplu
- exemple
- existent
- de aşteptat
- se așteaptă
- experienţă
- Experiențe
- experimente
- expertiză
- expus
- eșuează
- familie
- Modă
- mai repede
- Favorite
- Ficţiune
- Fișier
- În cele din urmă
- capăt
- fixată
- Podea
- Concentra
- concentrat
- următor
- Pentru
- format
- Gratuit
- din
- Complet
- complet
- g1
- joc
- General
- inteligenta generala
- genera
- generată
- generează
- generator
- generaţie
- generativ
- AI generativă
- generator
- obține
- dat
- bine
- grafică
- ghida
- orientări
- manipula
- Manipularea
- Avea
- he
- greu
- ridicare de greutati
- ajutor
- ajută
- ei
- extrem de
- Cum
- Cum Pentru a
- Totuși
- HTML
- http
- HTTPS
- identificatorii
- Identitate
- if
- ilustrează
- imagine
- imagini
- imagina
- captivantă
- îmbunătăţi
- îmbunătățiri
- in
- În altele
- include
- include
- Inclusiv
- crescând
- independent
- industrii
- influență
- informații
- Inovaţie
- intrare
- in schimb
- Inteligență
- interactiv
- IT
- ESTE
- Loc de munca
- Locuri de munca
- călătorie
- jpeg
- jpg
- JSON
- doar
- Cunoaște
- mare
- ouătoare
- conduce
- AFLAȚI
- învăţare
- Permite
- Nivel
- ridicare
- ca
- Linie
- linii
- situat
- logică
- Lung
- Uite
- de pe
- iubeste
- maşină
- masina de învățare
- gestionate
- manual
- de fabricaţie
- Mass-media
- Metrici
- ML
- mod
- model
- Modele
- mai mult
- În plus
- multiplu
- trebuie sa
- nume
- nume
- Navigare
- necesar
- Nevoie
- reţea
- Nou
- următor
- acum
- număr
- obiecte
- observa
- of
- on
- La cerere
- afară
- optimă
- or
- Oregon
- Altele
- al nostru
- afară
- producție
- iesiri
- exterior
- peste
- propriu
- deţinute
- pagină
- perechi
- pâine
- parametrii
- pasionat
- cale
- Efectua
- performanță
- permisiuni
- persoană
- Personalizat
- Animale de companie
- Fotografii
- planificare
- Plato
- Informații despre date Platon
- PlatoData
- joc
- piscină
- posibilităţile de
- posibil
- Post
- practică
- prezice
- Pregăti
- precedent
- de stabilire a prețurilor
- intimitate
- privat
- proces
- Procesat
- prelucrare
- producere
- profesional
- solicitări
- proprietate
- furniza
- prevăzut
- furnizori
- furnizează
- furnizarea
- cumpărare
- repede
- rată
- gata
- recomanda
- inregistrata
- trimite
- regiune
- regiuni
- rămâne
- rămășițe
- necesar
- cerință
- rezidă
- responsabil
- REST
- REZULTATE
- cu amănuntul
- Rol
- RON
- funcţionare
- acelaşi
- probă
- salvate
- cântare
- Ştiinţă
- Romane științifico-fantastice
- Om de stiinta
- capturi de ecran
- perfect
- Al doilea
- Secțiune
- vedea
- selecta
- selectate
- senior
- serverless
- serviciu
- Servicii
- set
- comun
- ea
- Arăta
- a arătat
- indicat
- Emisiuni
- Semne
- asemănător
- asemănător
- simplu
- pur şi simplu
- Ședință
- Mărimea
- inteligent
- So
- soluţii
- unele
- specialist
- specific
- Cheltuire
- Sportul
- standard
- Începe
- Pas
- paşi
- depozitare
- stoca
- stocate
- raționalizarea
- structura
- stil
- astfel de
- suficient
- tabel
- Sarcină
- sarcini
- echipă
- Tehnic
- durată
- test
- Testarea
- textual
- acea
- lor
- Lor
- apoi
- Acestea
- ei
- lucruri
- terț
- acest
- Prin
- debit
- timp
- ori
- gigant
- la
- Tren
- dresat
- Pregătire
- transformare
- tranzit
- Traveling
- încerca
- încercat
- de reglaj
- Două
- tip
- Ucraina
- înţelege
- unic
- de unităţi
- Actualizează
- actualizat
- actualizarea
- us
- utilizare
- carcasa de utilizare
- utilizat
- utilizatorii
- folosind
- validare
- valoare
- Valori
- diverse
- Versiunile
- de
- Virginia
- viziune
- vizual
- imagina
- vrea
- cald
- we
- web
- servicii web
- BINE
- au fost
- Vest
- cand
- care
- alb
- de ce
- voi
- fereastră
- cu
- fără
- Apartamente
- flux de lucru
- ar
- scrie
- ani
- încă
- Tu
- Ta
- zephyrnet