Utilizați Amazon DocumentDB pentru a crea soluții de învățare automată fără cod în Amazon SageMaker Canvas | Amazon Web Services

Utilizați Amazon DocumentDB pentru a crea soluții de învățare automată fără cod în Amazon SageMaker Canvas | Amazon Web Services

Suntem încântați să anunțăm lansarea Amazon DocumentDB (cu compatibilitate cu MongoDB) integrarea cu Amazon SageMaker Canvas, permițând clienților Amazon DocumentDB să creeze și să utilizeze soluții generative de inteligență artificială și de învățare automată (ML) fără a scrie cod. Amazon DocumentDB este o bază de date de documente JSON nativă complet gestionată, care face simplă și rentabilă operarea sarcinilor de lucru critice de documente la aproape orice scară, fără a gestiona infrastructura. Amazon SageMaker Canvas este un spațiu de lucru ML fără cod, care oferă modele gata de utilizat, inclusiv modele de bază și capacitatea de a pregăti date și de a construi și implementa modele personalizate.

În această postare, discutăm despre cum să aducem datele stocate în Amazon DocumentDB în SageMaker Canvas și să folosim acele date pentru a construi modele ML pentru analiză predictivă. Fără a crea și întreține conducte de date, veți putea alimenta modelele ML cu datele dvs. nestructurate stocate în Amazon DocumentDB.

Prezentare generală a soluțiilor

Să ne asumăm rolul unui analist de afaceri pentru o companie de livrare de alimente. Aplicația dvs. mobilă stochează informații despre restaurante în Amazon DocumentDB datorită scalabilității și capabilităților flexibile ale schemei. Doriți să culegeți informații despre aceste date și să construiți un model ML pentru a prezice modul în care vor fi evaluate noile restaurante, dar vi se pare dificil să efectuați analize asupra datelor nestructurate. Întâmpinați blocaje deoarece trebuie să vă bazați pe echipele de inginerie și știință a datelor pentru a îndeplini aceste obiective.

Această nouă integrare rezolvă aceste probleme, simplificând aducerea datelor Amazon DocumentDB în SageMaker Canvas și începe imediat să pregătească și să analizeze datele pentru ML. În plus, SageMaker Canvas elimină dependența de expertiza ML pentru a construi modele de înaltă calitate și a genera predicții.

Demonstrăm cum să folosiți datele Amazon DocumentDB pentru a construi modele ML în SageMaker Canvas în următorii pași:

  1. Creați un conector Amazon DocumentDB în SageMaker Canvas.
  2. Analizați datele folosind IA generativă.
  3. Pregătiți datele pentru învățarea automată.
  4. Construiește un model și generează predicții.

Cerințe preliminare

Pentru a implementa această soluție, completați următoarele cerințe preliminare:

  1. Aveți acces de administrator AWS Cloud cu un Gestionarea identității și accesului AWS (EU SUNT) utilizator cu permisiunile necesare pentru a finaliza integrarea.
  2. Finalizați configurarea mediului folosind Formarea AWS Cloud prin oricare dintre următoarele opțiuni:
    1. Implementați un șablon CloudFormation într-un nou VPC – Această opțiune creează un nou mediu AWS care constă din VPC, subrețele private, grupuri de securitate, roluri de execuție IAM, Amazon Cloud9, punctele finale VPC necesare, și domeniul SageMaker. Apoi implementează Amazon DocumentDB în acest nou VPC. Descărcați șablon sau lansați rapid stiva CloudFormation alegând Lansați Stack:
      Lansați stiva CloudFormation
    2. Implementați un șablon CloudFormation într-un VPC existent – Această opțiune creează punctele finale VPC necesare, rolurile de execuție IAM și domeniul SageMaker într-un VPC existent cu subrețele private. Descărcați șablon sau lansați rapid stiva CloudFormation alegând Lansați Stack:
      Lansați stiva CloudFormation

Rețineți că, dacă creați un nou domeniu SageMaker, trebuie să configurați domeniul să fie într-un VPC privat fără acces la internet pentru a putea adăuga conectorul la Amazon DocumentDB. Pentru a afla mai multe, consultați Configurați Amazon SageMaker Canvas într-un VPC fără acces la internet.

  1. Urmați tutorial pentru a încărca mostre de date despre restaurante în Amazon DocumentDB.
  2. Adăugați acces la Amazon Bedrock și modelul Anthropic Claude în cadrul acestuia. Pentru mai multe informații, consultați Adăugați acces la model.

Creați un conector Amazon DocumentDB în SageMaker Canvas

După ce vă creați domeniul SageMaker, parcurgeți următorii pași:

  1. Pe consola Amazon DocumentDB, alegeți Învățare automată fără cod în panoul de navigare.
  2. În Alegeți un domeniu și un profil¸ alegeți domeniul și profilul dvs. de utilizator SageMaker.
  3. Alege Lansați Canvas pentru a lansa SageMaker Canvas într-o filă nouă.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Când SageMaker Canvas se termină de încărcat, veți ateriza pe Fluxuri de date tab.

  1. Alege Crea pentru a crea un nou flux de date.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. Introduceți un nume pentru fluxul dvs. de date și alegeți Crea.
  3. Adăugați o nouă conexiune Amazon DocumentDB alegând Date de import, Apoi alegeți tabular pentru Tip de set de date.
  4. Pe Date de import pagina, pt Sursă de date, alege DocumentDB și Adăugați o conexiune.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  5. Introduceți un nume de conexiune, cum ar fi demo și alegeți clusterul Amazon DocumentDB dorit.

Rețineți că SageMaker Canvas va prepopula meniul derulant cu clustere în același VPC ca și domeniul dvs. SageMaker.

  1. Introduceți un nume de utilizator, o parolă și un nume de bază de date.
  2. În cele din urmă, selectați preferința de citire.

Pentru a proteja performanța instanțelor primare, SageMaker Canvas este implicit Secundar, ceea ce înseamnă că va citi doar din instanțe secundare. Când preferința de citire este Secundar de preferat, SageMaker Canvas citește din instanțe secundare disponibile, dar va citi din instanța principală dacă o instanță secundară nu este disponibilă. Pentru mai multe informații despre cum să configurați o conexiune Amazon DocumentDB, consultați Conectați-vă la o bază de date stocată în AWS.

  1. Alege Adăugați conexiune.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Dacă conexiunea reușește, veți vedea colecții în baza dvs. de date Amazon DocumentDB afișate sub formă de tabele.

  1. Trageți tabelul dorit în pânza goală. Pentru această postare, adăugăm datele restaurantului nostru.

Primele 100 de rânduri sunt afișate ca previzualizare.

  1. Pentru a începe să analizați și să vă pregătiți datele, alegeți Date de import.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. Introduceți un nume de set de date și alegeți Date de import.

Analizați datele folosind IA generativă

În continuare, dorim să obținem câteva informații despre datele noastre și să căutăm modele. SageMaker Canvas oferă o interfață în limbaj natural pentru analiza și pregătirea datelor. Cand Date se încarcă filele, puteți începe să discutați cu datele dvs. urmând următorii pași:

  1. Alege Chat pentru pregătirea datelor.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. Adunați informații despre datele dvs. punând întrebări precum exemplele prezentate în capturile de ecran de mai jos.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Pentru a afla mai multe despre cum să utilizați limbajul natural pentru a explora și pregăti date, consultați Utilizați limbajul natural pentru a explora și pregăti datele cu o nouă capacitate a Amazon SageMaker Canvas.

Să avem o idee mai profundă a calității datelor noastre utilizând Raportul SageMaker Canvas Data Quality and Insights, care evaluează automat calitatea datelor și detectează anomalii.

  1. Pe analize fila, alegeți Raport privind calitatea datelor și perspective.
  2. Alege rating ca coloană țintă și Regres ca tip de problemă, apoi alegeți Crea.

Acest lucru va simula formarea modelului și va oferi informații despre cum ne putem îmbunătăți datele pentru învățarea automată. Raportul complet este generat în câteva minute.

Raportul nostru arată că 2.47% dintre rândurile din ținta noastră au valori lipsă; vom aborda acest lucru în pasul următor. În plus, analiza arată că address line 2, name, și type_of_food caracteristicile au cea mai mare putere de predicție în datele noastre. Acest lucru indică informațiile de bază despre restaurant, cum ar fi locația și bucătăria, pot avea un impact enorm asupra evaluărilor.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Pregătiți datele pentru învățarea automată

SageMaker Canvas oferă peste 300 de transformări încorporate pentru a vă pregăti datele importate. Pentru mai multe informații despre caracteristicile de transformare ale SageMaker Canvas, consultați Pregătiți datele cu transformări avansate. Să adăugăm câteva transformări pentru a pregăti datele noastre pentru antrenarea unui model ML.

  1. Navigați înapoi la Flux de date pagină alegând numele fluxului de date din partea de sus a paginii.
  2. Alegeți semnul plus de lângă Tipuri de date Și alegeți Adăugați transformare.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  3. Alege Adăugați pasul.
  4. Să redenumim address line 2 coloana către cities.
    1. Alege Gestionați coloanele.
    2. Alege Redenumiți coloana pentru Transforma.
    3. Alege address line 2 pentru Coloana de intrare, introduce cities pentru Nume nouși alegeți Adăuga.
      Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  5. În plus, să aruncăm câteva coloane inutile.
    1. Adăugați o nouă transformare.
    2. Pentru Transforma, alege Aruncați coloana.
    3. Pentru Coloane de aruncat, alege URL și restaurant_id.
    4. Alege Adăuga.
      Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.[
  6. Our rating coloana caracteristică are unele valori lipsă, așa că haideți să completăm acele rânduri cu valoarea medie a acestei coloane.
    1. Adăugați o nouă transformare.
    2. Pentru Transforma, alege Impute.
    3. Pentru Tip de coloană, alege Numeric.
    4. Pentru Coloane de intrare, alege rating coloana.
    5. Pentru Strategia de imputare, alege medie.
    6. Pentru Coloana de ieșire, introduce rating_avg_filled.
    7. Alege Adăuga.
      Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  7. Putem scăpa rating coloană deoarece avem o coloană nouă cu valori completate.
  8. pentru că type_of_food este categoric în natură, vom dori să-l codificăm numeric. Să codificăm această caracteristică folosind tehnica de codificare one-hot.
    1. Adăugați o nouă transformare.
    2. Pentru Transforma, alege One-hot codificare.
    3. Pentru coloanele de intrare, alegeți type_of_food.
    4. Pentru Strategie de manipulare nevalid㸠alege A pastra.
    5. Pentru Stilul de ieșire¸ alege Coloane.
    6. Pentru Coloana de ieșire, introduce encoded.
    7. Alege Adăuga.
      Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Construiți un model și generați predicții

Acum că ne-am transformat datele, să antrenăm un model numeric ML pentru a prezice evaluările pentru restaurante.

  1. Alege Creați model.
  2. Pentru Numele setului de date, introduceți un nume pentru exportul setului de date.
  3. Alege Export și așteptați ca datele transformate să fie exportate.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  4. Alege Creați model link din colțul din stânga jos al paginii.

De asemenea, puteți selecta setul de date din caracteristica Data Wrangler din partea stângă a paginii.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

  1. Introduceți un nume de model.
  2. Alege Analiza predictivă, Apoi alegeți Crea.
  3. Alege rating_avg_filled ca coloană țintă.

SageMaker Canvas selectează automat un tip de model potrivit.

  1. Alege Previzualizare model pentru a vă asigura că nu există probleme de calitate a datelor.
  2. Alege Construire rapidă pentru a construi modelul.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Crearea modelului va dura aproximativ 2-15 minute.

Puteți vedea starea modelului după ce modelul termină antrenamentul. Modelul nostru are un RSME de 0.422, ceea ce înseamnă că modelul prezice adesea evaluarea unui restaurant cu +/- 0.422 din valoarea reală, o aproximare solidă pentru scara de rating de la 1 la 6.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

  1. În cele din urmă, puteți genera eșantion de predicții navigând la prezice tab.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A curăța

Pentru a evita costurile viitoare, ștergeți resursele pe care le-ați creat în timp ce urmăriți această postare. SageMaker Canvas vă facturează pentru durata sesiunii și vă recomandăm să vă deconectați de la SageMaker Canvas atunci când nu îl utilizați. A se referi la Deconectarea de la Amazon SageMaker Canvas pentru mai multe detalii.

Concluzie

În această postare, am discutat despre cum puteți utiliza SageMaker Canvas pentru IA generativă și ML cu datele stocate în Amazon DocumentDB. În exemplul nostru, am arătat cum un analist poate construi rapid un model ML de înaltă calitate utilizând un exemplu de set de date pentru restaurante.

Am arătat pașii pentru implementarea soluției, de la importul de date din Amazon DocumentDB până la construirea unui model ML în SageMaker Canvas. Întregul proces a fost finalizat printr-o interfață vizuală fără a scrie o singură linie de cod.

Pentru a începe călătoria ML low-code/fără cod, consultați Amazon SageMaker Canvas.


Despre autori

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Adeleke Coker este arhitect global de soluții cu AWS. Lucrează cu clienții la nivel global pentru a oferi îndrumare și asistență tehnică în implementarea sarcinilor de lucru de producție la scară pe AWS. În timpul liber, îi place să învețe, să citească, să se joace și să urmărească evenimente sportive.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai. Gururaj S Bayari este arhitect senior în soluții de specialitate DocumentDB la AWS. Îi face plăcere să ajute clienții să adopte bazele de date create special de Amazon. El îi ajută pe clienți să proiecteze, să evalueze și să-și optimizeze scara de internet și sarcinile de lucru de înaltă performanță alimentate de baze de date NoSQL și/sau relaționale.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Tim Pusateri este Senior Product Manager la AWS, unde lucrează pe Amazon SageMaker Canvas. Scopul său este de a ajuta clienții să obțină rapid valoare din AI/ML. În afara serviciului, îi place să fie în aer liber, să cânte la chitară, să vadă muzică live și să petreacă timp cu familia și prietenii.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Pratik Das este manager de produs la AWS. Îi place să lucreze cu clienții care doresc să creeze sarcini de lucru rezistente și baze solide de date în cloud. El aduce expertiză lucrând cu întreprinderi pe inițiative de modernizare, analitice și de transformare a datelor.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Varma Gottumukkala este arhitect senior în soluții de baze de date la AWS, cu sediul în Dallas Fort Worth. Varma lucrează cu clienții la strategia lor de baze de date și își construiește sarcinile de lucru folosind baze de date AWS create special. Înainte de a se alătura AWS, a lucrat intens cu baze de date relaționale, baze de date NOSQL și mai multe limbaje de programare în ultimii 22 de ani.

Timestamp-ul:

Mai mult de la Învățare automată AWS