Permiteți utilizatorilor dvs. de afaceri să extragă informații din documentele companiei folosind Amazon SageMaker Canvas și Generative AI | Amazon Web Services

Permiteți utilizatorilor dvs. de afaceri să extragă informații din documentele companiei folosind Amazon SageMaker Canvas și Generative AI | Amazon Web Services

Întreprinderile caută să valorifice potențialul Machine Learning (ML) pentru a rezolva probleme complexe și a îmbunătăți rezultatele. Până de curând, construirea și implementarea modelelor ML necesita niveluri profunde de abilități tehnice și de codificare, inclusiv ajustarea modelelor ML și menținerea conductelor operaționale. De la introducerea sa în 2021, Amazon SageMaker Canvas a permis analiștilor de afaceri să construiască, să implementeze și să utilizeze o varietate de modele ML – inclusiv tabelar, viziune computerizată și procesare în limbaj natural – fără a scrie o linie de cod. Acest lucru a accelerat capacitatea întreprinderilor de a aplica ML în cazuri de utilizare, cum ar fi prognoza serii cronologice, predicția retragerii clienților, analiza sentimentelor, detectarea defectelor industriale și multe altele.

După cum a fost anunțat pe Octombrie 5, 2023, SageMaker Canvas și-a extins suportul pentru modele la modele de bază (FM) – modele de limbaj mari utilizate pentru a genera și a rezuma conținut. Cu Lansare din 12 octombrie 2023, SageMaker Canvas le permite utilizatorilor să pună întrebări și să obțină răspunsuri bazate pe datele companiei lor. Acest lucru asigură că rezultatele sunt specifice contextului, deschizând cazuri de utilizare suplimentare în care ML fără cod poate fi aplicat pentru a rezolva problemele de afaceri. De exemplu, echipele de afaceri pot formula acum răspunsuri în concordanță cu vocabularul și principiile specifice ale unei organizații și pot interoga mai rapid documente lungi pentru a obține răspunsuri specifice și bazate pe conținutul acelor documente. Tot acest conținut este realizat într-o manieră privată și securizată, asigurându-se că toate datele sensibile sunt accesate cu guvernare și garanții adecvate.

Pentru a începe, un administrator cloud configurează și completează Amazon Kendra indexează cu datele companiei ca surse de date pentru SageMaker Canvas. Utilizatorii Canvas selectează indexul unde se află documentele lor și pot crea, cerceta și explora știind că rezultatul va fi întotdeauna susținut de sursele lor de adevăr. SageMaker Canvas folosește FM-uri de ultimă generație de la Amazon Bedrock și Amazon SageMaker JumpStart. Conversațiile pot fi începute cu mai multe FM unul lângă altul, comparând ieșirile și făcând cu adevărat AI-ul generativ accesibil tuturor.

În această postare, vom revizui caracteristica lansată recent, vom discuta despre arhitectură și vom prezenta un ghid pas cu pas pentru a permite SageMaker Canvas să interogheze documente din baza dvs. de cunoștințe, așa cum se arată în următoarea captură de ecran.

Permiteți utilizatorilor dvs. de afaceri să extragă informații din documentele companiei folosind Amazon SageMaker Canvas și Generative AI | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Prezentare generală a soluțiilor

Modelele de fundație pot produce halucinații – răspunsuri care sunt generice, vagi, fără legătură sau incorecte din punct de vedere faptic. Recuperare Augmented Generation (RAG) este o abordare frecvent utilizată pentru reducerea halucinațiilor. Arhitecturile RAG sunt folosite pentru a prelua date din afara unui FM, care sunt apoi folosite pentru a efectua învățarea în context pentru a răspunde la interogarea utilizatorului. Acest lucru asigură că FM poate folosi date dintr-o bază de cunoștințe de încredere și poate folosi aceste cunoștințe pentru a răspunde la întrebările utilizatorilor, reducând riscul de halucinație.

Cu RAG, datele externe FM și utilizate pentru a spori solicitările utilizatorilor pot proveni din mai multe surse de date disparate, cum ar fi arhivele de documente, bazele de date sau API-urile. Primul pas este să convertiți documentele și orice interogări ale utilizatorului într-un format compatibil pentru a efectua o căutare semantică de relevanță. Pentru a face formatele compatibile, o colecție de documente sau o bibliotecă de cunoștințe și interogările trimise de utilizator sunt convertite în reprezentări numerice folosind modele de încorporare.

Cu această versiune, funcționalitatea RAG este furnizată fără cod și fără întreruperi. Întreprinderile pot îmbogăți experiența de chat în Canvas cu Amazon Kendra ca sistem de management al cunoștințelor de bază. Următoarea diagramă ilustrează arhitectura soluției.

Permiteți utilizatorilor dvs. de afaceri să extragă informații din documentele companiei folosind Amazon SageMaker Canvas și Generative AI | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Conectarea SageMaker Canvas la Amazon Kendra necesită o configurare unică. Descriem procesul de configurare în detaliu în Configurarea Canvas pentru a interoga documente. Dacă nu v-ați configurat deja domeniul SageMaker, consultați Integrat la domeniul Amazon SageMaker.

Ca parte a configurației domeniului, un administrator cloud poate alege unul sau mai mulți indici Kendra pe care analistul de afaceri îi poate interoga atunci când interacționează cu FM prin SageMaker Canvas.

După ce indicii Kendra sunt hidratați și configurați, analiștii de afaceri îi folosesc cu SageMaker Canvas, pornind un nou chat și selectând comutatorul „Interogare documente”. SageMaker Canvas va gestiona apoi comunicarea de bază dintre Amazon Kendra și FM ales pentru a efectua următoarele operațiuni:

  1. Interogați indicii Kendra cu întrebarea venită de la utilizator.
  2. Preluați fragmentele (și sursele) din indicii Kendra.
  3. Creați promptul cu fragmentele cu interogarea originală, astfel încât modelul de fundație să poată genera un răspuns din documentele preluate.
  4. Furnizați răspunsul generat utilizatorului, împreună cu referințe la paginile/documentele care au fost folosite pentru a formula răspunsul.

Configurarea Canvas pentru a interoga documente

În această secțiune, vă vom ghida prin pașii pentru a configura Canvas pentru a interoga documentele difuzate prin indecșii Kendra. Ar trebui să aveți următoarele condiții preliminare:

  • Configurarea domeniului SageMaker – Integrat la domeniul Amazon SageMaker
  • Crearea unei Index Kendra (sau mai mult de unul)
  • Configurați conectorul Kendra Amazon S3 - urmați Conector Amazon S3 – și încărcați fișiere PDF și alte documente în compartimentul Amazon S3 asociat cu indexul Kendra
  • Configurați IAM astfel încât Canvas să aibă permisiunile corespunzătoare, inclusiv cele necesare pentru a apela punctele finale Amazon Bedrock și/sau SageMaker - urmați Configurați Canvas Chat documentaţie

Acum puteți actualiza Domeniul astfel încât să poată accesa indicii doriti. Pe consola SageMaker, pentru domeniul dat, selectați Editare din fila Setări domeniu. Activați comutatorul „Activați documentele de interogare cu Amazon Kendra”, care poate fi găsit la pasul Setări canvas. Odată activat, alegeți unul sau mai mulți indici Kendra pe care doriți să îi utilizați cu Canvas.

Permiteți utilizatorilor dvs. de afaceri să extragă informații din documentele companiei folosind Amazon SageMaker Canvas și Generative AI | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Permiteți utilizatorilor dvs. de afaceri să extragă informații din documentele companiei folosind Amazon SageMaker Canvas și Generative AI | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Acesta este tot ceea ce este necesar pentru a configura funcția de documente de interogare Canvas. Utilizatorii pot să intre acum într-un chat în Canvas și să înceapă să folosească bazele de cunoștințe care au fost atașate Domeniului prin indexurile Kendra. Deținătorii bazei de cunoștințe pot continua să actualizeze sursa adevărului și, cu capacitatea de sincronizare din Kendra, utilizatorii de chat vor putea automat să folosească informațiile actualizate într-un mod perfect.

Utilizarea funcției Interogare documente pentru chat

În calitate de utilizator SageMaker Canvas, funcția Interogare documente poate fi accesată dintr-un chat. Pentru a începe sesiunea de chat, faceți clic sau căutați butonul „Generați, extrageți și rezumați conținut” din fila Modele gata de utilizare din SageMaker Canvas.

Permiteți utilizatorilor dvs. de afaceri să extragă informații din documentele companiei folosind Amazon SageMaker Canvas și Generative AI | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Odată ajuns acolo, puteți activa și dezactiva Documentele de interogare cu comutatorul din partea de sus a ecranului. Consultați promptul de informații pentru a afla mai multe despre funcție.

Permiteți utilizatorilor dvs. de afaceri să extragă informații din documentele companiei folosind Amazon SageMaker Canvas și Generative AI | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Când Interogarea documentelor este activată, puteți alege dintr-o listă de indici Kendra activați de administratorul cloud.

Permiteți utilizatorilor dvs. de afaceri să extragă informații din documentele companiei folosind Amazon SageMaker Canvas și Generative AI | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Puteți selecta un index atunci când începeți un nou chat. Apoi puteți pune o întrebare în UX, cunoștințele fiind obținute automat din indexul selectat. Rețineți că, după ce a început o conversație cu un anumit index, nu este posibilă trecerea la alt index.

Permiteți utilizatorilor dvs. de afaceri să extragă informații din documentele companiei folosind Amazon SageMaker Canvas și Generative AI | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Pentru întrebările puse, chat-ul va afișa răspunsul generat de FM împreună cu documentele sursă care au contribuit la generarea răspunsului. Când faceți clic pe oricare dintre documentele sursă, Canvas deschide o previzualizare a documentului, evidențiind fragmentul folosit de FM.

Permiteți utilizatorilor dvs. de afaceri să extragă informații din documentele companiei folosind Amazon SageMaker Canvas și Generative AI | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Concluzie

Inteligența artificială conversațională are un potențial imens de a transforma experiența clienților și angajaților, oferind un asistent asemănător omului cu interacțiuni naturale și intuitive, cum ar fi:

  • Efectuarea de cercetări pe un subiect sau căutarea și răsfoirea bazei de cunoștințe a organizației
  • Rezumarea volumelor de conținut pentru a aduna rapid informații
  • Căutarea de Entități, Sentimente, PII și alte date utile și creșterea valorii comerciale a conținutului nestructurat
  • Generarea de proiecte pentru documente și corespondență de afaceri
  • Crearea de articole de cunoștințe din surse interne disparate (incidente, jurnalele de chat, wiki-uri)

Integrarea inovatoare a interfețelor de chat, regăsirea cunoștințelor și FM permite întreprinderilor să ofere răspunsuri precise și relevante la întrebările utilizatorilor, folosind cunoștințele de domeniu și sursele de adevăr.

Prin conectarea SageMaker Canvas la bazele de cunoștințe din Amazon Kendra, organizațiile își pot păstra datele proprietare în propriul mediu, beneficiind în același timp de capabilitățile de ultimă generație ale FM-urilor în limbaj natural. Odată cu lansarea funcției de interogare a documentelor de la SageMaker Canvas, facilităm pentru orice întreprindere utilizarea LLM-urilor și cunoștințele companiei lor ca sursă de adevăr pentru a alimenta o experiență de chat sigură. Toată această funcționalitate este disponibilă într-un format fără cod, permițând companiilor să evite gestionarea sarcinilor repetitive și nespecializate.

Pentru a afla mai multe despre SageMaker Canvas și despre cum ajută toată lumea să înceapă cu Machine Learning, consultați Anunțul SageMaker Canvas. Aflați mai multe despre modul în care SageMaker Canvas ajută la stimularea colaborării între oamenii de știință de date și analiștii de afaceri, citind Creați, distribuiți și implementați postarea. În cele din urmă, pentru a afla cum să vă creați propriul flux de lucru Retrieval Augmented Generation, consultați SageMaker JumpStart RAG.

Referinte

Lewis, P., Perez, E., Piktus, A., Petroni, F., Karpukhin, V., Goyal, N., Küttler, H., Lewis, M., Yih, W., Rocktäschel, T., Riedel, S., Kiela, D. (2020). Generare îmbunătățită de recuperare pentru sarcini NLP intensive în cunoștințe. Progrese în sistemele de procesare a informațiilor neuronale, 33, 9459-9474.


Despre Autori

Poza cu DavideDavide Gallitelli este arhitect de soluții de specialitate senior pentru AI/ML. Are sediul la Bruxelles și lucrează îndeaproape cu clienții din întreaga lume care doresc să adopte tehnologii de învățare automată Low-Code/No-Code și AI generativă. Este dezvoltator încă de când era foarte mic, începând să codifice la vârsta de 7 ani. A început să învețe AI/ML la universitate și de atunci s-a îndrăgostit de el.

Permiteți utilizatorilor dvs. de afaceri să extragă informații din documentele companiei folosind Amazon SageMaker Canvas și Generative AI | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Bilal Alam este arhitect de soluții pentru întreprinderi la AWS, cu accent pe industria serviciilor financiare. În majoritatea zilelor, Bilal îi ajută pe clienți să-și construiască, să întărească și să își securizeze mediul AWS pentru a-și implementa cele mai critice sarcini de lucru. Are o vastă experiență în telecomunicații, rețele și dezvoltare de software. Mai recent, el a căutat să folosească AI/ML pentru a rezolva problemele de afaceri.

Permiteți utilizatorilor dvs. de afaceri să extragă informații din documentele companiei folosind Amazon SageMaker Canvas și Generative AI | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Pashmeen Mistry este Senior Product Manager la AWS. În afara serviciului, lui Pashmeen îi plac drumețiile aventuroase, fotografierea și petrecerea timpului cu familia sa.

Permiteți utilizatorilor dvs. de afaceri să extragă informații din documentele companiei folosind Amazon SageMaker Canvas și Generative AI | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Dan Sinnreich este Senior Product Manager la AWS, ajutând la democratizarea învățării automate low-code/no-code. Înainte de AWS, Dan a construit și comercializat platforme SaaS de întreprindere și modele de serie cronologică utilizate de investitorii instituționali pentru a gestiona riscul și a construi portofolii optime. În afara serviciului, poate fi găsit jucând hochei, scufundări și citind science fiction.

Timestamp-ul:

Mai mult de la Învățare automată AWS