Călătoria asistentului virtual AI generativ al PGA TOUR, de la concept la dezvoltare până la prototip | Amazon Web Services

Călătoria asistentului virtual AI generativ al PGA TOUR, de la concept la dezvoltare până la prototip | Amazon Web Services

Aceasta este o postare pentru invitați scrisă împreună cu Scott Gutterman de la PGA TOUR.

Inteligența artificială generativă (AI generativă) a oferit noi posibilități de construire a sistemelor inteligente. Îmbunătățirile recente ale modelelor de limbaj mari (LLM) bazate pe IA generativă au permis utilizarea acestora într-o varietate de aplicații care înconjoară regăsirea informațiilor. Având în vedere sursele de date, LLM-urile au oferit instrumente care ne-ar permite să construim un chatbot de întrebări și răspunsuri în câteva săptămâni, mai degrabă decât ceea ce ar fi trebuit cu ani în urmă și probabil cu performanțe mai slabe. Am formulat o soluție Retrieval-Augmented-Generation (RAG) care ar permite PGA TOUR să creeze un prototip pentru o viitoare platformă de implicare a fanilor care ar putea face datele sale accesibile fanilor într-un mod interactiv într-un format conversațional.

Utilizarea datelor structurate pentru a răspunde la întrebări necesită o modalitate de a extrage în mod eficient datele relevante pentru interogarea unui utilizator. Am formulat o abordare text-to-SQL în care interogarea în limbaj natural a unui utilizator este convertită într-o instrucțiune SQL folosind un LLM. SQL este condus de Amazon Atena pentru a returna datele relevante. Aceste date sunt din nou furnizate unui LLM, căruia i se cere să răspundă la interogarea utilizatorului având în vedere datele.

Utilizarea datelor text necesită un index care poate fi utilizat pentru a căuta și a oferi context relevant unui LLM pentru a răspunde la o interogare a utilizatorului. Pentru a permite recuperarea rapidă a informațiilor, folosim Amazon Kendra ca index pentru aceste documente. Când utilizatorii pun întrebări, asistentul nostru virtual caută rapid prin indexul Amazon Kendra pentru a găsi informații relevante. Amazon Kendra folosește procesarea limbajului natural (NLP) pentru a înțelege interogările utilizatorilor și pentru a găsi cele mai relevante documente. Informațiile relevante sunt apoi furnizate LLM pentru generarea răspunsului final. Soluția noastră finală este o combinație a acestor abordări text-to-SQL și text-RAG.

În această postare subliniem modul în care Centrul de inovare AWS Generative AI a colaborat cu Servicii profesionale AWS și PGA TOUR pentru a dezvolta un prototip de asistent virtual folosind Amazon Bedrock care le-ar putea permite fanilor să extragă informații despre orice eveniment, jucător, detalii la nivel de gaură sau lovitura într-o manieră interactivă fără întreruperi. Amazon Bedrock este un serviciu complet gestionat care oferă o gamă de modele de fundație de înaltă performanță (FM) de la companii de IA lider, cum ar fi AI21 Labs, Anthropic, Cohere, Meta, Stability AI și Amazon printr-un singur API, împreună cu un set larg de capabilități de care aveți nevoie pentru a construi aplicații AI generative cu securitate, confidențialitate și AI responsabilă.

Dezvoltare: Pregătirea datelor

Ca și în cazul oricărui proiect bazat pe date, performanța va fi întotdeauna la fel de bună ca datele. Am procesat datele pentru a permite LLM să poată interoga și regăsi în mod eficient datele relevante.

Pentru datele de concurență tabelare, ne-am concentrat pe un subset de date relevante pentru cel mai mare număr de interogări ale utilizatorilor și am etichetat coloanele în mod intuitiv, astfel încât să fie mai ușor de înțeles pentru LLM. De asemenea, am creat câteva coloane auxiliare pentru a ajuta LLM să înțeleagă conceptele cu care altfel s-ar putea lupta. De exemplu, dacă un jucător de golf împușcă cu o lovitură mai puțin decât par (cum ar fi ajunge în gaură în 3 lovituri la par 4 sau în 4 lovituri pe un par 5), se numește în mod obișnuit un păsărică. Dacă un utilizator întreabă „Câte păsări a făcut jucătorul X anul trecut?”, doar a avea scorul și egalitatea în tabel nu este suficient. Drept urmare, am adăugat coloane pentru a indica termenii obișnuiți de golf, cum ar fi bogey, birdie și vultur. În plus, am legat datele Competiției cu o colecție video separată, prin alăturarea unei coloane pentru a video_id, ceea ce ar permite aplicației noastre să extragă videoclipul asociat cu o anumită fotografie din datele Competiției. De asemenea, am activat alăturarea datelor text cu datele tabulare, de exemplu, adăugând biografii pentru fiecare jucător ca coloană de text. Următoarele figuri arată procedura pas cu pas a modului în care este procesată o interogare pentru conducta text-to-SQL. Numerele indică seria de pași pentru a răspunde la o întrebare.

Călătoria asistentului virtual AI generativ al PGA TOUR, de la concept la dezvoltare până la prototip | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

În figura următoare, demonstrăm conducta noastră de la capăt la capăt. Folosim AWS Lambdas ca funcția noastră de orchestrare responsabilă de interacțiunea cu diverse surse de date, LLM-uri și corectarea erorilor pe baza interogării utilizatorului. Pașii 1-8 sunt similari cu ceea ce este prezentat în figura de continuare. Există mici modificări pentru datele nestructurate, despre care vom discuta în continuare.

Călătoria asistentului virtual AI generativ al PGA TOUR, de la concept la dezvoltare până la prototip | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Datele text necesită pași unici de procesare care fragmentează (sau segmentează) documentele lungi în părți care pot fi digerate de LLM, menținând în același timp coerența subiectului. Am experimentat cu mai multe abordări și am stabilit o schemă de fragmentare la nivel de pagină care se alinia bine cu formatul Ghidurilor media. Am folosit Amazon Kendra, care este un serviciu gestionat care se ocupă de indexarea documentelor, fără a necesita specificarea înglobărilor, oferind în același timp un API ușor pentru recuperare. Figura următoare ilustrează această arhitectură.

Călătoria asistentului virtual AI generativ al PGA TOUR, de la concept la dezvoltare până la prototip | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Conducta unificată și scalabilă pe care am dezvoltat-o ​​permite PGA TOUR să se extindă la istoria lor completă de date, dintre care unele datează din anii 1800. Permite aplicațiilor viitoare care pot prelua în direct contextul cursului pentru a crea experiențe bogate în timp real.

Dezvoltare: Evaluarea LLM-urilor și dezvoltarea de aplicații AI generative

Am testat și evaluat cu atenție LLM-urile primare și terțe disponibile în Amazon Bedrock pentru a alege modelul care este cel mai potrivit pentru pipeline și pentru cazul nostru de utilizare. Am selectat Claude v2 de la Anthropic și Claude Instant pe Amazon Bedrock. Pentru canalul nostru final de date structurate și nestructurate, observăm că Claude 2 de la Anthropic pe Amazon Bedrock a generat rezultate generale mai bune pentru conducta noastră finală de date.

Solicitarea este un aspect esențial al obținerii LLM-urilor să scoată text după cum doriți. Am petrecut timp considerabil experimentând cu diferite solicitări pentru fiecare dintre sarcini. De exemplu, pentru pipeline-ul text-to-SQL am avut mai multe solicitări de rezervă, cu specificitate crescândă și scheme de tabel simplificate treptat. Dacă o interogare SQL a fost nevalidă și a dus la o eroare de la Athena, am dezvoltat un prompt de corectare a erorilor care ar transmite eroarea și SQL incorect la LLM și i-ar cere să o repare. Promptul final din conducta text-to-SQL solicită LLM să preia rezultatul Athena, care poate fi furnizat în format Markdown sau CSV, și să ofere un răspuns utilizatorului. Pentru textul nestructurat, am dezvoltat instrucțiuni generale pentru a utiliza contextul preluat de pe Amazon Kendra pentru a răspunde la întrebarea utilizatorului. Solicitarea a inclus instrucțiuni pentru a utiliza numai informațiile preluate de la Amazon Kendra și pentru a nu se baza pe datele din pre-formarea LLM.

Latența este adesea o preocupare în cazul aplicațiilor AI generative și este, de asemenea, cazul aici. Este o preocupare în special pentru text-to-SQL, care necesită o invocare LLM inițială de generație SQL, urmată de o invocare LLM cu generarea de răspuns. Dacă folosim un LLM mare, cum ar fi Claude V2 de la Anthropic, acest lucru dublează efectiv latența unei singure invocari LLM. Am experimentat cu mai multe configurații de LLM-uri mari și mai mici pentru a evalua timpul de rulare, precum și corectitudinea. Următorul tabel prezintă un exemplu pentru o întrebare prezentată mai jos, care demonstrează latența, precum și răspunsurile generate cu Claude V2 de la Anthropic și Claude Instant pe Amazon Bedrock.

Călătoria asistentului virtual AI generativ al PGA TOUR, de la concept la dezvoltare până la prototip | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Prototip

În aplicația noastră, am folosit o funcție Lambda pentru a orchestra alegerile prompte și comunicarea dintre Amazon Athena, Amazon Kendra și Amazon Bedrock. Asistentul virtual are o interfață conversațională, construită cu React și Cloudscape Design System, care utilizează text și videoclipuri pentru a interacționa cu utilizatorii.

Asistentul nostru virtual poate adresa o gamă largă de întrebări despre evenimentele PGA TOUR, jucători, statistici, istorie și multe altele. De exemplu, când a fost întrebat despre cele mai lungi călătorii ale lui Tony Finau la Shriners Children's Open (unul dintre evenimentele de semnătură ale TURULUI PGA), asistentul poate interoga datele structurate pentru a-și extrage datele la nivel de șansă. Poate extrage distanța exactă în yarzi, numărul rotunjii și gaura în timpul căreia a realizat acest record folosind conducta text-to-SQL. Apoi, asistentul interpretează aceste date numerice pentru a genera un răspuns final. Următorul tabel conține câteva exemple de răspunsuri.

Întrebare Răspuns
Care a fost cel mai lung drum lovit de Tony Finau la Shriners Children's Open? Cel mai lung drum lovit de Tony Finau în Shriners Childrens Open a fost de 382 de metri, pe care l-a lovit în prima rundă la gaura numărul 4 în 2018.
Care a fost cel mai lung drum lovit de Collin Morikawa la Shriners Children's Open? Cel mai lung drum al lui Collin Morikawa la Shriners Childrens Open a fost de 334 de metri. Acest lucru s-a întâmplat în 2019, în timpul primei runde la gaura numărul 15.
A făcut cineva un as la Shriners Children’s Open 2022? Da, Adam Hadwin a făcut o gaură în unu la gaura 14 în timpul rundei 3 a Shriners Children's Open 2022

Următorul videoclip explicativ evidențiază câteva exemple de interacțiune cu asistentul virtual.

La testarea inițială, asistentul nostru virtual PGA TOUR a arătat o mare promisiune în îmbunătățirea experiențelor fanilor. Îmbinând tehnologii AI precum text-to-SQL, căutare semantică și generare de limbaj natural, asistentul oferă răspunsuri informative și captivante. Fanii sunt împuterniciți să acceseze fără efort date și narațiuni care anterior erau greu de găsit.

Ce rezerva viitorul?

Pe măsură ce continuăm dezvoltarea, vom extinde gama de întrebări pe care le poate rezolva asistentul nostru virtual. Acest lucru va necesita testare extinsă, prin colaborarea dintre AWS și PGA TOUR. De-a lungul timpului, ne propunem să evoluăm asistentul într-o experiență personalizată, omnicanal, accesibilă prin interfețe web, mobile și vocale.

Înființarea unui asistent AI generativ bazat pe cloud permite PGA TOUR să prezinte sursa sa vastă de date multiplelor părți interesate interne și externe. Pe măsură ce peisajul AI generativ pentru sport evoluează, acesta permite crearea de conținut nou. De exemplu, puteți folosi inteligența artificială și învățarea automată (ML) pentru a afișa conținutul pe care fanii doresc să vadă în timp ce urmăresc un eveniment sau când echipele de producție caută fotografii din turneele anterioare care se potrivesc cu un eveniment curent. De exemplu, dacă Max Homa se pregătește să efectueze ultima lovitură la Campionatul PGA TOUR dintr-un loc la 20 de picioare de știft, PGA TOUR poate folosi AI și ML pentru a identifica și prezenta clipuri, cu comentarii generate de AI, ale lui. a încercat o lovitură similară de cinci ori înainte. Acest tip de acces și date permit unei echipe de producție să adauge imediat valoare transmisiunii sau să permită unui fan să personalizeze tipul de date pe care dorește să le vadă.

„PGA TOUR este liderul industriei în utilizarea tehnologiei de ultimă oră pentru a îmbunătăți experiența fanilor. AI se află în fruntea stivei noastre de tehnologie, unde ne permite să creăm un mediu mai captivant și mai interactiv pentru fani. Acesta este începutul călătoriei noastre generative AI în colaborare cu Centrul de inovare AWS Generative AI pentru o experiență de transformare a clienților de la capăt la capăt. Lucrăm pentru a folosi Amazon Bedrock și datele noastre de proprietate pentru a crea o experiență interactivă pentru fanii PGA TOUR, pentru a găsi informații de interes despre un eveniment, jucător, statistici sau alt conținut într-un mod interactiv.”
– Scott Gutterman, SVP al Broadcast and Digital Properties la PGA TOUR.

Concluzie

Proiectul despre care am discutat în această postare exemplifica modul în care sursele de date structurate și nestructurate pot fi fuzionate folosind AI pentru a crea asistenți virtuali de generație următoare. Pentru organizațiile sportive, această tehnologie permite o implicare mai captivantă a fanilor și deblochează eficiențe interne. Inteligența datelor pe care o expunem îi ajută pe părțile interesate PGA TOUR, cum ar fi jucătorii, antrenorii, oficialii, partenerii și mass-media să ia decizii informate mai rapid. Dincolo de sport, metodologia noastră poate fi replicată în orice industrie. Aceleași principii se aplică și asistenților de construcție care implică clienții, angajații, studenții, pacienții și alți utilizatori finali. Cu o proiectare și testare atentă, aproape orice organizație poate beneficia de un sistem AI care își contextualizează bazele de date structurate, documentele, imaginile, videoclipurile și alt conținut.

Dacă sunteți interesat să implementați funcționalități similare, luați în considerare utilizarea Agenți pentru Amazon Bedrock și Baze de cunoștințe pentru Amazon Bedrock ca o soluție alternativă, complet gestionată de AWS. Această abordare ar putea investiga în continuare furnizarea de automatizări inteligente și abilități de căutare a datelor prin agenți personalizabili. Acești agenți ar putea transforma interacțiunile aplicațiilor utilizatorului pentru a fi mai naturale, mai eficiente și mai eficiente.


Despre autori

Călătoria asistentului virtual AI generativ al PGA TOUR, de la concept la dezvoltare până la prototip | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Scott Gutterman este SVP al operațiunilor digitale pentru PGA TOUR. El este responsabil pentru operațiunile digitale generale ale TOUR, dezvoltarea produselor și conduce strategia lor GenAI.

Călătoria asistentului virtual AI generativ al PGA TOUR, de la concept la dezvoltare până la prototip | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Ahsan Ali este un om de știință aplicat la Centrul de inovare Amazon Generative AI, unde lucrează cu clienți din diferite domenii pentru a le rezolva problemele urgente și costisitoare folosind Generative AI.

Călătoria asistentului virtual AI generativ al PGA TOUR, de la concept la dezvoltare până la prototip | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Tahin Syed este un om de știință aplicat la Centrul de inovare Amazon Generative AI, unde lucrează cu clienții pentru a ajuta la realizarea rezultatelor afacerii cu soluții generative de IA. În afara serviciului, îi place să încerce mâncare nouă, să călătorească și să predea taekwondo.

Călătoria asistentului virtual AI generativ al PGA TOUR, de la concept la dezvoltare până la prototip | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Grace Lang este inginer asociat de date și ML cu AWS Professional Services. Condus de pasiunea de a depăși provocările dificile, Grace îi ajută pe clienți să-și atingă obiectivele prin dezvoltarea de soluții bazate pe învățarea automată.

Călătoria asistentului virtual AI generativ al PGA TOUR, de la concept la dezvoltare până la prototip | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Jae Lee este Senior Engagement Manager în sectorul M&E al ProServe. Ea conduce și oferă angajamente complexe, prezintă seturi puternice de abilități de rezolvare a problemelor, gestionează așteptările părților interesate și organizează prezentări la nivel executiv. Îi place să lucreze la proiecte axate pe sport, IA generativă și experiența clienților.

Călătoria asistentului virtual AI generativ al PGA TOUR, de la concept la dezvoltare până la prototip | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Karn Chahar este consultant de securitate cu echipa de livrare partajată la AWS. Este un pasionat de tehnologie căruia îi place să lucreze cu clienții pentru a-și rezolva provocările de securitate și pentru a-și îmbunătăți postura de securitate în cloud.

Călătoria asistentului virtual AI generativ al PGA TOUR, de la concept la dezvoltare până la prototip | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Mike Amjadi este un inginer de date și ML cu AWS ProServe, axat pe a permite clienților să maximizeze valoarea din date. El este specializat în proiectarea, construirea și optimizarea conductelor de date urmând principii bine concepute. Mike este pasionat de utilizarea tehnologiei pentru a rezolva probleme și se angajează să ofere cele mai bune rezultate pentru clienții noștri.

Călătoria asistentului virtual AI generativ al PGA TOUR, de la concept la dezvoltare până la prototip | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Vrushali Sawant este inginer front-end cu Proserve. Este foarte calificată în crearea de site-uri web receptive. Îi place să lucreze cu clienții, să le înțeleagă cerințele și să le ofere soluții UI/UX scalabile, ușor de adoptat.

Călătoria asistentului virtual AI generativ al PGA TOUR, de la concept la dezvoltare până la prototip | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Neelam Patel este manager de soluții pentru clienți la AWS, conducând inițiative cheie de IA generativă și modernizare cloud. Neelam lucrează cu directori cheie și proprietari de tehnologie pentru a aborda provocările lor de transformare a cloud-ului și îi ajută pe clienți să maximizeze beneficiile adoptării cloud-ului. Ea are un MBA de la Warwick Business School, Marea Britanie și o licență în Inginerie Calculatoare, India.

Călătoria asistentului virtual AI generativ al PGA TOUR, de la concept la dezvoltare până la prototip | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Dr. Murali Baktha este arhitect global de soluții de golf la AWS, conduce inițiative esențiale care implică AI generativă, analiză de date și tehnologii cloud de ultimă oră. Murali lucrează cu directori cheie și proprietari de tehnologie pentru a înțelege provocările de afaceri ale clienților și proiectează soluții pentru a aborda aceste provocări. Are un MBA în finanțe de la UConn și un doctorat la Iowa State University.

Călătoria asistentului virtual AI generativ al PGA TOUR, de la concept la dezvoltare până la prototip | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Mehdi Noor este manager de știință aplicată la Generative Ai Innovation Center. Cu o pasiune pentru legătura dintre tehnologie și inovație, el îi ajută pe clienții AWS să deblocheze potențialul AI generativ, transformând provocările potențiale în oportunități de experimentare și inovare rapidă, concentrându-se pe utilizări scalabile, măsurabile și cu impact ale tehnologiilor AI avansate și simplificând calea. la producţie.

Timestamp-ul:

Mai mult de la Învățare automată AWS