Potovanje generativnega virtualnega pomočnika AI PGA TOUR, od koncepta do razvoja do prototipa | Spletne storitve Amazon

Potovanje generativnega virtualnega pomočnika AI PGA TOUR, od koncepta do razvoja do prototipa | Spletne storitve Amazon

To je gostujoča objava, ki jo je napisal skupaj s Scottom Guttermanom iz PGA TOUR.

Generativna umetna inteligenca (generative AI) je omogočila nove možnosti za gradnjo inteligentnih sistemov. Nedavne izboljšave velikih jezikovnih modelov (LLM), ki temeljijo na generativni AI, so omogočile njihovo uporabo v različnih aplikacijah, ki obkrožajo iskanje informacij. Glede na vire podatkov so LLM-ji zagotovili orodja, ki bi nam omogočila, da klepetalnico za vprašanja in odgovore zgradimo v tednih, namesto da bi to morda trajalo leta prej, in verjetno s slabšo zmogljivostjo. Oblikovali smo rešitev Retrieval-Augmented-Generation (RAG), ki bi PGA TOUR omogočila, da ustvari prototip za prihodnjo platformo za sodelovanje oboževalcev, ki bi oboževalcem lahko omogočila dostop do svojih podatkov na interaktiven način v pogovorni obliki.

Uporaba strukturiranih podatkov za odgovarjanje na vprašanja zahteva način za učinkovito ekstrahiranje podatkov, ki so pomembni za uporabnikovo poizvedbo. Oblikovali smo pristop besedila v SQL, kjer se uporabnikova poizvedba v naravnem jeziku pretvori v stavek SQL z uporabo LLM. SQL izvaja Amazonska Atena vrniti ustrezne podatke. Ti podatki so ponovno posredovani LLM, ki mora glede na podatke odgovoriti na uporabnikovo poizvedbo.

Uporaba besedilnih podatkov zahteva indeks, ki se lahko uporablja za iskanje in zagotavljanje ustreznega konteksta LLM za odgovor na uporabniško poizvedbo. Za omogočanje hitrega pridobivanja informacij uporabljamo Amazonska Kendra kot kazalo teh dokumentov. Ko uporabniki postavljajo vprašanja, naš virtualni pomočnik hitro išče po indeksu Amazon Kendra, da bi našel ustrezne informacije. Amazon Kendra uporablja obdelavo naravnega jezika (NLP) za razumevanje uporabniških poizvedb in iskanje najpomembnejših dokumentov. Ustrezne informacije se nato posredujejo LLM za ustvarjanje končnega odgovora. Naša končna rešitev je kombinacija teh pristopov besedila v SQL in besedila RAG.

V tej objavi izpostavljamo, kako AWS Generative AI Innovation Center sodeloval z Strokovne storitve AWS in PGA TOUR za razvoj prototipa virtualnega pomočnika z uporabo Amazon Bedrock ki bi lahko oboževalcem omogočili pridobivanje informacij o katerem koli dogodku, igralcu, luknji ali podrobnosti o stopnji udarca na brezhiben interaktiven način. Amazon Bedrock je popolnoma upravljana storitev, ki ponuja izbiro visoko zmogljivih temeljnih modelov (FM) vodilnih podjetij z umetno inteligenco, kot so AI21 Labs, Anthropic, Cohere, Meta, Stability AI in Amazon prek enega samega API-ja, skupaj s širokim naborom zmogljivosti, ki jih potrebujete za izdelavo generativnih aplikacij AI z varnostjo, zasebnostjo in odgovorno AI.

Razvoj: Priprava podatkov

Kot pri vseh projektih, ki temeljijo na podatkih, bo zmogljivost vedno tako dobra, kot so dobri podatki. Podatke smo obdelali, da bi LLM omogočili učinkovito poizvedovanje in pridobivanje ustreznih podatkov.

Pri tabelaričnih podatkih o konkurenci smo se osredotočili na podmnožico podatkov, pomembnih za največje število uporabniških poizvedb, in intuitivno označili stolpce, tako da bi jih LLM lažje razumeli. Ustvarili smo tudi nekaj pomožnih stolpcev, da bi študentu LLM pomagali razumeti koncepte, s katerimi bi sicer imel težave. Na primer, če igralec golfa zadane en udarec manj kot par (na primer v luknjo s 3 udarci na par 4 ali s 4 udarci na par 5), se temu običajno reče ptičica. Če uporabnik vpraša: "Koliko ptičkov je igralec X naredil v zadnjem letu?", samo rezultat in par v tabeli ne zadostujeta. Posledično smo dodali stolpce za označevanje pogostih izrazov golfa, kot so bogey, birdie in eagle. Poleg tega smo podatke o tekmovanju povezali z ločeno video zbirko, tako da smo združili stolpec za a video_id, kar bi naši aplikaciji omogočilo, da izvleče videoposnetek, povezan z določenim posnetkom v podatkih tekmovanja. Omogočili smo tudi povezovanje besedilnih podatkov s tabelarnimi podatki, na primer dodajanje biografij za vsakega igralca kot besedilni stolpec. Naslednje slike prikazujejo postopek po korakih za obdelavo poizvedbe za cevovod besedila v SQL. Številke označujejo niz korakov za odgovor na poizvedbo.

Potovanje generativnega virtualnega pomočnika AI PGA TOUR, od koncepta do razvoja do prototipa | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Na naslednji sliki prikazujemo naš cevovod od konca do konca. Uporabljamo AWS Lambda kot naša orkestracijska funkcija, ki je odgovorna za interakcijo z različnimi viri podatkov, LLM in odpravljanje napak na podlagi uporabniške poizvedbe. Koraki 1-8 so podobni tistemu, kar je prikazano na naslednji sliki. Obstajajo majhne spremembe za nestrukturirane podatke, o katerih bomo razpravljali v nadaljevanju.

Potovanje generativnega virtualnega pomočnika AI PGA TOUR, od koncepta do razvoja do prototipa | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Besedilni podatki zahtevajo edinstvene korake obdelave, ki dolge dokumente razdelijo (ali segmentirajo) na dele, ki jih lahko prebavi LLM, hkrati pa ohranijo koherenco teme. Preizkusili smo več pristopov in se odločili za shemo razčlenjevanja na ravni strani, ki se je dobro ujemala s formatom Media Guides. Uporabili smo Amazon Kendra, ki je upravljana storitev, ki skrbi za indeksiranje dokumentov, ne da bi zahtevala specifikacijo vdelav, hkrati pa zagotavlja enostaven API za iskanje. Naslednja slika ponazarja to arhitekturo.

Potovanje generativnega virtualnega pomočnika AI PGA TOUR, od koncepta do razvoja do prototipa | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Enoten, razširljiv cevovod, ki smo ga razvili, omogoča, da PGA TOUR prilagodi celotno zgodovino podatkov, od katerih nekateri segajo v 1800. stoletje. Omogoča prihodnje aplikacije, ki lahko v živo spremljajo kontekst tečaja, da ustvarijo bogate izkušnje v realnem času.

Razvoj: Vrednotenje LLM in razvoj generativnih aplikacij AI

Skrbno smo preizkusili in ovrednotili LLM prve in tretje osebe, ki so na voljo v Amazon Bedrock, da bi izbrali model, ki je najprimernejši za naš cevovod in primer uporabe. Izbrali smo Anthropic's Claude v2 in Claude Instant na Amazon Bedrock. Za naš končni cevovod strukturiranih in nestrukturiranih podatkov opažamo, da je Anthropicov Claude 2 na Amazon Bedrock ustvaril boljše splošne rezultate za naš končni cevovod podatkov.

Pozivi so ključni vidik pridobivanja LLM-jev za izpis želenega besedila. Precej časa smo porabili za eksperimentiranje z različnimi pozivi za vsako od nalog. Na primer, za cevovod besedila v SQL smo imeli več nadomestnih pozivov z večjo specifičnostjo in postopno poenostavljenimi shemami tabel. Če je bila poizvedba SQL neveljavna in je povzročila napako Athene, smo razvili poziv za odpravo napake, ki bi posredoval napako in napačen SQL LLM-u in ga pozval, naj to popravi. Zadnji poziv v cevovodu za pretvorbo besedila v SQL od LLM zahteva, da sprejme izhod Athena, ki je lahko na voljo v formatu Markdown ali CSV, in uporabniku ponudi odgovor. Za nestrukturirano besedilo smo razvili splošne pozive za uporabo konteksta, pridobljenega iz Amazon Kendra, za odgovor na vprašanje uporabnika. Poziv je vseboval navodila za uporabo samo informacij, pridobljenih iz Amazon Kendra, in ne zanašanje na podatke iz predhodnega usposabljanja LLM.

Zakasnitev je pogosto zaskrbljujoča pri generativnih aplikacijah AI, in tudi tukaj je tako. To je še posebej zaskrbljujoče za besedilo v SQL, ki zahteva začetni priklic LLM generacije SQL, ki mu sledi priklic LLM generacije odgovora. Če uporabljamo velik LLM, kot je Claude V2 podjetja Anthropic, to dejansko podvoji zakasnitev samo enega klica LLM. Eksperimentirali smo z več konfiguracijami velikih in manjših LLM, da bi ocenili čas delovanja in pravilnost. Naslednja tabela prikazuje primer za eno vprašanje, prikazano spodaj, ki prikazuje zakasnitev, pa tudi ustvarjene odgovore z Anthropicovim Claude V2 in Claude Instant na Amazon Bedrock.

Potovanje generativnega virtualnega pomočnika AI PGA TOUR, od koncepta do razvoja do prototipa | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Prototip

V naši aplikaciji smo uporabili funkcijo Lambda za orkestriranje hitrih izbir in komunikacije med Amazon Athena, Amazon Kendra in Amazon Bedrock. Virtualni pomočnik ima pogovorni vmesnik, zgrajen z React in Cloudscape Design System, ki uporablja besedilo in videoposnetke za interakcijo z uporabniki.

Naš virtualni pomočnik lahko odgovori na številna vprašanja o dogodkih PGA TOUR, igralcih, statistiki, zgodovini in še več. Na primer, ko ga vprašajo o najdaljših vožnjah Tonyja Finaua na Shriners Children's Open (eden od Signature dogodkov PGA TOUR), lahko pomočnik poizveduje po strukturiranih podatkih, da pridobi podatke o njegovi ravni strelov. Lahko izlušči natančno razdaljo v jardih, okroglo številko in luknjo, med katero je dosegel ta rekord z uporabo cevovoda text-to-SQL. Pomočnik nato interpretira te numerične podatke, da ustvari končni odgovor. Naslednja tabela vsebuje nekaj primerov odgovorov.

Vprašanje odgovor
Katera je bila najdaljša vožnja Tonyja Finaua na Shriners Children's Open? Najdaljši dosežek Tonyja Finaua na Shriners Childrens Open je bil 382 jardov, ki jih je dosegel v prvi rundi na luknji številka 4 leta 2018.
Katera je bila najdaljša vožnja, ki jo je dosegel Collin Morikawa na Shriners Children's Open? Najdaljša vožnja Collina Morikawe na Shriners Childrens Open je bila 334 jardov. To se je zgodilo leta 2019 med prvim krogom na luknji številka 15.
Je kdo naredil asa na Shriners Children's Open 2022? Da, Adam Hadwin je naredil hole-in-one na luknji 14 med 3. rundo Shriners Children's Open 2022

Naslednji razlagalni video prikazuje nekaj primerov interakcije z virtualnim pomočnikom.

V začetnem testiranju je naš virtualni pomočnik PGA TOUR pokazal veliko obetav pri izboljšanju izkušenj oboževalcev. Z mešanjem tehnologij umetne inteligence, kot so besedilo v SQL, semantično iskanje in generiranje naravnega jezika, pomočnik zagotavlja informativne in privlačne odgovore. Oboževalci so pooblaščeni za preprost dostop do podatkov in pripovedi, ki jih je bilo prej težko najti.

Kaj drži prihodnost?

Z nadaljnjim razvojem bomo razširili obseg vprašanj, ki jih lahko obravnava naš virtualni pomočnik. To bo zahtevalo obsežno testiranje s sodelovanjem med AWS in PGA TOUR. Sčasoma želimo pomočnika razviti v prilagojeno, večkanalno izkušnjo, dostopno prek spletnih, mobilnih in glasovnih vmesnikov.

Vzpostavitev generativnega AI pomočnika v oblaku omogoča PGA TOUR predstaviti svoj obsežen vir podatkov številnim notranjim in zunanjim deležnikom. Ker se športna generativna pokrajina AI razvija, omogoča ustvarjanje novih vsebin. Na primer, lahko uporabite AI in strojno učenje (ML) za prikaz vsebine, ki jo oboževalci želijo videti, ko gledajo dogodek, ali ko produkcijske ekipe iščejo posnetke s prejšnjih turnirjev, ki se ujemajo s trenutnim dogodkom. Na primer, če se Max Homa pripravlja na svoj zadnji strel na prvenstvu PGA TOUR z mesta, ki je oddaljeno 20 metrov od keglja, lahko PGA TOUR uporabi AI in ML za prepoznavanje in predstavitev njegovih posnetkov s komentarji, ki jih ustvari AI. poskušal podoben strel petkrat prej. Ta vrsta dostopa in podatkov omogoča produkcijski ekipi, da takoj doda vrednost oddaji ali omogoči oboževalcem, da prilagodijo vrsto podatkov, ki jih želijo videti.

»PGA TOUR je vodilni v panogi pri uporabi najsodobnejše tehnologije za izboljšanje izkušnje oboževalcev. AI je v ospredju našega tehnološkega sklopa, kjer nam omogoča ustvarjanje bolj privlačnega in interaktivnega okolja za oboževalce. To je začetek našega generativnega potovanja z umetno inteligenco v sodelovanju z AWS Generative AI Innovation Centre za transformacijsko uporabniško izkušnjo od konca do konca. Prizadevamo si izkoristiti Amazon Bedrock in naše podatke o ustreznosti, da ustvarimo interaktivno izkušnjo za oboževalce PGA TOUR, da na interaktiven način poiščejo zanimive informacije o dogodku, igralcu, statistiki ali drugi vsebini.«
– Scott Gutterman, višji podpredsednik za oddajanje in digitalne lastnosti pri PGA TOUR.

zaključek

Projekt, o katerem smo razpravljali v tej objavi, ponazarja, kako je mogoče z umetno inteligenco združiti strukturirane in nestrukturirane vire podatkov za ustvarjanje virtualnih pomočnikov naslednje generacije. Za športne organizacije ta tehnologija omogoča bolj poglobljeno sodelovanje oboževalcev in odklene notranjo učinkovitost. Podatkovna inteligenca, ki jo prikažemo, pomaga zainteresiranim stranem PGA TOUR, kot so igralci, trenerji, uradniki, partnerji in mediji, sprejemati odločitve na podlagi informacij. Poleg športa je našo metodologijo mogoče ponoviti v kateri koli industriji. Ista načela veljajo za gradbene pomočnike, ki vključujejo stranke, zaposlene, študente, bolnike in druge končne uporabnike. S premišljeno zasnovo in testiranjem lahko praktično vsaka organizacija izkoristi sistem AI, ki kontekstualizira njihove strukturirane baze podatkov, dokumente, slike, videoposnetke in drugo vsebino.

Če vas zanima implementacija podobnih funkcij, razmislite o uporabi Zastopniki za Amazon Bedrock in Baze znanja za Amazon Bedrock kot alternativna rešitev, ki jo v celoti upravlja AWS. Ta pristop bi lahko nadalje raziskal zagotavljanje inteligentne avtomatizacije in zmožnosti iskanja podatkov prek prilagodljivih agentov. Ti agenti bi potencialno lahko spremenili interakcije uporabniških aplikacij v bolj naravne, učinkovite in uspešne.


O avtorjih

Potovanje generativnega virtualnega pomočnika AI PGA TOUR, od koncepta do razvoja do prototipa | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Scott Gutterman je višji podpredsednik digitalnih operacij za PGA TOUR. Odgovoren je za celotne digitalne operacije TOUR, razvoj izdelkov in vodi njihovo strategijo GenAI.

Potovanje generativnega virtualnega pomočnika AI PGA TOUR, od koncepta do razvoja do prototipa | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Ahsan Ali je uporabni znanstvenik v Amazon Generative AI Innovation Center, kjer sodeluje s strankami iz različnih področij pri reševanju njihovih nujnih in dragih težav z uporabo Generative AI.

Potovanje generativnega virtualnega pomočnika AI PGA TOUR, od koncepta do razvoja do prototipa | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Tahin Syed je uporabni znanstvenik pri Amazon Generative AI Innovation Center, kjer sodeluje s strankami pri doseganju poslovnih rezultatov z generativnimi rešitvami umetne inteligence. Zunaj dela uživa v preizkušanju nove hrane, potovanjih in poučevanju taekwondoja.

Potovanje generativnega virtualnega pomočnika AI PGA TOUR, od koncepta do razvoja do prototipa | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Grace Lang je pridruženi inženir podatkov in ML pri AWS Professional Services. Grace, ki jo žene strast do premagovanja težkih izzivov, pomaga strankam doseči njihove cilje z razvojem rešitev, ki temeljijo na strojnem učenju.

Potovanje generativnega virtualnega pomočnika AI PGA TOUR, od koncepta do razvoja do prototipa | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Jae Lee je višji vodja sodelovanja v vertikali M&E družbe ProServe. Vodi in izvaja zapletene angažmaje, izkazuje močne nabore veščin za reševanje problemov, upravlja pričakovanja deležnikov in kurira predstavitve na vodilni ravni. Rada dela na projektih, osredotočenih na šport, generativno umetno inteligenco in uporabniško izkušnjo.

Potovanje generativnega virtualnega pomočnika AI PGA TOUR, od koncepta do razvoja do prototipa | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Karn Čahar je varnostni svetovalec pri skupini za skupno dostavo pri AWS. Je tehnološki navdušenec, ki uživa v sodelovanju s strankami pri reševanju njihovih varnostnih izzivov in izboljšanju njihovega varnostnega položaja v oblaku.

Potovanje generativnega virtualnega pomočnika AI PGA TOUR, od koncepta do razvoja do prototipa | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Mike Amjadi je inženir podatkov in ML pri AWS ProServe, ki se osredotoča na omogočanje strankam, da povečajo vrednost podatkov. Specializiran je za načrtovanje, gradnjo in optimizacijo podatkovnih cevovodov po dobro zasnovanih načelih. Mike je navdušen nad uporabo tehnologije za reševanje problemov in je predan zagotavljanju najboljših rezultatov za naše stranke.

Potovanje generativnega virtualnega pomočnika AI PGA TOUR, od koncepta do razvoja do prototipa | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Vrushali Sawant je Front End inženir pri Proserve. Je zelo usposobljena za izdelavo odzivnih spletnih strani. Rada dela s strankami, razume njihove zahteve in jim nudi razširljive rešitve UI/UX, ki jih je preprosto uporabiti.

Potovanje generativnega virtualnega pomočnika AI PGA TOUR, od koncepta do razvoja do prototipa | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Neelam Patel je vodja rešitev za stranke pri AWS, ki vodi ključne pobude za generativno umetno inteligenco in posodobitev v oblaku. Neelam sodeluje s ključnimi vodstvenimi delavci in lastniki tehnologije, da bi rešil njihove izzive preoblikovanja oblaka in strankam pomagal povečati prednosti sprejemanja oblaka. Ima MBA s poslovne šole Warwick v Združenem kraljestvu in diplomo iz računalniškega inženiringa v Indiji.

Potovanje generativnega virtualnega pomočnika AI PGA TOUR, od koncepta do razvoja do prototipa | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Murali Baktha je globalni arhitekt rešitev za golf pri AWS, vodi ključne pobude, ki vključujejo generativno umetno inteligenco, podatkovno analitiko in vrhunske tehnologije v oblaku. Murali sodeluje s ključnimi vodstvenimi delavci in lastniki tehnologije, da bi razumel poslovne izzive strank in oblikoval rešitve za reševanje teh izzivov. Ima MBA iz financ na UConnu in doktorat na Državni univerzi Iowa.

Potovanje generativnega virtualnega pomočnika AI PGA TOUR, od koncepta do razvoja do prototipa | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Mehdi Noor je vodja uporabne znanosti pri Generative Ai Innovation Center. S strastjo do premostitve tehnologije in inovacij pomaga strankam AWS pri sprostitvi potenciala generativne umetne inteligence, spreminjanju potencialnih izzivov v priložnosti za hitro eksperimentiranje in inovacije z osredotočenjem na razširljive, merljive in učinkovite uporabe naprednih tehnologij umetne inteligence ter racionalizacijo poti v proizvodnjo.

Časovni žig:

Več od Strojno učenje AWS