Lihtsustage juurdepääsu siseteabele, kasutades rakendusi Retrieval Augmented Generation ja LangChain Agents | Amazoni veebiteenused

Lihtsustage juurdepääsu siseteabele, kasutades rakendusi Retrieval Augmented Generation ja LangChain Agents | Amazoni veebiteenused

See postitus tutvustab teid kõige levinumate väljakutsetega, millega kliendid sisedokumentide otsimisel kokku puutuvad, ja annab konkreetseid juhiseid selle kohta, kuidas AWS-i teenuseid kasutada generatiivse tehisintellekti vestlusroti loomiseks, mis muudab siseteabe kasulikumaks.

Struktureerimata andmed moodustavad 80% kõigist andmetest leidub organisatsioonides, mis koosnevad käsiraamatute, PDF-ide, KKK-de, meilide ja muude dokumentide hoidlatest, mis kasvavad iga päev. Ettevõtted toetuvad tänapäeval pidevalt kasvavatele siseteabe hoidlatele ja probleemid tekivad siis, kui struktureerimata andmete hulk muutub hallamatuks. Sageli leiavad kasutajad, et lugevad ja kontrollivad palju erinevaid sisemisi allikaid, et leida neile vajalikke vastuseid.

Sisemised küsimuste ja vastuste foorumid võivad aidata kasutajatel saada väga konkreetseid vastuseid, kuid nõuavad ka pikemat ooteaega. Ettevõttespetsiifiliste sisemiste KKK-de puhul põhjustavad pikad ooteajad töötajate madalamat tootlikkust. Küsimuste ja vastuste foorumeid on raske skaleerida, kuna need tuginevad käsitsi kirjutatud vastustele. Generatiivse AI puhul toimub praegu paradigma muutus selles, kuidas kasutajad teavet otsivad ja leiavad. Järgmine loogiline samm on kasutada generatiivset AI-d, et koondada suured dokumendid väiksemaks teabeks, et kasutajal oleks neid lihtsam tarbida. Selle asemel, et kulutada pikka aega teksti lugemisele või vastuseid oodata, saavad kasutajad koostada reaalajas kokkuvõtteid mitme olemasoleva siseteabe hoidla põhjal.

Lahenduse ülevaade

Lahendus võimaldab klientidel hankida kureeritud vastuseid sisedokumentide kohta esitatud küsimustele, kasutades trafomudelit, et genereerida vastuseid küsimustele, mis puudutavad andmeid, mille kohta neid pole koolitatud. Seda tehnikat nimetatakse nullkaadri viipadeks. Selle lahenduse kasutuselevõtuga saavad kliendid saada järgmised eelised:

  • Otsige täpseid vastuseid küsimustele olemasolevate sisedokumentide allikate põhjal
  • Vähendage aega, mille kasutajad kulutavad vastuste otsimisele, kasutades suuri keelemudeleid (LLM), et pakkuda keerulistele päringutele peaaegu koheseid vastuseid, kasutades uusima teabega dokumente
  • Otsige eelnevalt vastatud küsimusi tsentraliseeritud armatuurlaua kaudu
  • Vähendage stressi, mis on põhjustatud vastuste otsimiseks teabe käsitsi lugemisest

Retrieval Augmented Generation (RAG)

Retrieval Augmented Generation (RAG) vähendab mõningaid LLM-põhiste päringute puudusi, leides vastused teie teadmistebaasist ja kasutades LLM-i dokumentide kokkuvõtmiseks lühikesteks vastusteks. Palun lugege seda pärast õppida, kuidas rakendada RAG-i lähenemisviisi Amazon Kendra. Järgmised riskid ja piirangud on seotud LLM-põhiste päringutega, mida Amazon Kendra RAG-lähenemine käsitleb:

  • Hallutsinatsioonid ja jälgitavus – LLMS-i koolitatakse suurte andmekogumitega ja genereerivad vastuseid tõenäosuste kohta. See võib põhjustada ebatäpseid vastuseid, mida nimetatakse hallutsinatsioonideks.
  • Mitu andmehoidlat – vastuses mitmest allikast pärit andmetele viitamiseks tuleb andmete koondamiseks seadistada konnektori ökosüsteem. Juurdepääs mitmele hoidlale on käsitsi ja aeganõudev.
  • Turvalisus – turvalisus ja privaatsus on RAG-i ja LLM-ide toel vestlusrobotite juurutamisel kriitilised kaalutlused. Vaatamata kasutamisele Amazoni mõistmine kasutajapäringute kaudu edastatavate isikuandmete välja filtreerimiseks jääb olenevalt sissevõetud andmetest võimalus tahtmatult pinnale tuua isiklikku või tundlikku teavet. See tähendab, et vestlusbotile juurdepääsu kontrollimine on tundlikule teabele tahtmatu juurdepääsu vältimiseks ülioluline.
  • Andmete asjakohasus – LLMS-i koolitatakse andmetega kuni teatud kuupäevani, mis tähendab, et teave ei ole sageli ajakohane. Viimaste andmete koolitusmudelitega seotud kulud on suured. Täpsete ja ajakohaste vastuste tagamiseks vastutavad organisatsioonid indekseeritud dokumentide sisu korrapärase ajakohastamise ja rikastamise eest.
  • Kulud – selle lahenduse kasutuselevõtuga seotud kulud peaksid ettevõtete jaoks arvestama. Ettevõtted peavad selle lahenduse rakendamisel hoolikalt hindama oma eelarve- ja jõudlusnõudeid. LLM-ide käitamine võib nõuda suuri arvutusressursse, mis võib suurendada tegevuskulusid. Need kulud võivad piirata rakendusi, mis peavad töötama suures mahus. Siiski on üks eeliseid AWS Cloud on paindlikkus maksta ainult selle eest, mida kasutate. AWS pakub lihtsat, järjepidevat ja jooksva tasumisega hinnamudelit, nii et teilt võetakse tasu ainult tarbitud ressursside eest.

Amazon SageMaker JumpStarti kasutamine

Trafopõhiste keelemudelite puhul võivad organisatsioonid kasu saada Amazon SageMaker JumpStart, mis pakub eelehitatud masinõppe mudelite kogumit. Amazon SageMaker JumpStart pakub laias valikus teksti loomise ja küsimustele vastamise (Q&A) alusmudeleid, mida saab hõlpsasti juurutada ja kasutada. See lahendus integreerib FLAN T5-XL Amazon SageMaker JumpStart mudeli, kuid on erinevaid aspekte, mida meeles pidada vundamendi mudeli valimine.

Turvalisuse integreerimine meie töövoogu

aasta turvasamba parimaid tavasid järgides Hästi läbimõeldud raamistik, Amazon Cognito kasutatakse autentimiseks. Amazon Cognito kasutajakogumeid saab integreerida kolmandate osapoolte identiteedipakkujatega, mis toetavad mitut juurdepääsu kontrollimiseks kasutatavat raamistikku, sealhulgas avatud autoriseerimine (OAuth), OpenID Connect (OIDC) või Security Assertion Markup Language (SAML). Kasutajate ja nende tegevuste tuvastamine võimaldab lahendusel säilitada jälgitavuse. Lahenduses kasutatakse ka Amazon Comprehend isikut tuvastava teabe (PII) tuvastamine funktsioon isikuandmete automaatseks tuvastamiseks ja redigeerimiseks. Redigeeritud PII sisaldab aadresse, sotsiaalkindlustuse numbreid, e-posti aadresse ja muud tundlikku teavet. See kujundus tagab, et kõik kasutaja poolt sisestuspäringu kaudu esitatud isikut tuvastavad andmed redigeeritakse. PII-d ei salvestata, Amazon Kendra ei kasuta ega edasta LLM-ile.

Lahendus Juurdepääs

Järgmised sammud kirjeldavad küsimusele vastamise töövoogu üle dokumendivoo.

  1. Kasutajad saadavad päringu veebiliidese kaudu.
  2. Amazon Cognito kasutatakse autentimiseks, tagades turvalise juurdepääsu veebirakendusele.
  3. Veebirakenduse kasutajaliides on hostitud AWS võimendus.
  4. Amazon API värav hostib erinevate lõpp-punktidega REST API-d, et käsitleda Amazon Cognito abil autentitud kasutajataotlusi.
  5. PII redigeerimine koos Amazoni mõistmine:
    • Kasutajapäringu töötlemine: kui kasutaja esitab päringu või sisendi, edastatakse see esmalt Amazon Comprehendi kaudu. Teenus analüüsib teksti ja tuvastab kõik päringus olevad PII-üksused.
    • PII ekstraheerimine: Amazon Comprehend ekstraheerib kasutaja päringust tuvastatud isikuandmete tuvastamise üksused.
  6. Asjakohase teabe otsimine Amazon Kendra:
    • Amazon Kendrat kasutatakse dokumentide indeksi haldamiseks, mis sisaldab teavet, mida kasutatakse kasutaja päringutele vastuste genereerimiseks.
    • . LangChain QA otsimine moodulit kasutatakse vestlusahela loomiseks, mis sisaldab asjakohast teavet kasutaja päringute kohta.
  7. Integratsioon koos Amazon SageMaker JumpStart:
    • Funktsioon AWS Lambda kasutab LangChaini teeki ja loob ühenduse Amazon SageMaker JumpStart lõpp-punktiga kontekstipõhise päringuga. Amazon SageMaker JumpStart lõpp-punkt toimib järelduste tegemiseks kasutatava LLM-i liidesena.
  8. Vastuste salvestamine ja kasutajale tagastamine:
    • LLM-i vastus salvestatakse Amazon DynamoDB koos kasutaja päringu, ajatempli, kordumatu identifikaatori ja muude suvaliste üksuse identifikaatoritega, näiteks küsimuse kategooria. Küsimuse ja vastuse salvestamine diskreetsete üksustena võimaldab AWS Lambda funktsioonil hõlpsasti uuesti luua kasutaja vestluste ajalugu, lähtudes küsimuste esitamise ajast.
    • Lõpuks saadetakse vastus kasutajale tagasi HTTP-päringu kaudu Amazon API Gateway REST API integratsioonivastuse kaudu.

Lihtsustage juurdepääsu siseteabele, kasutades Retrieval Augmented Generation ja LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Järgmised sammud kirjeldavad AWS Lambda funktsioone ja nende kulgu protsessis:

  1. Kontrollige ja redigeerige kogu isikut tõendavat infot/tundlikku teavet
  2. LangChain QA otsinguahel
    • Otsige ja hankige asjakohast teavet
  3. Konteksti täitmine ja kiire projekteerimine
  4. Järeldus LLM-iga
  5. Tagastage vastus ja salvestage see

Lihtsustage juurdepääsu siseteabele, kasutades Retrieval Augmented Generation ja LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Kasuta juhtudel

On palju ärikasutusjuhtumeid, kus kliendid saavad seda töövoogu kasutada. Järgmises jaotises selgitatakse, kuidas töövoogu saab kasutada erinevates tööstusharudes ja vertikaalides.

Töötaja abi

Hästi läbimõeldud ettevõttekoolitus võib parandada töötajate rahulolu ja vähendada uute töötajate töölevõtmiseks kuluvat aega. Organisatsioonide kasvades ja keerukuse kasvades on töötajatel raske mõista paljusid sisedokumentide allikaid. Selles kontekstis hõlmavad sisedokumendid ettevõtte juhiseid, eeskirju ja standardseid tööprotseduure. Selle stsenaariumi puhul on töötajal küsimus, kuidas edasi toimida ja muuta siseprobleemi piletipiletit. Töötajal on juurdepääs generatiivse tehisintellekti (AI) vestlusbotile ja seda kasutada, et küsida ja teha konkreetse pileti jaoks järgmisi samme.

Konkreetne kasutusjuht: Automatiseerige töötajate probleemide lahendamine ettevõtte juhiste alusel.

Lihtsustage juurdepääsu siseteabele, kasutades Retrieval Augmented Generation ja LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Järgmised sammud kirjeldavad AWS Lambda funktsioone ja nende kulgu protsessis:

  1. LangChaini agent kavatsuse tuvastamiseks
  2. Saada teade vastavalt töötaja soovile
  3. Muuda pileti olekut

Lihtsustage juurdepääsu siseteabele, kasutades Retrieval Augmented Generation ja LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Selles arhitektuuridiagrammis saab ettevõtte koolitusvideoid alla neelata Amazoni transkribeerimine nende videoskriptide logi kogumiseks. Lisaks saab erinevatesse allikatesse (nt Confluence, Microsoft SharePoint, Google Drive, Jira jne) salvestatud ettevõtte koolitussisu kasutada indeksite loomiseks Amazon Kendra konnektorite kaudu. Lugege seda artiklit, et saada lisateavet omakeelsete kogumite kohta ühendused saate kasutada Amazon Kendras lähtepunktina. Amazon Kendra roomaja saab seejärel kasutada nii ettevõtte koolitusvideo skripte kui ka nendesse muudesse allikatesse salvestatud dokumentatsiooni, et aidata vestlusrobotil vastata ettevõtte ettevõtte koolitusjuhistele spetsiifilistele küsimustele. LangChaini agent kontrollib õigusi, muudab pileti olekut ja teavitab õigeid isikuid Amazon Simple Notification Service'i (Amazon SNS).

Klienditoe meeskonnad

Kliendipäringute kiire lahendamine parandab kliendikogemust ja soodustab brändilojaalsust. Lojaalne kliendibaas aitab suurendada müüki, mis aitab kaasa lõpptulemusele ja suurendab klientide seotust. Klienditoe meeskonnad kulutavad palju energiat paljudele sisedokumentidele ja kliendisuhete haldamise tarkvarale viitamisele, et vastata klientide päringutele toodete ja teenuste kohta. Selles kontekstis võivad sisedokumendid hõlmata üldiseid klienditoe kõneskripte, käsiraamatuid, eskalatsioonijuhiseid ja äriteavet. Generatiivne AI vestlusbot aitab kulusid optimeerida, kuna see tegeleb päringutega klienditoe meeskonna nimel.

Konkreetne kasutusjuht: Õlivahetustaotluse käsitlemine ostetud hooldusajaloo ja klienditeenindusplaani alusel.

Lihtsustage juurdepääsu siseteabele, kasutades Retrieval Augmented Generation ja LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Selles arhitektuuridiagrammis suunatakse klient kas generatiivsesse AI vestlusbotti või Amazon Connect kontaktkeskus. See otsus võib põhineda vajalikul toe tasemel või klienditoe agentide olemasolul. LangChaini agent tuvastab kliendi kavatsuse ja kontrollib isikut. LangChaini agent kontrollib ka hooldusajalugu ja ostetud tugiplaani.

Järgmised sammud kirjeldavad AWS Lambda funktsioone ja nende kulgu protsessis:

  1. LangChaini agent tuvastab kavatsuse
  2. Hankige klienditeavet
  3. Kontrollige klienditeeninduse ajalugu ja garantiiteavet
  4. Broneerige kohtumine, edastage lisateavet või marsruut kontaktkeskusesse
  5. Saada kinnitus meilile

Lihtsustage juurdepääsu siseteabele, kasutades Retrieval Augmented Generation ja LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Amazon Connecti kasutatakse hääl- ja vestluslogide kogumiseks ning Amazon Comprehendi kasutatakse nendest logidest isikut tuvastava teabe (PII) eemaldamiseks. Amazon Kendra roomaja saab seejärel kasutada indeksi loomiseks redigeeritud hääl- ja vestluslogisid, kliendikõne skripte ja klienditeeninduse tugiplaani eeskirju. Kui otsus on tehtud, otsustab generatiivne AI vestlusbot, kas broneerida kohtumine, anda lisateavet või suunata klient edasise abi saamiseks kontaktkeskusesse. Kulude optimeerimiseks saab LangChaini agent vastuseid genereerida ka vähemate märkide ja odavama suure keelemudeli abil madalama prioriteediga kliendipäringute jaoks.

Finantsteenused

Finantsteenuste ettevõtted loodavad teabe õigeaegsele kasutamisele konkurentsis püsimiseks ja finantseeskirjade järgimiseks. Kasutades generatiivset tehisintellekti vestlusbotti, saavad finantsanalüütikud ja nõustajad suhelda tekstilise teabega vestlusel ning vähendada teadlikumate otsuste tegemiseks kuluvat aega ja vaeva. Väljaspool investeeringuid ja turu-uuringuid võib generatiivne AI-vestlusbot suurendada ka inimeste võimeid, täites ülesandeid, mis tavaliselt nõuavad rohkem inimlikku pingutust ja aega. Näiteks võib eralaenudele spetsialiseerunud finantsasutus suurendada laenude töötlemise kiirust, pakkudes samal ajal klientidele paremat läbipaistvust.

Konkreetne kasutusjuht: Kasutage laenuotsuse otsustamiseks ja selgitamiseks kliendi finantsajalugu ja varasemaid laenutaotlusi.

Lihtsustage juurdepääsu siseteabele, kasutades Retrieval Augmented Generation ja LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Järgmised sammud kirjeldavad AWS Lambda funktsioone ja nende kulgu protsessis:

  1. LangChaini agent kavatsuse tuvastamiseks
  2. Kontrollige kliendi finants- ja krediidiskoori ajalugu
  3. Kontrollige sisemist kliendisuhete haldussüsteemi
  4. Tutvuge tavaliste laenupoliitikatega ja tehke töötajale ettepaneku otsus laenu saamiseks
  5. Saada kliendile teade

Lihtsustage juurdepääsu siseteabele, kasutades Retrieval Augmented Generation ja LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

See arhitektuur sisaldab andmebaasi salvestatud klientide finantsandmeid ja kliendisuhete halduse (CRM) tööriista salvestatud andmeid. Neid andmepunkte kasutatakse ettevõtte sisestel laenupoliitikatel põhineva otsuse tegemiseks. Klient saab esitada täpsustavaid küsimusi, et mõista, millistele laenudele ta kvalifitseerub ja milliste laenutingimustega ta saab vastu võtta. Kui generatiivne AI vestlusbot ei saa laenutaotlust heaks kiita, saab kasutaja siiski esitada küsimusi krediidiskooride parandamise või alternatiivsete rahastamisvõimaluste kohta.

Valitsus

Generatiivsed AI vestlusrobotid võivad valitsusasutustele palju kasu saada, kiirendades suhtlust, tõhusust ja otsustusprotsesse. Generatiivsed AI-vestlusrobotid võivad pakkuda ka kohest juurdepääsu sisemistele teadmistebaasidele, et aidata valitsuse töötajatel kiiresti hankida teavet, eeskirju ja protseduure (st abikõlblikkuse kriteeriume, taotlusprotsesse ning kodanike teenuseid ja tuge). Üheks lahenduseks on interaktiivne süsteem, mis võimaldab maksumaksjatel ja maksuspetsialistidel hõlpsasti leida maksudega seotud üksikasju ja soodustusi. Seda saab kasutada kasutajate küsimuste mõistmiseks, maksudokumentide kokkuvõtmiseks ja selgete vastuste andmiseks interaktiivsete vestluste kaudu.

Kasutajad saavad esitada selliseid küsimusi nagu:

  • Kuidas pärandimaks toimib ja millised on maksumäärad?
  • Kas saate selgitada tulumaksu mõistet?
  • Millised on maksutagajärjed teise kinnisvara müümisel?

Lisaks saavad kasutajad mugavalt esitada maksuvormid süsteemi, mis aitab kontrollida esitatud teabe õigsust.

Lihtsustage juurdepääsu siseteabele, kasutades Retrieval Augmented Generation ja LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

See arhitektuur illustreerib, kuidas kasutajad saavad täidetud maksuvorme lahendusse üles laadida ja kasutada seda interaktiivseks kontrollimiseks ja juhiste andmiseks vajaliku teabe täpseks täitmiseks.

Tervishoid

Tervishoiuettevõtetel on võimalus automatiseerida suurte patsientide sisemisteabe kasutamist, käsitledes samal ajal ka levinud küsimusi seoses kasutusjuhtumitega, nagu ravivõimalused, kindlustusnõuded, kliinilised uuringud ja farmaatsiauuringud. Generatiivse AI vestlusroboti kasutamine võimaldab kiirelt ja täpselt genereerida vastuseid terviseteabe kohta pakutavast teadmistebaasist. Näiteks kulutavad mõned tervishoiutöötajad palju aega kindlustusnõuete esitamise vormide täitmisele.

Sarnastes tingimustes peavad kliiniliste uuringute administraatorid ja teadlased leidma teavet ravivõimaluste kohta. Generatiivne AI-vestlusbot saab kasutada Amazon Kendra eelseadistatud pistikuid, et hankida kõige olulisemat teavet miljonitest dokumentidest, mis on avaldatud farmaatsiaettevõtete ja ülikoolide käimasolevate uuringute käigus.

Konkreetne kasutusjuht: Vähendage vigu ja kindlustusvormide täitmiseks ja saatmiseks kuluvat aega.

Lihtsustage juurdepääsu siseteabele, kasutades Retrieval Augmented Generation ja LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Selles arhitektuuridiagrammis saab tervishoiutöötaja kasutada generatiivset AI vestlusbotti, et välja selgitada, millised vormid tuleb kindlustuse jaoks täita. LangChaini agent suudab seejärel hankida õiged vormid ja lisada patsiendi jaoks vajalikku teavet ning anda vastuseid vormide kirjeldavatele osadele kindlustuspoliiside ja varasemate vormide alusel. Tervishoiutöötaja saab enne vormi kinnitamist ja kindlustusportaali edastamist LLM-i antud vastuseid muuta.

Järgmised sammud kirjeldavad AWS Lambda funktsioone ja nende kulgu protsessis:

  1. LangChaini agent kavatsuse tuvastamiseks
  2. Hankige vajalik teave patsiendi kohta
  3. Täitke kindlustusvorm patsiendi teabe ja vormi juhendi alusel
  4. Pärast kasutaja nõusolekut esitage vorm kindlustusportaali

Lihtsustage juurdepääsu siseteabele, kasutades Retrieval Augmented Generation ja LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

AWS HealthLake kasutatakse terviseandmete, sealhulgas varasemate kindlustusvormide ja patsienditeabe turvaliseks salvestamiseks ning Amazon Comprehendi kasutatakse isikut tuvastava teabe (PII) eemaldamiseks eelmistest kindlustusvormidest. Seejärel saab Amazon Kendra roomik indeksi loomiseks kasutada kindlustusvormide ja juhiste komplekti. Kui generatiivne AI on vormi(d) täitnud, saab meditsiinitöötaja poolt läbi vaadatud vormi(d) saata kindlustusportaali.

Kulude prognoos

Põhilahenduse kui kontseptsiooni tõestuse juurutamise kulud on näidatud järgmises tabelis. Kuna baaslahendust peetakse kontseptsiooni tõestuseks, kasutati Amazon Kendra Developer Editionit odava võimalusena, kuna töökoormus ei oleks tootmises. Meie oletus Amazon Kendra Developer Editioni jaoks oli kuus 730 aktiivset tundi.

Amazon SageMakeri puhul eeldasime, et klient kasutab reaalajas järelduste tegemiseks eksemplari ml.g4dn.2xlarge, kusjuures iga eksemplari kohta on üks järelduse lõpp-punkt. Lisateavet Amazon SageMakeri hinnakujunduse ja saadaolevate järeldusjuhtumite tüüpide kohta leiate siin.

Teenus Tarbitud ressursid Hinnanguline kulu kuus USA dollarites
AWS võimendus 150 ehitusminutit
1 GB andmemahtu
500,000 taotlust
15.71
Amazon API värav 1M REST API kõned 3.5
AWS Lambda 1 miljon taotlust
Kestus 5 sekundit päringu kohta
2 GB mälu eraldatud
160.23
Amazon DynamoDB 1 miljonit lugemist
1 miljon kirjutab
100 GB ladustamise
26.38
Amazon Sagemaker Reaalajas järeldus ml.g4dn.2xlarge abil 676.8
Amazon Kendra Arendaja väljaanne 730 tunniga kuus
10,000 XNUMX skannitud dokumenti
5,000 päringut päevas
821.25
. . Kogumaksumus: 1703.87

* Amazon Cognitol on tasuta tase 50,000 50 igakuist aktiivset kasutajat, kes kasutavad Cognito kasutajakogumeid, või 2.0 igakuist aktiivset kasutajat, kes kasutavad SAML XNUMX identiteedipakkujaid.

Clean Up

Kulude säästmiseks kustutage kõik õpetuse raames juurutatud ressursid. Saate kustutada kõik SageMakeri lõpp-punktid, mille olete loonud SageMakeri konsooli kaudu. Pidage meeles, et Amazon Kendra indeksi kustutamine ei eemalda teie mälust originaaldokumente.

Järeldus

Selles postituses näitasime teile, kuidas lihtsustada juurdepääsu siseteabele, tehes reaalajas kokkuvõtteid mitmest hoidlast. Pärast kaubanduslikult saadaolevate LLM-ide hiljutist arengut on generatiivse AI võimalused muutunud ilmsemaks. Selles postituses tutvustasime viise, kuidas kasutada AWS-teenuseid, et luua serverita vestlusrobot, mis kasutab küsimustele vastamiseks generatiivset AI-d. See lähenemisviis sisaldab autentimiskihti ja Amazon Comprehendi isikuandmete tuvastamise funktsiooni, et filtreerida välja kasutaja päringus esitatud tundlik teave. Olenemata sellest, kas tervishoiutöötajad mõistavad kindlustusnõuete esitamise nüansse või personalitöötajad, kes mõistavad konkreetseid ettevõtteüleseid määrusi, on sellest lähenemisviisist kasu mitmel tööstusharul ja vertikaalil. Amazon SageMaker JumpStart vundamendimudel on vestlusroboti mootor, samas kui RAG-tehnikat kasutavat konteksti täitmise lähenemisviisi kasutatakse tagamaks, et vastused viitavad täpsemalt sisedokumentidele.

Lisateavet generatiivse AI-ga töötamise kohta AWS-is leiate artiklist Teatame uutest tööriistadest generatiivse AI-ga ehitamiseks AWS-is. Põhjalikumate juhiste saamiseks RAG-tehnika kasutamise kohta AWS-i teenustega vt Looge kiiresti ettevõtte andmetele ülitäpsed generatiivsed AI-rakendused, kasutades Amazon Kendrat, LangChaini ja suuri keelemudeleid. Kuna selle ajaveebi lähenemine on LLM-i agnostiline, saab järelduste tegemiseks kasutada mis tahes LLM-i. Järgmises postituses kirjeldame selle lahenduse rakendamise viise Amazon Bedrocki ja Amazon Titan LLM-i abil.


Autoritest

Lihtsustage juurdepääsu siseteabele, kasutades Retrieval Augmented Generation ja LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.Abhishek Maligehalli Shivalingaiah on AWS-i AI teenuste lahenduste vanemarhitekt. Ta on kirglik rakenduste loomisest, kasutades Generative AI-d, Amazon Kendrat ja NLP-d. Tal on ligikaudu 10-aastane kogemus andme- ja AI-lahenduste loomisel, et luua väärtust klientidele ja ettevõtetele. Ta on oma lõbuks ehitanud isegi (isikliku) vestlusroboti, et vastata küsimustele oma karjääri ja tööteekonna kohta. Väljaspool tööd meeldib talle teha perekonna ja sõprade portreesid ning talle meeldib kunstiteoseid luua.

Lihtsustage juurdepääsu siseteabele, kasutades Retrieval Augmented Generation ja LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.Medha Aiyah on AWS-i lahenduste kaasarhitekt, mis asub Austinis, Texases. Ta lõpetas hiljuti 2022. aasta detsembris Dallase Texase ülikooli arvutiteaduse magistrikraadiga intelligentsete süsteemide erialal, keskendudes tehisintellektile/ML-ile. Ta soovib saada lisateavet AI/ML kohta ja AWS-i teenuste kasutamisest, et leida lahendusi, millest kliendid kasu saavad.

Lihtsustage juurdepääsu siseteabele, kasutades Retrieval Augmented Generation ja LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.Hugo Tse on Washingtoni osariigis Seattle'is asuv AWS-i assotsieerunud lahenduste arhitekt. Tal on Arizona osariigi ülikooli infotehnoloogia magistrikraad ja Chicago ülikooli bakalaureusekraad majandusteaduses. Ta on infosüsteemide auditi ja kontrolli assotsiatsiooni (ISACA) ja rahvusvahelise infosüsteemide turvalisuse sertifitseerimise konsortsiumi (ISC)2 liige. Talle meeldib aidata klientidel tehnoloogiast kasu saada.

Lihtsustage juurdepääsu siseteabele, kasutades Retrieval Augmented Generation ja LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.Ayman Ishimwe on Washingtoni osariigis Seattle'is asuv AWS-i assotsieerunud lahenduste arhitekt. Tal on magistrikraad tarkvaratehnika ja IT alal Oaklandi ülikoolist. Tal on varasem kogemus tarkvaraarendusega, täpsemalt mikroteenuste loomisel hajutatud veebirakendustele. Ta soovib kirglikult aidata klientidel parimaid tavasid järgides luua AWS-i pilveteenustele tugevaid ja skaleeritavaid lahendusi.

Lihtsustage juurdepääsu siseteabele, kasutades Retrieval Augmented Generation ja LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.Shervin Suresh on AWS-i assotsieerunud lahenduste arhitekt, mis asub Austinis, Texases. Ta on lõpetanud San Jose osariigi ülikoolis tarkvaratehnika magistrikraadi, keskendudes pilvandmetöötlusele ja virtualiseerimisele, ning bakalaureusekraadi arvutitehnikas. Ta on kirglik tehnoloogia võimendamise vastu, et aidata parandada erineva taustaga inimeste elu.

Ajatempel:

Veel alates AWS-i masinõpe