A generatív mesterséges intelligencia egy olyan típusú mesterséges intelligencia, amely új tartalmakat és ötleteket hozhat létre, beleértve a beszélgetéseket, történeteket, képeket, videókat és zenét. Nagy nyelvi modellek (LLM-ek) hajtják, amelyek hatalmas mennyiségű adatra vannak előtanulva, és amelyeket általában alapmodelleknek (FM-eknek) neveznek.
Ezen LLM-ek vagy FM-ek megjelenésével az ügyfelek egyszerűen létrehozhatnak Generative AI-alapú alkalmazásokat reklámozásra, tudásmenedzsmentre és ügyfélszolgálatra. Ezeknek az alkalmazásoknak a hatásának felismerése jobb betekintést nyújthat az ügyfelek számára, és pozitívan befolyásolhatja a szervezet teljesítményének hatékonyságát, egyszerű információkereséssel és bizonyos időigényes feladatok automatizálásával.
Az AWS generatív mesterséges intelligenciájával újra feltalálhatja alkalmazásait, teljesen új felhasználói élményeket teremthet, és javíthatja az általános termelékenységet.
Ebben a bejegyzésben egy biztonságos vállalati alkalmazást készítünk AWS erősítés amely meghív egy Amazon SageMaker JumpStart alapozó modell, Amazon SageMaker végpontok, és Amazon OpenSearch szolgáltatás elmagyarázni, hogyan hozható létre szöveg-szöveg vagy szöveg-kép és Retrieval Augmented Generation (RAG). Ezt a bejegyzést referenciaként használhatja biztonságos vállalati alkalmazások létrehozásához a Generative AI tartományban AWS-szolgáltatások segítségével.
Megoldás áttekintése
Ez a megoldás a SageMaker JumpStart modelleket használja a szöveg-szöveg, szöveg-kép és szövegbeágyazási modellek SageMaker-végpontként történő telepítéséhez. Ezeket a SageMaker-végpontokat az Amplify React alkalmazás használja fel Amazon API átjáró és a AWS Lambda funkciókat. Az alkalmazás és az API-k véletlen hozzáféréstől való védelme érdekében Amazon Cognito integrálva van az Amplify React, az API Gateway és a Lambda funkciókba. A SageMaker végpontok és a Lambda telepítése a privát VPC, így az API Gateway és a Lambda funkciók közötti kommunikáció API Gateway VPC hivatkozások segítségével védett. A következő munkafolyamat-diagram ezt a megoldást szemlélteti.
A munkafolyamat a következő lépéseket tartalmazza:
- Kezdeti beállítás: A SageMaker JumpStart FM-ek SageMaker-végpontként kerülnek telepítésre, három végponttal pedig a SageMaker JumpStart modellek. A szöveg-kép modell egy Stabilitási AI Stable Diffusion alapmodell, amelyet képek generálására használnak majd. A szöveg generálására használt és a megoldásban telepített szöveg-szöveg modell egy Hugging Face Flan T5 XL modell. A szövegbeágyazási modell, amelyet az Amazon OpenSearch Service-ben indexelendő beágyazás generálására vagy a bejövő kérdés kontextusának keresésére használunk, egy Hugging Face GPT 6B FP16 beágyazási modell. Alternatív LLM-ek telepíthetők a használati eset és a modell teljesítmény-benchmarkok alapján. Az alapozó modellekkel kapcsolatos további információkért lásd: Az Amazon SageMaker JumpStart használatának első lépései.
- A React alkalmazást a számítógépéről érheti el. A React alkalmazásnak három oldala van: egy oldal, amely képparancsokat fogad, és megjeleníti a generált képet; egy oldal, amely szöveges felszólításokat fogad, és megjeleníti a generált szöveget; és egy oldal, amely felvesz egy kérdést, megkeresi a kérdésnek megfelelő kontextust, és megjeleníti a szöveg-szöveg modell által generált választ.
- Az Amplify-könyvtárak használatával készült React alkalmazás az Amplify-on található, és az Amplify gazdagép URL-címén jelenik meg a felhasználó számára. Az Amplify biztosítja a tárhelykörnyezetet a React alkalmazás számára. Az Amplify CLI az Amplify tárhelykörnyezet rendszerindítására és a kód Amplify tárhelykörnyezetbe történő telepítésére szolgál.
- Ha nem lett hitelesítve, az Amplify React UI könyvtár használatával hitelesítik az Amazon Cognito ellen.
- Amikor megad egy bevitelt és elküldi az űrlapot, a kérés feldolgozása az API-átjárón keresztül történik.
- A lambda-függvények megtisztítják a felhasználói bevitelt, és meghívják a megfelelő SageMaker végpontokat. A lambda-függvények a megtisztított felhasználói bemenetből is létrehozzák a promptokat az LLM által elvárt megfelelő formátumban. Ezek a Lambda-függvények az LLM-ek kimenetét is újraformázzák, és visszaküldik a választ a felhasználónak.
- A SageMaker végpontokat a szöveg-szöveg (Flan T5 XXL), a szöveg-beágyazás (GPTJ-6B) és a szöveg-kép modellek (Stability AI) alkalmazzák. Három különálló végpont van telepítve, amelyek az ajánlott alapértelmezett SageMaker-példánytípusokat használják.
- A dokumentumok beágyazásai a szöveg-beágyazási modell használatával jönnek létre, és ezek a beágyazások az OpenSearch szolgáltatásba indexelve. A k-Legközelebbi szomszéd (k-NN) index engedélyezve van, hogy lehetővé tegye a beágyazások keresését az OpenSearch szolgáltatásból.
- An AWS Fargate A job átveszi a dokumentumokat, és kisebb csomagokba szegmentálja, meghívja a szöveg-beágyazási LLM-modellt, és a visszaadott beágyazásokat az OpenSearch Service-be indexeli a kontextus kereséséhez a korábban leírtak szerint.
Adatkészlet áttekintése
A megoldáshoz használt adatkészlet a pile-of-law
belül Hugging Face adattár. Ez az adatkészlet jogi és adminisztratív adatok nagy részét képezi. Ebben a példában használjuk train.cc_casebooks.jsonl.xz
ezen az adattáron belül. Ez az oktatási esetkönyvek gyűjteménye JSONL formátumban, az LLM-ek által előírtak szerint.
Előfeltételek
Mielőtt elkezdené, győződjön meg arról, hogy rendelkezik a következő előfeltételekkel:
Valósítsa meg a megoldást
Az összes építészeti komponenst tartalmazó AWS CDK projekt elérhetővé vált ebben az AWS mintában GitHub tárház. A megoldás megvalósításához tegye a következőket:
- Klónozza a GitHub tárház a számítógéphez.
- Menjen a gyökérmappába.
- Inicializálja a Python virtuális környezetet.
- Telepítse a szükséges függőségeket, amelyeket a
requirements.txt
fájlt. - Inicializálja az AWS CDK-t a projekt mappájában.
- Bootstrap AWS CDK a projekt mappában.
- Az AWS CDK deploy paranccsal telepítse a veremeket.
- Lépjen az Amplify mappába a projekt mappán belül.
- Inicializálja az Amplify-t, és fogadja el a CLI által biztosított alapértelmezett értékeket.
- Adja hozzá az Amplify tárhelyet.
- Tegye közzé az Amplify kezelőfelületet az Amplify mappából, és jegyezze fel a futás végén megadott tartománynevet.
- Az Amazon Cognito konzolon adjon hozzá egy felhasználót a központi telepítéssel kiépített Amazon Cognito példányhoz.
- A 11. lépéstől lépjen a domain névre, és adja meg az Amazon Cognito bejelentkezési adatait az alkalmazás eléréséhez.
Indítson el egy OpenSearch indexelési feladatot
Az AWS CDK projekt egy Lambda függvényt telepített GenAIServiceTxt2EmbeddingsOSIndexingLambda
. Navigáljon ehhez a funkcióhoz a Lambda konzolon.
Futtasson le egy tesztet üres rakománysal, amint az a következő képernyőképen látható.
Ez a lambda-függvény Fargate-feladatot indít el Amazon Elastic Container Service (Amazon ECS), amely a VPC-n belül fut. Ez a Fargate-feladat a mellékelt JSONL-fájl segítségével szegmentálja és létrehozza a beágyazási indexet. Minden egyes szegmensbeágyazás az AWS CDK-projekt részeként telepített szöveg-beágyazások LLM-végpontjának meghívásának eredménye.
Tisztítsuk meg
A jövőbeni díjak elkerülése érdekében törölje a SageMaker végpontot, és állítsa le az összes Lambda funkciót. Törölje továbbá az Amazon S3 kimeneti adatait, amelyeket az alkalmazás munkafolyamatának futtatása közben hozott létre. Törölnie kell az S3 gyűjtőzónákban lévő adatokat, mielőtt törölni tudná a gyűjtősávokat.
Következtetés
Ebben a bejegyzésben bemutattunk egy teljes körű megközelítést egy biztonságos vállalati alkalmazás létrehozására a Generative AI és a RAG használatával. Ez a megközelítés használható biztonságos és méretezhető generatív AI-alkalmazások AWS-en történő építéséhez. Javasoljuk, hogy telepítse fiókjában az AWS CDK alkalmazást, és készítse el a Generative AI megoldást.
További források
Az AWS-en futó generatív AI-alkalmazásokkal kapcsolatos további információkért tekintse meg a következőket:
A szerzőkről
Jay Pillai az Amazon Web Services fő megoldási építésze. Információs technológiai vezetőként Jay a mesterséges intelligencia, az adatintegráció, az üzleti intelligencia és a felhasználói felület tartományaira specializálódott. 23 éves, széleskörű tapasztalattal rendelkezik, ahol több ügyféllel dolgozott ingatlan, pénzügyi szolgáltatások, biztosítás, fizetési és piackutatási üzletágakban.
Shikhar Kwatra AI/ML Specialist Solutions Architect az Amazon Web Servicesnél, és egy vezető globális rendszerintegrátorral dolgozik együtt. Több mint 500 szabadalommal érdemelte ki az egyik legfiatalabb indiai mesterfeltaláló címet az AI/ML és az IoT területén. A Shikhar segítséget nyújt a szervezet költséghatékony, méretezhető felhőkörnyezeteinek tervezésében, felépítésében és karbantartásában, valamint támogatja a GSI-partnert az AWS-en alapuló stratégiai ipari megoldások kidolgozásában. Shikhar szeret gitározni, zenét komponálni, és szabadidejében gyakorolja a tudatosságot.
Karthik Sonti egy globális megoldástervezői csapatot vezet, amely horizontális, funkcionális és vertikális megoldások koncepciózására, megépítésére és bevezetésére összpontosít az Accenture-rel, hogy segítse közös ügyfeleinket abban, hogy az AWS-en differenciált módon alakítsák át üzletüket.
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
- PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
- PlatoESG. Autóipar / elektromos járművek, Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
- PlatoHealth. Biotechnológiai és klinikai vizsgálatok intelligencia. Hozzáférés itt.
- ChartPrime. Emelje fel kereskedési játékát a ChartPrime segítségével. Hozzáférés itt.
- BlockOffsets. A környezetvédelmi ellentételezési tulajdon korszerűsítése. Hozzáférés itt.
- Forrás: https://aws.amazon.com/blogs/machine-learning/build-a-secure-enterprise-application-with-generative-ai-and-rag-using-amazon-sagemaker-jumpstart/
- :van
- :is
- :nem
- 100
- 11
- 23
- 500
- 7
- a
- Rólunk
- Accenture
- Elfogad!
- hozzáférés
- Fiók
- át
- hozzá
- adminisztratív
- megérkezés
- Hirdetés
- ellen
- AI
- AI / ML
- AIDS
- Minden termék
- lehetővé
- Is
- alternatív
- amazon
- Amazon Cognito
- Amazon OpenSearch szolgáltatás
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Az Amazon Web Services
- Összegek
- an
- és a
- válasz
- api
- API-k
- app
- Alkalmazás
- alkalmazások
- megközelítés
- építészek
- építészeti
- VANNAK
- mesterséges
- mesterséges intelligencia
- AS
- At
- bővített
- hitelesített
- automatizálás
- elérhető
- elkerülése érdekében
- AWS
- vissza
- alapján
- BE
- óta
- előtt
- referenciaértékek
- Bootstrap
- épít
- Épület
- épült
- üzleti
- üzleti intelligencia
- by
- TUD
- eset
- bizonyos
- díjak
- ügyfél részére
- felhő
- kód
- gyűjtemény
- általában
- közlés
- alkatrészek
- számítógép
- Konzol
- konstrukció
- fogyasztott
- Konténer
- tartalom
- kontextus
- beszélgetések
- teremt
- készítette
- a válogatott
- vevő
- Vevőszolgálat
- Ügyfelek
- dátum
- alapértelmezett
- alapértelmezett
- igazolták
- függőségek
- telepíteni
- telepített
- bevetés
- leírt
- részletek
- differenciált
- Diffusion
- kijelzők
- do
- dokumentumok
- domain
- Domain név
- domainek
- minden
- szerzett
- könnyű
- Oktatás
- hatékonyság
- beágyazás
- engedélyezve
- ösztönzése
- végén
- végtől végig
- Endpoint
- fokozott
- Vállalkozás
- teljesen
- Környezet
- környezetek
- birtok
- példa
- várható
- tapasztalat
- Tapasztalatok
- Magyarázza
- kiterjedt
- Átfogó tapasztalat
- Arc
- filé
- pénzügyi
- pénzügyi szolgáltatások
- leletek
- összpontosított
- következő
- A
- forma
- formátum
- Alapítvány
- ból ből
- front
- Front end
- funkció
- funkcionális
- funkciók
- jövő
- gateway
- generált
- generáló
- generáció
- nemző
- Generatív AI
- szerzés
- Globális
- Legyen
- he
- segít
- övé
- tart
- Vízszintes
- vendéglátó
- házigazdája
- tárhely
- Hogyan
- How To
- http
- HTTPS
- ötletek
- illusztrálja
- kép
- képek
- Hatás
- végre
- javul
- in
- beleértve
- magában foglalja a
- Beleértve
- Bejövő
- index
- indexelt
- indexek
- indián
- ipar
- információ
- információs technológia
- bemenet
- meglátások
- példa
- biztosítás
- integrált
- integráció
- Intelligencia
- Felület
- bele
- feltalálók
- behívja
- tárgyak internete
- Munka
- közös
- jpg
- tudás
- Tudásmenedzsment
- nyelv
- nagy
- indítás
- vezető
- vezető
- vezetékek
- Jogi
- könyvtárak
- könyvtár
- linkek
- LLM
- Belépés
- készült
- fenntartása
- csinál
- vezetés
- mód
- piacára
- piackutatás
- mester
- egyező
- Éberség
- modell
- modellek
- több
- zene
- kell
- név
- Nevezett
- Keresse
- Új
- of
- on
- ONE
- or
- szervezet
- mi
- teljesítmény
- felett
- átfogó
- csomagok
- oldal
- oldalak
- rész
- partner
- Szabadalmak
- kifizetések
- teljesítmény
- Plató
- Platón adatintelligencia
- PlatoData
- játék
- állás
- powered
- előfeltételek
- korábban
- Fő
- Feldolgozott
- termelékenység
- program
- védelme
- védett
- ad
- feltéve,
- biztosít
- Piton
- kérdés
- Reagál
- igazi
- ingatlan
- felismerve
- ajánlott
- utal
- említett
- feltalálni
- raktár
- kérni
- kötelező
- kutatás
- azok
- válasz
- eredményez
- gyökér
- futás
- futás
- sagemaker
- skálázható
- keres
- biztonság
- lát
- részes
- szegmensek
- küld
- különálló
- szolgáltatás
- Szolgáltatások
- felépítés
- számos
- mutatott
- egyszerűen
- kisebb
- So
- megoldások
- Megoldások
- szakember
- specializálódott
- meghatározott
- Stabilitás
- stabil
- Stacks
- kezdődött
- Lépés
- Lépései
- megáll
- TÖRTÉNETEK
- Stratégiai
- beküldése
- támogatás
- Támogatja
- biztos
- rendszer
- tart
- Feladat
- feladatok
- csapat
- Technológia
- teszt
- szöveg
- hogy
- A
- azok
- Őket
- Ezek
- ezt
- három
- Keresztül
- idő
- időigényes
- Cím
- nak nek
- Átalakítás
- típus
- típusok
- ui
- URL
- használ
- használati eset
- használt
- használó
- felhasználói felület
- használ
- segítségével
- Hatalmas
- függőleges
- keresztül
- Videók
- Tényleges
- volt
- we
- háló
- webes szolgáltatások
- ami
- míg
- lesz
- val vel
- belül
- munkafolyamat
- dolgozó
- év
- te
- Legfiatalabb
- A te
- zephyrnet