Yritykset pyrkivät nopeasti vapauttamaan generatiivisen tekoälyn potentiaalia tarjoamalla pääsyn perusmalleihin (FM) eri liiketoiminta-alueille (LOB). IT-tiimien tehtävänä on auttaa LOBia innovoimaan nopeasti ja ketterästi samalla kun ne tarjoavat keskitetyn hallinnan ja havainnoinnin. Heidän on esimerkiksi ehkä seurattava FM-laitteiden käyttöä eri ryhmien välillä, perittävä takaisinperinnän kustannuksia ja tarjottava näkyvyys LOB:n asiaankuuluvalle kustannuspaikalle. Lisäksi heidän on ehkä säädettävä pääsyä eri malleihin joukkuekohtaisesti. Esimerkiksi jos vain tietyt FM:t voidaan hyväksyä käytettäväksi.
Amazonin kallioperä on täysin hallittu palvelu, joka tarjoaa valikoiman tehokkaita perusmalleja johtavilta tekoälyyrityksiltä, kuten AI21 Labs, Anthropic, Cohere, Meta, Stability AI ja Amazon, yhden API:n kautta sekä laajan valikoiman ominaisuuksia generatiivisen tekoälyn rakentamiseen. sovelluksia, joissa on turvallisuus, yksityisyys ja vastuullinen tekoäly. Koska Amazon Bedrock on palvelimeton, sinun ei tarvitse hallita mitään infrastruktuuria, ja voit turvallisesti integroida ja ottaa käyttöön luovia tekoälyominaisuuksia sovelluksiisi käyttämällä jo tuttuja AWS-palveluita.
Ohjelmisto palveluna (SaaS) -kerros perustamalleihin voi tarjota yksinkertaisen ja yhtenäisen käyttöliittymän loppukäyttäjille samalla, kun se ylläpitää keskitettyä pääsyn ja kulutuksen hallintaa. API-yhdyskäytävät voivat tarjota löysää kytkentää mallin kuluttajien ja mallin päätepistepalvelun välille sekä joustavuutta mukautua muuttuviin malliin, arkkitehtuureihin ja kutsumenetelmiin.
Tässä viestissä näytämme, kuinka voit rakentaa sisäisen SaaS-kerroksen, jotta voit käyttää Amazon Bedrockin perusmalleja usean vuokralaisen (tiimi) arkkitehtuurissa. Keskitymme erityisesti käytön ja kustannusten seurantaan vuokralaista kohden sekä ohjaimiin, kuten käytön rajoituksiin vuokralaista kohden. Kuvaamme kuinka ratkaisu ja Amazon Bedrockin kulutussuunnitelmat liittyvät yleiseen SaaS-matkakehykseen. Ratkaisun koodi ja an AWS Cloud Development Kit (AWS CDK) -malli on saatavilla osoitteessa GitHub-arkisto.
Haasteet
Tekoälyalustan järjestelmänvalvojan on tarjottava standardoitu ja helppo pääsy FM:iin useille kehitystiimeille.
Seuraavassa on joitain haasteita säätiömallien ohjatun pääsyn tarjoamiseen:
- Kustannusten ja käytön seuranta – Seuraa ja tarkasta yksittäisten vuokralaisten kustannuksia ja säätiömallien käyttöä sekä tarjoa takaisinveloituskulut tietyille kustannuspaikoille
- Budjetin ja käytön hallinta – Hallinnoi perusmallien sallitun käytön API-kiintiöitä, budjettia ja käyttörajoja tietyllä taajuudella vuokralaista kohden
- Kulunvalvonta ja mallihallinta – Määritä pääsynhallinta tietyille sallituille malleille vuokralaista kohden
- Usean vuokraajan standardoitu API – Tarjoa yhtenäinen pääsy perustusmalleihin OpenAPI standardit
- API:n keskitetty hallinta – Tarjoa yksi kerros API-avaimien hallintaan malleihin pääsyä varten
- Malliversiot ja päivitykset – Käsittele uusien ja päivitettyjen malliversioiden julkaisuja
Ratkaisun yleiskatsaus
Tässä ratkaisussa viittaamme a usean vuokralaisen lähestyä. A vuokralainen Tämä voi vaihdella yksittäisestä käyttäjästä, tietystä projektista, tiimistä tai jopa koko osastosta. Kun keskustelemme lähestymistavasta, käytämme termiä joukkue-, koska se on yleisin. Käytämme API-avaimia rajoittamaan ja valvomaan ryhmien API-käyttöä. Jokaiselle joukkueelle on määritetty API-avain FM:ien käyttöä varten. Organisaatiossa voi olla erilaisia käyttäjien todennus- ja valtuutusmekanismeja. Yksinkertaisuuden vuoksi emme sisällytä niitä tähän ratkaisuun. Voit myös integroida olemassa olevia identiteetin tarjoajia tähän ratkaisuun.
Seuraavassa kaaviossa on yhteenveto ratkaisun arkkitehtuurista ja avainkomponenteista. Erillisiin kustannuspaikkoihin määrätyt tiimit (vuokralaiset) kuluttavat Amazon Bedrock FM:itä API-palvelun kautta. Kulutuksen ja tiimikohtaisten kustannusten seuraamiseksi ratkaisu kirjaa kunkin yksittäisen kutsun tiedot, mukaan lukien kutsutun mallin, tekstinluontimallien merkkien määrän ja multimodaalisten mallien kuvamitat. Lisäksi se kokoaa kutsut mallikohtaisesti ja kunkin tiimin kustannukset.
Voit ottaa ratkaisun käyttöön omalla tililläsi AWS CDK:n avulla. AWS CDK on avoimen lähdekoodin ohjelmistokehityskehys, jolla voit mallintaa ja tarjota pilvisovellusresursseja tutuilla ohjelmointikielillä. AWS CDK -koodi on saatavilla osoitteessa GitHub-arkisto.
Seuraavissa osioissa käsittelemme tarkemmin ratkaisun avainkomponentteja.
Perusmallin käytön taltiointi tiimiä kohden
Työnkulku FM-käytön taltioimiseksi tiimikohtaisesti koostuu seuraavista vaiheista (edellisessä kaaviossa numeroitu):
- Ryhmän sovellus lähettää POST-pyynnön osoitteeseen Amazon API -yhdyskäytävä mallissa, jota käytetään
model_id
kyselyparametri ja käyttäjäkehote pyynnön rungossa. - API-yhdyskäytävä reitittää pyynnön osoitteeseen AWS Lambda toiminto (
bedrock_invoke_model
), joka on vastuussa joukkueen käyttötietojen kirjaamisesta amazonin pilvikello ja vetoamalla Amazon Bedrock -malliin. - Amazon Bedrock tarjoaa VPC-päätepisteen, jonka virtalähteenä on AWS PrivateLink. Tässä ratkaisussa Lambda-toiminto lähettää pyynnön Amazon Bedrockille PrivateLinkin avulla luodakseen yksityisen yhteyden tilisi VPC:n ja Amazon Bedrock -palvelutilin välille. Lisätietoja PrivateLinkistä on osoitteessa AWS PrivateLinkin avulla voit määrittää yksityisen pääsyn Amazon Bedrockiin.
- Amazonin kallioperän kutsun jälkeen Amazon CloudTrail luo a CloudTrail-tapahtuma.
- Jos Amazon Bedrock -kutsu onnistuu, Lambda-funktio kirjaa seuraavat tiedot kutsutun mallin tyypistä riippuen ja palauttaa luodun vastauksen sovellukselle:
- tiimin_tunnus – Pyynnön esittäneen tiimin yksilöllinen tunniste.
- requestId – Pyynnön yksilöllinen tunniste.
- mallin_tunnus – Kutsuttavan mallin tunnus.
- inputTokens – Malliin osana kehotetta lähetettyjen tunnuksien määrä (tekstin luonti- ja upotusmalleille).
- output Tokens – Mallin luomien merkkien enimmäismäärä (tekstin luontimalleille).
- korkeus – Pyydetyn kuvan korkeus (multimodaalisille malleille ja multimodaalisille upotusmalleille).
- leveys – Pyydetyn kuvan leveys (vain multimodaalimalleille).
- vaiheet – Vaaditut vaiheet (Stability AI -malleille).
Seurantakulut joukkuetta kohti
Erilainen kulku kokoaa käyttötiedot, laskee ja säästää on-demand-kustannukset tiimiä kohti päivittäin. Erillisen kulun avulla varmistamme, että kustannusseuranta ei vaikuta mallin kutsuvirran viiveeseen ja suorituskykyyn. Työnkulun vaiheet ovat seuraavat:
- An Amazon EventBridge sääntö laukaisee lambda-funktion (
bedrock_cost_tracking
) päivittäin. - Lambda-toiminto hakee CloudWatchista edellisen päivän käyttötiedot, laskee niihin liittyvät kustannukset ja tallentaa tiedot, jotka on koottu
team_id
jamodel_id
in Amazonin yksinkertainen tallennuspalvelu (Amazon S3) CSV-muodossa.
Amazon S3:een tallennettujen tietojen kyselyyn ja visualisointiin sinulla on erilaisia vaihtoehtoja, mukaan lukien S3 Valitseja Amazon Athena ja Amazon QuickSight.
Hallitse käyttöä joukkueittain
Käyttösuunnitelma määrittää, kuka voi käyttää yhtä tai useampaa käyttöön otettua sovellusliittymää, ja valinnaisesti asettaa tavoitepyyntösuhteen pyyntöjen hillitsemisen aloittamiseksi. Suunnitelma käyttää API-avaimia tunnistamaan API-asiakkaat, jotka voivat käyttää kullekin avaimelle liittyvää API-liittymää. Voit käyttää API-yhdyskäytävää käyttösuunnitelmat hillitä pyyntöjä, jotka ylittävät ennalta määritetyt kynnykset. Voit myös käyttää API-avaimet ja kiintiörajoitukset, joiden avulla voit asettaa pyyntöjen enimmäismäärän API-avainta kohti, jonka kukin tiimi saa lähettää tietyn aikavälin sisällä. Tämä on lisäksi Amazon Bedrockin palvelukiintiöt jotka on määritetty vain tilitasolla.
Edellytykset
Ennen kuin otat ratkaisun käyttöön, varmista, että sinulla on seuraavat asiat:
Ota AWS CDK -pino käyttöön
Seuraa ohjeita LUEMINUT GitHub-arkiston tiedosto määrittääksesi ja ottaaksesi käyttöön AWS CDK -pinon.
Pino ottaa käyttöön seuraavat resurssit:
- Yksityinen verkkoympäristö (VPC, yksityiset aliverkot, suojausryhmä)
- IAM-rooli mallin pääsyn hallintaan
- Lambda-kerrokset tarvittaville Python-moduuleille
- Lambda toiminto
invoke_model
- Lambda toiminto
list_foundation_models
- Lambda toiminto
cost_tracking
- Rest API (API Gateway)
- API-yhdyskäytävän käyttösuunnitelma
- Käyttösuunnitelmaan liittyvä API-avain
Uuteen joukkueeseen
Tarjotaksesi pääsyn uusille tiimeille voit joko jakaa saman API-avaimen eri tiimeille ja seurata mallin kulutusta antamalla eri team_id
API-kutsua varten tai luo erityisiä API-avaimia, joita käytetään Amazon Bedrock -resurssien käyttämiseen noudattamalla LUEMINUT.
Pino ottaa käyttöön seuraavat resurssit:
- API-yhdyskäytävän käyttösuunnitelma, joka liittyy aiemmin luotuun REST-sovellusliittymään
- API-avain, joka liittyy uuden tiimin käyttösuunnitelmaan, jossa on varatut kuristus- ja purskekonfiguraatiot API:lle
Lisätietoja API-yhdyskäytävän kuristuksesta ja purskemäärityksistä on kohdassa Throttle API-pyynnöt paremman suorituskyvyn saavuttamiseksi.
Kun olet ottanut pinon käyttöön, näet, että uusi API-avain team-2
on myös luotu.
Määritä mallin pääsynhallinta
Alustan ylläpitäjä voi sallia pääsyn tiettyihin perustusmalleihin muokkaamalla Lambda-toimintoon liittyvää IAM-käytäntöä invoke_model
.
IAM-oikeudet määritellään tiedostossa setup/stack_constructs/iam.py. Katso seuraava koodi:
Kutsu palvelu
Kun olet ottanut ratkaisun käyttöön, voit kutsua palvelun suoraan koodistasi. Seuraavat
on esimerkki Pythonissa kuluttamisesta invoke_model
API tekstin luomiseen POST-pyynnön kautta:
Tuotos: Amazon Bedrock on sisäinen teknologia-alusta, jonka Amazon on kehittänyt monien heidän palveluidensa ja tuotteidensa ohjaamiseksi. Muutamia tärkeitä asioita Bedrockista…
Seuraava on toinen esimerkki Pythonissa kuluttamisesta invoke_model
API upotusten luomiseen POST-pyynnön kautta:
model_id = "amazon.titan-embed-text-v1" #the model id for the Amazon Titan Embeddings Text model prompt = "What is Amazon Bedrock?" response = requests.post( f"{api_url}/invoke_model?model_id={model_id}", json={"inputs": prompt, "parameters": model_kwargs}, headers={ "x-api-key": api_key, #key for querying the API "team_id": team_id #unique tenant identifier, "embeddings": "true" #boolean value for the embeddings model }
) text = response.json()[0]["embedding"]
Lähtö: 0.91796875, 0.45117188, 0.52734375, -0.18652344, 0.06982422, 0.65234375, -0.13085938, 0.056884766, 0.092285156, 0.06982422 . 1.03125, 0.8515625 …
Perusmalleihin pääsy kielletty
Seuraavassa on esimerkki Pythonissa kuluttamisesta invoke_model
API tekstin luomiseen POST-pyynnön kautta ja pääsy kielletty -vastaukseen:
“Traceback (viimeisin puhelu viimeisin):n Tiedosto ”/var/task/index.py”, rivi 213, lambda_handlern response = _invoke_text(bedrock_client, model_id, body, model_kwargs)n Tiedosto ”/var/task/index.py ”, rivi 146, _invoke_textn raise fi File ”/var/task/index.py”, rivi 131, _invoke_textn response = bedrock_client.invoke_model(n Tiedosto ”/opt/python/botocore/client.py”, rivi 535, _api_calln palauttaa self._make_api_call(operation_name, kwargs)n Tiedosto ”/opt/python/botocore/client.py”, rivi 980, _make_api_calln raise error_class(parsed_response, operation_name)nbotocore.errorfactoryedAccceptiones:D InvokeModel-toimintoa kutsuttaessa tapahtui virhe (AccessDeniedException): Tililläsi ei ole valtuuksia kutsua tätä API-toimintoa.n”
Esimerkki kustannusarviosta
Käytettäessä Amazon Bedrock -malleja on-demand-hinnoittelulla, kokonaiskustannus lasketaan panos- ja tuotantokustannusten summana. Syöttökustannukset perustuvat malliin lähetettyjen syöttötunnisteiden määrään, ja tuotantokustannukset perustuvat luotuihin tokeneihin. Hinnat ovat per 1,000 1,000 syöttötunnusta ja XNUMX XNUMX tulostetunnusta. Katso tarkemmat tiedot ja mallihinnat osoitteesta Amazonin kallioperän hinnoittelu.
Katsotaanpa esimerkkiä, jossa kaksi tiimiä, team1 ja team2, pääsevät Amazon Bedrockiin tämän viestin ratkaisun kautta. Amazon S3:een yhden päivän aikana tallennetut käyttö- ja hintatiedot näkyvät seuraavassa taulukossa.
Sarakkeet input_tokens
ja output_tokens
tallentaa kokonaissyöttö- ja lähtötunnisteet mallien kutsujen välillä mallia ja ryhmää kohti tietyltä päivältä.
Sarakkeet input_cost
ja output_cost
tallentaa vastaavat kustannukset mallia ja joukkuetta kohti. Ne lasketaan seuraavilla kaavoilla:
input_cost = input_token_count * model_pricing["input_cost"] / 1000
output_cost = output_token_count * model_pricing["output_cost"] / 1000
tiimin_tunnus | mallin_tunnus | input_tokens | output_tones | kutsut | input_cost | tuotannon_kustannus |
Team1 | amazon.titan-tg1-large | 24000 | 2473 | 1000 | 0.0072 | 0.00099 |
Team1 | anthropic.claude-v2 | 2448 | 4800 | 24 | 0.02698 | 0.15686 |
Team2 | amazon.titan-tg1-large | 35000 | 52500 | 350 | 0.0105 | 0.021 |
Team2 | ai21.j2-grande-instruct | 4590 | 9000 | 45 | 0.05738 | 0.1125 |
Team2 | anthropic.claude-v2 | 1080 | 4400 | 20 | 0.0119 | 0.14379 |
Päästä päähän -näkymä toimivasta usean vuokralaisen palvelimettomasta SaaS-ympäristöstä
Ymmärretään, miltä päästä päähän toimiva, usean vuokraajan palvelimeton SaaS-ympäristö voisi näyttää. Seuraavassa on referenssiarkkitehtuurikaavio.
Tämä arkkitehtuurikaavio on zoomattu versio aiemmin viestissä selostetusta arkkitehtuurikaaviosta, jossa edellinen arkkitehtuurikaavio selittää yhden mainitun mikropalvelun (perusmallipalvelu) yksityiskohdat. Tämä kaavio selittää, että perusmallipalvelun lisäksi usean vuokraajan SaaS-alustassasi on oltava myös muita komponentteja toimivan ja skaalautuvan alustan toteuttamiseksi.
Käydään läpi arkkitehtuurin yksityiskohdat.
Vuokralaisen hakemukset
Vuokrasovellukset ovat käyttöliittymäsovelluksia, jotka ovat vuorovaikutuksessa ympäristön kanssa. Tässä näytämme useita vuokralaisia, jotka käyttävät eri paikallisista tai AWS-ympäristöistä. Käyttöliittymäsovelluksia voidaan laajentaa sisältämään rekisteröintisivun uusien vuokralaisten rekisteröintiä varten sekä hallintakonsolin SaaS-palvelukerroksen ylläpitäjille. Jos vuokraajasovellukset vaativat mukautetun logiikan toteuttamisen, joka vaatii vuorovaikutusta SaaS-ympäristön kanssa, ne voivat toteuttaa sovellussovittimen mikropalvelun määritykset. Esimerkkiskenaariot voisivat olla mukautetun valtuutuslogiikan lisääminen SaaS-ympäristön valtuutusmäärityksiä kunnioittaen.
Yhteiset palvelut
Seuraavat ovat yhteisiä palveluita:
- Vuokralais- ja käyttäjähallintapalvelut – Nämä palvelut vastaavat vuokralaisten rekisteröinnistä ja hallinnoinnista. Ne tarjoavat monialaisen toiminnallisuuden, joka on erillinen sovelluspalveluista ja jaettu kaikille vuokralaisille.
- Perusmallipalvelu – Tämän postauksen alussa selitetty ratkaisuarkkitehtuurikaavio edustaa tätä mikropalvelua, jossa vuorovaikutus API Gatewaysta Lambda-toimintoihin tapahtuu tämän mikropalvelun puitteissa. Kaikki vuokralaiset käyttävät tätä mikropalvelua Anthropicin, AI21:n, Coheren, Stabilityn, Metan ja Amazonin perusmallien sekä hienosäädettyjen mallien käyttöön. Se tallentaa myös käytön seurantaan tarvittavat tiedot CloudWatch-lokeihin.
- Kustannusten seurantapalvelu – Tämä palvelu seuraa kunkin vuokralaisen kustannuksia ja käyttöä. Tämä mikropalvelu toimii aikataulun mukaan ja tekee kyselyn CloudWatch-lokeista ja tulostaa kootun käytön seurannan ja päätellyt kustannukset datatallennustilaan. Kustannusseurantapalvelua voidaan laajentaa rakentamaan lisää raportteja ja visualisointeja.
Sovellussovitinpalvelu
Tämä palvelu sisältää joukon määrityksiä ja sovellusliittymiä, joita vuokralainen voi ottaa käyttöön integroidakseen mukautetun logiikkansa SaaS-ympäristöön. Sen mukaan, kuinka paljon mukautettua integraatiota tarvitaan, tämä komponentti voi olla valinnainen vuokralaisille.
Usean vuokralaisen tietovarasto
Jaetut palvelut tallentavat tietonsa tietosäilöön, joka voi olla yksi jaettu Amazon DynamoDB taulukko vuokralaisen osiointiavaimella, joka liittää DynamoDB-kohteet yksittäisiin vuokralaisiin. Kustannusseurannan jaettu palvelu tuottaa kootut käyttö- ja kustannusseurantatiedot Amazon S3:lle. Käyttötapauksesta riippuen voi olla myös sovelluskohtainen tietovarasto.
Usean vuokraajan SaaS-ympäristössä voi olla paljon enemmän komponentteja. Lisätietoja on kohdassa Usean vuokralaisen SaaS-ratkaisun rakentaminen AWS-palvelimettomilla palveluilla.
Tuki useille käyttöönottomalleille
SaaS-kehykset hahmottelevat tyypillisesti kaksi käyttöönottomallia: pooli ja siilo. Pool-mallissa kaikki vuokralaiset käyttävät FM-laitteita jaetusta ympäristöstä, jossa on yhteinen tallennus- ja laskentainfrastruktuuri. Siilomallissa jokaisella vuokralaisella on omat resurssinsa. Voit lukea eristysmalleista SaaS-vuokralaisten eristysstrategioiden raportti.
Ehdotettu ratkaisu voidaan ottaa käyttöön molemmissa SaaS-käyttöönottomalleissa. Pool-lähestymistavassa keskitetty AWS-ympäristö isännöi API-, tallennus- ja laskentaresursseja. Siilotilassa jokainen tiimi käyttää sovellusliittymiä, tallennustilaa ja laskentaresursseja erillisessä AWS-ympäristössä.
Ratkaisu sopii myös Amazon Bedrockin tarjoamiin kulutussuunnitelmiin. AWS tarjoaa valinnan kahdesta kulutussuunnitelmasta päätelmiä varten:
- Tarpeen vaatiessa – Tämän tilan avulla voit käyttää perustusmalleja jakoperusteisesti ilman, että sinun tarvitsee tehdä aikaperusteisia sitoumuksia
- Tarjottu läpimeno – Tämän tilan avulla voit tarjota riittävän suorituskyvyn sovelluksesi suorituskykyvaatimusten täyttämiseksi vastineeksi aikaperusteisesta sitoumuksesta
Lisätietoja näistä vaihtoehdoista on kohdassa Amazonin kallioperän hinnoittelu.
Tässä viestissä kuvattu palvelimeton SaaS-viiteratkaisu voi soveltaa Amazon Bedrockin kulutussuunnitelmia tarjotakseen perus- ja premium-tasovaihtoehtoja loppukäyttäjille. Peruskäyttöön voisi kuulua Amazon Bedrockin on-demand- tai Provisioned Throughput -kulutus, ja se voi sisältää erityisiä käyttö- ja budjettirajoituksia. Vuokralaisrajat voidaan ottaa käyttöön rajoittamalla pyyntöjä pyyntöjen, tunnuksen koon tai budjetin allokoinnin perusteella. Premium-tason vuokralaisilla voisi olla omat resurssinsa Amazon Bedrockin varatulla läpimenokulutuksella. Nämä vuokralaiset liittyvät tyypillisesti tuotantotyökuormiin, jotka edellyttävät suurta suorituskykyä ja pientä viivettä Amazon Bedrock FM -laitteille.
Yhteenveto
Tässä viestissä keskustelimme siitä, kuinka rakentaa sisäinen SaaS-alusta, jolla päästään käsiksi perusmalleihin Amazon Bedrockin avulla usean vuokralaisen asennuksessa keskittyen kustannusten ja käytön seurantaan sekä kunkin vuokralaisen rajoittamiseen. Muita tutkittavia aiheita ovat olemassa olevien todennus- ja valtuutusratkaisujen integrointi organisaatioon, API-kerroksen tehostaminen sisältämään verkkopistorasiat kaksisuuntaista asiakaspalvelinvuorovaikutusta varten, sisällön suodatuksen ja muiden hallinnan suojakaiteiden lisääminen, useiden käyttöönottotasojen suunnittelu, muiden mikropalvelujen integrointi SaaS-palveluun. arkkitehtuuria ja paljon muuta.
Koko tämän ratkaisun koodi on saatavilla osoitteessa GitHub-arkisto.
Lisätietoja SaaS-pohjaisista kehyksistä on kohdassa SaaS Journey Framework: Uuden SaaS-ratkaisun rakentaminen AWS:lle.
Tietoja Tekijät
Hasan Poonawala on AWS:n vanhempi AI/ML Specialist Solutions -arkkitehti, joka työskentelee Healthcare and Life Sciences -asiakkaiden kanssa. Hasan auttaa suunnittelemaan, ottamaan käyttöön ja skaalaamaan generatiivisia tekoäly- ja koneoppimissovelluksia AWS:ssä. Hänellä on yli 15 vuoden yhdistetty työkokemus koneoppimisesta, ohjelmistokehityksestä ja datatieteestä pilvessä. Vapaa-ajallaan Hasan rakastaa tutkia luontoa ja viettää aikaa ystävien ja perheen kanssa.
Anastasia Tzeveleka on AWS:n vanhempi AI/ML Specialist Solutions -arkkitehti. Osana työtään hän auttaa asiakkaita kaikkialla EMEA-alueella rakentamaan perusmalleja ja luomaan skaalautuvia generatiivisia tekoäly- ja koneoppimisratkaisuja AWS-palveluiden avulla.
Bruei mäntää on generatiivisen AI- ja ML-asiantuntijaratkaisujen arkkitehti AWS:lle Milanossa. Hän työskentelee suurten asiakkaiden kanssa auttaakseen heitä ymmärtämään syvällisesti teknisiä tarpeitaan ja suunnittelemaan tekoäly- ja koneoppimisratkaisuja, jotka hyödyntävät AWS-pilviä ja Amazon Machine Learning -pinoa parhaalla mahdollisella tavalla. Hänen asiantuntemukseensa kuuluvat: koneoppiminen päästä päähän, koneoppimisen teollistuminen ja generatiivinen tekoäly. Hän nauttii ajan viettämisestä ystäviensä kanssa ja uusien paikkojen tutkimisesta sekä matkustamisesta uusiin kohteisiin.
Vikesh Pandey on Generative AI/ML Solutions -arkkitehti, joka on erikoistunut rahoituspalveluihin, joissa hän auttaa finanssiasiakkaita rakentamaan ja skaalaamaan Generative AI/ML -alustoja ja -ratkaisuja, jotka skaalautuvat satoihin jopa tuhansiin käyttäjiin. Vapaa-ajallaan Vikesh kirjoittaa mielellään erilaisille blogifoorumeille ja rakentaa legoja lapsensa kanssa.
- SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
- PlatoData.Network Vertical Generatiivinen Ai. Vahvista itseäsi. Pääsy tästä.
- PlatoAiStream. Web3 Intelligence. Tietoa laajennettu. Pääsy tästä.
- PlatoESG. hiili, CleanTech, energia, ympäristö, Aurinko, Jätehuolto. Pääsy tästä.
- PlatonHealth. Biotekniikan ja kliinisten kokeiden älykkyys. Pääsy tästä.
- Lähde: https://aws.amazon.com/blogs/machine-learning/build-an-internal-saas-service-with-cost-and-usage-tracking-for-foundation-models-on-amazon-bedrock/
- :on
- :On
- :ei
- :missä
- $ YLÖS
- 000
- 1
- 120
- 15 vuotta
- 15%
- 160
- 26%
- 500
- 7
- a
- Meistä
- pääsy
- Pääsy
- Tili
- poikki
- sopeuttaa
- lisää
- Lisäksi
- lisä-
- Lisäksi
- admin
- ylläpitäjät
- hyväksytty
- aggregaatit
- AI
- AI-mallit
- Tekoälyalusta
- AI / ML
- Kaikki
- jako
- sallia
- mahdollistaa
- pitkin
- jo
- Myös
- Amazon
- Amazonin koneoppiminen
- Amazon QuickSight
- Amazon Web Services
- an
- ja
- Toinen
- Antropinen
- Kaikki
- erilleen
- api
- API-käyttö
- API-AVAimet
- API
- Hakemus
- sovellukset
- käyttää
- lähestymistapa
- hyväksytty
- arkkitehtuuri
- arkkitehtuurit
- OVAT
- AS
- osoitettu
- liittyvä
- osakkuusyritysten
- At
- tilintarkastus
- Authentication
- lupa
- valtuutettu
- saatavissa
- AWS
- perustua
- perustiedot
- perusta
- BE
- koska
- Alku
- PARAS
- Paremmin
- välillä
- Uutiset ja media
- elin
- sekä
- laaja
- talousarvio
- rakentaa
- Rakentaminen
- liiketoiminta
- by
- laskettu
- laskee
- soittaa
- soittamalla
- CAN
- kyvyt
- kaapata
- kaappaa
- tapaus
- keskus
- keskuksissa
- keskitetty
- haasteet
- muuttuviin
- valinta
- asiakas
- asiakkaat
- pilvi
- koodi
- Pylväät
- yhdistetty
- Yhteinen
- Yritykset
- komponentti
- osat
- Laskea
- Konfigurointi
- liitäntä
- johdonmukainen
- muodostuu
- Console
- kuluttaa
- Kuluttajat
- kuluttaa
- kulutus
- pitoisuus
- ohjaus
- valvonta
- valvonta
- Hinta
- kustannukset
- voisi
- luoda
- luotu
- asiakassuhde
- Asiakkaat
- päivittäin
- tiedot
- tietojenkäsittely
- tietovarasto
- päivä
- omistautunut
- syvästi
- määritellä
- määritelty
- evätty
- osasto
- Riippuen
- sijoittaa
- käyttöön
- käyttöönotto
- lauennut
- kuvata
- on kuvattu
- Malli
- suunnittelu
- kohteet
- yksityiskohta
- yksityiskohdat
- kehitetty
- Kehitys
- kehitysryhmät
- kaavio
- eri
- mitat
- suoraan
- pohtia
- keskusteltiin
- do
- ei
- Dont
- kukin
- Aikaisemmin
- helppo
- vaikutus
- myöskään
- upottamisen
- EMEA
- mahdollistaa
- käytössä
- loppu
- päittäin
- päätepiste
- parantaa
- varmistaa
- Koko
- ympäristö
- ympäristöissä
- virhe
- perustaa
- Jopa
- tapahtuma
- esimerkki
- ylittää
- Vaihdetaan
- olemassa
- experience
- asiantuntemus
- selitti
- selittää
- tutkia
- Tutkiminen
- ilmaista
- laajennettu
- tuttu
- perhe
- filee
- suodatus
- taloudellinen
- rahoituspalvelut
- sopii
- Joustavuus
- virtaus
- Keskittää
- jälkeen
- seuraa
- varten
- muoto
- foorumit
- perusta
- perustava
- Perustukset
- Puitteet
- puitteet
- Taajuus
- ystäviä
- alkaen
- etuosa
- etupään
- täysin
- toiminto
- toiminnallinen
- toiminnallisuus
- tehtävät
- edelleen
- portti
- yhdyskäytäviä
- general
- syntyy
- synnyttää
- sukupolvi
- generatiivinen
- Generatiivinen AI
- saa
- GitHub
- tietty
- Go
- hallinto
- säännellään
- Ryhmä
- kahva
- Happening
- Olla
- ottaa
- he
- terveydenhuollon
- korkeus
- auttaa
- auttaa
- hänen
- tätä
- Korkea
- suorituskykyinen
- hänen
- isännät
- Miten
- Miten
- HTML
- http
- HTTPS
- Sadat
- ID
- tunniste
- tunnistaa
- Identiteetti
- if
- kuva
- Vaikutus
- toteuttaa
- täytäntöön
- in
- sisältää
- Mukaan lukien
- henkilökohtainen
- pääteltyihin
- tiedot
- Infrastruktuuri
- innovoida
- panos
- tuloa
- ohjeet
- yhdistää
- Integrointi
- integraatio
- olla vuorovaikutuksessa
- vuorovaikutus
- vuorovaikutukset
- liitäntä
- sisäinen
- tulee
- kutsuttuihin
- eristäminen
- kysymys
- antaneen
- IT
- kohdetta
- SEN
- matka
- jpg
- avain
- avaimet
- Lapsi
- Labs
- kielet
- suuri
- Sukunimi
- Viive
- kerros
- kerrokset
- johtava
- OPPIA
- oppiminen
- Taso
- elämä
- Life Sciences
- pitää
- tykkää
- rajat
- linja
- linjat
- lueteltu
- paikallinen
- hakkuu
- logiikka
- katso
- näyttää joltakin
- Erä
- rakastaa
- Matala
- kone
- koneoppiminen
- ylläpitäminen
- tehdä
- hoitaa
- onnistui
- johto
- toimitusjohtaja
- monet
- kartta
- maksimi
- Saattaa..
- mekanismit
- Tavata
- mainitsi
- Meta
- menetelmät
- MICROSERVICE
- microservices
- ehkä
- MILAN
- ML
- tila
- malli
- mallit
- monitori
- lisää
- eniten
- paljon
- moninkertainen
- luonto
- välttämätön
- Tarve
- tarvitaan
- tarpeet
- verkostoituminen
- Uusi
- numero
- numeroitu
- tapahtui
- of
- Tarjoukset
- on
- Tarpeen vaatiessa
- ONE
- vain
- avata
- avoimen lähdekoodin
- käyttää
- toiminta
- Vaihtoehdot
- or
- tilata
- organisaatio
- Muut
- ääriviivat
- ulostulo
- lähdöt
- yli
- oma
- sivulla
- parametri
- parametrit
- osa
- varten
- suorituskyky
- Oikeudet
- paikat
- suunnitelma
- suunnitelmat
- foorumi
- Platforms
- Platon
- Platonin tietotieto
- PlatonData
- politiikka
- pool
- Kirje
- mahdollinen
- powered
- edeltävä
- ennalta
- palkkio
- lahjat
- edellinen
- aiemmin
- Hinnat
- hinnoittelu
- yksityisyys
- yksityinen
- tuotanto
- Tuotteemme
- Ohjelmointi
- ohjelmointikielet
- projekti
- ehdotettu
- toimittaa
- mikäli
- tarjoajat
- tarjoaa
- tarjoamalla
- säännös
- Python
- kysymys
- nopeasti
- nostaa
- alue
- hinta
- Lue
- äskettäinen
- katso
- viite
- ilmoittautua
- rekisteröitymättä
- Rekisteröinti
- Säännellä
- merkityksellinen
- Raportit
- säilytyspaikka
- edustaa
- pyyntö
- pyynnöt
- edellyttää
- vaatimukset
- varattu
- Esittelymateriaalit
- kunnioittaen
- ne
- vastaavasti
- vastaus
- vastuullinen
- REST
- rajoittaa
- palata
- Tuotto
- Rooli
- reitit
- Sääntö
- ajaa
- toimii
- SaaS
- sama
- tallennettu
- skaalautuva
- Asteikko
- asteikot
- skenaariot
- aikataulu
- tiede
- tieteet
- laajuus
- osiot
- turvallisesti
- turvallisuus
- nähdä
- etsiä
- SELF
- lähettää
- vanhempi
- lähetetty
- erillinen
- palvelin
- serverless
- palvelu
- Palvelut
- setti
- Setit
- setup
- Jaa:
- yhteinen
- hän
- näyttää
- esitetty
- Yksinkertainen
- yksinkertaisuus
- single
- koot
- Tuotteemme
- ohjelmisto palveluna
- ohjelmistokehitys
- ratkaisu
- Ratkaisumme
- jonkin verran
- lähde
- erikoistunut
- asiantuntija
- erityinen
- erityisesti
- tekniset tiedot
- määritelty
- nopeus
- viettää
- menot
- Pysyvyys
- pino
- Alkaa
- Askeleet
- Levytila
- verkkokaupasta
- tallennettu
- varastot
- strategiat
- aliverkkoon
- onnistunut
- niin
- riittävä
- varma
- taulukko
- Kohde
- joukkue-
- tiimit
- Tekninen
- Elektroniikka
- sapluuna
- vuokralainen
- termi
- teksti
- että
- -
- tiedot
- heidän
- Niitä
- itse
- sitten
- Siellä.
- Nämä
- ne
- asiat
- tätä
- tuhansia
- Kautta
- suoritusteho
- porras
- aika
- Titaani
- että
- symbolinen
- tokens
- Aiheet
- Yhteensä
- raita
- Seuranta
- kappaleet
- totta
- kaksi
- tyyppi
- tyypillisesti
- ymmärtää
- unique
- avata
- päivitetty
- Käyttö
- käyttää
- käyttölaukku
- käytetty
- käyttäjä
- Käyttäjät
- käyttötarkoituksiin
- käyttämällä
- v1
- arvo
- eri
- versio
- versiot
- kautta
- Näytä
- näkyvyys
- visualisointi
- havainnollistaa
- we
- verkko
- verkkopalvelut
- Verkkopistokkeet
- HYVIN
- Mitä
- Mikä on
- kun
- joka
- vaikka
- KUKA
- leveys
- with
- sisällä
- ilman
- Referenssit
- työnkulku
- työskentely
- toimii
- olisi
- kirjoittaa
- vuotta
- Voit
- Sinun
- zephyrnet