Den generative AI-revolusjonen i spill PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Den generative AI-revolusjonen i spill

For å forstå hvor radikalt spilling er i ferd med å bli transformert av Generative AI, trenger du ikke lete lenger enn denne siste tiden Twitter post by @emmanuel_2m. I dette innlegget utforsker han bruken av Stable Diffusion + Dreambooth, populære 2D Generative AI-modeller, for å generere bilder av potions for et hypotetisk spill.

Det som er transformerende med dette arbeidet er ikke bare at det sparer tid og penger samtidig som det leverer kvalitet – og dermed knuse den klassiske trekanten «du kan bare ha to av kostnad, kvalitet eller hastighet». Kunstnere lager nå bilder av høy kvalitet i løpet av få timer som ellers ville tatt uker å generere for hånd. Det som virkelig er transformativt er at:

  • Denne kreative kraften er nå tilgjengelig for alle som kan lære noen få enkle verktøy.
  • Disse verktøyene kan skape et uendelig antall variasjoner på en svært iterativ måte.
  • Når den er trent, er prosessen i sanntid – resultatene er tilgjengelig nesten umiddelbart.

Det har ikke vært en teknologi så revolusjonerende for spill siden sanntids 3D. Bruk når som helst på å snakke med spillskapere, og følelsen av spenning og undring er til å ta og føle på. Så hvor går denne teknologien? Og hvordan vil det transformere spill? La oss først se på hva som er Generativ AI?

INNHOLDSFORTEGNELSE

Hva er Generativ AI

Generativ AI er en kategori for maskinlæring der datamaskiner kan generere originalt nytt innhold som svar på spørsmål fra brukeren. I dag er tekst og bilder de mest modne bruksområdene for denne teknologien, men det er arbeid på gang i praktisk talt alle kreative domener, fra animasjon, til lydeffekter, til musikk, til og med å lage virtuelle karakterer med fullstendige personligheter.

AI er ikke noe nytt i spill, selvfølgelig. Selv tidlige spill, som Ataris Pong, hadde datastyrte motstandere til å utfordre spilleren. Disse virtuelle fiendene kjørte imidlertid ikke AI slik vi kjenner det i dag. De var ganske enkelt skriptprosedyrer laget av spilldesignere. De simulerte en kunstig intelligent motstander, men de kunne ikke lære, og de var bare like gode som programmererne som bygde dem.

Det som er annerledes nå er mengden datakraft som er tilgjengelig, takket være raskere mikroprosessorer og skyen. Med denne kraften er det mulig å bygge store nevrale nettverk som kan identifisere mønstre og representasjoner i svært komplekse domener.

Dette blogginnlegget har to deler:

  • Del I består av våre observasjoner og spådommer for feltet Generativ AI for spill.
  • Del II er vårt markedskart over området, som skisserer de ulike segmentene og identifiserer nøkkelselskaper i hver.

INNHOLDSFORTEGNELSE

Antagelser

La oss først utforske noen antagelser som ligger til grunn for resten av dette blogginnlegget:

1. Mengden forskning som gjøres generelt AI vil fortsette å vokse, og skape stadig mer effektive teknikker

Vurder denne grafen over antall akademiske artikler publisert om maskinlæring eller kunstig intelligens i arXiv arkiv hver måned:

Den generative AI-revolusjonen i spill PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.Som du kan se, vokser antallet papirer eksponentielt, uten tegn til å avta. Og dette inkluderer bare publiserte artikler – mye av forskningen blir aldri publisert, og går direkte til åpen kildekode-modeller eller produkt-FoU. Resultatet er en eksplosjon i interesse og innovasjon.

2. Av all underholdning vil spill bli mest påvirket av Generative AI

Spill er den mest komplekse formen for underholdning, med tanke på det store antallet aktivatyper som er involvert (2D-kunst, 3D-kunst, lydeffekter, musikk, dialog osv.). Spill er også de mest interaktive, med stor vekt på sanntidsopplevelser. Dette skaper en bratt adgangsbarriere for nye spillutviklere, i tillegg til en høy kostnad for å produsere et moderne spill med toppkarakter. Det skaper også en enorm mulighet for generativ AI-avbrudd.

Den generative AI-revolusjonen i spill PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Vurder et spill som Red Dead Redemption 2, et av de dyreste spillene som noen gang er produsert, og koster nesten 500 millioner dollar å lage. Det er lett å se hvorfor – den har en av de vakreste, fullt realiserte virtuelle verdenene av alle spill på markedet. Det tok også nesten 8 år å bygge, har mer enn 1,000 ikke-spillbare karakterer (hver med sin egen personlighet, kunstverk og stemmeskuespiller), en verden på nesten 30 kvadratkilometer i størrelse, mer enn 100 oppdrag fordelt på 6 kapitler, og nesten 60 timer med musikk laget av over 100 musikere. Alt ved dette spillet er stort.

Den generative AI-revolusjonen i spill PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Sammenlign nå Red Dead Redemption 2 med Microsoft Flight Simulator, som ikke bare er stor, den er enorm. Microsoft Flight Simulator lar spillere fly rundt hele planeten Jorden, alle 197 millioner kvadratkilometer av den. Hvordan bygde Microsoft et så massivt spill? Ved å la en AI gjøre det. Microsoft samarbeidet med blackshark.ai, og trent en AI til generere en fotorealistisk 3D-verden fra 2D-satellittbilder.

Den generative AI-revolusjonen i spill PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Dette er et eksempel på et spill som bokstavelig talt ville vært umulig å bygge uten bruk av AI, og som dessuten drar nytte av det faktum at disse modellene kan forbedres kontinuerlig over tid. For eksempel kan de forbedre "motorveien kløverbladovergang"-modellen, kjøre hele byggeprosessen på nytt, og plutselig er alle motorveiovergangene på hele planeten forbedret.

3. Det vil være en generativ AI-modell for hver ressurs som er involvert i spillproduksjon

Så langt har 2D-bildegeneratorer som Stable Diffusion eller MidJourney fanget mesteparten av den populære spenningen over Generative AI på grunn av den iøynefallende naturen til bildene de kan generere. Men allerede er det Generative AI-modeller for praktisk talt alle eiendeler involvert i spill, fra 3D-modeller, til karakteranimasjoner, til dialog og musikk. Den andre halvdelen av dette blogginnlegget inneholder et markedskart som fremhever noen av selskapene som fokuserer på hver type innhold.

4. Prisen på innhold vil falle dramatisk, og i noen tilfeller gå effektivt til null.

Når du snakker med spillutviklere som eksperimenterer med å integrere Generativ AI i produksjonspipelinen, er den største spenningen over den dramatiske reduksjonen i tid og kostnader. En utvikler har fortalt oss at tiden deres til å generere konseptkunst for et enkelt bilde, fra start til slutt, har gått ned fra 3 uker til en enkelt time: en reduksjon på 120 til 1. Vi tror lignende besparelser vil være mulig på tvers av hele produksjonsrørledningen.

For å være tydelig, artister står ikke i fare for å bli erstattet. Det betyr at kunstnere ikke lenger trenger å gjøre alt arbeidet selv: de kan nå sette den første kreative retningen, og deretter overføre mye av den tidkrevende og tekniske utførelsen til en AI. I dette er de som cel-malere fra de tidlige dagene av håndtegnet animasjon, der svært dyktige "inkers" tegnet konturene av animasjon, og deretter hærer av rimeligere "malere" ville gjøre det tidkrevende arbeidet med å male animasjonsceller, fyller ut linjene. Det er "autofullføringen" for spillskaping.

5. Vi er fortsatt i startfasen av denne revolusjonen, og mange praksiser må fortsatt forbedres

Til tross for all spenningen den siste tiden, er vi fortsatt bare på startstreken. Det er en enorm mengde arbeid foran oss når vi finner ut hvordan vi kan utnytte denne nye teknologien for spill, og enorme muligheter vil genereres for selskaper som beveger seg raskt inn i dette nye området.

INNHOLDSFORTEGNELSE

Spådommer

Gitt disse forutsetningene, her er noen spådommer for hvordan spillindustrien kan bli transformert:

1. Å lære å bruke Generativ AI effektivt vil bli en salgbar ferdighet

Vi ser allerede at noen eksperimenterer bruker Generativ AI mer effektivt enn andre. For å få mest mulig ut av denne nye teknologien kreves det å bruke en rekke verktøy og teknikker og vite hvordan man spretter mellom dem. Vi spår at dette vil bli en salgbar ferdighet, som kombinerer den kreative visjonen til en artist med de tekniske ferdighetene til en programmerer.

Chris Anderson er kjent for å si: "Hver overflod skaper en ny knapphet." Etter hvert som innholdet blir rikelig, tror vi at det er artistene som vet hvordan de skal samarbeide mest effektivt med AI-verktøyene som vil være mest mangelvare.

For eksempel, å bruke Generative AI til produksjon av kunstverk har spesielle utfordringer, inkludert:

  • Sammenheng. Med et hvilket som helst produksjonselement må du kunne gjøre endringer eller redigeringer av innholdselementet underveis. Med et AI-verktøy betyr det at du må være i stand til å reprodusere aktivaet med samme spørsmål, slik at du deretter kan gjøre endringer. Dette kan være vanskelig ettersom den samme forespørselen kan generere svært forskjellige utfall.
  • Stil. Det er viktig for all kunst i et gitt spill å ha en konsistent stil – noe som betyr at verktøyene dine må trenes på eller på annen måte knyttes til din gitte stil.

2. Å senke barrierer vil resultere i mer risikotaking og kreativ utforskning

Vi kan snart gå inn i en ny "gullalder" for spillutvikling, der en lavere inngangsbarriere resulterer i en eksplosjon av mer innovative og kreative spill. Ikke bare fordi lavere produksjonskostnader gir lavere risiko, men fordi disse verktøyene låser opp muligheten til å lage innhold av høy kvalitet for et bredere publikum. Som fører til neste spådom...

3. En økning i AI-assisterte "mikrospillstudioer"

Bevæpnet med Generative AI-verktøy og -tjenester vil vi begynne å se mer levedyktige kommersielle spill produsert av små "mikrostudioer" med bare 1 eller 2 ansatte. Ideen om et lite indie-spillstudio er ikke nytt – hitspill Blant oss ble opprettet av studio Innersloth med bare 5 ansatte – men størrelsen og omfanget av spillene disse små studioene kan lage vil vokse. Dette vil resultere i…

4. En økning i antall spill utgitt hvert år

Suksessen til Unity og Roblox har vist at å tilby kraftige kreative verktøy resulterer i at flere spill bygges. Generativ AI vil senke baren ytterligere, og skape et enda større antall spill. Industrien lider allerede av oppdagelsesutfordringer – mer enn 10,000 XNUMX spill ble lagt til Steam bare i fjor – og dette vil legge enda mer press på oppdagelsen. Men vi vil også se...

5. Nye spilltyper opprettet som ikke var mulig før Generativ AI

Vi vil se nye spillsjangre oppfunnet som rett og slett ikke var mulig uten Generative AI. Vi har allerede snakket om Microsofts flysimulator, men det vil bli oppfunnet helt nye sjangere som er avhengige av sanntidsgenerering av nytt innhold.

Vurder Arrowmancer, Ved spelbrush. Dette er et RPG-spill som inneholder AI-skapte karakterer for nesten ubegrenset ny spilling.

Vi vet også om en annen spillutvikler som bruker AI for å la spillere lage sin egen avatar i spillet. Tidligere hadde de en samling håndtegnede avatarbilder som spillere kunne mikse og matche for å lage sin avatar – nå har de kastet dette helt ut, og genererer ganske enkelt avatarbildet fra spillerens beskrivelse. Å la spillere generere innhold gjennom en AI er tryggere enn å la spillere laste opp sitt eget innhold fra bunnen av, siden AI-en kan trenes opp til å unngå å lage støtende innhold, samtidig som det gir spillerne en større følelse av eierskap.

6. Verdien vil tilfalle bransjespesifikke AI-verktøy, og ikke bare grunnleggende modeller

Spenningen og suset rundt grunnleggende modeller som Stable Diffusion og Midjourney genererer iøynefallende verdivurderinger, men den fortsatte flommen av ny forskning sikrer at nye modeller vil komme og gå etter hvert som nye teknikker raffineres. Vurder nettstedsøketrafikk til 3 populære Generative AI-modeller: Dall-E, Midjourney og Stable Diffusion. Hver ny modell har sin tur i søkelyset.

Den generative AI-revolusjonen i spill PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

En alternativ tilnærming kan være å bygge bransjetilpassede suiter med verktøy som fokuserer på Generative AI-behovene til en gitt bransje, med dyp forståelse av et bestemt publikum, og rik integrasjon i eksisterende produksjonsrørledninger (som Unity eller Unreal for spill).

Et godt eksempel er Rullebane som retter seg mot behovene til videoskapere med AI-assisterte verktøy som videoredigering, fjerning av grønn skjerm, maling og bevegelsessporing. Verktøy som dette kan bygge opp og tjene penger på et gitt publikum, og legge til nye modeller over tid. Vi har ennå ikke sett en suite som Runway for spill dukke opp ennå, men vi vet at det er et rom for aktiv utvikling.

7. Juridiske utfordringer kommer

Det alle disse Generative AI-modellene har til felles, er at de trenes opp ved hjelp av massive datasett med innhold, ofte skapt ved å skrape Internett selv. Stabil diffusjon, for eksempel, er trent på mer enn 5 milliarder bilde/teksting-par, skrapet fra nettet.

For øyeblikket hevder disse modellene å operere under "fair use" copyright-doktrinen, men dette argumentet har ennå ikke blitt definitivt testet i retten. Det virker klart det juridiske utfordringer kommer som sannsynligvis vil endre landskapet til Generative AI.

Det er mulig at store studioer vil søke konkurransefortrinn ved å bygge proprietære modeller bygget på internt innhold de har klare rettigheter og rettigheter til. Microsoft er for eksempel spesielt godt posisjonert her med 23 første feststudioer i dag, og ytterligere 7 etter oppkjøpet av Activision stenges.

8. Programmering vil ikke bli forstyrret like dypt som kunstnerisk innhold – i hvert fall ikke ennå

Programvareutvikling er den andre store kostnaden ved spillutvikling, men som våre kolleger på a16z Enterprise-teamet har delt i deres nylige blogginnlegg, Kunsten er ikke død, den er bare maskingenerert, å generere kode med en AI-modell krever mer testing og verifisering, og har dermed en mindre produktivitetsforbedring enn å generere kreative eiendeler. Kodeverktøy som Copilot kan gi moderate ytelsesforbedringer for ingeniører, men vil ikke ha samme effekt ... i hvert fall når som helst snart.

INNHOLDSFORTEGNELSE

Anbefalinger

Basert på disse spådommene tilbyr vi følgende anbefalinger:

1. Begynn å utforske Generative AI nå

Det kommer til å ta en stund å finne ut hvordan du fullt ut kan utnytte kraften til denne kommende Generative AI-revolusjonen. Bedrifter som starter nå vil ha en fordel senere. Vi kjenner flere studioer som har interne eksperimentelle prosjekter på gang for å utforske hvordan disse teknikkene kan påvirke produksjonen.

2. Se etter muligheter for markedskart

Noen deler av markedskartet vårt er allerede veldig overfylt, som animasjoner eller tale og dialog, men andre områder er vidt åpne. Vi oppfordrer gründere som er interessert i dette området til å fokusere innsatsen på områdene som fortsatt er uutforsket, for eksempel "Runway for Games".

INNHOLDSFORTEGNELSE

Markedets nåværende tilstand

Vi har laget et markedskart for å fange en liste over selskapene vi har identifisert i hver av disse kategoriene der vi ser Generative AI som påvirker spill. Dette blogginnlegget går gjennom hver av disse kategoriene, forklarer det litt mer detaljert, og fremhever de mest spennende selskapene i hver kategori.

Den generative AI-revolusjonen i spill PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

INNHOLDSFORTEGNELSE

2D-bilder

Generering av 2D-bilder fra tekstmeldinger er allerede et av de mest brukte områdene innen generativ AI. Verktøy som midt på reisen, Stabil diffusjonog Dall-E 2 kan generere høykvalitets 2D-bilder fra tekst, og har allerede funnet veien inn i spillproduksjon på flere stadier av spillets livssyklus.

Konseptkunst

Generative AI-verktøy er utmerkede til å "ideere" eller hjelpe ikke-artister, som spilldesignere, å utforske konsepter og ideer veldig raskt for å generere konseptkunstverk, en nøkkeldel av produksjonsprosessen. For eksempel bruker ett studio (som forblir anonym) flere av disse verktøyene sammen for å radikalt fremskynde konseptkunstprosessen deres, og det tar en enkelt dag å lage et bilde som tidligere ville tatt så lang tid som 3 uker.

  • For det første bruker spilldesignerne deres Midjourney til å utforske forskjellige ideer og generere bilder de synes er inspirerende.
  • Disse blir overført til en profesjonell konseptkunstner som setter dem sammen og maler over resultatet for å skape et enkelt sammenhengende bilde – som deretter mates inn i Stable Diffusion for å lage en haug med variasjoner.
  • De diskuterer disse variasjonene, velger en, maler inn noen redigeringer manuelt – så gjentar de prosessen til de er fornøyd med resultatet.
  • På det stadiet kan du sende dette bildet tilbake til Stable Diffusion en siste gang for å "oppskalere" det for å lage det siste kunstverket.

2D Produksjon Art

Noen studioer eksperimenterer allerede med å bruke de samme verktøyene for produksjonskunst i spillet. For eksempel, her er en fin opplæring fra Albert Bozesan om å bruke stabil diffusjon for å lage 2D-ressurser i spillet.

INNHOLDSFORTEGNELSE

3D-kunstverk

3D-ressurser er byggesteinen i alle moderne spill, så vel som den kommende metaversen. En virtuell verden, eller spillnivå, er egentlig bare en samling av 3D-ressurser, plassert og modifisert for å fylle miljøet. Å lage et 3D-element er imidlertid mer komplekst enn å lage et 2D-bilde, og involverer flere trinn, inkludert å lage en 3D-modell og legge til teksturer og effekter. For animerte karakterer innebærer det også å lage et internt "skjelett", og deretter lage animasjoner på toppen av det skjelettet.

Vi ser flere forskjellige startups som går etter hvert trinn i denne 3D-opprettingsprosessen, inkludert modelloppretting, karakteranimasjon og nivåbygging. Dette er imidlertid ikke et løst problem ennå – ingen av løsningene er klare til å bli fullt integrert i produksjonen ennå.

3D-ressurser

Startups som prøver å løse problemet med å lage 3D-modeller inkluderer Kaedim, Mirageog Hypotetisk. Større selskaper ser også på problemet, inkludert Nvidias Få 3D og Autodesks ClipForge. Kaedim og Get3d er fokusert på bilde-til-3D; ClipForge og Mirage er fokusert på tekst-til-3D, mens Hypotetic er interessert i både tekst-til-3D-søk, så vel som bilde-til-3D.

3D teksturer

En 3D-modell ser bare like realistisk ut som teksturen eller materialene som er påført nettet. Å bestemme hvilken mosegrodd, forvitret steintekstur som skal brukes på en middelalderslottmodell kan endre utseendet og følelsen til en scene fullstendig. Teksturer inneholder metadata om hvordan lys reagerer på materialet (f.eks. ruhet, glans osv.). Å la artister enkelt generere teksturer basert på tekst- eller bildeoppfordringer vil være enormt verdifullt for å øke iterasjonshastigheten i den kreative prosessen. Flere lag forfølger denne muligheten, inkludert BariumAI, ponzuog ArmorLab.

animasjon

Å lage flott animasjon er en av de mest tidkrevende, dyre og dyktige delene av spillopprettingsprosessen. En måte å redusere kostnadene på, og lage mer realistisk animasjon, er å bruke motion capture, der du setter en skuespiller eller danser i en motion capture-drakt og registrerer dem i bevegelse i en spesialinstrumentert motion capture-scene.

Vi ser nå Generative AI-modeller som kan fange animasjoner rett fra en video. Dette er mye mer effektivt, både fordi det fjerner behovet for en kostbar motion capture-rigg, og fordi det betyr at du kan fange animasjoner fra eksisterende videoer. Et annet spennende aspekt ved disse modellene er at de også kan brukes til å bruke filtre på eksisterende animasjoner, for eksempel å få dem til å se fulle, gamle eller glade ut. Selskaper som går etter denne plassen inkluderer Kinetix, Deep Motion, Radikal, Flytt Aiog Plask.

Nivådesign og verdensbygging

En av de mest tidkrevende aspektene ved spillskaping er å bygge ut verden av et spill, en oppgave som generativ AI burde være godt egnet til. Spill som Minecraft, No Man's Sky og Diablo er allerede kjent for å bruke prosedyreteknikker for å generere nivåene deres, der nivåer lages tilfeldig, forskjellige hver gang, men følger regler fastsatt av nivådesigneren. Et stort salgsargument for den nye Unreal 5-spillmotoren er samlingen av prosedyreverktøy for åpen verdensdesign, for eksempel plassering av bladverk.

Vi har sett noen få initiativ i rommet, som Promethean, MLXAR, eller Meta's Byggmester Bot, og tror det bare er et spørsmål om tid før generative teknikker i stor grad erstatter prosedyreteknikker. Det har vært akademisk forskning i rommet en stund, bl.a generative teknikker for Minecraft or nivådesign i Doom.

En annen overbevisende grunn til å se frem til generative AI-verktøy for nivådesign vil være muligheten til å lage nivåer og verdener i forskjellige stiler. Du kan tenke deg å spørre verktøy for å skape en verden i 1920-tallets flapper-æra New York, vs dystopisk blade-runner-aktig fremtid, vs. Tolkien-aktig fantasiverden.

Følgende konsepter ble generert av Midjourney ved å bruke ledeteksten, "et spillnivå i stil med ..."

lyd

Lyd og musikk er en stor del av spillopplevelsen. Vi begynner å se selskaper som bruker Generative AI for å generere lyd for å utfylle arbeidet som allerede skjer på grafikksiden.

Lydeffekter

Lydeffekter er et attraktivt åpent område for kunstig intelligens. Det har vært akademiske artikler utforske ideen om å bruke AI for å generere "foley" i film (f.eks. fotspor), men få kommersielle produkter i spill ennå.

Vi tror dette bare er et spørsmål om tid, siden den interaktive naturen til spill gjør dette til en åpenbar applikasjon for generativ AI, som både skaper statiske lydeffekter som en del av produksjonen ("laserpistollyd, i stil med Star Wars"), og lage interaktive lydeffekter i sanntid under kjøring.

Tenk på noe så enkelt som å generere fottrinnlyder for spillerens karakter. De fleste spill løser dette ved å inkludere et lite antall forhåndsinnspilte fottrinnlyder: gå på gress, gå på grus, løpe på gress, løpe på grus osv. Disse er kjedelige å generere og administrere, og høres repeterende og urealistiske ut under kjøring.

En bedre tilnærming ville være en sanntidsgenerativ AI-modell for foley-lydeffekter, som kan generere passende lydeffekter, på farten, litt annerledes hver gang, som reagerer på parametere i spillet som bakkeoverflate, karaktervekt, ganglag, fottøy osv.

musikk

Musikk har alltid vært en utfordring for spill. Det er viktig, siden det kan bidra til å sette den emosjonelle tonen akkurat som det gjør i film eller TV, men siden spill kan vare i hundrevis eller til og med tusenvis av timer, kan det raskt bli repeterende eller irriterende. På grunn av spills interaktive natur kan det også være vanskelig for musikken å matche nøyaktig det som skjer på skjermen til enhver tid.

Adaptiv musikk har vært et tema innen spilllyd i mer enn to tiår, og går helt tilbake til Microsofts «Direktemusikk” system for å lage interaktiv musikk. DirectMusic ble aldri mye tilpasset, hovedsakelig på grunn av vanskeligheten med å komponere i formatet. Bare noen få spill, som Monoliths Ingen lever for alltid, skapte virkelig interaktive partiturer.

Nå ser vi en rekke selskaper som prøver å lage AI-generert musikk, som f.eks Lydfull, Musiker, harmoni, Uendelig albumog Ava. Og mens noen verktøy i dag, som Jukebox av Open AI, er svært beregningsintensive og kan ikke kjøre i sanntid, de fleste kan kjøre i sanntid når den første modellen er bygget.

Tale og dialog

Det er et stort antall selskaper som prøver å lage realistiske stemmer for karakterer i spillet. Dette er ikke overraskende gitt den lange historien med å prøve å gi datamaskiner en stemme gjennom talesyntese. Bedrifter inkluderer Sonantisk, Coqui, Replica Studios, Ser ut som.ai, Readspeaker.ai, og mange flere.

Det er flere fordeler med å bruke generativ AI for tale, noe som delvis forklarer hvorfor denne plassen er så overfylt.

  • Generer dialog mens du er på farten. Vanligvis er tale i spill forhåndsinnspilt fra stemmeskuespillere, men disse er begrenset til forhåndsinnspilte hermetiske taler. Med generativ AI-dialog kan karakterer si hva som helst – noe som betyr at de kan reagere fullt ut på hva spillerne gjør. Kombinert med mer intelligente AI-modeller for NPC-er (utenfor rammen av denne bloggen, men et like spennende område for innovasjon akkurat nå), kommer snart løftet om spill som er fullstendig reaktive for spillere.
  • Rollespill. Mange spillere ønsker å spille som fantasifigurer som ligner lite på deres virkelige identitet. Denne fantasien bryter sammen så snart spillerne snakker med sine egne stemmer. Ved å bruke en generert stemme som matcher spillerens avatar opprettholdes denne illusjonen.
    Styre. Etter hvert som talen genereres, kan du kontrollere nyansen til stemmen som tambre, bøyning, emosjonell resonans, fonemlengde, aksenter og mer.
  • Lokalisering. Lar dialogen oversettes til alle språk og snakkes med samme stemme. Selskaper liker Deepdub er spesifikt fokusert på denne nisjen.

INNHOLDSFORTEGNELSE

NPC-er eller spillerkarakterer

Mange startups ser på å bruke generativ AI for å lage troverdige karakterer du kan samhandle med, delvis fordi dette er et marked med så bred anvendelighet utenfor spill, for eksempel virtuelle assistenter eller resepsjonister.

Arbeidet med å skape troverdige karakterer går tilbake til begynnelsen av AI-forskning. Faktisk er definisjonen av den klassiske "Turing-testen" for kunstig intelligens at et menneske ikke skal være i stand til å skille mellom en chat-samtale med en AI versus et menneske.

På dette tidspunktet er det hundrevis av selskaper som bygger generelle chatbots, mange av dem drevet av GPT-3-lignende språkmodeller. Et mindre antall prøver spesifikt å bygge chatbots for underholdningsformål, som f.eks replika og Anima som prøver å bygge virtuelle venner. Konseptet med å date en virtuell kjæreste, som utforsket i filmen Henne, kan være nærmere enn du tror.

Vi ser nå neste iterasjon av disse chatbot-plattformene, som f.eks Charisma.ai, Convai.comeller Inworld.ai, ment å drive fullt gjengitte 3D-karakterer, med følelser og handlefrihet, med verktøy som lar skaperen gi disse karakterene mål. Dette er viktig hvis de skal passe inn i et spill eller ha en narrativ plass i å fremme handlingen fremover, i motsetning til rent vinduspredning.

INNHOLDSFORTEGNELSE

Alt-i-ett-plattformer

Et av de mest vellykkede generative AI-verktøyene for øvrig er Runwayml.com, fordi den samler en bred pakke med skaperverktøy i en enkelt pakke. Foreløpig er det ingen slik plattform som serverer videospill, og vi tror dette er en oversett mulighet. Vi vil gjerne investere i en løsning som inneholder:

  • Komplett sett med generative AI-verktøy som dekker hele produksjonsprosessen. (kode, aktivagenerering, teksturer, lyd, beskrivelser osv.)
  • Tett integrert med populære spillmotorer som Unreal og Unity.
  • Designet for å passe inn i en typisk spillproduksjonspipeline.

INNHOLDSFORTEGNELSE

konklusjonen

Dette er en utrolig tid å være en spillskaper på! Takket være verktøyene som er beskrevet i dette blogginnlegget, har det aldri vært enklere å generere innholdet som trengs for å bygge et spill – selv om spillet ditt er like stort som hele planeten!

Det er til og med mulig å en dag forestille seg et helt personlig tilpasset spill, laget kun for spilleren, basert på nøyaktig hva spilleren ønsker. Dette har vært i science fiction lenge – som «AI Mind Game» i Ender's Game, eller holodecket i Star Trek. Men med verktøyene beskrevet i dette blogginnlegget som går så raskt som de er, er det ikke vanskelig å forestille seg at denne virkeligheten er rett rundt hjørnet.

Hvis du er en grunnlegger, eller potensiell grunnlegger, interessert i å bygge et AI for spillselskap, vennligst ta kontakt! Vi ønsker å høre fra deg!

***

Synspunktene som er uttrykt her, er de fra individuelle AH Capital Management, LLC (“a16z”) personell som er sitert og er ikke synspunktene til a16z eller dets tilknyttede selskaper. Visse opplysninger her er innhentet fra tredjepartskilder, inkludert fra porteføljeselskaper av fond forvaltet av a16z. Selv om a16z er hentet fra kilder som antas å være pålitelige, har ikke a16z uavhengig verifisert slik informasjon og gir ingen representasjoner om den nåværende eller varige nøyaktigheten til informasjonen eller dens hensiktsmessighet for en gitt situasjon. I tillegg kan dette innholdet inkludere tredjepartsannonser; aXNUMXz har ikke vurdert slike annonser og støtter ikke noe reklameinnhold som finnes deri.

Dette innholdet er kun gitt for informasjonsformål, og bør ikke stoles på som juridisk, forretningsmessig, investerings- eller skatterådgivning. Du bør rådføre deg med dine egne rådgivere om disse sakene. Referanser til verdipapirer eller digitale eiendeler er kun for illustrasjonsformål, og utgjør ikke en investeringsanbefaling eller tilbud om å tilby investeringsrådgivningstjenester. Videre er dette innholdet ikke rettet mot eller ment for bruk av noen investorer eller potensielle investorer, og kan ikke under noen omstendigheter stoles på når du tar en beslutning om å investere i et fond som forvaltes av a16z. (Et tilbud om å investere i et a16z-fond vil kun gis av det private emisjonsmemorandumet, tegningsavtalen og annen relevant dokumentasjon for et slikt fond og bør leses i sin helhet.) Eventuelle investeringer eller porteføljeselskaper nevnt, referert til, eller beskrevet er ikke representative for alle investeringer i kjøretøy forvaltet av a16z, og det kan ikke gis noen garanti for at investeringene vil være lønnsomme eller at andre investeringer som gjøres i fremtiden vil ha lignende egenskaper eller resultater. En liste over investeringer foretatt av fond forvaltet av Andreessen Horowitz (unntatt investeringer som utstederen ikke har gitt tillatelse til at a16z kan offentliggjøre så vel som uanmeldte investeringer i børsnoterte digitale eiendeler) er tilgjengelig på https://a16z.com/investments /.

Diagrammer og grafer gitt i er kun for informasjonsformål og bør ikke stoles på når du tar investeringsbeslutninger. Tidligere resultater er ikke en indikasjon på fremtidige resultater. Innholdet taler kun fra den angitte datoen. Eventuelle anslag, estimater, prognoser, mål, prospekter og/eller meninger uttrykt i dette materialet kan endres uten varsel og kan avvike eller være i strid med meninger uttrykt av andre. Vennligst se https://a16z.com/disclosures for ytterligere viktig informasjon.

Tidstempel:

Mer fra Andreessen Horowitz