Rewolucja generatywnej sztucznej inteligencji w grach PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Generatywna rewolucja AI w grach

Aby zrozumieć, jak radykalnie zmieni się granie przez generatywną sztuczną inteligencję, nie szukaj dalej Twitter postu by @emmanuel_2m. W tym poście bada użycie Stable Diffusion + Dreambooth, popularnych generatywnych modeli sztucznej inteligencji 2D, do generowania obrazów mikstur do hipotetycznej gry.

To, co jest przełomowe w tej pracy, to nie tylko oszczędność czasu i pieniędzy przy jednoczesnym zapewnieniu jakości – w ten sposób rozbijając klasyczny trójkąt „możesz mieć tylko dwa koszty, jakość lub szybkość”. Artyści tworzą teraz wysokiej jakości obrazy w ciągu kilku godzin, których ręczne wygenerowanie zajęłoby tygodnie. To, co naprawdę zmienia, to fakt, że:

  • Ta twórcza moc jest teraz dostępna dla każdego, kto potrafi nauczyć się kilku prostych narzędzi.
  • Narzędzia te mogą tworzyć nieskończoną liczbę wariacji w wysoce iteracyjny sposób.
  • Po przeszkoleniu proces odbywa się w czasie rzeczywistym – wyniki są dostępne niemal natychmiast.

Od czasów 3D w czasie rzeczywistym nie było technologii tak rewolucyjnej dla gier. Poświęć dowolny czas na rozmowy z twórcami gier, a poczujesz podekscytowanie i zdumienie. Dokąd więc zmierza ta technologia? I jak to zmieni gry? Najpierw jednak przyjrzyjmy się, czym jest generatywna sztuczna inteligencja?

SPIS TREŚCI

Co to jest generatywna sztuczna inteligencja

Generatywna sztuczna inteligencja to kategoria uczenia maszynowego, w której komputery mogą generować oryginalne nowe treści w odpowiedzi na monity użytkownika. Obecnie tekst i obrazy są najbardziej dojrzałymi zastosowaniami tej technologii, ale trwają prace nad praktycznie każdą dziedziną twórczości, od animacji, przez efekty dźwiękowe, muzykę, a nawet tworzenie wirtualnych postaci o w pełni ukształtowanych osobowościach.

Sztuczna inteligencja nie jest oczywiście niczym nowym w grach. Nawet wczesne gry, takie jak Atari's Pong, miały kontrolowanych przez komputer przeciwników, którzy rzucali wyzwanie graczowi. Ci wirtualni wrogowie nie korzystali jednak ze sztucznej inteligencji, jaką znamy dzisiaj. Były to po prostu oskryptowane procedury opracowane przez projektantów gier. Symulowali sztucznie inteligentnego przeciwnika, ale nie mogli się uczyć i byli tak dobrzy, jak programiści, którzy je zbudowali.

Tym, co jest teraz inne, jest ilość dostępnej mocy obliczeniowej dzięki szybszym mikroprocesorom i chmurze. Dzięki tej mocy możliwe jest budowanie dużych sieci neuronowych, które mogą identyfikować wzorce i reprezentacje w bardzo złożonych domenach.

Ten wpis na blogu składa się z dwóch części:

  • Część I składa się z naszych obserwacji i przewidywań w zakresie generatywnej sztucznej inteligencji w grach.
  • Część II to nasza mapa rynku przestrzeni, przedstawiająca różne segmenty i identyfikująca kluczowe firmy w każdym z nich.

SPIS TREŚCI

Założenia

Najpierw przyjrzyjmy się pewnym założeniom leżącym u podstaw pozostałej części tego wpisu na blogu:

1. Ilość badań prowadzonych w zakresie sztucznej inteligencji będzie nadal rosła, tworząc coraz bardziej efektywne techniki

Rozważ ten wykres liczby artykułów naukowych opublikowanych na temat uczenia maszynowego lub sztucznej inteligencji w archiwum arXiv każdego miesiąca:

Rewolucja generatywnej sztucznej inteligencji w grach PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.Jak widać, liczba artykułów rośnie wykładniczo i nie widać oznak spowolnienia. Obejmuje to tylko opublikowane artykuły – większość badań nigdy nie jest nawet publikowana, przechodząc bezpośrednio do modeli open source lub badań i rozwoju produktów. Rezultatem jest eksplozja zainteresowania i innowacji.

2. Ze wszystkich rodzajów rozrywki największy wpływ na gry będzie miała generatywna sztuczna inteligencja

Gry są najbardziej złożoną formą rozrywki pod względem samej liczby typów zasobów (grafika 2D, grafika 3D, efekty dźwiękowe, muzyka, dialogi itp.). Gry są również najbardziej interaktywne, z dużym naciskiem na doświadczenia w czasie rzeczywistym. Stwarza to stromą barierę wejścia dla nowych twórców gier, a także wysokie koszty wyprodukowania nowoczesnej gry, która zajmuje czołowe miejsca na listach przebojów. Stwarza to również ogromną szansę na zakłócenia generatywnej sztucznej inteligencji.

Rewolucja generatywnej sztucznej inteligencji w grach PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Rozważ grę typu Red Dead Redemption 2, jedna z najdroższych gier, jakie kiedykolwiek wyprodukowano, a jej wyprodukowanie kosztowało prawie 500 milionów dolarów. Łatwo zrozumieć, dlaczego – ma jeden z najpiękniejszych, w pełni zrealizowanych wirtualnych światów ze wszystkich gier na rynku. Budowa zajęła prawie 8 lat, zawiera ponad 1,000 niegrywalnych postaci (każda z własną osobowością, grafiką i aktorem głosowym), świat o powierzchni prawie 30 mil kwadratowych, ponad 100 misji podzielonych na 6 rozdziałów i prawie 60 godzin muzyki stworzonej przez ponad 100 muzyków. Wszystko w tej grze jest duże.

Rewolucja generatywnej sztucznej inteligencji w grach PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Teraz porównaj Red Dead Redemption 2 z Microsoft Flight Simulator, który jest nie tylko duży, jest ogromny. Microsoft Flight Simulator umożliwia graczom latanie po całej planecie Ziemi, wszystkich jej 197 milionach mil kwadratowych. Jak Microsoft stworzył tak potężną grę? Pozwalając AI to zrobić. Microsoft współpracuje z blackshark.aii wyszkolił sztuczną inteligencję generować fotorealistyczny świat 3D z obrazów satelitarnych 2D.

Rewolucja generatywnej sztucznej inteligencji w grach PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Jest to przykład gry, której zbudowanie byłoby dosłownie niemożliwe bez użycia sztucznej inteligencji, a ponadto czerpie korzyści z faktu, że modele te można stale ulepszać w miarę upływu czasu. Na przykład mogą udoskonalić model „wiaduktu autostrady koniczyny”, ponownie uruchomić cały proces budowy i nagle wszystkie wiadukty autostrad na całej planecie zostaną ulepszone.

3. Dla każdego zasobu zaangażowanego w produkcję gry będzie generatywny model sztucznej inteligencji

Do tej pory generatory obrazów 2D, takie jak Stable Diffusion lub MidJourney, zdobyły większość popularnego entuzjazmu w stosunku do Generative AI ze względu na przyciągający wzrok charakter obrazów, które mogą generować. Ale już istnieją modele Generative AI dla praktycznie wszystkich zasobów związanych z grami, od modeli 3D, przez animacje postaci, po dialogi i muzykę. Druga połowa tego wpisu na blogu zawiera mapę rynku, na której zaznaczono niektóre firmy koncentrujące się na każdym typie treści.

4. Ceny treści drastycznie spadną, w niektórych przypadkach praktycznie do zera.

Podczas rozmów z twórcami gier, którzy eksperymentują z integracją Generative AI w swoich procesach produkcyjnych, największą ekscytacją jest radykalna redukcja czasu i kosztów. Jeden z programistów powiedział nam, że czas potrzebny na wygenerowanie grafiki koncepcyjnej dla pojedynczego obrazu, od początku do końca, spadł z 3 tygodni do jednej godziny: redukcja o 120 do 1. Uważamy, że podobne oszczędności będą możliwe w całym rurociągu produkcyjnym.

Żeby było jasne, artystom nie grozi zastąpienie. Oznacza to, że artyści nie muszą już sami wykonywać całej pracy: mogą teraz wyznaczyć początkowy kierunek twórczy, a następnie przekazać większość czasochłonnej i technicznej realizacji sztucznej inteligencji. Pod tym względem są jak malarze cel z początków animacji odręcznej, w których wysoko wykwalifikowani „tuszownicy” rysowali kontury animacji, a następnie armie tańszych „malarzy” wykonywały czasochłonną pracę polegającą na malowaniu cele animacji, wypełnianie linii. Jest to „automatyczne uzupełnianie” podczas tworzenia gier.

5. Wciąż jesteśmy w powijakach tej rewolucji i wiele praktyk wymaga jeszcze dopracowania

Pomimo całego zamieszania w ostatnim czasie, wciąż jesteśmy na linii startu. Przed nami ogromna praca, gdy wymyślimy, jak wykorzystać tę nową technologię w grach, a firmy, które szybko wkroczą w tę nową przestrzeń, stworzą ogromne możliwości.

SPIS TREŚCI

Przewidywania

Biorąc pod uwagę te założenia, oto kilka prognoz dotyczących tego, w jaki sposób branża gier może ulec zmianie:

1. Nauka efektywnego korzystania z generatywnej sztucznej inteligencji stanie się umiejętnością rynkową

Już teraz obserwujemy, jak niektórzy eksperymentatorzy wykorzystują generatywną sztuczną inteligencję skuteczniej niż inni. Aby jak najlepiej wykorzystać tę nową technologię, należy korzystać z różnych narzędzi i technik oraz wiedzieć, jak się między nimi poruszać. Przewidujemy, że stanie się to umiejętnością rynkową, łączącą twórczą wizję artysty z umiejętnościami technicznymi programisty.

Chris Anderson słynie z powiedzenia: „Każda obfitość tworzy nowy niedobór”. Wierzymy, że w miarę pojawiania się obfitości treści najbardziej brakuje artystów, którzy wiedzą, jak najlepiej współpracować i efektywnie pracować z narzędziami sztucznej inteligencji.

Na przykład użycie Generative AI do produkcji grafiki wiąże się ze specjalnymi wyzwaniami, takimi jak:

  • Konsekwencja. W przypadku dowolnego zasobu produkcyjnego musisz mieć możliwość wprowadzania zmian lub edycji zasobu w przyszłości. W przypadku narzędzia AI oznacza to konieczność odtworzenia zasobu z tym samym monitem, aby można było wprowadzić zmiany. Może to być trudne, ponieważ ten sam monit może generować bardzo różne wyniki.
  • Styl. Ważne jest, aby cała grafika w danej grze miała spójny styl – co oznacza, że ​​twoje narzędzia muszą być wyszkolone lub w inny sposób powiązane z danym stylem.

2. Obniżenie barier spowoduje więcej podejmowania ryzyka i kreatywnych poszukiwań

Być może wkrótce wkroczymy w nowy „złoty wiek” tworzenia gier, w którym niższa bariera wejścia skutkuje eksplozją bardziej innowacyjnych i kreatywnych gier. Nie tylko dlatego, że niższe koszty produkcji oznaczają mniejsze ryzyko, ale dlatego, że te narzędzia odblokowują możliwość tworzenia wysokiej jakości treści dla szerszej publiczności. Co prowadzi do następnej prognozy…

3. Wzrost liczby „studiów mikro gier” wspomaganych przez sztuczną inteligencję

Uzbrojeni w narzędzia i usługi Generative AI, zaczniemy widzieć bardziej opłacalne komercyjne gry produkowane przez małe „mikro studia” zatrudniające zaledwie 1 lub 2 pracowników. Pomysł na małe studio gier indie nie jest nowy – gra hitowa Among Us została stworzona przez studio Innersloth zatrudniające zaledwie 5 pracowników – ale rozmiar i skala gier, które mogą tworzyć te małe studia, będzie rosła. Spowoduje to…

4. Wzrost liczby gier wydawanych każdego roku

Sukces Unity i Roblox pokazał, że dostarczanie potężnych narzędzi kreatywnych skutkuje tworzeniem większej liczby gier. Generatywna sztuczna inteligencja jeszcze bardziej obniży poprzeczkę, tworząc jeszcze większą liczbę gier. Branża już teraz boryka się z wyzwaniami związanymi z odkrywaniem – więcej niż Do Steam dodano 10,000 XNUMX gier tylko w zeszłym roku – a to wywrze jeszcze większą presję na odkrywanie. Jednak zobaczymy też…

5. Stworzono nowe typy gier, które nie były możliwe przed generatywną sztuczną inteligencją

Będziemy świadkami wynalezienia nowych gatunków gier, które po prostu nie byłyby możliwe bez generatywnej sztucznej inteligencji. Mówiliśmy już o symulatorze lotu Microsoftu, ale zostaną wymyślone zupełnie nowe gatunki, które będą polegały na generowaniu nowej zawartości w czasie rzeczywistym.

Rozważać Arrowman, przez Pędzel czarów. Jest to gra RPG, w której postacie stworzone przez sztuczną inteligencję zapewniają praktycznie nieograniczoną nową rozgrywkę.

Znamy również innego twórcę gier, który wykorzystuje sztuczną inteligencję, aby umożliwić graczom tworzenie własnych awatarów w grze. Wcześniej mieli kolekcję ręcznie rysowanych obrazów awatarów, które gracze mogli mieszać i dopasowywać, aby stworzyć swojego awatara – teraz wyrzucili to całkowicie i po prostu generują obraz awatara z opisu gracza. Pozwalanie graczom na generowanie treści za pośrednictwem sztucznej inteligencji jest bezpieczniejsze niż pozwalanie graczom na przesyłanie własnych treści od zera, ponieważ sztuczną inteligencję można wyszkolić, aby unikała tworzenia obraźliwych treści, jednocześnie dając graczom większe poczucie własności.

6. Wartość będzie naliczana dzięki specyficznym dla branży narzędziom sztucznej inteligencji, a nie tylko podstawowym modelom

Emocje i szum wokół fundamentalnych modeli, takich jak Stable Diffusion i Midjourney, generują oszałamiające wyceny, ale ciągły zalew nowych badań gwarantuje, że nowe modele będą pojawiać się i znikać wraz z udoskonalaniem nowych technik. Rozważ ruch związany z wyszukiwaniem w witrynie 3 popularne modele generatywnej sztucznej inteligencji: Dall-E, Midjourney i Stable Diffusion. Każdy nowy model ma swoją kolej w centrum uwagi.

Rewolucja generatywnej sztucznej inteligencji w grach PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Alternatywnym podejściem może być zbudowanie dopasowanych do branży zestawów narzędzi, które koncentrują się na potrzebach generatywnej sztucznej inteligencji danej branży, z dogłębnym zrozumieniem określonej publiczności i bogatą integracją z istniejącymi potokami produkcyjnymi (takimi jak Unity lub Unreal dla gier).

Dobrym przykładem jest Pas startowy która jest skierowana na potrzeby twórców wideo za pomocą narzędzi wspomaganych przez sztuczną inteligencję, takich jak edycja wideo, usuwanie zielonego ekranu, malowanie i śledzenie ruchu. Narzędzia takie jak to mogą budować i zarabiać na określonej grupie odbiorców, dodając z czasem nowe modele. Nie widzieliśmy jeszcze, jak pojawił się pakiet gier, taki jak Runway, ale wiemy, że jest to przestrzeń aktywnego rozwoju.

7. Nadchodzą wyzwania prawne

Cechą wspólną wszystkich tych generatywnych modeli sztucznej inteligencji jest to, że są one szkolone przy użyciu ogromnych zestawów danych treści, często tworzonych przez skrobanie samego Internetu. Na przykład Stable Diffusion jest trenowane na ponad 5 miliardach par obraz/napis, zebranych z sieci.

W tej chwili modele te twierdzą, że działają zgodnie z doktryną prawa autorskiego „dozwolonego użytku”, ale argument ten nie został jeszcze ostatecznie przetestowany w sądzie. Wydaje się jasne, że nadchodzą wyzwania prawne co prawdopodobnie zmieni krajobraz generatywnej sztucznej inteligencji.

Możliwe, że duże studia będą szukać przewagi konkurencyjnej, budując własne modele oparte na treściach wewnętrznych, do których mają wyraźne prawa i tytuły. Na przykład Microsoft ma tutaj szczególnie dobrą pozycję 23 studia pierwszej klasy dzisiaj, a kolejne 7 później zamyka się przejęcie Activision.

8. Programowanie nie zostanie zakłócone tak głęboko jak treści artystyczne – przynajmniej na razie

Inżynieria oprogramowania to drugi główny koszt tworzenia gier, ale nasi koledzy z zespołu a16z Enterprise podzielili się w swoim ostatnim poście na blogu: Sztuka nie umarła, jest po prostu generowana maszynowo, generowanie kodu za pomocą modelu AI wymaga więcej testów i weryfikacji, a zatem zapewnia mniejszą poprawę produktywności niż generowanie zasobów kreatywnych. Narzędzia do kodowania, takie jak Copilot, mogą zapewnić inżynierom umiarkowaną poprawę wydajności, ale nie będą miały takiego samego wpływu… przynajmniej w najbliższym czasie.

SPIS TREŚCI

Zalecenia

Na podstawie tych przewidywań proponujemy następujące zalecenia:

1. Zacznij odkrywać generatywną sztuczną inteligencję już teraz

Zajmie trochę czasu, zanim wymyślimy, jak w pełni wykorzystać moc nadchodzącej rewolucji generatywnej sztucznej inteligencji. Firmy, które zaczynają teraz, będą miały przewagę później. Znamy kilka studiów, które prowadzą wewnętrzne projekty eksperymentalne mające na celu zbadanie, w jaki sposób te techniki mogą wpłynąć na produkcję.

2. Poszukaj możliwości na mapie rynku

Niektóre części naszej mapy rynku są już bardzo zatłoczone, jak Animacje czy Mowa i dialogi, ale inne obszary są szeroko otwarte. Zachęcamy przedsiębiorców zainteresowanych tą przestrzenią do skoncentrowania swoich wysiłków na obszarach wciąż niezbadanych, takich jak „Runway for Games”.

SPIS TREŚCI

Aktualny stan rynku

Stworzyliśmy mapę rynku, aby uchwycić listę firm, które zidentyfikowaliśmy w każdej z tych kategorii, w których widzimy wpływ generatywnej sztucznej inteligencji na gry. Ten post na blogu omawia każdą z tych kategorii, wyjaśniając ją nieco bardziej szczegółowo i podkreślając najbardziej ekscytujące firmy w każdej kategorii.

Rewolucja generatywnej sztucznej inteligencji w grach PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

SPIS TREŚCI

Obrazy 2D

Generowanie obrazów 2D z monitów tekstowych jest już jednym z najczęściej stosowanych obszarów generatywnej sztucznej inteligencji. Narzędzia jak W połowie drogi, Stabilna dyfuzja, Dall E 2 mogą generować wysokiej jakości obrazy 2D z tekstu i znalazły już drogę do produkcji gier na wielu etapach cyklu życia gry.

Sztuka koncepcyjna

Narzędzia generatywnej sztucznej inteligencji są doskonałe w „ideowaniu” lub pomagają nie-artystom, takim jak projektanci gier, bardzo szybko badać koncepcje i pomysły w celu generowania grafiki koncepcyjnej, która jest kluczową częścią procesu produkcyjnego. Na przykład jedno studio (zachowując anonimowość) używa razem kilku z tych narzędzi, aby radykalnie przyspieszyć proces tworzenia grafiki koncepcyjnej, poświęcając jeden dzień na stworzenie obrazu, który wcześniej zająłby nawet 3 tygodnie.

  • Po pierwsze, ich projektanci gier używają Midjourney do odkrywania różnych pomysłów i generowania inspirujących obrazów.
  • Zostają one przekazane profesjonalnemu artyście koncepcyjnemu, który łączy je razem i maluje wynik, aby stworzyć jeden spójny obraz – który jest następnie wprowadzany do Stable Diffusion w celu stworzenia wielu wariacji.
  • Omawiają te warianty, wybierają jeden, ręcznie wprowadzają niektóre zmiany – a następnie powtarzają ten proces, aż będą zadowoleni z rezultatu.
  • Na tym etapie przekaż ten obraz z powrotem do Stable Diffusion po raz ostatni, aby „przeskalować” go i stworzyć ostateczne dzieło sztuki.

Produkcja 2D Art

Niektóre studia już eksperymentują z wykorzystaniem tych samych narzędzi do tworzenia grafiki w grze. Na przykład tutaj jest ładny samouczek od Alberta Bozesana na temat używania Stable Diffusion do tworzenia zasobów 2D w grze.

SPIS TREŚCI

Grafika 3D

Zasoby 3D są budulcem wszystkich współczesnych gier, a także nadchodzącego Metaverse. Wirtualny świat lub poziom gry to w zasadzie zbiór zasobów 3D umieszczonych i zmodyfikowanych w celu wypełnienia środowiska. Tworzenie zasobu 3D jest jednak bardziej złożone niż tworzenie obrazu 2D i obejmuje wiele kroków, w tym tworzenie modelu 3D oraz dodawanie tekstur i efektów. W przypadku animowanych postaci obejmuje to również utworzenie wewnętrznego „szkieletu”, a następnie utworzenie animacji na tym szkielecie.

Widzimy kilka różnych startupów, które zajmują się każdym etapem tego procesu tworzenia zasobów 3D, w tym tworzeniem modeli, animacją postaci i budowaniem poziomów. Nie jest to jednak jeszcze rozwiązany problem – żadne z rozwiązań nie jest jeszcze gotowe do pełnej integracji z produkcją.

Zasoby 3D

Startupy próbujące rozwiązać problem tworzenia modeli 3D to m.in Kaedim, Miraż, Hipotetyczny. Większe firmy również przyglądają się problemowi, w tym Nvidia Pobierz3D i Autodesk ClipForge. Kaedim i Get3d koncentrują się na przetwarzaniu obrazu do 3D; ClipForge i Mirage koncentrują się na zamianie tekstu na 3D, podczas gdy Hypothetic jest zainteresowany zarówno wyszukiwaniem tekstu na 3D, jak i obrazem na 3D.

Tekstury 3D

Model 3D wygląda tak realistycznie, jak tekstura lub materiały zastosowane do siatki. Decyzja, którą omszałą, zwietrzałą teksturę kamienia zastosować do modelu średniowiecznego zamku, może całkowicie zmienić wygląd sceny. Tekstury zawierają metadane dotyczące tego, jak światło reaguje na materiał (tj. chropowatość, połysk itp.). Umożliwienie artystom łatwego generowania tekstur w oparciu o podpowiedzi tekstowe lub graficzne będzie niezwykle cenne w zwiększaniu szybkości iteracji w procesie twórczym. Z tej możliwości korzysta kilka zespołów, m.in Bar AI, ponzu, ArmorLab.

Animacja

Tworzenie świetnej animacji jest jedną z najbardziej czasochłonnych, kosztownych i wymagających umiejętności części procesu tworzenia gry. Jednym ze sposobów na obniżenie kosztów i stworzenie bardziej realistycznej animacji jest użycie motion capture, w którym umieszcza się aktora lub tancerza w kostiumie do przechwytywania ruchu i rejestruje ich poruszanie się na specjalnie oprzyrządowanej scenie do przechwytywania ruchu.

Widzimy teraz generatywne modele AI, które mogą przechwytywać animację bezpośrednio z wideo. Jest to znacznie bardziej wydajne, zarówno dlatego, że eliminuje potrzebę posiadania drogiego sprzętu do przechwytywania ruchu, jak i dlatego, że umożliwia przechwytywanie animacji z istniejących filmów. Innym ekscytującym aspektem tych modeli jest to, że można ich również używać do nakładania filtrów na istniejące animacje, na przykład sprawiając, że wyglądają na pijanych, starych lub szczęśliwych. Firmy podążające za tą przestrzenią to m.in kinetiks, DeepMotionMo, Rodnik, Przenieś Aj, Płask.

Projektowanie poziomów i budowanie świata

Jednym z najbardziej czasochłonnych aspektów tworzenia gier jest budowanie świata gry, zadanie, do którego generatywna sztuczna inteligencja powinna się dobrze nadawać. Gry takie jak Minecraft, No Man's Sky czy Diablo słyną już z wykorzystywania technik proceduralnych do generowania swoich poziomów, w których poziomy są tworzone losowo, za każdym razem inaczej, ale zgodnie z zasadami określonymi przez projektanta poziomów. Dużą zaletą nowego silnika gry Unreal 5 jest kolekcja narzędzi proceduralnych do projektowania otwartego świata, takich jak rozmieszczanie roślinności.

Widzieliśmy kilka inicjatyw w przestrzeni kosmicznej, jak np Prometejski, MLXARlub Meta Konstruktor Boti myślę, że to tylko kwestia czasu, zanim techniki generatywne w dużej mierze zastąpią techniki proceduralne. Od jakiegoś czasu prowadzone są badania akademickie w tej przestrzeni, w tym techniki generatywne dla Minecrafta or projekt poziomów w grze Doom.

Innym przekonującym powodem, dla którego warto oczekiwać generatywnych narzędzi sztucznej inteligencji do projektowania poziomów, byłaby możliwość tworzenia poziomów i światów w różnych stylach. Można sobie wyobrazić proszenie narzędzi o stworzenie świata w Nowym Jorku z lat 1920. XX wieku, kontra dystopijna przyszłość przypominająca łowcy androidów, kontra świat fantasy w stylu Tolkiena.

Następujące koncepcje zostały wygenerowane przez Midjourney przy użyciu monitu „poziom gry w stylu…”

Audio

Dźwięk i muzyka są ogromną częścią rozgrywki. Zaczynamy widzieć firmy używające Generative AI do generowania dźwięku w celu uzupełnienia prac już prowadzonych po stronie graficznej.

Efekty dźwiękowe

Efekty dźwiękowe są atrakcyjnym otwartym obszarem dla sztucznej inteligencji. Były prace naukowe zbadanie pomysłu wykorzystania sztucznej inteligencji do generowania „foley” w filmie (np. odgłosów kroków), ale jak dotąd niewiele komercyjnych produktów w grach.

Uważamy, że to tylko kwestia czasu, ponieważ interaktywny charakter gier sprawia, że ​​jest to oczywiste zastosowanie dla generatywnej sztucznej inteligencji, zarówno tworzącej statyczne efekty dźwiękowe w ramach produkcji („dźwięk pistoletu laserowego w stylu Gwiezdnych wojen”), jak i tworzenie interaktywnych efektów dźwiękowych w czasie rzeczywistym w czasie wykonywania.

Rozważ coś tak prostego, jak generowanie dźwięków kroków dla postaci gracza. Większość gier rozwiązuje ten problem, dodając niewielką liczbę nagranych wcześniej odgłosów kroków: chodzenie po trawie, chodzenie po żwirze, bieganie po trawie, bieganie po żwirze itp. Generowanie i zarządzanie nimi jest żmudne, a w czasie działania brzmią powtarzalnie i nierealistycznie.

Lepszym podejściem byłby generatywny model AI w czasie rzeczywistym dla efektów dźwiękowych Foleya, który może generować odpowiednie efekty dźwiękowe w locie, za każdym razem nieco inaczej, reagujące na parametry w grze, takie jak powierzchnia podłoża, waga postaci, chód, obuwie itp.

Muzyka

Muzyka zawsze była wyzwaniem dla gier. Jest to ważne, ponieważ może pomóc ustawić emocjonalny ton, tak jak ma to miejsce w filmie lub telewizji, ale ponieważ gry mogą trwać setki, a nawet tysiące godzin, może szybko stać się powtarzalne lub irytujące. Ponadto, ze względu na interaktywny charakter gier, może być trudno precyzyjnie dopasować muzykę do tego, co dzieje się na ekranie w danym momencie.

Muzyka adaptacyjna była tematem audio w grach przez ponad dwie dekady, sięgając wstecz do „Directmusic” system do tworzenia muzyki interaktywnej. DirectMusic nigdy nie był szeroko adaptowany, głównie ze względu na trudność komponowania w tym formacie. Tylko kilka gier, jak Monolith Nikt nie żyje wiecznie, stworzył prawdziwie interaktywne partytury.

Teraz widzimy wiele firm, które próbują tworzyć muzykę generowaną przez sztuczną inteligencję, na przykład Dźwiękowy, Muzyk, Harmony, Nieskończony album, Aiva. I chociaż niektóre narzędzia dzisiaj, jak Szafa grająca przez Open AI, są bardzo wymagające obliczeniowo i nie mogą działać w czasie rzeczywistym, większość z nich może działać w czasie rzeczywistym po zbudowaniu początkowego modelu.

Mowa i dialog

Istnieje wiele firm, które próbują stworzyć realistyczne głosy dla postaci w grze. Nie jest to zaskakujące, biorąc pod uwagę długą historię prób nadania komputerom głosu poprzez syntezę mowy. Firmy obejmują Sonanty, Coqui, Repliki Studiów, Przypomina.ai, Readspeaker.ai, I wiele więcej.

Istnieje wiele zalet używania generatywnej sztucznej inteligencji do mowy, co częściowo wyjaśnia, dlaczego ta przestrzeń jest tak zatłoczona.

  • Generuj dialogi w locie. Zazwyczaj mowa w grach jest wcześniej nagrywana przez aktorów głosowych, ale są one ograniczone do wcześniej nagranych przemówień w puszkach. Dzięki generatywnemu dialogowi AI postacie mogą powiedzieć wszystko, co oznacza, że ​​mogą w pełni reagować na to, co robią gracze. W połączeniu z bardziej inteligentnymi modelami sztucznej inteligencji dla NPC (poza zakresem tego bloga, ale obecnie równie ekscytującym obszarem innowacji), obietnica gier, które są w pełni reaktywne dla graczy, nadchodzi wkrótce.
  • Odgrywanie ról. Wielu graczy chce grać postaciami fantastycznymi, które w niewielkim stopniu przypominają ich prawdziwą tożsamość. Ta fantazja jednak załamuje się, gdy tylko gracze zaczynają mówić własnym głosem. Używanie wygenerowanego głosu, który pasuje do awatara gracza, podtrzymuje tę iluzję.
    Kontrola. Podczas generowania mowy możesz kontrolować niuanse głosu, takie jak jego barwa, fleksja, rezonans emocjonalny, długość fonemów, akcenty i inne.
  • Lokalizacja Umożliwia tłumaczenie dialogów na dowolny język i wypowiadanie ich tym samym głosem. Firmy takie jak Deepdub skupiają się na tej niszy.

SPIS TREŚCI

NPC lub postacie graczy

Wiele startupów rozważa wykorzystanie generatywnej sztucznej inteligencji do tworzenia wiarygodnych postaci, z którymi można wchodzić w interakcje, częściowo dlatego, że jest to rynek o tak szerokim zastosowaniu poza grami, na przykład wirtualni asystenci lub recepcjonistki.

Wysiłki mające na celu stworzenie wiarygodnych postaci sięgają początków badań nad sztuczną inteligencją. W rzeczywistości definicja klasycznego „testu Turinga” dla sztucznej inteligencji jest taka, że ​​człowiek nie powinien być w stanie odróżnić rozmowy na czacie z AI od człowieka.

W tym momencie istnieją setki firm budujących chatboty ogólnego przeznaczenia, z których wiele jest opartych na modelach językowych podobnych do GPT-3. Mniejsza liczba specjalnie próbuje budować chatboty do celów rozrywkowych, takich jak Replika i Anima którzy próbują zbudować wirtualnych przyjaciół. Koncepcja umawiania się z wirtualną dziewczyną, opisana w filmie Ona, może być bliższa niż myślisz.

Widzimy teraz kolejną iterację tych platform chatbotów, takich jak Charyzma.ai, Convai.comlub Inworld.ai, przeznaczony do zasilania w pełni wyrenderowanych postaci 3D, emocjami i sprawczością, za pomocą narzędzi, które pozwolą twórcy na wyznaczenie tym postaciom celów. Jest to ważne, jeśli mają pasować do gry lub odgrywać rolę narracyjną w rozwoju fabuły, zamiast być jedynie dekoracją.

SPIS TREŚCI

Platformy typu „wszystko w jednym”.

Jednym z najbardziej udanych narzędzi generatywnej sztucznej inteligencji jest Runwayml.com, ponieważ łączy szeroki zestaw narzędzi dla twórców w jednym pakiecie. Obecnie nie ma takiej platformy obsługującej gry wideo i uważamy, że jest to przeoczona szansa. Chętnie zainwestujemy w rozwiązanie, które posiada:

  • Pełny zestaw generatywnych narzędzi AI obejmujących cały proces produkcyjny. (kod, generowanie zasobów, tekstury, dźwięk, opisy itp.)
  • Ściśle zintegrowany z popularnymi silnikami gier, takimi jak Unreal i Unity.
  • Zaprojektowany, aby pasował do typowego procesu produkcji gier.

SPIS TREŚCI

Wnioski

To niesamowity czas na bycie twórcą gier! Częściowo dzięki narzędziom opisanym w tym poście na blogu generowanie zawartości potrzebnej do zbudowania gry nigdy nie było łatwiejsze – nawet jeśli Twoja gra jest tak duża, jak cała planeta!

Można nawet wyobrazić sobie pewnego dnia całą spersonalizowaną grę, stworzoną specjalnie dla gracza, opartą dokładnie na tym, czego on chce. To było w science fiction od dawna – jak „gra umysłowa AI” w Grze Endera lub holodeck w Star Trek. Ale dzięki narzędziom opisanym w tym poście na blogu rozwijającym się tak szybko, jak to możliwe, nietrudno sobie wyobrazić, że ta rzeczywistość jest tuż za rogiem.

Jeśli jesteś założycielem lub potencjalnym założycielem i chcesz zbudować firmę AI for Gaming, skontaktuj się z nami! Chcemy usłyszeć od ciebie!

***

Wyrażone tutaj poglądy są poglądami poszczególnych cytowanych pracowników AH Capital Management, LLC („a16z”) i nie są poglądami a16z ani jej podmiotów stowarzyszonych. Niektóre informacje w nim zawarte zostały pozyskane ze źródeł zewnętrznych, w tym od spółek portfelowych funduszy zarządzanych przez a16z. Chociaż pochodzą ze źródeł uważanych za wiarygodne, a16z nie zweryfikowało niezależnie takich informacji i nie składa żadnych oświadczeń dotyczących aktualnej lub trwałej dokładności informacji lub ich adekwatności w danej sytuacji. Ponadto treści te mogą zawierać reklamy osób trzecich; a16z nie przeglądał takich reklam i nie popiera żadnych zawartych w nich treści reklamowych.

Te treści są udostępniane wyłącznie w celach informacyjnych i nie należy ich traktować jako porady prawnej, biznesowej, inwestycyjnej lub podatkowej. Powinieneś skonsultować się w tych sprawach z własnymi doradcami. Odniesienia do jakichkolwiek papierów wartościowych lub aktywów cyfrowych służą wyłącznie celom ilustracyjnym i nie stanowią rekomendacji inwestycyjnej ani oferty świadczenia usług doradztwa inwestycyjnego. Ponadto treść ta nie jest skierowana ani przeznaczona do użytku przez jakichkolwiek inwestorów lub potencjalnych inwestorów iw żadnym wypadku nie można na nich polegać przy podejmowaniu decyzji o zainwestowaniu w jakikolwiek fundusz zarządzany przez a16z. (Oferta inwestycji w fundusz a16z zostanie złożona wyłącznie na podstawie memorandum dotyczącego oferty prywatnej, umowy subskrypcyjnej i innej odpowiedniej dokumentacji takiego funduszu i należy ją przeczytać w całości.) Wszelkie inwestycje lub spółki portfelowe wymienione, wymienione lub opisane nie są reprezentatywne dla wszystkich inwestycji w pojazdy zarządzane przez a16z i nie można zapewnić, że inwestycje będą opłacalne lub że inne inwestycje dokonane w przyszłości będą miały podobne cechy lub wyniki. Lista inwestycji dokonanych przez fundusze zarządzane przez Andreessena Horowitza (z wyłączeniem inwestycji, w przypadku których emitent nie wyraził zgody na publiczne ujawnienie przez a16z oraz niezapowiedzianych inwestycji w aktywa cyfrowe będące w obrocie publicznym) jest dostępna pod adresem https://a16z.com/investments /.

Wykresy i wykresy zamieszczone w niniejszym dokumencie służą wyłącznie celom informacyjnym i nie należy na nich polegać przy podejmowaniu jakichkolwiek decyzji inwestycyjnych. Wyniki osiągnięte w przeszłości nie wskazują na przyszłe wyniki. Treść mówi dopiero od wskazanej daty. Wszelkie prognozy, szacunki, prognozy, cele, perspektywy i/lub opinie wyrażone w tych materiałach mogą ulec zmianie bez powiadomienia i mogą się różnić lub być sprzeczne z opiniami wyrażanymi przez innych. Dodatkowe ważne informacje można znaleźć na stronie https://a16z.com/disclosures.

Znak czasu:

Więcej z Andreessen Horowitz