Az OpenAI GPT-4 nem futja a Doomot, de rosszul fogja játszani a játékot

Újra kiadta Platón

Követő: 0

Lehet, hogy egy vadászpuska kunyhóban élsz. És előfordulhat, hogy a GPT-4-gyel dolgozik. És felteheti magának a kérdést: „Futtatja a GPT-4 a Doomot?” És felteheted magadnak a kérdést: „Igazam van? Tévedek?"

Adrian de Wynter, a Microsoft vezető alkalmazott tudósa és az angliai Yorki Egyetem kutatója ezeket a kérdéseket tette fel egy friss kutatási cikkében:A GPT-4 futtatja a Doomot?"

Sajnos a GPT-4, a Microsoft által támogatott OpenAI nagy nyelvi modellje nem képes a Doom forráskódjának közvetlen végrehajtására.

De multimodális változata, a GPT-4V, amely képes bemenetként képeket és szöveget is elfogadni, ugyanazt a megnyerő alkompetenciát mutatja. Végzet mint a tele szöveg alapú modellek, amelyek számtalan mesterséges intelligenciát indítottak el.

„A papír beállításai szerint a GPT-4 (és a GPT-4 látással, vagy a GPT-4V) nem igazán tudja futtatni a Doomot önmagában, mert korlátozza a bemeneti mérete (és nyilván az is, hogy valószínűleg csak kitalál valamit). tényleg nem akarja, hogy a fordítója ötpercenként hallucináljon)” – írta de Wynter a magyarázatában; megjegyezni lapjáról. "Ez azt jelenti, hogy határozottan működhet a motor proxyjaként, nem úgy, mint a többi "futja a Doomot?" megvalósítások, mint pl E. Coli or Jegyzettömb. "

Vagyis a GPT-4V nem futtatja a Doomot mint egy John Deere traktor de speciális képzés nélkül is lejátssza a Doomot.

Ennek kezelésére de Wynter tervezett egy Vision komponenst, amely GPT-4V-nek hívja, amely képernyőképeket rögzít a játékmotorból, és visszaadja a játék állapotának szerkezeti leírását. És ezt kombinálta egy ügynökmodellel, amely meghívja a GPT-4-et, hogy döntéseket hozzon a vizuális bemenet és a korábbi előzmények alapján. Az Agent modellnek azt mondták, hogy a válaszait billentyűleütési parancsokká fordítsa le, amelyek a játékmotor számára jelentenek valamit.

Az interakciókat egy menedzserrétegen keresztül kezelik, amely egy nyílt forráskódú Python-kötésből áll a következőhöz C Doom motor Matplotliben fut.

A DOOM lejátszásához használható GPT-4V rendszer kialakítását bemutató diagram

De Wynter diagramja egy GPT-4V rendszer kialakítását mutatja a Doom játékhoz… Kattintson a nagyításhoz

Az újság szerint a mesterséges intelligencia modellek és kódok keveréke ajtókat nyithat, ellenségekkel harcolhat, és fegyvereket lőhet. És képes végrehajtani egy szélesebb körű utasításkészletet, például egy szintű áttekintést saját teljesítményének javítása érdekében.

Ennek a GPT-4V-alapú rendszernek a fő hiányossága az objektumok állandóságának hiánya – elfelejti a játékon belüli zombikat, amikor kikerülnek a képernyőről.

A GPT-4 megfeledkezik a zombiról, és csak megy tovább

„Például nagyon gyakori, hogy a modell egy zombit lát a képernyőn, és addig lövöldözni kezd, amíg el nem találta (vagy meghal)” – magyarázza de Wynter. „Nos, ez a mesterséges intelligencia az 1993-as hardverrel való együttműködésre van írva, úgyhogy azt hiszem, nincs túl mély döntési fája. Tehát a zombi rád lő, majd rohanni kezd a szobában.

"Mi itt a probléma? Nos, először is, hogy a zombi eltűnjön a látókörből. Ami még rosszabb, még mindig életben van, és egy bizonyos ponton el fog ütni. Szóval utána kell menned, igaz? Végtére is, a Doomban ez ütés, vagy ütés.

„Kiderült, hogy a GPT-4 megfeledkezik a zombiról, és csak megy tovább. Megjegyzés: a prompt kifejezetten megmondja a modellnek, hogy mit tegyen, ha sebzést szenved, és nem lát ellenséget. Még jobb, ha csak elindul a vidám útjára, beszorul a sarokban, és meghal. Néhányszor megfordult, de közel 50-60 futás alatt megfigyeltem… kétszer, azt akarom mondani.

Ezenkívül a GPT-4 nem tud túl jól érvelni. Amikor arra kérték, hogy magyarázza el cselekedeteit, amelyek a kontextusban általában helyesek voltak, magyarázatai szegényesek voltak, és gyakran tartalmaztak hallucinációkat (más néven helytelen információkat).

De Wynter mindazonáltal figyelemre méltónak tartja, hogy a GPT-4 képes a Doom lejátszására előzetes képzés nélkül.

Ugyanakkor aggasztónak tartja ezt.

„Az etikai osztályon eléggé aggasztó, hogy (a) mennyire könnyű volt kódot építeni, hogy rávegyem a modellt, hogy lőjön valamit; és (b) hogy a modell pontosan lőjön le valamit anélkül, hogy ténylegesen kitalálná az utasításokat” – írta összefoglaló bejegyzésében.

„Tehát, bár ez egy nagyon érdekes feltárás a tervezés és az érvelés körül, és alkalmazhatók lehetnek az automatizált videojáték-tesztelésben, teljesen nyilvánvaló, hogy ez a modell nincs tisztában azzal, hogy mit csinál. Nyomatékosan arra buzdítok mindenkit, hogy gondolja át, mit jelent ezeknek a modelleknek a társadalom számára való alkalmazása és az esetleges visszaélések.”

És mondhatod magadnak:Istenem, mit tettem?”®

SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
PlatoESG. Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
PlatoHealth. Biotechnológiai és klinikai vizsgálatok intelligencia. Hozzáférés itt.
Forrás: https://go.theregister.com/feed/www.theregister.com/2024/03/11/gpt4_wont_run_doom/

Időbélyeg: Március 12, 2024

Időbélyeg: 28. július 2022.

Kína betiltja az engedély nélkül vagy gonoszságból készített mélyhamisításokat

Forrás klaszter:

A regisztráció

Forrás csomópont: 1771113

Időbélyeg: 11. december 2022.

Az Egyesült Királyság azt akarja, hogy a bűnöző bevándorlók naponta akár ötször vizsgálják meg az arcukat a PlatoBlockchain Data Intelligence karórával. Függőleges keresés. Ai.

Az Egyesült Királyság azt akarja, hogy a bűnöző bevándorlók naponta akár ötször nézzék át az arcukat egy óra segítségével

Forrás klaszter:

A regisztráció

Forrás csomópont: 1612093

Időbélyeg: 7. augusztus 2022.

Az OpenAI GPT-4-jén nem fut a Doom, de rosszul fogja játszani a játékot

Újra kiadta Platón

Még több A regisztráció

A Big Tech 235 millió dollárt utal át a Hugging Face mesterséges intelligencia modellraktárába

Mi az Elon Musk xAI? Ebben a Kettle podcastban megvitatjuk

Hogyan terelheti a GitHub Copilot a Microsoftot szerzői jogi viharba

A „Robot ügyvéd” DoNotPay nem felel meg a célnak – állítja a panasz

A DARPA keres néhány jó mesterséges intelligencia kódolót, hogy segítsen Amerikának megtalálni a saját ritka ásványait

Egy mesterséges intelligencia képhez annyi energia kell, mint egy okostelefon töltéséhez

Az AlphaFold AI által megjósolt szinte minden, a tudomány által ismert fehérjeszerkezet

Kína betiltja az engedély nélkül vagy gonoszságból készített mélyhamisításokat

Az Egyesült Királyság azt akarja, hogy a bűnöző bevándorlók naponta akár ötször nézzék át az arcukat egy óra segítségével

Rólunk

Vertical Search & Ai

Emelvény

Maradjon kapcsolatban

Fiók