AI-driven creativity gives overpowered PCs something worthwhile to do, at last PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A mesterséges intelligencia által vezérelt kreativitás végre valami érdemes tennivalót ad a túlhatalmas PC-knek

Oszlop Egészen a közelmúltig úgy tűnt, hogy a személyi számítógépek hardverei túlszárnyalták a szoftverrel szemben támasztott követelményeket. Még a csúcskategóriás játékok is – amelyek hagyományosan a felhasználói teljesítményre vonatkozó követelmények élvonalába tartoznak – alig adóztak a hatalmasan túlerős, csúcskategóriás szilíciumnak. Aztán jött az AI művészet.

Az Apple M1 Ultra mikroprocesszora 100 milliárdos tranzisztorszámmal rendelkezik. Az Nvidia most adta ki zászlóshajó RTX 4090 GPU, 76 milliárd tranzisztorral – ez háromszoros növekedés az előző generációhoz képest, a legújabb folyamatcsomópont terméke, és az ördögtől való hozzáállás az energiafogyasztáshoz. Közel 500 W TDP? Hajtsa fel, és fűtse fel otthonát ezen a télen.

De mi célból? 300 fps Fortnite battle royale? Áprilisban Írtam: "Ezeket a szörnyeket meg kell szelídíteni, ki kell képezni és munkába kell állni." A technológia irtózik a vákuumtól – a területen eltöltött négy évtized megtanított erre. Ahol van kapacitás, ott jön valami, ami ezt kihasználja.

Az a másik cipő szeptember elején esett le, amikor HuggingFace AI – egy magáncég, amely a legkorszerűbb mesterséges intelligencia technikákat kiaknázó szoftvereszközöket készít – jelent meg Stabil diffúzió.

Hasonló rendszerekhez, mint a DALL•E ill középút, A Stable Diffusion felfelé ível, majd több milliárd képet redukál szimbolikusan súlyozott tokenekké, amelyeket egy megfelelően kialakított szöveges prompt segítségével vissza lehet varázsolni láthatóvá. Az egész a boszorkányságnak ezen az oldalán áll – mégis rendkívül jól működik.

Ellentétben a DALL•E-vel vagy a Midjourney-vel, a Stable Diffusion egyrészt teljesen önálló – minden elég erős gépen képes működni –, másrészt tiszta FOSS. Ez azt jelentette, hogy bár a kezdeti kiadáshoz az Nvidia csúcskategóriás GPU-ira volt szükség, a projekt közreműködői egy héten belül lecsupaszította a kódját és csökkentette a hardverigényét. A jelenlegi verzió meglehetősen kényelmesen futhat azon a masszív PC-n, amelyet hat éve vásároltam, hogy felfedezzem a virtuális valóság újjászületett világát – és nagyjából minden M1-alapú Mac-en. Sok játék PC-n és laptopon elég jól fut a Stable Diffusion ahhoz, hogy projektalapú kreatív igényekre – vagy csak szórakozásra – használhassa.

Aztán egy kutatócsoport közzétett egy papírt valamin, amit Dreamfusion-nak hívtak – amely képes szöveges promptokból teljesen megvalósított 3D-s modellek végtelen sorozatát varázsolni. Begépel pineapple, és a számítógép gondolkodni fog, majd elkészíti a legjobb közelítését arra vonatkozóan, hogy milyennek kell lennie a modellnek. Bár ez a csoport még nem adta ki a kódját, az újság elegendő vázlatot adott ahhoz, hogy egy ambiciózus kódoló adaptálhassa a Stable Diffusion kódbázist. Stabil Dreamfusion – amihez ismét elég erős hardver szükséges.

A Stable Diffusion által készített kép az „Egy robot, aki képet fest futópadon futva” szöveges promptból… Kattintson a nagyításhoz

Hogy ne maradjunk le, a Tel Avivi Egyetem egy másik csoportja ámulatba ejtette a világot Emberi mozgás diffúziós modell. Ez a tanulmány bemutatta, hogyan használták a kutatók diffúzió alapú mesterséges intelligencia technikákat egy olyan prompt konvertálására, mint például:the person walks forward two steps and does a cartwheel” egy emberszerű animációba. Egy héttel később maguk a kutatók kiadták a kódjukat mint FOSS.

Még egy kicsit korán járunk a mesterséges intelligencia-képességek exponenciális növekedésében, hogy tudjuk, hová vezet. Már a Canva és a Microsoft is integrált prompt-alapú képgenerátorokat kreatív eszközei közé. Meta, Google, és mások saját fejlesztésű prompt-to-video generátorokat mutattak be. A jelenlegi trend szerint nem kell sokáig várnunk, amíg FOSS-egyenértékekkel játszhatunk.

A vizuális művészetek erőteljes új eszközökkel rendelkeznek, amelyek nem kizárólagos területei az olyan óriásoknak, mint a Google vagy az OpenAI – ez utóbbi egy olyan cég, amely megalapításakor megígérte, hogy demokratizálja a mesterséges intelligenciát, de úgy tűnik, hogy saját, szabadalmaztatott birodalma létrehozására összpontosított a Microsofttal. nem hivatalos tulajdonos.

Az egyik első hasábomban A regisztráció - mutattam rá a vég a végtelen frissítési ciklus PC-k számára. Nincs több futópad: elég jó, csak akkor cserélnék ki, ha elhasználódtak. Kivéve a frissítések hullámzását, hogy elférjen világjárvány által vezérelt videokonferencia ez a jóslat bevált.

A személyi számítógép azonban levetette bőrét, és felfedte új, sima kreatív szuperszámítógép formáját: diffúziós hajtású, és olyan kreatív képességekkel rendelkezik, amilyeneket a régi PC nem tudott megközelíteni. Ahelyett, hogy egy másik új ceruzát vagy ecsetet kínálnának, ezek a minőségileg eltérő eszközök újfajta kreatív együttműködést kovácsolnak.

Júniusban vásároltam egy nagy teljesítményű PC laptopot – és azonnal bűntudatom lett miatta, és azt hittem, hogy soha nem fogom igazán működni. Ma teljes mértékben kihasználom azt a gépet, amely képes mind a hétköznapokra, mind a hihetetlenekre. Utólag visszagondolva ez a vásárlás okos alkunak tűnik – az igazi reneszánsz előhírnökének –, ahogy az újjászületett PC munkához lát. ®

Időbélyeg:

Még több A regisztráció