Cât de generativă IA va perturba totul în deceniul actual

Republicat de Platon

Urmaritori: 0

Mulți vor fi surprinși

In În ultimele luni, sistemele AI precum Midjourney, DALL-E, Stable Diffusion, LaMDA și PaLM au făcut progrese mari în domenii aparent la fel de diverse precum generarea de imagini și text. Capacitățile acestor sisteme sunt impresionante: produc imagini extrem de sugestive, creează o copie eficientă de vânzare pentru publicitate și multe, multe altele - toate de la simple „îndemnuri” care descriu ceea ce dorește utilizatorul să obțină.

Toate acestea se fac cu AI generativă.

„IA generativă” se referă la sistemele alimentate de rețele neuronale profunde acel implement Modele de limbaj mari (LLM) pentru a crea un fel de conținut. Aici spun „creează”, adică nu este o copie a ceva existent deja, nu într-un sens filosofic (ce este o „creație” oricum?).

Companii noi mari apar în această lume nouă și curajoasă, cum ar fi Jasp, care oferă atât generarea de copii de vânzare, cât și imagini pentru publicitate: Jasper are acum o evaluare de peste un miliard de dolari, devenind un unicorn peste noapte.

Prima platformă Generative AI care a făcut cu adevărat o zgârietură a fost GPT-3 – lansat cu doar câțiva ani în urmă! După aceea, o succesiune de lansări ale mai multor jucători din domeniu (OpenAI, Google, StableDiffusion, Google, DeepMind și alții) a apărut într-un ritm zguduitor, atât de mult încât este greu să rămâi la curent.

Dar dincolo de cât de distractiv și fantastic este să petreci un timp cu Midjourney pentru a crea imagini din indicațiile noastre, mulți pasionați de tehnologie se luptă să dea sens acestui val IA generativ.

Este Generative IA o tendință solidă sau este doar un moft?

Voi merge pentru "tendință solidă” pentru că va transforma mii de activități profesionale și de agrement în sfera acestui deceniu. Să încep cu un exemplu.

Sunt un mare fan al tenisului (cel puțin în sensul TV). Dar meciurile live de tenis durează ore întregi până se termină și am alte activități și interese, așa că de obicei recurg la vizionarea reluărilor sau doar a videoclipurilor evidențiate cu cele mai distractive aproximativ 4 minute dintr-un meci.

Dar dacă în loc de un videoclip de 4 minute, vreau unul de 10 sau 15 minute? Sau dacă vreau să includ fiecare punct în tie-break-uri? Momentan nu am noroc.

Acum puneți-vă pălăria Generative-IA la lucru: un generator de videoclipuri sportive Generative IA ar crea un videoclip doar pentru tine conform specificațiilor pe care le-ați introdus în mod informal într-un mesaj text precum următorul:

Videoclip de aproximativ 15 minute cu cele mai distractive puncte ale meciului Rafa Nadal vs. Tommy Paul din Paris Bercy 2022, inclusiv tiebreak-uri complete, dacă există, precum și fiecare breakpoint convertitMatei 22:21

Asta este. Primești un link cu videoclipul tău personalizat, diferit de un videoclip vizionat de oricine altcineva din lume. Și acest serviciu video ar fi la fel de fezabil din punct de vedere economic ca DALL-E și Midjourney.

Cercetarea este diferită de inovație. Primul se preocupă de rezultatele originale publicate, iar cel de-al doilea are mai mult de-a face cu găsirea modului de a construi o afacere din acele rezultate: inovației nu îi pasă de originalitate, ci de creștere, defensibilitatea, rentabilitatea investiției etc.

Adesea, lucrurile devin confuze, deoarece cercetările sunt făcute de companii precum Google, care, în principiu, sunt acolo pentru a obține profit, dar înțeleg că afacerea lor este de înaltă tehnologie și tehnologia nu este ridicată fără cercetare. Așa că se implică în finanțarea cercetării, precum și în apropierea mediului academic – mulți dintre cercetătorii lor de top au fost angajați din mediul academic. În calitate de cercetător, am fost invitat la un Summit al Facultății la sediul lor din Mountain View în urmă cu câțiva ani și m-au cazat într-o suită la hotelul Four Seasons – orice este nevoie pentru a face o impresie bună asupra comunității academice!

Dar chiar dacă ar putea fi dificil – și chiar artificial – să se facă o distincție clară între cercetare și inovare, diferența este crucială aici deoarece, în cazul AI generativă, cele două vor fi dezvoltate de actori diferiți și vor fi asociate. cu două straturi diferite în stiva de software – as subliniat de J. Currier:

Stratul software de jos este Model de învățare profundă, construit în jurul implementărilor de modele de limbaj mari (LLM) sau reprezentări interne echivalente. Modelele oferă blocul de bază din care pot fi dezvoltate aplicațiile.
Stratul de software superior este cerere unul, care se bazează pe modelul Deep Learning pentru a îndeplini o anumită sarcină, de exemplu, pentru a scoate o imagine dintr-un prompt text.

Această arhitectură cu două straturi va alimenta o nouă eră a inovației accelerate, deoarece odată ce stratul inferior este dezvoltat de companii foarte mari precum Google, OpenAI și altele, companiile mai mici vor furniza stratul de aplicație - oferind, desigur, o reducere a profitului lor. către furnizorul de nivel inferior.

În prezent, stratul inferior a fost îmbunătățit rapid și, adesea, a fost distribuit împreună cu o aplicație deasupra. De exemplu, LaMDA și PaLM oferă capacități de dialog imediate, în timp ce DALL-E și Midjourney oferă servicii prompt-to-image. Dar, în curând, proliferarea alternativelor open-source pentru stratul inferior va face posibilă dezvoltarea doar a stratului superior de aplicație și conectarea acestuia într-un strat inferior deja disponibil. Mai ușor de spus decât de făcut, desigur, dar adevărul este că stratul de jos este cu ordine de mărime mai complex decât cel de sus.

Aș susține că IA generativă va pătrunde aproape fiecare activitate de muncă și de agrement pentru că va oferi instrumente pentru a îndepărta complexitatea de activitățile anterior dificile și pentru că poate oferi un nivel cu totul nou de personalizare pe care l-aș numi „personalizare generativă”.

Puteți vedea ce este „personalizarea generativă” din exemplul video de sport de mai sus: fiecărui utilizator i se oferă un videoclip cu momente unice și nou-nouțe, în loc de doar o selecție între două sau trei opțiuni.

Impactul cumulat al tuturor aplicațiilor Generative IA este greu de exagerat:

Crearea grafică ușoară este deja la îndemâna persoanelor care nu sunt profesioniști cu instrumente precum DALL-E, Midjourney și Stable Diffusion, cel puțin în scopuri utilitare simple, cum ar fi obținerea unei imagini de antet pentru această postare. Înainte de acest an, nu am fost complet în stare să-mi desenez propriile imagini, iar experții în blog ne sfătuiau să nu pierzi timpul cu designul grafic pentru propriile povești.
Utilizatorii de editare foto nu vor trebui să îndure o curbă grea de învățare pentru a stăpâni setul complicat de instrumente Photoshop sau Affinity Photo (folosesc pe acestea din urmă și este atât de complex încât trebuie să consulte tutorialele YouTube pentru a învăța cum să faci majoritatea ajustărilor). Cu Generative AI, utilizatorii vor cere doar software-ului să efectueze o anumită transformare și voila! Imaginea se va repara. Dacă Adobe nu reușește să livreze AI generativă cu instrumentele lor, acestea vor fi perturbate de noile startup-uri care le oferă și vor merge pe calea Blockbuster.
Instrumentele de prezentare precum PowerPoint, în loc să ofere doar șabloane așa cum o fac acum, vor genera și ajusta prezentări întregi la nivel profesional din idei de schiță. În prezent, diferența dintre prezentările profesionale și cele de amatori este uriașă – nu va mai fi cazul.
Scrierea textului va fi un proces extrem de îmbunătățit de instrumentele AI generative. Multe forme de scriere primesc deja ajutor de la instrumente sofisticate precum Grammarly, dar AI generativ va oferi scriitorilor un nivel de ajutor calitativ nou, de exemplu, generând o primă versiune completă a unui blog. Scrisul va fi un proces de colaborare între oameni și instrumentul AI.
Orice software destinat unui utilizator final va trebui să fie simplu de utilizat, cu mesaje text sau vocale. Manualele de utilizare și videoclipurile cu instrucțiuni vor fi de domeniul trecutului și, de îndată ce utilizatorii se obișnuiesc cu noul mod simplu de utilizare a software-ului, totul va trebui să îl ofere pentru a rămâne relevant.
Învățarea limbilor străine se va face în principal cu ajutorul asistenților vocali, care vor fi alimentați de – ați ghicit corect – AI generativ. Asistenții vocali, care vor acționa ca instructori personali de limbă, își vor folosi capabilitățile uimitoare de dialog în limbaj natural, văzute pentru prima dată în sisteme precum LaMDA de la Google, pentru a ghida cursanții de limbă umană pentru a dobândi vocabular și expresii, pentru a îmbunătăți pronunția etc. asistenții vocali nu sunt o fantezie futuristă – doar are sens economic de acum.
Chiar și produsele hardware (cum ar fi mașinile) vor avea sisteme de ajutor bazate pe dialog AI generativ. Ați încercat să efectuați o operațiune complexă precum reglarea afișajului la mașinile moderne? Nu este ușor, pot să vă spun. În loc să cauti în manuale complexe, vei cere doar asistentului vocal fie să primească instrucțiuni, fie să efectueze direct ajustările.

Multe profesii vor fi transformate dincolo de recunoaștere. Designerii grafici simt deja usturimea acestei perturbări. Profesii întregi vor dispărea, iar altele vor fi create. Companiile puternice vor da faliment, iar altele noi vor deveni dominante, în funcție de cât de bine gestionează întreruperea tehnologică cauzată de AI generativă.

Și toate acestea se vor întâmpla în acest deceniu.

S-ar putea să mă înșel, dar mi se pare că a fost dificil, chiar și pentru experții experimentați în tehnologie, să prezică capacitățile enorme ale generatoarelor actuale de imagini și text: nu era evident în urmă cu câțiva ani că modelele și seturile de antrenament uriașe conduc la capacități calitativ diferite.

Aș merge până acolo încât să spun că a fost o descoperire norocoasă, aproape întâmplătoare. Dar acum că avem instrumente generative, porțile sunt deschise companiilor inovatoare care vor dezvolta aplicație după aplicare într-un ritm rapid: este mai mult o chestiune de a descoperi ce poate fi îmbunătățit radical și de a găsi modelul de afaceri potrivit pentru a face o afacere din o idee generativă de IA.

În urmă cu câțiva ani, se părea că alte tendințe tehnologice, cum ar fi mașinile autonome, VR sau blockchain-ul, vor prelua în curând controlul, dar tehnologia auto-conducerii a fost limitată de obstacole legislative, blockchain-ul a fost lovit de recesiunea economică și VR. adoptarea este limitată de costurile ridicate ale hardware-ului. AI generativ, în schimb, nu este încă limitat de legislație (hei, lustruirea unei prezentări PowerPoint sau generarea unui videoclip sportiv nu este o problemă de viață sau de moarte) și nu are nevoie de hardware scump pentru a fi cumpărat de utilizator.

Și nu credeam că activitățile creative vor fi întrerupte atât de curând. Dar au fost.

Intrăm în vremuri noi și uneori ciudate, în care creativitatea umană este amestecată cu noile capacități ale mașinilor, până la punctul în care este greu de făcut distincția între ele. La fel de J. Currier evidențiază:

„Astăzi și în următorii câțiva ani, acest lucru va fi surprinzător și în multe privințe înfricoșător. Pentru că acele momente creative în care treci de la zero la ideile inițiale s-au simțit întotdeauna atât de unic uman, pentru că a fost atât de misterios.”

Cât de generativă IA va perturba totul în deceniul actual Republicat din sursă https://towardsdatascience.com/how-generative-ia-will-disrupt-everything-in-the-current-decade-b4e8ce7dd4f1?source=rss—-7f60cf5620c9— 4 prin https://towardsdatascience.com/feed

<!–

Timestamp-ul: Noiembrie 10, 2022Noiembrie 11, 2022