Kuidas generatiivne IA häirib kõike praegusel kümnendil

Paljud on üllatunud

Autori pilt stabiilse difusiooniga

In Viimastel kuudel on AI-süsteemid, nagu Midjourney, DALL-E, Stable Diffusion, LaMDA ja PaLM, teinud suuri edusamme valdkondades, mis on ilmselt nii mitmekesised nagu piltide ja tekstide genereerimine. Nende süsteemide võimalused on muljetavaldavad: nad toodavad väga sugestiivseid pilte, loovad tõhusa müügikoopia reklaami jaoks ja palju-palju muud – kõike seda pelgalt „viipadest”, mis kirjeldavad, mida kasutaja saada soovib.

Seda kõike tehakse generatiivse AI-ga.

„Generatiivne AI” viitab süsteemidele, mida toidab sügavad närvivõrgud mis rakendab Suured keelemudelid (LLM), et looma mingi sisu. Siin ma ütlen "loo", mis tähendab, et see ei ole millegi juba olemasoleva koopia, mitte filosoofilises mõttes (mis on ikkagi "loomine"?).

Selles vapras uues maailmas on tekkimas suuri uusi ettevõtteid, nagu Jaspis, mis pakub reklaamimiseks nii müügikoopiate kui ka piltide genereerimist: Jasperi väärtus on nüüd enam kui miljard dollarit ja temast saab üleöö ükssarvik.

Esimene Generative AI platvorm, mis tõesti mõlki tegi, oli GPT-3 – see anti välja vaid paar aastat tagasi! Pärast seda on mitme selle valdkonna mängija (OpenAI, Google, StableDiffusion, Google, DeepMind jt) väljaandeid ilmunud murrangulise tempoga, nii et on raske kursis olla.

Kuid peale selle, kui lõbus ja fantastiline on veeta aega Midjourneyga meie juhiste järgi piltide loomiseks, näevad paljud tehnikahuvilised vaeva selle generatiivse IA laine mõtestamise nimel.

Kas generatiivne IA on kindel trend või on see lihtsalt moeröögatus?

ma lähen "kindel trend”, sest see muudab selle kümnendi jooksul tuhandeid tööalaseid ja vaba aja tegevusi. Lubage mul alustada näitega.

Olen tohutu tennisefänn (vähemalt telesaadete mõttes). Kuid tenniseotsingu kohtumistel kulub tunde ja mul on muid tegevusi ja huvisid, nii et ma vaatan tavaliselt kordusi või lihtsalt esiletõstetud videoid, mis sisaldavad matšist kõige meelelahutuslikumat 4 minutit.

Aga mis siis, kui 4-minutilise video asemel tahan 10- või 15-minutilist videot? Või kui ma tahan kaasata kõik punktid vaheaegadesse? Mul pole praegu õnne.

Nüüd pane oma Generative-IA müts tööle: Generative IA spordivideo generaator looks video ainult sinule vastavalt spetsifikatsioonidele, mille panite mitteametlikult tekstiviipale, näiteks järgmiselt:

"Umbes 15-minutiline video, mis sisaldab kõige lõbusamaid punkte Rafa Nadali ja Tommy Pauli matšist Pariisis Bercys 2022."

see on kõik. Saate lingi oma isikupärastatud videoga, mis erineb videost, mida vaatab keegi teine ​​maailmas. Ja see videoteenus oleks majanduslikult sama otstarbekas kui DALL-E ja Midjourney.

Teadusuuringud erinevad innovatsioonist. Esimene puudutab avaldatud originaalseid tulemusi ja teine ​​on rohkem pistmist selle leidmisega, kuidas nendest tulemustest äri üles ehitada: innovatsioon ei hooli originaalsusest, vaid kasvust, kaitstavusest, investeeringutasuvusest jne.

Sageli lähevad asjad segaseks, sest uuringuid teevad sellised ettevõtted nagu Google, mis on põhimõtteliselt kasumi teenimise eesmärk, kuid nad mõistavad, et nende äri on kõrgtehnoloogiline ja tehnoloogia ei ole kõrge ilma uuringuteta. Nii osalevad nad nii teadustöö rahastamises kui ka akadeemilise ringkonnaga lähedal – paljud nende tippteadlased palgati akadeemilistest ringkondadest. Teadlasena kutsuti mind mõned aastad tagasi teaduskonna tippkohtumisele nende peakorteris Mountain View's ja nad majutasid mind hotelli Four Seasons sviidis – olenemata sellest, mida on vaja akadeemilisele kogukonnale hea mulje jätmiseks!

Kuid isegi kui teadusuuringute ja innovatsiooni vahel võib olla raske – ja isegi kunstlik – selget lõiku teha, on erinevus siin ülioluline, sest generatiivse AI puhul töötavad need kaks välja erinevad osalejad ja nad on omavahel seotud. kahe erineva kihiga tarkvarapinus –as märkis J. Currier:

  1. Alumine tarkvarakiht on Süvaõppe mudel, mis on üles ehitatud suurte keelemudelite (LLM) või samaväärse sisemise esituse juurutuste ümber. Mudelid on aluseks, millest saab rakendusi arendada.
  2. Ülemine tarkvarakiht on taotlus üks, mis tugineb süvaõppe mudelile konkreetse ülesande täitmiseks, näiteks pildi väljastamiseks tekstiviipast.

See kahekihiline arhitektuur toidab uut kiirendatud innovatsiooni ajastut, sest kui alumise kihi on välja töötanud väga suured ettevõtted, nagu Google, OpenAI ja teised, pakuvad väiksemad ettevõtted rakenduskihti, mis annab loomulikult oma kasumikärbe. alumise kihi pakkujale.

Praegu on alumist kihti kiiresti täiustatud – ja sageli on see jaotatud koos pealispinnaga. Näiteks LaMDA ja PaLM pakuvad koheselt dialoogivõimalusi, samas kui DALL-E ja Midjourney pakuvad kiireid pildistamise teenuseid. Kuid peagi võimaldab alumise kihi avatud lähtekoodiga alternatiivide levik välja töötada ainult ülemise rakenduskihi ja ühendada selle juba saadaoleva alumise kihiga. Muidugi on lihtsam öelda kui teha, kuid fakt on see, et alumine kiht on suurusjärgus keerulisem kui ülemine.

Ma väidan, et generatiivne IA läbib peaaegu iga teadmistöö ja vaba aja tegevust sest see pakub tööriistu, kuidas endistest rasketest tegevustest keerukust eemale viia, ja kuna see võib pakkuda täiesti uuel tasemel isikupärastamist, mida ma nimetaksin "generatiivseks isikupärastamiseks".

Ülaltoodud spordivideo näitest näete, mis on "generatiivne isikupärastamine": igale kasutajale antakse täiesti uus ja ainulaadne esiletõstetud video, selle asemel, et valida kahe või kolme valiku vahel.

Kõigi generatiivse IA rakenduste kumulatiivset mõju on raske liialdada.

  1. Lihtne graafiline loomine on mitteprofessionaalidele juba käeulatuses selliste tööriistadega nagu DALL-E, Midjourney ja Stable Diffusion, vähemalt lihtsatel utilitaarsetel eesmärkidel, näiteks selle postituse päisepildi saamiseks. Enne seda aastat ei saanud ma täiesti oma pilte joonistada ja ajaveebieksperdid soovitasid mitte raisata aega oma lugude graafilisele kujundamisele.
  2. Fototöötluse kasutajad ei pea Photoshopi või Affinity Photo keeruka tööriistakomplekti omandamiseks taluma rasket õppimiskõverat (kasutan viimast ja see on nii keeruline, et pean YouTube'i õpetustega tutvuma, et õppida, kuidas enamikke kohandusi teha). Generatiivse tehisintellektiga paluvad kasutajad tarkvaral teha antud teisendus ja voila! Pilt parandatakse. Kui Adobe ei suuda generatiivset AI-d oma tööriistadega tarnida, häirivad neid uued idufirmad, kes neid pakuvad, ja nad lähevad Blockbusteri teed.
  3. Esitlustööriistad, nagu PowerPoint, loovad ja viimistlevad ideekavandite põhjal terveid professionaalsel tasemel esitlusi, selle asemel, et pakkuda lihtsalt malle, nagu praegu. Praegu on erinevus professionaalsete ja amatööride ettekannete vahel tohutu – see ei ole enam nii.
  4. Teksti kirjutamine on protsess, mida Generative AI tööriistad täiustavad. Paljud kirjutamisvormid saavad juba abi keerukatest tööriistadest, nagu Grammarly, kuid Generative AI annab kirjanikele kvalitatiivselt uue taseme abi, luues näiteks ajaveebi täieliku esimese versiooni. Kirjutamine on koostööprotsess inimeste ja tehisintellekti tööriista vahel.
  5. Iga lõppkasutajale mõeldud tarkvara peab olema teksti- või hääljuhistega hõlpsasti kasutatav. Kasutusjuhendid ja juhendvideod jäävad minevikku ning niipea, kui kasutajad harjuvad uue lihtsa tarkvara kasutusviisiga, peavad kõik seda pakkuma, et püsida asjakohane.
  6. Keeleõpe toimub peamiselt hääleassistentide abil, mille toiteallikaks on – arvasite õigesti – generatiivne AI. Hääleabilised, kes tegutsevad nagu isiklikud keeletreenerid, kasutavad oma hämmastavaid loomuliku keele dialoogivõimalusi, mida esmakordselt nähti sellistes süsteemides nagu Google'i LaMDA, et juhendada inimkeeleõppijat sõnavara ja väljendite omandamisel, häälduse parandamisel jne. Keeleõpetus hääleassistendid ei ole futuristlik fantaasia – see on praegu lihtsalt majanduslikult mõttekas.
  7. Isegi riistvaratoodetel (nt autodel) on Generative AI dialoogipõhised abisüsteemid. Kas olete proovinud teha keerulist toimingut, näiteks tänapäevaste autode ekraani reguleerimist? Pole lihtne, ma võin teile öelda. Selle asemel, et süveneda keerulistesse juhenditesse, paluge hääleassistendil lihtsalt juhiseid hankida või kohe seadistusi teha.

Paljud elukutsed muutuvad tundmatuseni. Graafilised disainerid juba tunnevad selle häire kipitust. Terved elukutsed kaovad ja tekib teisi. Võimsad ettevõtted lähevad pankrotti ja uued ettevõtted muutuvad domineerivaks, olenevalt sellest, kui hästi nad Generative AI põhjustatud tehniliste häiretega toime tulevad.

Ja kõik see juhtub selle kümnendi jooksul.

Ma võin eksida, kuid mulle tundub, et isegi kogenud tehnikatundjatel oli raske prognoosida praeguste pildi- ja tekstigeneraatorite tohutut võimekust: paar aastat tagasi polnud veel selge, et tohutud mudelid ja treeningkomplektid viia kvalitatiivselt erinevate võimeteni.

Ma läheksin nii kaugele, et ütleksin, et see oli õnnelik, peaaegu juhuslik leid. Kuid nüüd, kus meil on generatiivsed tööriistad, on väravad avatud uuenduslikele ettevõtetele, kes arendavad rakendust rakenduse järel kiires tempos: enamasti on vaja välja mõelda, mida saaks radikaalselt parandada, ja leida sobiv ärimudel, millest äri teha. Generatiivse IA idee.

Paar aastat tagasi tundus, et teised tehnikatrendid, nagu isejuhtivad autod, VR või plokiahel, võtavad peagi võimust, kuid isejuhtimise tehnoloogiat on piiranud seadusandlikud takistused, plokiahelat tabas majanduslangus ja VR kasutuselevõttu piiravad riistvara kõrged kulud. Selle asemel ei ole generatiivne tehisintellekt veel õigusaktidega piiratud (hei, PowerPointi esitluse lihvimine või spordivideo loomine ei ole elu või surma küsimus) ning kasutajal pole vaja kallist riistvara osta.

Ja me ei arvanud, et loominguline tegevus niipea häiritud saab. Aga nad olid.

Oleme jõudmas uutesse ja mõnikord veidratesse aegadesse, kus inimese loovus seguneb masinate uute võimetega niivõrd, et neid on raske eristada. Nagu J. Currier juhib tähelepanu sellele:

„Täna ja paari järgmise aasta jooksul tundub see üllatav ja paljuski hirmutav. Sest need loomingulised hetked, kus minnakse nullideedest algideteni, on alati tundunud nii ainulaadselt inimlikud, sest see on olnud nii salapärane.

Kuidas generatiivne IA häirib kõike praegusel kümnendil Avaldatud allikast https://towardsdatascience.com/how-generative-ia-will-disrupt-everything-in-the-current-decade-b4e8ce7dd4f1?source=rss—-7f60cf5620c9— 4 https://towardsdatascience.com/feed kaudu

<!–

->

Ajatempel:

Veel alates Blockchaini konsultandid