Bagaimana IA Generatif akan Mengganggu Segalanya di Dekade Saat Ini

Banyak yang akan terkejut

Gambar oleh penulis dengan Difusi Stabil

In beberapa bulan terakhir, sistem AI seperti Midjourney, DALL-E, Stable Diffusion, LaMDA, dan PaLM telah membuat kemajuan besar dalam berbagai domain seperti pembuatan gambar dan teks. Kemampuan sistem ini sangat mengesankan: menghasilkan gambar yang sangat sugestif, menciptakan salinan penjualan yang efektif untuk iklan, dan masih banyak lagi โ€“ semuanya hanya dari โ€œperintahโ€ yang menggambarkan apa yang ingin didapatkan pengguna.

Semua ini dilakukan dengan AI Generatif.

โ€œAI Generatifโ€ mengacu pada sistem yang didukung oleh jaringan saraf yang dalam implementasi itu Model Bahasa Besar (LLM) untuk membuat semacam konten. Di sini saya katakan โ€œmenciptakan,โ€ artinya ini bukan salinan dari sesuatu yang sudah ada, bukan dalam pengertian filosofis (apa sih yang dimaksud dengan โ€œpenciptaanโ€?).

Perusahaan-perusahaan besar baru bermunculan di dunia baru yang berani ini Yasper, yang menawarkan generasi salinan penjualan dan juga gambar untuk iklan: Jasper kini memiliki valuasi lebih dari satu miliar dolar, menjadi unicorn dalam semalam.

Platform AI Generatif pertama yang benar-benar berhasil adalah GPT-3 โ€“yang dirilis beberapa tahun lalu! Setelah itu, serangkaian rilis yang dilakukan oleh beberapa pemain di bidang ini (OpenAI, Google, StableDiffusion, Google, DeepMind, dan lainnya) muncul dengan kecepatan yang sangat tinggi, sedemikian rupa sehingga sulit untuk tetap mengikuti perkembangan terkini.

Namun selain betapa menyenangkan dan fantastisnya menghabiskan waktu bersama Midjourney untuk membuat gambar dari perintah kami, banyak penggemar teknologi yang kesulitan memahami gelombang IA Generatif ini.

Apakah IA Generatif merupakan tren yang solid, atau hanya sekedar iseng saja?

aku akan pergi untuk โ€œtren yang solidโ€ karena ini akan mengubah ribuan aktivitas profesional dan rekreasi dalam dekade ini. Izinkan saya memulai dengan sebuah contoh.

Saya penggemar berat tenis (setidaknya dalam pengertian TV). Namun pertandingan tenis langsung membutuhkan waktu berjam-jam untuk diselesaikan, dan saya memiliki aktivitas dan minat lain, jadi saya biasanya menonton tayangan ulang atau hanya menyoroti video dengan durasi paling menghibur sekitar 4 menit dari sebuah pertandingan.

Namun bagaimana jika alih-alih video berdurasi 4 menit, saya ingin video berdurasi 10 atau 15 menit? Atau apakah saya ingin memasukkan setiap poin ke dalam tie-break? Saat ini saya kurang beruntung.

Sekarang gunakan topi Generatif-IA Anda: generator video olahraga Generatif IA akan membuat video hanya untukmu sesuai dengan spesifikasi yang Anda masukkan secara informal ke dalam teks prompt seperti berikut:

"Video berdurasi sekitar 15 menit dengan poin paling menghibur pertandingan Rafa Nadal vs Tommy Paul di Paris Bercy 2022, termasuk tiebreak lengkap jika ada, serta setiap breakpoint yang dikonversi"

Itu dia. Anda mendapatkan tautan dengan video hasil personalisasi Anda, berbeda dari video yang ditonton oleh orang lain di dunia. Dan layanan video ini layak secara ekonomi seperti DALL-E dan Midjourney.

Penelitian berbeda dengan inovasi. Yang pertama berkaitan dengan hasil-hasil asli yang dipublikasikan, dan yang kedua lebih berkaitan dengan menemukan cara membangun bisnis dari hasil-hasil tersebut: inovasi tidak peduli pada orisinalitas tetapi tentang pertumbuhan, pertahanan, laba investasi, dan sebagainya.

Seringkali hal-hal menjadi membingungkan karena penelitian dilakukan oleh perusahaan seperti Google, yang pada prinsipnya bertujuan untuk mendapatkan keuntungan โ€“tetapi mereka memahami bahwa bisnis mereka berteknologi tinggi, dan teknologi tidak akan tinggi tanpa penelitian. Jadi mereka terlibat dalam pendanaan penelitian, serta mendekatkan diri dengan dunia akademis โ€“ banyak peneliti terkemuka mereka direkrut dari dunia akademis. Sebagai seorang peneliti, saya diundang ke Pertemuan Fakultas di kantor pusat mereka di Mountain View beberapa tahun yang lalu, dan mereka menempatkan saya di sebuah suite di hotel Four Seasons โ€“ apa pun yang diperlukan untuk memberikan kesan yang baik pada komunitas akademis!

Namun meskipun sulit โ€“dan bahkan dibuat-buatโ€“ untuk membedakan antara penelitian dan inovasi, perbedaannya sangat penting karena, dalam kasus AI Generatif, keduanya akan dikembangkan oleh aktor yang berbeda, dan keduanya akan terkait. dengan dua lapisan berbeda dalam tumpukan perangkat lunak โ€“as ditunjukkan oleh J. Currier:

  1. Lapisan perangkat lunak paling bawah adalah Model Pembelajaran Mendalam, dibangun berdasarkan implementasi Model Bahasa Besar (LLM) atau representasi internal yang setara. Model memberikan landasan dasar dimana aplikasi dapat dikembangkan.
  2. Lapisan perangkat lunak teratas adalah aplikasi satu, yang dibangun di atas model Pembelajaran Mendalam untuk menyelesaikan tugas tertentu, misalnya, untuk mengeluarkan gambar dari perintah teks.

Arsitektur dua lapisan ini akan memicu era baru percepatan inovasi karena ketika lapisan terbawah dikembangkan oleh perusahaan-perusahaan besar seperti Google, OpenAI, dan lainnya, perusahaan-perusahaan kecil akan menyediakan lapisan aplikasi โ€“ tentu saja memberikan potongan keuntungan bagi mereka. ke penyedia lapisan bawah.

Saat ini, lapisan bawah telah diperbaiki dengan cepat โ€“ dan seringkali, lapisan tersebut telah didistribusikan bersama dengan aplikasi di atasnya. Misalnya, LaMDA dan PaLM menawarkan kemampuan dialog yang siap pakai, sementara DALL-E dan Midjourney menawarkan layanan prompt-to-image. Namun dalam waktu dekat, menjamurnya alternatif sumber terbuka untuk lapisan bawah akan memungkinkan untuk mengembangkan hanya lapisan aplikasi teratas dan menyambungkannya ke lapisan bawah yang sudah tersedia. Tentu saja lebih mudah diucapkan daripada dilakukan, namun kenyataannya lapisan bawah jauh lebih kompleks daripada lapisan atas.

Saya berpendapat bahwa IA Generatif akan meresapi hampir setiap aktivitas kerja dan rekreasi pengetahuan karena hal ini akan memberikan alat untuk menghilangkan kompleksitas dari aktivitas yang sebelumnya sulit dan karena hal ini dapat memberikan tingkat personalisasi baru yang saya sebut โ€œpersonalisasi generatif.โ€

Anda dapat melihat apa yang dimaksud dengan โ€œpersonalisasi generatifโ€ dari contoh video olahraga di atas: setiap pengguna diberikan video sorotan yang benar-benar baru dan unik, bukan hanya pilihan antara dua atau tiga opsi.

Dampak kumulatif dari semua aplikasi Generatif IA sulit untuk dilebih-lebihkan:

  1. Pembuatan grafis yang mudah sudah dapat dijangkau oleh non-profesional dengan alat seperti DALL-E, Midjourney, dan Stable Diffusion, setidaknya untuk tujuan utilitarian sederhana seperti mendapatkan gambar header untuk postingan ini. Sebelum tahun ini, saya sama sekali tidak bisa menggambar sendiri, dan pakar blog menyarankan agar tidak membuang waktu untuk desain grafis untuk cerita Anda sendiri.
  2. Pengguna pengeditan foto tidak perlu melalui proses belajar yang sulit untuk menguasai seperangkat alat Photoshop atau Affinity Photo yang rumit (saya menggunakan yang terakhir, dan ini sangat rumit sehingga saya harus membaca tutorial YouTube untuk mempelajari cara membuat sebagian besar penyesuaian). Dengan AI Generatif, pengguna cukup meminta perangkat lunak untuk melakukan transformasi tertentu, dan voila! Gambar akan diperbaiki. Jika Adobe gagal menghadirkan AI Generatif pada alatnya, mereka akan terganggu oleh startup baru yang menawarkannya dan akan beralih ke Blockbuster.
  3. Alat presentasi seperti PowerPoint, alih-alih hanya menyediakan templat seperti sekarang, akan menghasilkan dan menyempurnakan seluruh presentasi tingkat profesional dari ide garis besar. Saat ini, perbedaan antara presentasi profesional dan amatir sangat besar โ€“ hal ini tidak akan terjadi lagi.
  4. Penulisan teks akan menjadi proses yang sangat ditingkatkan dengan alat AI Generatif. Banyak bentuk penulisan yang sudah mendapatkan bantuan dari alat canggih seperti Grammarly, namun AI Generatif akan memberi penulis tingkat bantuan yang secara kualitatif baru, misalnya dengan membuat versi pertama blog yang lengkap. Menulis akan menjadi proses kolaboratif antara manusia dan alat AI.
  5. Perangkat lunak apa pun yang ditujukan untuk pengguna akhir harus mudah digunakan dengan perintah teks atau suara. Panduan pengguna dan video instruksi akan menjadi masa lalu, dan segera setelah pengguna terbiasa dengan cara baru yang sederhana dalam menggunakan perangkat lunak, segala sesuatu harus ditawarkan agar tetap relevan.
  6. Pembelajaran bahasa akan dilakukan terutama dengan bantuan asisten suara, yang akan didukung oleh โ€“Anda dapat menebaknya dengan benarโ€“ AI Generatif. Asisten suara, yang akan bertindak seperti pelatih bahasa pribadi, akan menggunakan kemampuan dialog bahasa alami mereka yang luar biasa, yang pertama kali terlihat dalam sistem seperti LaMDA Google, untuk memandu pembelajar bahasa manusia guna memperoleh kosakata dan ekspresi, meningkatkan pengucapan, dll. Pengajaran bahasa asisten suara bukanlah fantasi futuristik โ€“hanya masuk akal secara ekonomi saat ini.
  7. Bahkan produk perangkat keras (seperti mobil) akan memiliki sistem bantuan berbasis dialog AI Generatif. Pernahkah Anda mencoba melakukan operasi rumit seperti menyesuaikan tampilan pada mobil modern? Tidak mudah, saya dapat memberitahu Anda. Daripada menggali manual yang rumit, Anda cukup meminta asisten suara untuk mendapatkan instruksi atau langsung melakukan penyesuaian.

Banyak profesi akan mengalami transformasi yang tidak dapat dikenali lagi. Desainer grafis sudah merasakan dampak dari gangguan ini. Seluruh profesi akan hilang, dan profesi lain akan tercipta. Perusahaan-perusahaan besar akan bangkrut, dan perusahaan-perusahaan baru akan menjadi dominan, tergantung pada seberapa baik mereka menangani disrupsi teknologi yang disebabkan oleh AI Generatif.

Dan semua ini akan terjadi dalam dekade ini.

Saya mungkin salah, namun menurut saya sulit, bahkan bagi pakar teknologi berpengalaman, untuk memperkirakan kemampuan luar biasa dari generator gambar dan teks saat ini: beberapa tahun yang lalu tidak terlihat bahwa model dan rangkaian pelatihan yang besar akan mampu melakukannya. menghasilkan kemampuan yang berbeda secara kualitatif.

Saya bahkan mengatakan bahwa ini adalah sebuah keberuntungan, penemuan yang hampir acak. Namun kini kita telah memiliki alat generatif, pintu terbuka bagi perusahaan-perusahaan berinovasi yang akan mengembangkan aplikasi demi aplikasi dengan cepat: yang terpenting adalah mencari tahu apa yang dapat ditingkatkan secara radikal dan menemukan model bisnis yang sesuai untuk memulai bisnis. ide IA Generatif.

Beberapa tahun yang lalu, sepertinya tren teknologi lainnya, seperti mobil self-driving, VR, atau blockchain, akan segera mengambil alih, namun teknologi self-driving telah dibatasi oleh hambatan legislatif, blockchain terkena dampak krisis ekonomi, dan VR. adopsi dibatasi oleh biaya perangkat keras yang tinggi. Sebaliknya, AI generatif belum dibatasi oleh undang-undang (hei, menyempurnakan presentasi PowerPoint atau membuat video olahraga bukanlah masalah hidup atau mati) dan tidak memerlukan perangkat keras yang mahal untuk dibeli oleh pengguna.

Dan kami tidak menyangka aktivitas kreatif akan terganggu secepat ini. Tapi memang begitu.

Kita sedang memasuki masa baru dan terkadang aneh, saat kreativitas manusia bercampur dengan kemampuan baru mesin hingga sulit membedakan keduanya. Sebagai J.Kurier menunjukkan:

โ€œSaat ini dan beberapa tahun ke depan, hal ini akan terasa mengejutkan dan dalam banyak hal menakutkan. Karena momen-momen kreatif di mana Anda beralih dari ide nol ke ide awal selalu terasa sangat manusiawi, karena sangat misterius.โ€

Bagaimana IA Generatif Akan Mengganggu Segalanya dalam Dekade Saat Ini Diterbitkan Ulang dari Sumber https://towardsdatascience.com/how-generative-ia-will-disrupt-everything-in-the-current-decade-b4e8ce7dd4f1?source=rssโ€”-7f60cf5620c9โ€” 4 melalui https://towardsdatascience.com/feed

<!โ€“

->

Stempel Waktu:

Lebih dari Konsultan Blockchain