Üretken IA, İçinde bulunduğumuz On Yılda Her Şeyi Nasıl Bozacak?

Birçoğu şaşıracak

Yazarın Stabil Difüzyonlu görüntüsü

In Son aylarda Midjourney, DALL-E, Stable Diffusion, LaMDA ve PaLM gibi yapay zeka sistemleri görüntü ve metin oluşturma gibi çok çeşitli alanlarda büyük ilerlemeler kaydetti. Bu sistemlerin yetenekleri etkileyicidir: son derece düşündürücü görüntüler üretirler, reklam için etkili satış kopyaları oluştururlar ve çok daha fazlasını yaparlar; bunların hepsi kullanıcının ne almak istediğini açıklayan yalnızca "istemlerden" oluşur.

Bütün bunlar Üretken Yapay Zeka ile yapılıyor.

“Üretici Yapay Zeka”, tarafından desteklenen sistemleri ifade eder. derin sinir ağları uygulayan Büyük Dil Modelleri (LLM) amacıyla yaratmak bir çeşit içerik. Burada "yaratmak" diyorum, yani zaten var olan bir şeyin kopyası değil, felsefi anlamda değil (zaten "yaratılış" nedir?).

Bu cesur yeni dünyada büyük yeni şirketler ortaya çıkıyor. Jasperhem metin satışı hem de reklam amaçlı görsel üretimi sunan Jasper, artık bir milyar doların üzerinde bir değerlemeye sahip ve bir gecede tek boynuzlu at haline geldi.

Gerçekten başarıya ulaşan ilk Üretken Yapay Zeka platformu, yalnızca birkaç yıl önce piyasaya sürülen GPT-3'tü! Bundan sonra, sahadaki birçok oyuncunun (OpenAI, Google, StableDiffusion, Google, DeepMind ve diğerleri) peş peşe yayınları baş döndürücü bir hızla ortaya çıktı; o kadar ki güncel kalmak zor.

Ancak Midjourney'de istemlerimizden görseller oluşturmak için biraz zaman geçirmenin ne kadar eğlenceli ve fantastik olduğunun ötesinde, birçok teknoloji meraklısı bu Üretken IA dalgasını anlamlandırmakta zorlanıyor.

Üretken IA sağlam bir trend mi, yoksa sadece geçici bir moda mı?

" için gideceğimsağlam eğilimÇünkü bu on yıl içerisinde binlerce mesleki ve boş zaman faaliyetini dönüştürecek. Bir örnekle başlayayım.

Ben büyük bir tenis hayranıyım (en azından TV anlamında). Ancak canlı tenis maçlarının bitmesi saatler sürüyor ve başka aktivitelerim ve ilgi alanlarım var, bu yüzden genellikle tekrarları izlemeyi tercih ediyorum veya maçın en eğlenceli 4 dakikasını içeren öne çıkan videoları izliyorum.

Peki ya 4 dakikalık bir video yerine 10 veya 15 dakikalık bir video istersem? Veya her noktayı eşitlik bozmalara dahil etmek istersem? Şu anda şansım yaver gitti.

Şimdi Generative-IA şapkanızı işe koyun: Generative IA spor video oluşturucusu bir video oluşturacaktır sadece senin için Aşağıdaki gibi bir metin istemine gayri resmi olarak koyduğunuz spesifikasyonlara göre:

"Paris Bercy 15'deki Rafa Nadal - Tommy Paul maçının en eğlenceli anlarını içeren, varsa tam eşitlik bozmaları ve dönüştürülen tüm kırılma noktalarını içeren yaklaşık 2022 dakikalık videobaşlıklı bir kılavuz yayınladı

Bu kadar. Dünyadaki herhangi bir kişinin izlediği videodan farklı olarak, kişiselleştirilmiş videonuzla bir bağlantı alırsınız. Ve bu video hizmeti ekonomik olarak DALL-E ve Midjourney kadar uygun olacaktır.

Araştırma inovasyondan farklıdır. İlki, yayınlanmış orijinal sonuçlarla ilgilidir ve ikincisi, bu sonuçlardan nasıl bir iş kurulacağını bulmakla daha çok ilgilidir: inovasyon orijinallikle değil, büyümeyle, savunulabilirlikle, yatırım getirisiyle vb. ilgilenir.

Çoğu zaman işler kafa karıştırıcı hale geliyor çünkü araştırmalar Google gibi prensipte kar elde etmek için var olan şirketler tarafından yapılıyor ancak işlerinin yüksek teknolojiye dayalı olduğunu biliyorlar ve araştırma olmadan teknoloji yüksek değildir. Böylece araştırmaların finansmanına dahil oluyorlar ve akademi ile yakınlaşıyorlar; en iyi araştırmacılarının çoğu akademiden işe alınıyor. Ben de bir araştırmacı olarak, birkaç yıl önce Mountain View'daki genel merkezlerindeki Fakülte Zirvesi'ne davet edildim ve beni Four Seasons otelindeki bir süite yerleştirdiler; akademik camia üzerinde iyi bir izlenim bırakmak için ne gerekiyorsa yapın!

Ancak araştırma ve yenilik arasında net bir ayrım yapmak zor ve hatta yapay olsa bile, buradaki fark çok önemlidir çünkü Üretken Yapay Zeka durumunda ikisi farklı aktörler tarafından geliştirilecek ve birbiriyle ilişkilendirilecektir. yazılım yığınında iki farklı katmanla J. Currier'in belirttiği:

  1. En alttaki yazılım katmanı ise Derin Öğrenme modeliBüyük Dil Modelleri (LLM) veya eşdeğer dahili temsilin uygulamaları etrafında inşa edilmiştir. Modeller, uygulamaların geliştirilebileceği temel yapı taşını sağlar.
  2. En üstteki yazılım katmanı uygulama Örneğin bir metin isteminden bir görüntünün çıktısını almak gibi belirli bir görevi gerçekleştirmek için Derin Öğrenme modelinin üzerine inşa edilen bir tanesi.

Bu iki katmanlı mimari, yeni bir hızlandırılmış inovasyon çağını ateşleyecek çünkü alt katman Google, OpenAI ve diğerleri gibi çok büyük şirketler tarafından geliştirildiğinde, daha küçük şirketler uygulama katmanını sağlayacak ve elbette karlarından bir pay alacak. alt katman sağlayıcısına.

Şu anda alt katman hızla geliştirildi ve çoğu zaman üstteki bir uygulamayla birlikte dağıtıldı. Örneğin, LaMDA ve PaLM kutudan çıktığı gibi diyalog yetenekleri sunarken, DALL-E ve Midjourney görüntü istemi hizmetleri sunar. Ancak çok geçmeden, alt katman için açık kaynak alternatiflerinin çoğalması, yalnızca üst uygulama katmanını geliştirmeyi ve onu zaten mevcut olan alt katmana yerleştirmeyi mümkün kılacak. Tabii ki söylemesi yapmaktan daha kolay, ama gerçek şu ki alt katman üst katmandan çok daha karmaşık.

Ben şunu iddia ediyorum: Üretken IA hemen hemen her bilgi çalışmasına ve boş zaman etkinliğine nüfuz edecek çünkü eskiden zor olan aktivitelerden karmaşıklığı uzaklaştıracak araçlar sağlayacak ve benim "üretken kişiselleştirme" adını verdiğim tamamen yeni bir kişiselleştirme düzeyi sağlayabilecek.

Yukarıdaki spor videosu örneğinde "üretken kişiselleştirmenin" ne olduğunu görebilirsiniz: her kullanıcıya yalnızca iki veya üç seçenek arasında seçim yapmak yerine yepyeni ve benzersiz bir öne çıkanlar videosu sunulur.

Tüm Üretken IA uygulamalarının kümülatif etkisini abartmak zordur:

  1. Kolay grafik oluşturma, DALL-E, Midjourney ve Stable Diffusion gibi araçlarla, en azından bu yazı için başlık resmi almak gibi basit faydacı amaçlar için, profesyonel olmayanların zaten erişebileceği bir yerdedir. Bu yıldan önce kendi görsellerimi çizemiyordum ve blog uzmanları kendi hikayeleriniz için grafik tasarımla zaman kaybetmemenizi tavsiye ediyordu.
  2. Fotoğraf düzenleme kullanıcılarının, Photoshop veya Affinity Photo'nun karmaşık araç setinde uzmanlaşmak için zorlu bir öğrenme sürecine katlanmaları gerekmeyecek (ikincisini kullanıyorum ve bu o kadar karmaşık ki, çoğu ayarlamayı nasıl yapacağımı öğrenmek için YouTube eğitimlerine başvurmam gerekiyor). Üretken AI ile kullanıcılar yazılımdan belirli bir dönüşümü gerçekleştirmesini isteyecek ve işte! Görüntü düzelecektir. Adobe, Üretken Yapay Zeka'yı araçlarıyla birlikte sunmayı başaramazsa, bunları sunan yeni girişimler nedeniyle sekteye uğrayacak ve Blockbuster'ın yoluna gidecekler.
  3. PowerPoint gibi sunum araçları, şu anda olduğu gibi yalnızca şablonlar sağlamak yerine, taslak fikirlerden profesyonel düzeydeki sunumların tamamını oluşturacak ve ince ayarlar yapacaktır. Şu anda profesyonel ve amatör sunumlar arasındaki fark çok büyük; artık durum böyle olmayacak.
  4. Metin yazma, Üretken Yapay Zeka araçlarıyla oldukça geliştirilmiş bir süreç olacaktır. Pek çok yazma biçimi hâlihazırda Grammarly gibi gelişmiş araçlardan yardım alıyor ancak Üretken Yapay Zeka, örneğin bir blogun ilk versiyonunun tamamını oluşturarak yazarlara niteliksel olarak yeni bir düzeyde yardım sağlayacak. Yazma, insanlar ve yapay zeka aracı arasında işbirliğine dayalı bir süreç olacaktır.
  5. Son kullanıcıya yönelik herhangi bir yazılımın, metin veya sesli komutlarla kullanımının basit olması gerekecektir. Kullanım kılavuzları ve eğitici videolar geçmişte kalacak ve kullanıcılar yazılımı kullanmanın yeni ve basit yoluna alıştıkları anda, alakalı kalabilmek için her şeyin onu sunması gerekecek.
  6. Dil öğrenimi esas olarak, –doğru tahmin ettiniz– Üretken Yapay Zeka tarafından desteklenen sesli asistanların yardımıyla gerçekleştirilecek. Kişisel dil koçları gibi davranacak olan sesli asistanlar, ilk olarak Google'ın LaMDA'sı gibi sistemlerde görülen şaşırtıcı doğal dil diyalog yeteneklerini kullanarak, kelime ve ifadeler edinmek, telaffuzu geliştirmek vb. amacıyla dil öğrenen kişiye rehberlik edecek. Sesli asistanlar fütüristik bir fantezi değil; sadece şu an itibariyle ekonomik açıdan mantıklı.
  7. Donanım ürünlerinde bile (arabalar gibi) Üretken Yapay Zeka diyalog tabanlı yardım sistemleri bulunacaktır. Modern arabalarda ekranı ayarlamak gibi karmaşık bir işlem gerçekleştirmeyi denediniz mi? Kolay değil, söyleyebilirim. Karmaşık kılavuzlara dalmak yerine, sesli asistandan talimat almasını veya doğrudan ayarlamaları yapmasını isteyeceksiniz.

Pek çok meslek tanınmayacak şekilde dönüşecek. Grafik tasarımcıları bu aksaklığın acısını şimdiden hissediyorlar. Bütün meslekler ortadan kalkacak ve başka meslekler yaratılacak. Güçlü şirketler iflas edecek ve Üretken Yapay Zeka'nın getirdiği teknolojik aksaklığı ne kadar iyi idare ettiklerine bağlı olarak yenileri baskın hale gelecektir.

Ve bunların hepsi bu on yıl içinde gerçekleşecek.

Yanılıyor olabilirim ama bana öyle geliyor ki, mevcut görüntü ve metin oluşturucuların muazzam yeteneklerini tahmin etmek deneyimli teknoloji uzmanları için bile zordu: birkaç yıl öncesine kadar devasa modellerin ve eğitim setlerinin bu kadar başarılı olabileceği açık değildi. niteliksel olarak farklı yeteneklere yol açar.

Bunun şanslı, neredeyse tesadüfi bir bulgu olduğunu söyleyecek kadar ileri giderdim. Ancak artık üretken araçlara sahip olduğumuza göre, hızlı bir tempoda uygulama üstüne uygulama geliştirecek yenilikçi şirketlere kapılar açık: mesele çoğunlukla neyin radikal biçimde iyileştirilebileceğini bulmak ve bundan iş yapmak için uygun iş modelini bulmak meselesi. Üretken bir IA fikri.

Birkaç yıl önce, otonom arabalar, VR veya blockchain gibi diğer teknoloji trendlerinin yakında devralacağı görülüyordu ancak otonom sürüş teknolojisi yasal engeller nedeniyle sınırlıydı, blockchain ekonomik krizden etkilendi ve VR benimsenmesi donanımın yüksek maliyetleri nedeniyle sınırlıdır. Bunun yerine, üretken yapay zeka henüz mevzuatla sınırlı değil (hey, bir PowerPoint sunumunu cilalamak veya bir spor videosu oluşturmak bir ölüm kalım meselesi değil) ve kullanıcı tarafından satın alınacak pahalı donanımlara ihtiyaç duymuyor.

Ve yaratıcı faaliyetlerin bu kadar çabuk kesintiye uğrayacağını düşünmemiştik. Ama öyleydi.

İnsan yaratıcılığının makinelerin yeni yetenekleriyle, aralarında ayrım yapmanın zorlaşacak kadar karıştığı yeni ve bazen tuhaf zamanlara giriyoruz. Gibi J. Currier işaret:

"Bugün ve önümüzdeki birkaç yıl boyunca bu durum şaşırtıcı ve birçok açıdan korkutucu olacak. Çünkü sıfırdan başlangıç ​​fikirlerine doğru gittiğiniz o yaratıcı anlar her zaman çok insana özgü hissettirmiştir, çünkü çok gizemli olmuştur.”

Üretken IA, İçinde Bulunduğumuz On Yılda Her Şeyi Nasıl Bozacak? Kaynaktan yayımlanmıştır: https://towardsdatascience.com/how-generative-ia-will-disrupt-everything-in-the-current-decade-b4e8ce7dd4f1?source=rss—-7f60cf5620c9— 4 https://towardsdatascience.com/feed aracılığıyla

<!–

->

Zaman Damgası:

Den fazla Blockchain Danışmanları