Generative IA จะทำลายทุกสิ่งในทศวรรษปัจจุบันอย่างไร

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

หลายคนคงจะแปลกใจ

In หลายเดือนที่ผ่านมา ระบบ AI เช่น Midjourney, DALL-E, Stable Diffusion, LaMDA และ PaLM ได้สร้างความก้าวหน้าอย่างมากในโดเมนที่มีความหลากหลายพอๆ กับการสร้างรูปภาพและข้อความ ความสามารถของระบบเหล่านี้น่าประทับใจ: สร้างภาพที่มีการชี้นำทางเพศสูง สร้างสำเนาการขายที่มีประสิทธิภาพสำหรับการโฆษณา และอื่นๆ อีกมากมาย ทั้งหมดนี้มาจาก "ข้อความแจ้ง" ที่อธิบายถึงสิ่งที่ผู้ใช้ต้องการได้รับ

ทั้งหมดนี้ทำได้ด้วย Generative AI

“Generative AI” หมายถึงระบบที่ขับเคลื่อนโดย เครือข่ายประสาทลึก ที่ใช้ โมเดลภาษาขนาดใหญ่ (LLM) เพื่อ สร้าง เนื้อหาบางประเภท ในที่นี้ฉันพูดว่า "สร้าง" ซึ่งหมายความว่ามันไม่ใช่สำเนาของสิ่งที่มีอยู่แล้ว ไม่ใช่ในความหมายเชิงปรัชญา (อย่างไรก็ตาม "การทรงสร้าง" คืออะไร?)

บริษัทใหม่ขนาดใหญ่กำลังเกิดขึ้นในโลกใหม่ที่กล้าหาญเช่นนี้ นิลซึ่งนำเสนอทั้งการขายสำเนาและรูปภาพสำหรับการโฆษณา ปัจจุบัน Jasper มีมูลค่ามากกว่าหนึ่งพันล้านดอลลาร์ และกลายเป็นยูนิคอร์นในชั่วข้ามคืน

แพลตฟอร์ม Generative AI แรกที่สร้างความฮือฮาอย่างแท้จริงคือ GPT-3 ซึ่งเปิดตัวเมื่อไม่กี่ปีก่อน! หลังจากนั้น การเผยแพร่อย่างต่อเนื่องโดยผู้เล่นหลายคนในสนาม (OpenAI, Google, StableDiffusion, Google, DeepMind และอื่น ๆ ) ปรากฏขึ้นอย่างรวดเร็วจนทำให้ยากที่จะติดตามกระแส

แต่นอกเหนือจากความสนุกและอัศจรรย์คือการใช้เวลากับ Midjourney เพื่อสร้างภาพจากคำแนะนำของเราแล้ว ผู้ที่ชื่นชอบเทคโนโลยีจำนวนมากยังต้องดิ้นรนเพื่อทำความเข้าใจคลื่น Generative IA นี้

Generative IA เป็นเทรนด์ที่แข็งแกร่งหรือเป็นเพียงแฟชั่น?

ฉันจะไปเพื่อ “แนวโน้มที่มั่นคง” เพราะจะเปลี่ยนกิจกรรมด้านอาชีพและการพักผ่อนนับพันรายการในทศวรรษนี้ ผมขอเริ่มต้นด้วยตัวอย่าง

ฉันเป็นแฟนเทนนิสตัวยง (อย่างน้อยก็ในแง่ทีวี) แต่การแข่งขันเทนนิสสดใช้เวลาหลายชั่วโมงจึงจะเสร็จสิ้น และฉันมีกิจกรรมและความสนใจอื่น ๆ ดังนั้นฉันจึงมักจะหันไปดูการเล่นย้อนหลังหรือเพียงแค่ไฮไลต์วิดีโอที่มีความบันเทิงมากที่สุดประมาณ 4 นาทีจากการแข่งขัน

แต่จะเป็นอย่างไร แทนที่จะเป็นวิดีโอความยาว 4 นาที ฉันอยากได้วิดีโอความยาว 10 หรือ 15 นาทีล่ะ หรือถ้าผมอยากรวมทุกแต้มไว้ในไทเบรกล่ะ? ขณะนี้ฉันโชคไม่ดี

ตอนนี้ให้หมวก Generative-IA ของคุณใช้งานได้: โปรแกรมสร้างวิดีโอกีฬา Generative IA จะสร้างวิดีโอ สำหรับคุณ ตามข้อกำหนดที่คุณระบุไว้อย่างไม่เป็นทางการในข้อความแจ้งดังต่อไปนี้:

"วิดีโอความยาวประมาณ 15 นาทีพร้อมแต้มความบันเทิงที่สุดของแมตช์ระหว่าง Rafa Nadal กับ Tommy Paul ใน Paris Bercy 2022 รวมถึงไทเบรกแบบสมบูรณ์หากมี รวมถึงทุกเบรกพอยต์ที่แปลงแล้ว"

แค่นั้นแหละ. คุณจะได้รับลิงก์พร้อมวิดีโอส่วนตัวของคุณ ซึ่งแตกต่างจากวิดีโอที่ใครๆ ในโลกรับชม และบริการวิดีโอนี้จะเป็นไปได้ในเชิงเศรษฐกิจพอๆ กับ DALL-E และ Midjourney

การวิจัยแตกต่างจากนวัตกรรม แบบแรกเกี่ยวข้องกับผลลัพธ์ต้นฉบับที่เผยแพร่ และแบบหลังเกี่ยวข้องกับการหาวิธีสร้างธุรกิจจากผลลัพธ์เหล่านั้นมากกว่า: นวัตกรรมไม่สนใจเกี่ยวกับความคิดริเริ่ม แต่เกี่ยวกับการเติบโต การป้องกัน ผลตอบแทนจากการลงทุน ฯลฯ

บ่อยครั้งสิ่งต่างๆ ทำให้เกิดความสับสนเนื่องจากบริษัทอย่าง Google ทำการวิจัย ซึ่งโดยหลักการแล้วมีวัตถุประสงค์เพื่อทำกำไร แต่พวกเขาเข้าใจว่าธุรกิจของพวกเขาเป็นเทคโนโลยีขั้นสูง และ เทคโนโลยีไม่สูงถ้าไม่มีการวิจัย- ดังนั้นพวกเขาจึงมีส่วนร่วมในการวิจัยทางการเงิน รวมถึงการใกล้ชิดกับนักวิชาการ นักวิจัยชั้นนำหลายคนได้รับการว่าจ้างจากสถาบันการศึกษา ในฐานะนักวิจัย ฉันได้รับเชิญให้เข้าร่วมการประชุมคณะที่สำนักงานใหญ่ใน Mountain View เมื่อหลายปีก่อน และพวกเขาก็ให้ฉันพักในห้องสวีทที่โรงแรม Four Seasons ไม่ว่าจะต้องใช้วิธีใดก็ตามเพื่อสร้างความประทับใจให้กับชุมชนวิชาการ!

แต่ถึงแม้จะเป็นเรื่องยากและแม้แต่สิ่งประดิษฐ์ก็ตาม ที่จะแยกแยะระหว่างการวิจัยและนวัตกรรมให้ชัดเจน ความแตกต่างเป็นสิ่งสำคัญที่นี่ เพราะในกรณีของ Generative AI ทั้งสองจะได้รับการพัฒนาโดยนักแสดงที่แตกต่างกัน และพวกเขาจะเชื่อมโยงกัน โดยมีเลเยอร์ที่แตกต่างกันสองชั้นในซอฟต์แวร์สแต็ก ชี้ให้เห็นโดย J. Currier:

เลเยอร์ซอฟต์แวร์ด้านล่างคือ รูปแบบการเรียนรู้เชิงลึกสร้างขึ้นจากการใช้งาน Large Language Models (LLM) หรือการเป็นตัวแทนภายในที่เทียบเท่า โมเดลจัดเตรียมบล็อคการสร้างพื้นฐานสำหรับการพัฒนาแอปพลิเคชัน
เลเยอร์ซอฟต์แวร์ด้านบนคือ ใบสมัคร หนึ่งซึ่งสร้างขึ้นจากโมเดลการเรียนรู้เชิงลึกเพื่อทำงานที่เฉพาะเจาะจงให้สำเร็จ เช่น ส่งออกรูปภาพจากข้อความแจ้ง

สถาปัตยกรรมสองชั้นนี้จะเติมพลังให้กับยุคใหม่ของนวัตกรรมที่เร่งรีบ เนื่องจากเมื่อชั้นล่างสุดได้รับการพัฒนาโดยบริษัทขนาดใหญ่ เช่น Google, OpenAI และอื่นๆ บริษัทขนาดเล็กจะจัดเตรียมเลเยอร์แอปพลิเคชัน ซึ่งแน่นอนว่าจะช่วยลดผลกำไรของพวกเขาได้ ไปยังผู้ให้บริการชั้นล่างสุด

ปัจจุบันชั้นล่างได้รับการปรับปรุงอย่างรวดเร็ว และบ่อยครั้งที่มีการแพร่กระจายพร้อมกับแอปพลิเคชันที่อยู่ด้านบน ตัวอย่างเช่น LaMDA และ PaLM นำเสนอความสามารถในการโต้ตอบทันที ในขณะที่ DALL-E และ Midjourney เสนอบริการแสดงภาพทันที แต่ในไม่ช้านี้ การแพร่กระจายของทางเลือกโอเพ่นซอร์สสำหรับชั้นล่างสุดจะทำให้สามารถพัฒนาเฉพาะชั้นแอปพลิเคชันด้านบนและเสียบเข้ากับชั้นล่างสุดที่มีอยู่แล้วได้ พูดง่ายกว่าทำแน่นอน แต่ความจริงก็คือชั้นล่างสุดมีความซับซ้อนมากกว่าชั้นบนสุด

ฉันจะโต้แย้งว่า Generative IA จะแทรกซึมเกือบทุกงานความรู้และกิจกรรมยามว่าง เพราะมันจะให้เครื่องมือในการขจัดความซับซ้อนจากกิจกรรมที่ยากลำบากในอดีต และเพราะมันสามารถให้ความเป็นส่วนตัวในระดับใหม่ทั้งหมดที่ฉันเรียกว่า "การปรับเปลี่ยนในแบบเฉพาะบุคคล"

คุณสามารถดูว่า "การปรับเปลี่ยนในแบบเฉพาะบุคคลทั่วไป" คืออะไรจากตัวอย่างวิดีโอกีฬาด้านบน: ผู้ใช้แต่ละคนจะได้รับวิดีโอไฮไลท์ใหม่ล่าสุดที่ไม่ซ้ำใคร แทนที่จะมีเพียงการเลือกระหว่างสองหรือสามตัวเลือก

ผลกระทบสะสมจากแอปพลิเคชัน Generative IA ทั้งหมดนั้นยากที่จะกล่าวเกินจริง:

การสร้างกราฟิกง่ายๆ นั้นเข้าถึงได้สำหรับผู้ที่ไม่ใช่มืออาชีพด้วยเครื่องมืออย่าง DALL-E, Midjourney และ Stable Diffusion อย่างน้อยก็เพื่อจุดประสงค์ที่เป็นประโยชน์ง่ายๆ เช่น การสร้างภาพส่วนหัวสำหรับโพสต์นี้ ก่อนปีนี้ ฉันไม่สามารถวาดภาพของตัวเองได้โดยสิ้นเชิง และผู้เชี่ยวชาญบล็อกแนะนำว่าอย่าเสียเวลาในการออกแบบกราฟิกสำหรับเรื่องราวของคุณเอง
ผู้ใช้การแก้ไขภาพไม่จำเป็นต้องอดทนกับการเรียนรู้อันหนักหน่วงเพื่อฝึกฝนชุดเครื่องมือที่ซับซ้อนของ Photoshop หรือ Affinity Photo (ฉันใช้อย่างหลัง และมันซับซ้อนมาก ฉันต้องศึกษาบทช่วยสอนของ YouTube เพื่อเรียนรู้วิธีปรับแต่งให้ได้มากที่สุด) ด้วย Generative AI ผู้ใช้จะขอให้ซอฟต์แวร์ทำการเปลี่ยนแปลงที่กำหนด และ voila! ภาพจะได้รับการแก้ไข หาก Adobe ล้มเหลวในการส่งมอบ Generative AI ด้วยเครื่องมือของพวกเขา พวกเขาจะถูกขัดขวางโดยบริษัทสตาร์ทอัพรายใหม่ที่เสนอให้พวกเขา และจะหันไปตามทางของ Blockbuster
เครื่องมือการนำเสนอ เช่น PowerPoint แทนที่จะให้แค่เทมเพลตเหมือนที่ทำอยู่ตอนนี้ จะสร้างและปรับแต่งงานนำเสนอระดับมืออาชีพทั้งหมดจากแนวคิดโครงร่าง ในปัจจุบัน ความแตกต่างระหว่างการนำเสนอแบบมืออาชีพและมือสมัครเล่นนั้นแตกต่างกันมาก ซึ่งจะไม่เป็นเช่นนั้นอีกต่อไป
การเขียนข้อความจะได้รับการปรับปรุงอย่างมากด้วยเครื่องมือ Generative AI การเขียนหลายรูปแบบได้รับความช่วยเหลือจากเครื่องมือที่ซับซ้อน เช่น Grammarly แล้ว แต่ Generative AI จะให้ความช่วยเหลือในเชิงคุณภาพแก่นักเขียนด้วย เช่น การสร้างบล็อกเวอร์ชันแรกที่สมบูรณ์ การเขียนจะเป็นกระบวนการทำงานร่วมกันระหว่างมนุษย์กับเครื่องมือ AI
ซอฟต์แวร์ใดๆ ที่มีไว้สำหรับผู้ใช้ขั้นสุดท้ายจะต้องใช้งานง่ายพร้อมข้อความหรือเสียงแจ้ง คู่มือผู้ใช้และวิดีโอแนะนำจะกลายเป็นเรื่องในอดีต และทันทีที่ผู้ใช้คุ้นเคยกับวิธีการใช้ซอฟต์แวร์แบบใหม่ที่เรียบง่ายแล้ว ทุกอย่างจะต้องนำเสนอเพื่อให้คงความเกี่ยวข้องต่อไป
การเรียนภาษาจะดำเนินการโดยได้รับความช่วยเหลือจากผู้ช่วยด้านเสียงเป็นหลัก ซึ่งขับเคลื่อนโดย Generative AI คุณเดาถูกแล้ว ผู้ช่วยด้านเสียงซึ่งจะทำหน้าที่เหมือนโค้ชสอนภาษาส่วนตัวจะใช้ความสามารถในการโต้ตอบด้วยภาษาธรรมชาติอันน่าทึ่ง ซึ่งพบเห็นครั้งแรกในระบบเช่น LaMDA ของ Google เพื่อชี้แนะผู้เรียนภาษามนุษย์เพื่อให้ได้คำศัพท์และสำนวน ปรับปรุงการออกเสียง ฯลฯ ผู้ช่วยด้านเสียงไม่ใช่จินตนาการแห่งอนาคต แต่มันสมเหตุสมผลทางเศรษฐกิจในตอนนี้
แม้แต่ผลิตภัณฑ์ฮาร์ดแวร์ (เช่น รถยนต์) ก็ยังมีระบบช่วยเหลือที่ใช้กล่องโต้ตอบ Generative AI คุณเคยพยายามดำเนินการที่ซับซ้อนเช่นการปรับจอแสดงผลในรถยนต์สมัยใหม่หรือไม่? ไม่ใช่เรื่องง่ายฉันสามารถบอกคุณได้ แทนที่จะต้องค้นหาคู่มือที่ซับซ้อน คุณเพียงแค่ขอให้ผู้ช่วยเสียงรับคำแนะนำหรือทำการปรับเปลี่ยนโดยตรง

อาชีพมากมายจะเปลี่ยนไปจนจำไม่ได้ นักออกแบบกราฟิกรู้สึกถึงความยุ่งยากของการหยุดชะงักนี้อยู่แล้ว อาชีพทั้งหมดจะหายไป และอาชีพอื่นๆ จะถูกสร้างขึ้น บริษัทที่ทรงอำนาจจะล้มละลาย และบริษัทใหม่ๆ จะเข้ามาครอบงำ ขึ้นอยู่กับว่าพวกเขารับมือกับการเปลี่ยนแปลงทางเทคโนโลยีที่เกิดจาก Generative AI ได้ดีเพียงใด

และทั้งหมดนี้จะเกิดขึ้นภายในทศวรรษนี้

ฉันอาจจะผิด แต่สำหรับฉันแล้วดูเหมือนว่าเป็นเรื่องยาก แม้แต่ผู้เชี่ยวชาญด้านเทคโนโลยีที่มีประสบการณ์ ที่จะคาดการณ์ความสามารถอันมหาศาลของเครื่องสร้างรูปภาพและข้อความในปัจจุบัน: ไม่ปรากฏชัดเมื่อไม่กี่ปีที่ผ่านมาว่าโมเดลขนาดใหญ่และชุดฝึกอบรมจะ นำไปสู่ความสามารถที่แตกต่างกันในเชิงคุณภาพ

ฉันบอกได้เลยว่ามันเป็นโชคดีที่เกือบจะบังเอิญเจอ แต่ตอนนี้ เรามีเครื่องมือที่สร้างสรรค์แล้ว ประตูจึงเปิดรับบริษัทที่สร้างสรรค์นวัตกรรมที่จะพัฒนาแอปพลิเคชันแล้วแอปพลิเคชันเล่าอย่างรวดเร็ว โดยส่วนใหญ่แล้วเป็นเรื่องของการค้นหาว่าสิ่งใดสามารถปรับปรุงได้อย่างมาก และค้นหาโมเดลธุรกิจที่เหมาะสมเพื่อสร้างธุรกิจจาก แนวคิดเจนเนอเรทีฟ IA

ไม่กี่ปีที่ผ่านมา ดูเหมือนว่าเทรนด์เทคโนโลยีอื่นๆ เช่น รถยนต์ที่ขับเคลื่อนด้วยตนเอง VR หรือบล็อกเชน กำลังจะเข้ามาแทนที่ในไม่ช้า แต่เทคโนโลยีที่ขับเคลื่อนด้วยตนเองถูกจำกัดด้วยอุปสรรคทางกฎหมาย บล็อกเชนได้รับผลกระทบจากภาวะเศรษฐกิจถดถอย และ VR การนำไปใช้ถูกจำกัดด้วยต้นทุนที่สูงของฮาร์ดแวร์ Generative AI ยังไม่ถูกจำกัดด้วยกฎหมาย (เฮ้ การขัดเกลางานนำเสนอ PowerPoint หรือการสร้างวิดีโอกีฬาไม่ใช่เรื่องของชีวิตหรือความตาย) และผู้ใช้ไม่จำเป็นต้องซื้อฮาร์ดแวร์ราคาแพง

และเราไม่คิดว่ากิจกรรมสร้างสรรค์จะหยุดชะงักเร็วขนาดนี้ แต่พวกเขาก็เป็นเช่นนั้น

เรากำลังเข้าสู่ยุคใหม่และบางครั้งก็แปลกประหลาด ที่ซึ่งความคิดสร้างสรรค์ของมนุษย์ผสมผสานกับความสามารถใหม่ของเครื่องจักร จนถึงจุดที่ยากต่อการแยกแยะระหว่างสิ่งเหล่านั้น เช่น เจ. เคอร์เรียร์ ชี้ให้เห็น:

“วันนี้และอีกไม่กี่ปีข้างหน้า สิ่งนี้จะน่าประหลาดใจและน่ากลัวในหลายๆ ด้าน เพราะช่วงเวลาที่สร้างสรรค์ที่คุณเปลี่ยนจากแนวคิดศูนย์ไปสู่ความคิดริเริ่มมักจะให้ความรู้สึกถึงความเป็นมนุษย์ที่ไม่เหมือนใครเสมอ เพราะมันลึกลับมาก”

Generative IA จะขัดขวางทุกสิ่งในทศวรรษปัจจุบันอย่างไร เผยแพร่ซ้ำจากแหล่งที่มา https://towardsdatascience.com/how-generative-ia-will-disrupt-everything-in-the-current-decade-b4e8ce7dd4f1?source=rss—-7f60cf5620c9— 4 ทาง https://towardsdatascience.com/feed

<!–

ประทับเวลา: November 10, 2022November 11, 2022