GPU คืออะไร? ชิปที่ขับเคลื่อนความเจริญของ AI และเหตุใดจึงมีมูลค่านับล้านล้าน

GPU คืออะไร? ชิปที่ขับเคลื่อนความเจริญของ AI และเหตุใดจึงมีมูลค่านับล้านล้าน

GPU คืออะไร? ชิปที่ขับเคลื่อนความเจริญของ AI และเหตุใดพวกมันจึงมีมูลค่านับล้านล้าน PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

ในขณะที่โลกเร่งรีบในการใช้ประโยชน์จากคลื่นลูกใหม่ของเทคโนโลยี AI ฮาร์ดแวร์ไฮเทคชิ้นเดียวก็กลายเป็นสินค้ายอดนิยมอย่างน่าประหลาดใจ นั่นก็คือ หน่วยประมวลผลกราฟิกหรือ GPU

GPU ระดับแนวหน้าสามารถขายได้ หลายหมื่นดอลลาร์และผู้ผลิตชั้นนำอย่าง Nvidia ก็ได้เห็นการประเมินมูลค่าตลาดแล้ว ทะยานทะลุ 2 ล้านล้านดอลลาร์ เนื่องจากความต้องการผลิตภัณฑ์เพิ่มขึ้น

GPU ไม่ได้เป็นเพียงผลิตภัณฑ์ AI ระดับไฮเอนด์เช่นกัน มี GPU ที่ทรงพลังน้อยกว่าในโทรศัพท์ แล็ปท็อป และคอนโซลเกมเช่นกัน

ถึงตอนนี้คุณอาจสงสัยว่า GPU คืออะไรจริงๆ และอะไรทำให้พวกเขาพิเศษมาก?

GPU คืออะไร?

เดิมที GPU ได้รับการออกแบบมาเพื่อสร้างและแสดงฉากและวัตถุ 3 มิติที่ซับซ้อนเป็นหลักอย่างรวดเร็ว เช่น ที่เกี่ยวข้องกับวิดีโอเกมและ การออกแบบโดยใช้คอมพิวเตอร์ช่วย ซอฟต์แวร์. GPU สมัยใหม่ยังจัดการงานต่างๆ เช่น คลายตัว สตรีมวิดีโอ

“สมอง” ของคอมพิวเตอร์ส่วนใหญ่คือชิปที่เรียกว่าหน่วยประมวลผลกลาง (CPU) CPU สามารถใช้เพื่อสร้างฉากกราฟิกและขยายขนาดวิดีโอได้ แต่โดยทั่วไปแล้วจะช้ากว่ามากและมีประสิทธิภาพน้อยกว่ามากเมื่อเทียบกับ GPU CPU เหมาะกว่าสำหรับงานคำนวณทั่วไป เช่น การประมวลผลคำและการเรียกดูเว็บเพจ

GPU แตกต่างจาก CPU อย่างไร?

CPU สมัยใหม่ทั่วไปประกอบด้วยขนาดระหว่าง 8 ถึง 16”แกน” ซึ่งแต่ละงานสามารถประมวลผลงานที่ซับซ้อนได้ตามลำดับ

ในทางกลับกัน GPU มีคอร์ที่ค่อนข้างเล็กหลายพันคอร์ ซึ่งได้รับการออกแบบมาเพื่อให้ทุกคนทำงานพร้อมกัน (“แบบขนาน”) เพื่อให้เกิดการประมวลผลโดยรวมที่รวดเร็ว ทำให้เหมาะสำหรับงานที่ต้องมีการดำเนินการง่ายๆ จำนวนมากซึ่งสามารถทำได้ในเวลาเดียวกัน แทนที่จะดำเนินการทีละขั้นตอน

GPU แบบดั้งเดิมมีสองรูปแบบหลัก

ประการแรก มีชิปแบบสแตนด์อโลน ซึ่งมักมาในการ์ดเสริมสำหรับคอมพิวเตอร์เดสก์ท็อปขนาดใหญ่ อย่างที่สองคือ GPU ที่รวมกับ CPU ในแพ็คเกจชิปเดียวกัน ซึ่งมักพบในแล็ปท็อปและเครื่องเล่นเกม เช่น PlayStation 5 ในทั้งสองกรณี CPU จะควบคุมสิ่งที่ GPU ทำ

เหตุใด GPU จึงมีประโยชน์สำหรับ AI?

ปรากฎว่า GPU สามารถนำไปใช้ใหม่ได้เพื่อทำมากกว่าการสร้างฉากกราฟิก

เทคนิคการเรียนรู้ของเครื่องมากมายที่อยู่เบื้องหลัง ปัญญาประดิษฐ์เช่น เครือข่ายประสาทลึกต้องอาศัยการคูณเมทริกซ์ในรูปแบบต่างๆ เป็นอย่างมาก

นี่คือการดำเนินการทางคณิตศาสตร์ที่มีการคูณและรวมชุดตัวเลขที่มีขนาดใหญ่มากเข้าด้วยกัน การดำเนินการเหล่านี้เหมาะอย่างยิ่งสำหรับการประมวลผลแบบขนาน ดังนั้น GPU จึงสามารถทำได้อย่างรวดเร็ว

อะไรต่อไปสำหรับ GPU?

ความสามารถในการกระทืบจำนวน GPU เพิ่มขึ้นอย่างต่อเนื่องเนื่องจากจำนวนคอร์ที่เพิ่มขึ้นและความเร็วในการทำงาน การปรับปรุงเหล่านี้ได้รับแรงผลักดันหลักจากการปรับปรุงการผลิตชิปของบริษัทต่างๆ เช่น TSMC ในไต้หวัน

ขนาดของทรานซิสเตอร์แต่ละตัวซึ่งเป็นส่วนประกอบพื้นฐานของชิปคอมพิวเตอร์ กำลังลดลง ทำให้สามารถวางทรานซิสเตอร์ได้มากขึ้นในพื้นที่ทางกายภาพเท่าเดิม

อย่างไรก็ตาม นั่นไม่ใช่เรื่องราวทั้งหมด แม้ว่า GPU แบบเดิมจะมีประโยชน์สำหรับงานคำนวณที่เกี่ยวข้องกับ AI แต่ก็ไม่ได้เหมาะสมที่สุด

เช่นเดียวกับที่ GPU ได้รับการออกแบบมาเพื่อเร่งความเร็วคอมพิวเตอร์โดยจัดให้มีการประมวลผลกราฟิกแบบพิเศษ มีตัวเร่งความเร็วบางตัวที่ได้รับการออกแบบมาเพื่อเร่งความเร็วงานการเรียนรู้ของเครื่อง ตัวเร่งความเร็วเหล่านี้มักเรียกว่า GPU สำหรับศูนย์ข้อมูล

ตัวเร่งความเร็วยอดนิยมบางตัวที่ผลิตโดยบริษัทต่างๆ เช่น AMD และ Nvidia เริ่มต้นจาก GPU แบบดั้งเดิม เมื่อเวลาผ่านไป การออกแบบของพวกเขาได้พัฒนาเพื่อรองรับงานการเรียนรู้ของเครื่องต่างๆ ได้ดีขึ้น เช่น โดยการสนับสนุนที่มีประสิทธิภาพมากขึ้น “สมองลอย” รูปแบบตัวเลข

ตัวเร่งความเร็วอื่นๆ เช่น ของกูเกิล หน่วยประมวลผลเทนเซอร์ และเทนสตอร์เรนต์ แกนเทนซิกซ์ได้รับการออกแบบตั้งแต่ต้นจนจบเพื่อเร่งความเร็วโครงข่ายประสาทเทียมระดับลึก

GPU สำหรับศูนย์ข้อมูลและตัวเร่งความเร็ว AI อื่นๆ มักจะมาพร้อมกับหน่วยความจำมากกว่าการ์ดเสริม GPU แบบดั้งเดิมอย่างมาก ซึ่งมีความสำคัญอย่างยิ่งในการฝึกโมเดล AI ขนาดใหญ่ ยิ่งโมเดล AI มีขนาดใหญ่เท่าใดก็ยิ่งมีความสามารถและแม่นยำมากขึ้นเท่านั้น

เพื่อเร่งการฝึกอบรมและจัดการกับโมเดล AI ที่มีขนาดใหญ่กว่า เช่น ChatGPT คุณสามารถรวม GPU ของศูนย์ข้อมูลจำนวนมากเข้าด้วยกันเพื่อสร้างซูเปอร์คอมพิวเตอร์ได้ ซึ่งต้องใช้ซอฟต์แวร์ที่ซับซ้อนมากขึ้นเพื่อควบคุมพลังการประมวลผลตัวเลขที่มีอยู่อย่างเหมาะสม อีกแนวทางหนึ่งก็คือ สร้างเครื่องเร่งความเร็วขนาดใหญ่เพียงเครื่องเดียวเช่น “โปรเซสเซอร์ระดับเวเฟอร์” ผลิตโดย Cerebras

ชิปเฉพาะทางเป็นอนาคตหรือไม่?

CPU ก็ไม่ได้หยุดนิ่งเช่นกัน CPU ล่าสุดจาก AMD และ Intel มีคำสั่งระดับต่ำในตัวที่เร่งความเร็วการประมวลผลเชิงตัวเลขที่จำเป็นสำหรับเครือข่ายประสาทเชิงลึก ฟังก์ชันเพิ่มเติมนี้ช่วยงาน "การอนุมาน" เป็นหลัก กล่าวคือ การใช้โมเดล AI ที่ได้รับการพัฒนาแล้วจากที่อื่น

ในการฝึกโมเดล AI ตั้งแต่แรก ยังจำเป็นต้องมีตัวเร่งความเร็วคล้าย GPU ขนาดใหญ่

เป็นไปได้ที่จะสร้างตัวเร่งความเร็วพิเศษมากขึ้นสำหรับอัลกอริธึมการเรียนรู้ของเครื่องเฉพาะ ตัวอย่างเช่น เมื่อเร็วๆ นี้บริษัทชื่อ Groq ได้ผลิต "หน่วยประมวลผลภาษา” (LPU) ออกแบบมาโดยเฉพาะสำหรับการรันโมเดลภาษาขนาดใหญ่ตามแนว ChatGPT

อย่างไรก็ตาม การสร้างโปรเซสเซอร์พิเศษเหล่านี้ต้องใช้ทรัพยากรทางวิศวกรรมจำนวนมาก ประวัติศาสตร์แสดงให้เห็นการใช้งานและความนิยมของอัลกอริธึมแมชชีนเลิร์นนิงมีแนวโน้มที่จะถึงจุดสูงสุดและจากนั้นก็ลดลง ดังนั้นฮาร์ดแวร์เฉพาะทางที่มีราคาแพงจึงอาจล้าสมัยอย่างรวดเร็ว

อย่างไรก็ตาม สำหรับผู้บริโภคทั่วไปไม่น่าจะเป็นปัญหา GPU และชิปอื่นๆ ในผลิตภัณฑ์ที่คุณใช้มีแนวโน้มที่จะทำงานเร็วขึ้นอย่างเงียบๆ

บทความนี้ตีพิมพ์ซ้ำจาก สนทนา ภายใต้ใบอนุญาตครีเอทีฟคอมมอนส์ อ่าน บทความต้นฉบับ.

เครดิตภาพ: Nvidia

ประทับเวลา:

เพิ่มเติมจาก Hub เอกพจน์