ป้อน AI Fire ด้วยการรวมศูนย์

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

คุณสมบัติที่สนับสนุน กระแสของเทคโนโลยีและการค้นพบที่ปฏิวัติวงการ เช่น ไฟ การเกษตร วงล้อ แท่นพิมพ์ และอินเทอร์เน็ต เป็นต้น ได้หล่อหลอมการพัฒนามนุษย์และอารยธรรมอย่างลึกซึ้ง และวัฏจักรแห่งนวัตกรรมนั้นยังคงดำเนินต่อไปด้วยปัญญาประดิษฐ์ (AI)

บริษัทวิจัย IDC ได้สรุปไปแล้วว่า AI คือคำตอบของ “ทุกสิ่ง” จริงๆ Rasmus Andsbjerg รองประธานฝ่ายข้อมูลและการวิเคราะห์ของ IDC กล่าวว่า "ความจริงก็คือ AI นำเสนอวิธีแก้ปัญหาสำหรับทุกสิ่งที่เราเผชิญอยู่ในขณะนี้ AI สามารถเป็นแหล่งที่มาของเส้นทางการเปลี่ยนผ่านสู่ดิจิทัลที่รวดเร็ว ช่วยประหยัดต้นทุนในช่วงเวลาที่อัตราเงินเฟ้อสูงลิ่ว และสนับสนุนความพยายามด้านระบบอัตโนมัติในช่วงเวลาที่แรงงานขาดแคลน”

แน่นอน ในทุกอุตสาหกรรมและทุกหน้าที่ องค์กรผู้ใช้ปลายทางเริ่มค้นพบประโยชน์ของ AI เนื่องจากอัลกอริธึมและโครงสร้างพื้นฐานที่ทรงพลังมากขึ้นช่วยให้ตัดสินใจได้ดีขึ้นและผลิตภาพที่สูงขึ้น

รายได้ทั่วโลกสำหรับตลาดปัญญาประดิษฐ์ (AI) รวมถึงซอฟต์แวร์ ฮาร์ดแวร์ และบริการที่เกี่ยวข้องสำหรับทั้งแอปพลิเคชันที่มี AI เป็นศูนย์กลางและไม่ใช่ AI เป็นศูนย์กลาง มีมูลค่ารวม 383.3 พันล้านดอลลาร์ในปี 2021 ซึ่งเพิ่มขึ้น 20.7% จากปีก่อนหน้า ตามข้อมูลสูงสุด ล่าสุด International Data Corporation (IDC) ตัวติดตามปัญญาประดิษฐ์รายครึ่งปีทั่วโลก.

ในทำนองเดียวกัน การปรับใช้ซอฟต์แวร์ AI บนคลาวด์ยังคงเติบโตอย่างต่อเนื่อง IDC คาดว่าซอฟต์แวร์ AI เวอร์ชันคลาวด์ที่ซื้อใหม่จะเหนือกว่าการปรับใช้ในองค์กรในปี 2022

ท้องฟ้าเป็นขีดจำกัดของ AI

ดร. Ronen Dar หัวหน้าเจ้าหน้าที่เทคโนโลยีของผู้เชี่ยวชาญด้าน AI Run:ai ซึ่งได้สร้างแพลตฟอร์มการจัดการคอมพิวเตอร์สำหรับ AI เชื่อว่าท้องฟ้าเป็นขีดจำกัดสำหรับภาค AI ขององค์กรที่เพิ่งตั้งไข่

“AI เป็นตลาดที่เราเห็นว่ามีการเติบโตอย่างรวดเร็ว และในแง่ขององค์กร เราเห็นความต้องการและการนำแมชชีนเลิร์นนิงและ AI มาใช้ และฉันคิดว่าตอนนี้มีเทคโนโลยีใหม่ที่นำเสนอความสามารถใหม่ที่กำลังจะเปลี่ยนแปลงโลก ที่กำลังจะปฏิวัติธุรกิจ” ดาร์กล่าว

นอกจากนี้ยังมีความเข้าใจที่ชัดเจนมากขึ้นเกี่ยวกับความจำเป็นในการเริ่มสำรวจและทดลองกับ AI และเข้าใจวิธีการรวม AI เข้ากับโมเดลธุรกิจ

Dar เชื่อว่า AI สามารถนำ "ประโยชน์ที่น่าทึ่ง" มาปรับปรุงกระบวนการทางธุรกิจขององค์กรที่มีอยู่: "ในแง่ของการเพิ่มประสิทธิภาพและพิสูจน์ธุรกิจปัจจุบัน เราเห็นกรณีการใช้งานจำนวนมากเกี่ยวกับ AI และการเรียนรู้ของเครื่องซึ่งช่วยปรับปรุงการดำเนินงานและวิธีการตัดสินใจ รอบอุปสงค์และอุปทาน”

เขาชี้ให้เห็นว่าโมเดลการเรียนรู้เชิงลึกใหม่ที่ใช้โครงข่ายประสาทเทียมสามารถปรับปรุงกระบวนการ การตัดสินใจ และความแม่นยำของกระบวนการทางธุรกิจที่สำคัญ เช่น การตรวจจับการฉ้อโกงในอุตสาหกรรมบริการทางการเงิน การดูแลสุขภาพเป็นอีกภาคส่วนหนึ่งที่ศักยภาพของ AI นั้น "มหาศาล" โดยเฉพาะอย่างยิ่งในแง่ของการช่วยแพทย์ในการตัดสินใจทางคลินิกที่ดีขึ้น และช่วยในการค้นพบและพัฒนายาใหม่ๆ

และเมื่อมองไปข้างหน้า Dar คาดการณ์ว่าเทคโนโลยี AI จะช่วยมอบโอกาสทางการค้าใหม่ๆ ที่ไม่มีอยู่ในภาคส่วนอื่นๆ เช่น รถยนต์ไร้คนขับและเกมที่สมจริง

อุปสรรคด้านโครงสร้างพื้นฐานที่ต้องเอาชนะ

แม้จะมีศักยภาพที่ชัดเจนสำหรับ AI และแมชชีนเลิร์นนิงในองค์กร แต่ Dar ยอมรับว่าการปรับใช้ AI ในเชิงพาณิชย์นั้นถูกขัดขวางด้วยปัญหาเกี่ยวกับการจัดหาโครงสร้างพื้นฐาน เขาแนะนำว่าบริษัทต่างๆ จำเป็นต้องพิจารณาถึงวิธีการที่ AI จะเข้ามาทำงานในองค์กรเป็นอันดับแรก

โดยทั่วไปแล้ว ขั้นตอนนี้เกี่ยวข้องกับกระบวนการแผนกต่อแผนกที่ไม่ประสานกัน ซึ่งจะเห็นทีมต่างๆ จัดสรรเทคโนโลยีและทรัพยากรอย่างอิสระ ซึ่งนำไปสู่การปรับใช้แบบแยกส่วน ฝ่ายไอทีไม่สามารถควบคุมโครงการเฉพาะกิจเหล่านี้ได้อย่างมีประสิทธิภาพ และไม่สามารถมองเห็นสิ่งที่เกิดขึ้นได้ และสิ่งนี้ทำให้การคำนวณ ROI ของการใช้จ่ายโครงสร้างพื้นฐาน AI เป็นไปได้ยากหรือเป็นไปไม่ได้

“มันเป็นปัญหาคลาสสิก เมื่อก่อนมันเป็นเงาของ IT และตอนนี้มันเป็นเงาของ AI” Dar กล่าว

นอกจากนี้ โครงสร้างพื้นฐานอันล้ำสมัยที่จำเป็นสำหรับ AI/ML คือการลงทุน เนื่องจากองค์กรต่างๆ ต้องการฮาร์ดแวร์การประมวลผลที่เร่งด้วย GPU อันทรงพลังเพื่อประมวลผลข้อมูลที่ซับซ้อนมากและเพื่อฝึกโมเดล

“ทีม AI ต้องการพลังประมวลผลจำนวนมากเพื่อฝึกโมเดล โดยทั่วไปจะใช้ GPU ซึ่งเป็นทรัพยากรศูนย์ข้อมูลระดับพรีเมียมที่สามารถแยกเก็บและใช้งานไม่ได้อย่างมีประสิทธิภาพ” Dar กล่าว “อาจทำให้เสียเงินจำนวนมากอย่างแน่นอน”

โครงสร้างพื้นฐานแบบแยกส่วนนั้นอาจส่งผลให้มีระดับการใช้งานน้อยกว่า 10% เป็นต้น

จากการสำรวจของ Run:ai ระบุว่า การสำรวจสถานะโครงสร้างพื้นฐาน AI ประจำปี 2021ซึ่งเผยแพร่ในเดือนตุลาคม 2021 87 เปอร์เซ็นต์ของผู้ตอบแบบสอบถามกล่าวว่าพวกเขาประสบปัญหาการจัดสรรทรัพยากร GPU/คอมพิวเตอร์ในระดับหนึ่ง โดย 12 เปอร์เซ็นต์กล่าวว่าสิ่งนี้เกิดขึ้นบ่อยครั้ง ผลที่ตามมาคือ 83 เปอร์เซ็นต์ของบริษัทที่ทำการสำรวจรายงานว่าพวกเขาไม่ได้ใช้ GPU และฮาร์ดแวร์ AI อย่างเต็มที่ อันที่จริงแล้ว เกือบสองในสาม (61 เปอร์เซ็นต์) ระบุว่า GPU และฮาร์ดแวร์ AI ของพวกเขาส่วนใหญ่อยู่ในระดับ "ปานกลาง" ของการใช้งาน

การรวมศูนย์ของ AI

เพื่อแก้ปัญหาเหล่านี้ Dar สนับสนุนให้รวมศูนย์การจัดหาทรัพยากร AI Run:AI ได้พัฒนาแพลตฟอร์มการจัดการคอมพิวเตอร์สำหรับ AI ที่ทำเพียงแค่นี้ โดยรวมศูนย์และทำเวอร์ช่วลไลซ์ทรัพยากรการประมวลผล GPU ด้วยการรวม GPUs ไว้ในเลเยอร์เสมือนจริงเดียวและกำหนดปริมาณงานโดยอัตโนมัติสำหรับการใช้งาน 100 เปอร์เซ็นต์ วิธีการนี้ให้ข้อได้เปรียบเมื่อเทียบกับระบบแบบแยกส่วนในระดับแผนก

การรวมศูนย์โครงสร้างพื้นฐานช่วยให้สามารถควบคุมและมองเห็นได้ ในขณะเดียวกันก็ช่วยให้นักวิทยาศาสตร์ข้อมูลไม่ต้องเสียค่าใช้จ่ายในการจัดการโครงสร้างพื้นฐาน ทีม AI แบ่งปันทรัพยากรการประมวลผล AI สากลซึ่งสามารถหมุนขึ้นและลงแบบไดนามิกตามความต้องการที่เพิ่มขึ้นหรือลดลง ขจัดปัญหาคอขวดของความต้องการและระยะเวลาที่อยู่ระหว่างการใช้งาน

แนวทางนี้ Dar ระบุว่าสามารถช่วยให้องค์กรได้รับประโยชน์สูงสุดจากฮาร์ดแวร์ของตน และทำให้นักวิทยาศาสตร์ข้อมูลหลุดพ้นจากข้อจำกัดด้านทรัพยากรที่จำกัด ทั้งหมดนี้หมายความว่าพวกเขาสามารถรันงานได้มากขึ้นและนำโมเดล AI เข้าสู่การผลิตได้มากขึ้น

ตัวอย่างมีให้จาก London Medical Imaging & Artificial Intelligence Center for Value Based Healthcare นำโดย King's College London และประจำอยู่ที่ St. Thomas' Hospital ใช้ภาพทางการแพทย์และข้อมูลการดูแลสุขภาพอิเล็กทรอนิกส์เพื่อฝึกอัลกอริธึมการเรียนรู้เชิงลึกที่ซับซ้อนสำหรับการมองเห็นด้วยคอมพิวเตอร์และการประมวลผลภาษาธรรมชาติ อัลกอริธึมเหล่านี้ใช้เพื่อสร้างเครื่องมือใหม่สำหรับการตรวจคัดกรองที่มีประสิทธิภาพ การวินิจฉัยที่รวดเร็วขึ้น และการรักษาเฉพาะบุคคล

ศูนย์ตระหนักว่าโครงสร้างพื้นฐาน AI เดิมประสบปัญหาด้านประสิทธิภาพ: การใช้งาน GPU ทั้งหมดต่ำกว่า 30 เปอร์เซ็นต์โดยมีช่วงว่าง "ที่สำคัญ" สำหรับส่วนประกอบบางอย่าง หลังจากย้ายไปแก้ไขปัญหาเหล่านี้โดยใช้โมเดลการจัดสรรการประมวลผล AI แบบรวมศูนย์ตามแพลตฟอร์มของ Run:ai การใช้งาน GPU เพิ่มขึ้น 110 เปอร์เซ็นต์ พร้อมการปรับปรุงความเร็วการทดสอบและประสิทธิภาพการวิจัยโดยรวมควบคู่กันไป

Dr M. Jorge Cardoso รองศาสตราจารย์และผู้บรรยายอาวุโสด้าน AI ของ King's College London และ CTO ของ AI Centre กล่าวว่า "การทดลองของเราอาจใช้เวลาเป็นวันหรือนาที โดยใช้กำลังประมวลผลเพียงเล็กน้อยหรือทั้งคลัสเตอร์ “การลดเวลาไปสู่ผลลัพธ์ทำให้เราสามารถถามและตอบคำถามที่สำคัญมากขึ้นเกี่ยวกับสุขภาพและชีวิตของผู้คน”

การรวมศูนย์ทรัพยากร AI GPU ยังมอบประโยชน์เชิงพาณิชย์อันมีค่าให้กับ Wayve บริษัทในลอนดอนที่พัฒนาซอฟต์แวร์ AI สำหรับรถยนต์ไร้คนขับ เทคโนโลยีได้รับการออกแบบให้ไม่ขึ้นอยู่กับการตรวจจับ แต่มุ่งเน้นไปที่ความฉลาดที่มากขึ้นแทน เพื่อการขับขี่แบบอิสระที่ดีกว่าในเขตเมืองที่มีผู้คนหนาแน่น

Wayve's Fleet Learning Loop เกี่ยวข้องกับวงจรที่ต่อเนื่องของการรวบรวมข้อมูล การจัดการ การฝึกอบรมแบบจำลอง การจำลองซ้ำ และแบบจำลองการออกใบอนุญาตก่อนที่จะปรับใช้ในกองเรือ การใช้การประมวลผล GPU หลักของบริษัทมาจากการฝึกอบรมการผลิต Fleet Learning Loop โดยจะฝึกพื้นฐานผลิตภัณฑ์ด้วยชุดข้อมูลทั้งหมดและฝึกซ้ำอย่างต่อเนื่องเพื่อรวบรวมข้อมูลใหม่ผ่านการทำซ้ำของลูปการเรียนรู้ของฟลีต

บริษัทเริ่มตระหนักว่าประสบปัญหาจากการตั้งเวลา GPU "สยองขวัญ": แม้ว่าเกือบ 100 เปอร์เซ็นต์ของทรัพยากร GPU ที่มีอยู่จะถูกจัดสรรให้กับนักวิจัย แต่น้อยกว่า 45 เปอร์เซ็นต์ถูกใช้เมื่อทำการทดสอบในขั้นต้น

“เนื่องจาก GPU ถูกกำหนดให้กับนักวิจัยแบบคงที่ เมื่อนักวิจัยไม่ได้ใช้ GPU ที่กำหนด ผู้อื่นจะไม่สามารถเข้าถึงได้ สร้างภาพลวงตาว่า GPU สำหรับการฝึกโมเดลมีความจุเพียงพอ แม้ว่า GPU จำนวนมากจะไม่ได้ใช้งาน” Wayve กล่าว

การทำงานกับ Run:ai แก้ไขปัญหานี้โดยการลบไซโลและกำจัดการจัดสรรทรัพยากรแบบคงที่ กลุ่มของ GPU ที่ใช้ร่วมกันถูกสร้างขึ้นเพื่อให้ทีมสามารถเข้าถึง GPU ได้มากขึ้นและเรียกใช้ปริมาณงานได้มากขึ้น ซึ่งนำไปสู่การปรับปรุงการใช้งาน 35%

ปรับปรุงประสิทธิภาพของ CPU มิเรอร์

สะท้อนให้เห็นวิธีการที่ VMware นำการปรับปรุงประสิทธิภาพอย่างมากมาใช้กับ CPU ของเซิร์ฟเวอร์เพื่อให้มีความจุสูงสุดในช่วงไม่กี่ปีที่ผ่านมา นวัตกรรมใหม่กำลังมาในสตรีมเพื่อเพิ่มประสิทธิภาพการใช้งาน GPU สำหรับเวิร์กโหลดการประมวลผล AI

“ถ้าคุณนึกถึงสแต็กซอฟต์แวร์ที่ทำงานบนซีพียู มันถูกสร้างด้วย VMware และเวอร์ชวลไลเซชันจำนวนมาก” Dar อธิบาย “GPU ค่อนข้างใหม่ในศูนย์ข้อมูล และซอฟต์แวร์สำหรับ AI และเวอร์ชวลไลเซชัน เช่น NVIDIA AI องค์กร – ยังเป็นการพัฒนาล่าสุด”

“เรานำเทคโนโลยีขั้นสูงเข้ามาในพื้นที่นั้นด้วยความสามารถต่างๆ เช่น GPU แบบแยกส่วน การสลับงานและ ช่วยให้ปริมาณงานสามารถแบ่งปัน GPU ได้อย่างมีประสิทธิภาพ” Dar กล่าว พร้อมเสริมว่ากำลังมีการวางแผนปรับปรุงเพิ่มเติม

Run:ai ทำงานอย่างใกล้ชิดกับ NVIDIA เพื่อปรับปรุงและลดความซับซ้อนของการใช้ GPU ในองค์กร การทำงานร่วมกันครั้งล่าสุดรวมถึงการเปิดใช้งานความยืดหยุ่นของ GPU แบบมัลติคลาวด์สำหรับบริษัทที่ใช้ GPU ในระบบคลาวด์ และการผสานรวมกับ เซิร์ฟเวอร์การอนุมาน NVIDIA Triton ซอฟต์แวร์เพื่อลดความซับซ้อนของกระบวนการปรับใช้โมเดลในการผลิต

ในลักษณะที่นวัตกรรมที่สำคัญในประวัติศาสตร์มีผลกระทบอย่างลึกซึ้งต่อเผ่าพันธุ์มนุษย์และโลก Dar ตั้งข้อสังเกตว่าพลังของ AI จะต้องได้รับการควบคุมอย่างระมัดระวังเพื่อเพิ่มประโยชน์สูงสุดในขณะที่จัดการข้อเสียที่อาจเกิดขึ้น เขาเปรียบเทียบ AI กับนวัตกรรมยุคดึกดำบรรพ์ที่สุด นั่นก็คือ ไฟ

“มันเหมือนกับไฟที่นำพาสิ่งยิ่งใหญ่มากมายและเปลี่ยนแปลงชีวิตมนุษย์ ไฟยังนำมาซึ่งอันตราย ดังนั้นมนุษย์จึงเข้าใจวิธีการอยู่กับไฟ” ดาร์กล่าว “ฉันคิดว่านี่คือ AI ในทุกวันนี้เช่นกัน”

สนับสนุนโดย Run:ai

ประทับเวลา: November 16, 2022November 17, 2022

ประทับเวลา: เมษายน 5, 2024

ป้อนไฟ AI ด้วยการรวมศูนย์

เผยแพร่ซ้ำโดยเพลโต

เพิ่มเติมจาก ลงทะเบียน

Intel พบกับความเร็วอีกขั้นด้วย Mobileye IPO ที่ล่าช้า

LLMs ดูเหมือนจะให้เหตุผลโดยการเปรียบเทียบว่า boffins

Samsung และ Naver ยักษ์ใหญ่ด้านไอทีของเกาหลีสร้างชิป AI ไฮเปอร์สเกล

AWS เปิดตัวสิ่ง AI เชิงกำเนิดที่ชาญฉลาดจนคุณอาจให้เงินสองเท่า

อินเดียแสวงหามาตรฐานระดับโลกเพื่อหยุด AI ที่ทำร้ายมนุษยชาติ

OpenAI คืนสถานะสิทธิ์การท่องอินเทอร์เน็ตของ ChatGPT

Llama 2 ของ Meta ไม่ใช่โอเพ่นซอร์ส

สหราชอาณาจักรแสวงหากฎหมาย AI ที่สัมผัสได้เล็กน้อย เนื่องจากผู้นำในอุตสาหกรรมเรียกร้องให้ LLM หยุดชั่วคราว

Microsoft เปิดตัว DALL-E 3 รุ่นล่าสุดของ OpenAI ลงใน Bing

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้