ป้อนไฟ AI ด้วย PlatoBlockchain Data Intelligence แบบรวมศูนย์ ค้นหาแนวตั้ง AI.

ป้อนไฟ AI ด้วยการรวมศูนย์

คุณสมบัติที่สนับสนุน กระแสของเทคโนโลยีและการค้นพบที่ปฏิวัติวงการ เช่น ไฟ การเกษตร วงล้อ แท่นพิมพ์ และอินเทอร์เน็ต เป็นต้น ได้หล่อหลอมการพัฒนามนุษย์และอารยธรรมอย่างลึกซึ้ง และวัฏจักรแห่งนวัตกรรมนั้นยังคงดำเนินต่อไปด้วยปัญญาประดิษฐ์ (AI) 

บริษัทวิจัย IDC ได้สรุปไปแล้วว่า AI คือคำตอบของ “ทุกสิ่ง” จริงๆ Rasmus Andsbjerg รองประธานฝ่ายข้อมูลและการวิเคราะห์ของ IDC กล่าวว่า "ความจริงก็คือ AI นำเสนอวิธีแก้ปัญหาสำหรับทุกสิ่งที่เราเผชิญอยู่ในขณะนี้ AI สามารถเป็นแหล่งที่มาของเส้นทางการเปลี่ยนผ่านสู่ดิจิทัลที่รวดเร็ว ช่วยประหยัดต้นทุนในช่วงเวลาที่อัตราเงินเฟ้อสูงลิ่ว และสนับสนุนความพยายามด้านระบบอัตโนมัติในช่วงเวลาที่แรงงานขาดแคลน”

แน่นอน ในทุกอุตสาหกรรมและทุกหน้าที่ องค์กรผู้ใช้ปลายทางเริ่มค้นพบประโยชน์ของ AI เนื่องจากอัลกอริธึมและโครงสร้างพื้นฐานที่ทรงพลังมากขึ้นช่วยให้ตัดสินใจได้ดีขึ้นและผลิตภาพที่สูงขึ้น 

รายได้ทั่วโลกสำหรับตลาดปัญญาประดิษฐ์ (AI) รวมถึงซอฟต์แวร์ ฮาร์ดแวร์ และบริการที่เกี่ยวข้องสำหรับทั้งแอปพลิเคชันที่มี AI เป็นศูนย์กลางและไม่ใช่ AI เป็นศูนย์กลาง มีมูลค่ารวม 383.3 พันล้านดอลลาร์ในปี 2021 ซึ่งเพิ่มขึ้น 20.7% จากปีก่อนหน้า ตามข้อมูลสูงสุด ล่าสุด International Data Corporation (IDC) ตัวติดตามปัญญาประดิษฐ์รายครึ่งปีทั่วโลก.

ในทำนองเดียวกัน การปรับใช้ซอฟต์แวร์ AI บนคลาวด์ยังคงเติบโตอย่างต่อเนื่อง IDC คาดว่าซอฟต์แวร์ AI เวอร์ชันคลาวด์ที่ซื้อใหม่จะเหนือกว่าการปรับใช้ในองค์กรในปี 2022

ท้องฟ้าเป็นขีดจำกัดของ AI

ดร. Ronen Dar หัวหน้าเจ้าหน้าที่เทคโนโลยีของผู้เชี่ยวชาญด้าน AI Run:ai ซึ่งได้สร้างแพลตฟอร์มการจัดการคอมพิวเตอร์สำหรับ AI เชื่อว่าท้องฟ้าเป็นขีดจำกัดสำหรับภาค AI ขององค์กรที่เพิ่งตั้งไข่ 

“AI เป็นตลาดที่เราเห็นว่ามีการเติบโตอย่างรวดเร็ว และในแง่ขององค์กร เราเห็นความต้องการและการนำแมชชีนเลิร์นนิงและ AI มาใช้ และฉันคิดว่าตอนนี้มีเทคโนโลยีใหม่ที่นำเสนอความสามารถใหม่ที่กำลังจะเปลี่ยนแปลงโลก ที่กำลังจะปฏิวัติธุรกิจ” ดาร์กล่าว 

นอกจากนี้ยังมีความเข้าใจที่ชัดเจนมากขึ้นเกี่ยวกับความจำเป็นในการเริ่มสำรวจและทดลองกับ AI และเข้าใจวิธีการรวม AI เข้ากับโมเดลธุรกิจ

Dar เชื่อว่า AI สามารถนำ "ประโยชน์ที่น่าทึ่ง" มาปรับปรุงกระบวนการทางธุรกิจขององค์กรที่มีอยู่: "ในแง่ของการเพิ่มประสิทธิภาพและพิสูจน์ธุรกิจปัจจุบัน เราเห็นกรณีการใช้งานจำนวนมากเกี่ยวกับ AI และการเรียนรู้ของเครื่องซึ่งช่วยปรับปรุงการดำเนินงานและวิธีการตัดสินใจ รอบอุปสงค์และอุปทาน”

เขาชี้ให้เห็นว่าโมเดลการเรียนรู้เชิงลึกใหม่ที่ใช้โครงข่ายประสาทเทียมสามารถปรับปรุงกระบวนการ การตัดสินใจ และความแม่นยำของกระบวนการทางธุรกิจที่สำคัญ เช่น การตรวจจับการฉ้อโกงในอุตสาหกรรมบริการทางการเงิน การดูแลสุขภาพเป็นอีกภาคส่วนหนึ่งที่ศักยภาพของ AI นั้น "มหาศาล" โดยเฉพาะอย่างยิ่งในแง่ของการช่วยแพทย์ในการตัดสินใจทางคลินิกที่ดีขึ้น และช่วยในการค้นพบและพัฒนายาใหม่ๆ 

และเมื่อมองไปข้างหน้า Dar คาดการณ์ว่าเทคโนโลยี AI จะช่วยมอบโอกาสทางการค้าใหม่ๆ ที่ไม่มีอยู่ในภาคส่วนอื่นๆ เช่น รถยนต์ไร้คนขับและเกมที่สมจริง 

อุปสรรคด้านโครงสร้างพื้นฐานที่ต้องเอาชนะ

แม้จะมีศักยภาพที่ชัดเจนสำหรับ AI และแมชชีนเลิร์นนิงในองค์กร แต่ Dar ยอมรับว่าการปรับใช้ AI ในเชิงพาณิชย์นั้นถูกขัดขวางด้วยปัญหาเกี่ยวกับการจัดหาโครงสร้างพื้นฐาน เขาแนะนำว่าบริษัทต่างๆ จำเป็นต้องพิจารณาถึงวิธีการที่ AI จะเข้ามาทำงานในองค์กรเป็นอันดับแรก

โดยทั่วไปแล้ว ขั้นตอนนี้เกี่ยวข้องกับกระบวนการแผนกต่อแผนกที่ไม่ประสานกัน ซึ่งจะเห็นทีมต่างๆ จัดสรรเทคโนโลยีและทรัพยากรอย่างอิสระ ซึ่งนำไปสู่การปรับใช้แบบแยกส่วน ฝ่ายไอทีไม่สามารถควบคุมโครงการเฉพาะกิจเหล่านี้ได้อย่างมีประสิทธิภาพ และไม่สามารถมองเห็นสิ่งที่เกิดขึ้นได้ และสิ่งนี้ทำให้การคำนวณ ROI ของการใช้จ่ายโครงสร้างพื้นฐาน AI เป็นไปได้ยากหรือเป็นไปไม่ได้ 

“มันเป็นปัญหาคลาสสิก เมื่อก่อนมันเป็นเงาของ IT และตอนนี้มันเป็นเงาของ AI” Dar กล่าว 

นอกจากนี้ โครงสร้างพื้นฐานอันล้ำสมัยที่จำเป็นสำหรับ AI/ML คือการลงทุน เนื่องจากองค์กรต่างๆ ต้องการฮาร์ดแวร์การประมวลผลที่เร่งด้วย GPU อันทรงพลังเพื่อประมวลผลข้อมูลที่ซับซ้อนมากและเพื่อฝึกโมเดล 

“ทีม AI ต้องการพลังประมวลผลจำนวนมากเพื่อฝึกโมเดล โดยทั่วไปจะใช้ GPU ซึ่งเป็นทรัพยากรศูนย์ข้อมูลระดับพรีเมียมที่สามารถแยกเก็บและใช้งานไม่ได้อย่างมีประสิทธิภาพ” Dar กล่าว “อาจทำให้เสียเงินจำนวนมากอย่างแน่นอน” 

โครงสร้างพื้นฐานแบบแยกส่วนนั้นอาจส่งผลให้มีระดับการใช้งานน้อยกว่า 10% เป็นต้น

จากการสำรวจของ Run:ai ระบุว่า การสำรวจสถานะโครงสร้างพื้นฐาน AI ประจำปี 2021ซึ่งเผยแพร่ในเดือนตุลาคม 2021 87 เปอร์เซ็นต์ของผู้ตอบแบบสอบถามกล่าวว่าพวกเขาประสบปัญหาการจัดสรรทรัพยากร GPU/คอมพิวเตอร์ในระดับหนึ่ง โดย 12 เปอร์เซ็นต์กล่าวว่าสิ่งนี้เกิดขึ้นบ่อยครั้ง ผลที่ตามมาคือ 83 เปอร์เซ็นต์ของบริษัทที่ทำการสำรวจรายงานว่าพวกเขาไม่ได้ใช้ GPU และฮาร์ดแวร์ AI อย่างเต็มที่ อันที่จริงแล้ว เกือบสองในสาม (61 เปอร์เซ็นต์) ระบุว่า GPU และฮาร์ดแวร์ AI ของพวกเขาส่วนใหญ่อยู่ในระดับ "ปานกลาง" ของการใช้งาน

การรวมศูนย์ของ AI

เพื่อแก้ปัญหาเหล่านี้ Dar สนับสนุนให้รวมศูนย์การจัดหาทรัพยากร AI Run:AI ได้พัฒนาแพลตฟอร์มการจัดการคอมพิวเตอร์สำหรับ AI ที่ทำเพียงแค่นี้ โดยรวมศูนย์และทำเวอร์ช่วลไลซ์ทรัพยากรการประมวลผล GPU ด้วยการรวม GPUs ไว้ในเลเยอร์เสมือนจริงเดียวและกำหนดปริมาณงานโดยอัตโนมัติสำหรับการใช้งาน 100 เปอร์เซ็นต์ วิธีการนี้ให้ข้อได้เปรียบเมื่อเทียบกับระบบแบบแยกส่วนในระดับแผนก 

การรวมศูนย์โครงสร้างพื้นฐานช่วยให้สามารถควบคุมและมองเห็นได้ ในขณะเดียวกันก็ช่วยให้นักวิทยาศาสตร์ข้อมูลไม่ต้องเสียค่าใช้จ่ายในการจัดการโครงสร้างพื้นฐาน ทีม AI แบ่งปันทรัพยากรการประมวลผล AI สากลซึ่งสามารถหมุนขึ้นและลงแบบไดนามิกตามความต้องการที่เพิ่มขึ้นหรือลดลง ขจัดปัญหาคอขวดของความต้องการและระยะเวลาที่อยู่ระหว่างการใช้งาน 

แนวทางนี้ Dar ระบุว่าสามารถช่วยให้องค์กรได้รับประโยชน์สูงสุดจากฮาร์ดแวร์ของตน และทำให้นักวิทยาศาสตร์ข้อมูลหลุดพ้นจากข้อจำกัดด้านทรัพยากรที่จำกัด ทั้งหมดนี้หมายความว่าพวกเขาสามารถรันงานได้มากขึ้นและนำโมเดล AI เข้าสู่การผลิตได้มากขึ้น 

ตัวอย่างมีให้จาก London Medical Imaging & Artificial Intelligence Center for Value Based Healthcare นำโดย King's College London และประจำอยู่ที่ St. Thomas' Hospital ใช้ภาพทางการแพทย์และข้อมูลการดูแลสุขภาพอิเล็กทรอนิกส์เพื่อฝึกอัลกอริธึมการเรียนรู้เชิงลึกที่ซับซ้อนสำหรับการมองเห็นด้วยคอมพิวเตอร์และการประมวลผลภาษาธรรมชาติ อัลกอริธึมเหล่านี้ใช้เพื่อสร้างเครื่องมือใหม่สำหรับการตรวจคัดกรองที่มีประสิทธิภาพ การวินิจฉัยที่รวดเร็วขึ้น และการรักษาเฉพาะบุคคล

ศูนย์ตระหนักว่าโครงสร้างพื้นฐาน AI เดิมประสบปัญหาด้านประสิทธิภาพ: การใช้งาน GPU ทั้งหมดต่ำกว่า 30 เปอร์เซ็นต์โดยมีช่วงว่าง "ที่สำคัญ" สำหรับส่วนประกอบบางอย่าง หลังจากย้ายไปแก้ไขปัญหาเหล่านี้โดยใช้โมเดลการจัดสรรการประมวลผล AI แบบรวมศูนย์ตามแพลตฟอร์มของ Run:ai การใช้งาน GPU เพิ่มขึ้น 110 เปอร์เซ็นต์ พร้อมการปรับปรุงความเร็วการทดสอบและประสิทธิภาพการวิจัยโดยรวมควบคู่กันไป

Dr M. Jorge Cardoso รองศาสตราจารย์และผู้บรรยายอาวุโสด้าน AI ของ King's College London และ CTO ของ AI Centre กล่าวว่า "การทดลองของเราอาจใช้เวลาเป็นวันหรือนาที โดยใช้กำลังประมวลผลเพียงเล็กน้อยหรือทั้งคลัสเตอร์ “การลดเวลาไปสู่ผลลัพธ์ทำให้เราสามารถถามและตอบคำถามที่สำคัญมากขึ้นเกี่ยวกับสุขภาพและชีวิตของผู้คน” 

การรวมศูนย์ทรัพยากร AI GPU ยังมอบประโยชน์เชิงพาณิชย์อันมีค่าให้กับ Wayve บริษัทในลอนดอนที่พัฒนาซอฟต์แวร์ AI สำหรับรถยนต์ไร้คนขับ เทคโนโลยีได้รับการออกแบบให้ไม่ขึ้นอยู่กับการตรวจจับ แต่มุ่งเน้นไปที่ความฉลาดที่มากขึ้นแทน เพื่อการขับขี่แบบอิสระที่ดีกว่าในเขตเมืองที่มีผู้คนหนาแน่น

Wayve's Fleet Learning Loop เกี่ยวข้องกับวงจรที่ต่อเนื่องของการรวบรวมข้อมูล การจัดการ การฝึกอบรมแบบจำลอง การจำลองซ้ำ และแบบจำลองการออกใบอนุญาตก่อนที่จะปรับใช้ในกองเรือ การใช้การประมวลผล GPU หลักของบริษัทมาจากการฝึกอบรมการผลิต Fleet Learning Loop โดยจะฝึกพื้นฐานผลิตภัณฑ์ด้วยชุดข้อมูลทั้งหมดและฝึกซ้ำอย่างต่อเนื่องเพื่อรวบรวมข้อมูลใหม่ผ่านการทำซ้ำของลูปการเรียนรู้ของฟลีต

บริษัทเริ่มตระหนักว่าประสบปัญหาจากการตั้งเวลา GPU "สยองขวัญ": แม้ว่าเกือบ 100 เปอร์เซ็นต์ของทรัพยากร GPU ที่มีอยู่จะถูกจัดสรรให้กับนักวิจัย แต่น้อยกว่า 45 เปอร์เซ็นต์ถูกใช้เมื่อทำการทดสอบในขั้นต้น 

“เนื่องจาก GPU ถูกกำหนดให้กับนักวิจัยแบบคงที่ เมื่อนักวิจัยไม่ได้ใช้ GPU ที่กำหนด ผู้อื่นจะไม่สามารถเข้าถึงได้ สร้างภาพลวงตาว่า GPU สำหรับการฝึกโมเดลมีความจุเพียงพอ แม้ว่า GPU จำนวนมากจะไม่ได้ใช้งาน” Wayve กล่าว 

การทำงานกับ Run:ai แก้ไขปัญหานี้โดยการลบไซโลและกำจัดการจัดสรรทรัพยากรแบบคงที่ กลุ่มของ GPU ที่ใช้ร่วมกันถูกสร้างขึ้นเพื่อให้ทีมสามารถเข้าถึง GPU ได้มากขึ้นและเรียกใช้ปริมาณงานได้มากขึ้น ซึ่งนำไปสู่การปรับปรุงการใช้งาน 35% 

ปรับปรุงประสิทธิภาพของ CPU มิเรอร์

สะท้อนให้เห็นวิธีการที่ VMware นำการปรับปรุงประสิทธิภาพอย่างมากมาใช้กับ CPU ของเซิร์ฟเวอร์เพื่อให้มีความจุสูงสุดในช่วงไม่กี่ปีที่ผ่านมา นวัตกรรมใหม่กำลังมาในสตรีมเพื่อเพิ่มประสิทธิภาพการใช้งาน GPU สำหรับเวิร์กโหลดการประมวลผล AI 

“ถ้าคุณนึกถึงสแต็กซอฟต์แวร์ที่ทำงานบนซีพียู มันถูกสร้างด้วย VMware และเวอร์ชวลไลเซชันจำนวนมาก” Dar อธิบาย “GPU ค่อนข้างใหม่ในศูนย์ข้อมูล และซอฟต์แวร์สำหรับ AI และเวอร์ชวลไลเซชัน เช่น NVIDIA AI องค์กร – ยังเป็นการพัฒนาล่าสุด” 

“เรานำเทคโนโลยีขั้นสูงเข้ามาในพื้นที่นั้นด้วยความสามารถต่างๆ เช่น GPU แบบแยกส่วน การสลับงานและ ช่วยให้ปริมาณงานสามารถแบ่งปัน GPU ได้อย่างมีประสิทธิภาพ” Dar กล่าว พร้อมเสริมว่ากำลังมีการวางแผนปรับปรุงเพิ่มเติม

Run:ai ทำงานอย่างใกล้ชิดกับ NVIDIA เพื่อปรับปรุงและลดความซับซ้อนของการใช้ GPU ในองค์กร การทำงานร่วมกันครั้งล่าสุดรวมถึงการเปิดใช้งานความยืดหยุ่นของ GPU แบบมัลติคลาวด์สำหรับบริษัทที่ใช้ GPU ในระบบคลาวด์ และการผสานรวมกับ เซิร์ฟเวอร์การอนุมาน NVIDIA Triton ซอฟต์แวร์เพื่อลดความซับซ้อนของกระบวนการปรับใช้โมเดลในการผลิต

ในลักษณะที่นวัตกรรมที่สำคัญในประวัติศาสตร์มีผลกระทบอย่างลึกซึ้งต่อเผ่าพันธุ์มนุษย์และโลก Dar ตั้งข้อสังเกตว่าพลังของ AI จะต้องได้รับการควบคุมอย่างระมัดระวังเพื่อเพิ่มประโยชน์สูงสุดในขณะที่จัดการข้อเสียที่อาจเกิดขึ้น เขาเปรียบเทียบ AI กับนวัตกรรมยุคดึกดำบรรพ์ที่สุด นั่นก็คือ ไฟ 

“มันเหมือนกับไฟที่นำพาสิ่งยิ่งใหญ่มากมายและเปลี่ยนแปลงชีวิตมนุษย์ ไฟยังนำมาซึ่งอันตราย ดังนั้นมนุษย์จึงเข้าใจวิธีการอยู่กับไฟ” ดาร์กล่าว “ฉันคิดว่านี่คือ AI ในทุกวันนี้เช่นกัน” 

สนับสนุนโดย Run:ai

ประทับเวลา:

เพิ่มเติมจาก ลงทะเบียน