การสาธิตสวิตช์ออปติคัลที่สอดคล้องกันสำหรับคลัสเตอร์ AI ที่มีขนาดใหญ่ยิ่งขึ้น

การสาธิตสวิตช์ออปติคัลที่สอดคล้องกันสำหรับคลัสเตอร์ AI ที่มีขนาดใหญ่ยิ่งขึ้น

ธุรกิจเครือข่าย Coherent เปิดตัวสวิตช์วงจรออปติกที่ออกแบบมาเพื่อรองรับคลัสเตอร์ AI ความหนาแน่นสูงในการประชุมการสื่อสารด้วยไฟเบอร์ออปติกเมื่อวันจันทร์

สวิตช์ไม่เหมือนกับสวิตช์ที่คุณมักพบในกลุ่ม AI ตรงที่สวิตช์จริงได้รับการจัดการแบบออพติคัลทั้งหมด แทนที่จะใช้ตัวรับส่งสัญญาณเพื่อแปลงโฟตอนเป็นอิเล็กตรอนแล้วกลับมาอีกครั้ง แสงเลเซอร์เพียงแค่เข้าสู่พอร์ตหนึ่งและออกจากอีกพอร์ตหนึ่ง แน่นอนว่าจะต้องลดทอนลงเล็กน้อย

พื้นที่ เครื่องใช้ซึ่งมีกำหนดจัดส่งในปริมาณมากในปีหน้า โดยมีพอร์ตอินพุต 300 พอร์ตและเอาต์พุต 300 พอร์ต และใช้เทคโนโลยี Datacenter Light Wave Cross Connect ของ Coherent ตามที่เราเข้าใจ มันทำงานโดยการควบคุมเซลล์ผลึกเหลวเพื่อควบคุมว่าความยาวคลื่นของแสงจะไปที่จุดใด

สวิตช์วงจรออปติกล่าสุดของ Coherent บนจอแสดงผลที่ OFC มีพอร์ตอินพุต 300 พอร์ตและเอาต์พุต 300 พอร์ต

สวิตช์วงจรออปติกล่าสุดของ Coherent บนจอแสดงผลที่ OFC มีพอร์ตอินพุต 300 พอร์ตและเอาต์พุต 300 พอร์ต - คลิกเพื่อดูภาพขยาย

Sameh Boujelbene นักวิเคราะห์ของ Dell'Oro Group กล่าว ลงทะเบียน สวิตช์วงจรออปติคอลมีประโยชน์สองประการ นอกเหนือจากแบนด์วิธสูงและเครือข่ายเวลาแฝงต่ำแล้ว สวิตช์ประเภทนี้ยังมีราคาถูกกว่าในการใช้งาน เนื่องจากต้องใช้สวิตช์ไฟฟ้าและตัวรับส่งสัญญาณแบบออปติคัลน้อยกว่ามาก

นอกจากนี้ Coherent ตั้งข้อสังเกตว่าสวิตช์แบบใช้แสงประเภทนี้มีแนวโน้มที่จะเชื่อถือได้มากกว่า ซึ่งเป็นสิ่งที่จะจ่ายเงินปันผลในกลุ่มที่ใหญ่กว่ามาก ซึ่งระยะเวลาที่เกิดความล้มเหลวมักจะค่อนข้างต่ำ

นี่เป็นหนึ่งในเหตุผลที่ Google พัฒนาสวิตช์วงจรแสงของตัวเองสำหรับพ็อด TPUv4 Andy Swing หัวหน้าฝ่ายเทคนิคของกลุ่ม TPU ของ Google พูดที่ Hot Chips เมื่อปีที่แล้ว อธิบาย [วิดีโอ] ที่ใช้ OCS Google สามารถสลับตัวเร่งความเร็วจำนวนมากเข้าด้วยกันได้

พ็อดเหล่านี้ประกอบด้วยชั้นวาง 64 ชั้นวาง โดยแต่ละชั้นวางประกอบด้วยหน่วยประมวลผลเทนเซอร์ (TPU) 64 ยูนิต แร็คเหล่านี้แต่ละแร็คเชื่อมต่อแบบออพติคัลกลับไปยังสวิตช์ OCS ที่พัฒนาภายในของ Google ตัวใดตัวหนึ่งสำหรับเมชแบบ all-to-all

Swing อธิบายว่าแนวทางนี้มีข้อดี 2-3 ประการ รวมถึงความสามารถในการกำหนดค่าขนาดคลัสเตอร์ใหม่แบบไดนามิก อีกประการหนึ่งคือตัวเร่งความเร็วทั้งหมดเชื่อมต่อกัน ซึ่งช่วยเพิ่มความน่าเชื่อถือ ซึ่งเป็นคุณภาพที่ต้องการ เนื่องจากปริมาณงานการฝึกอบรมอาจใช้เวลานานหลายเดือน ขึ้นอยู่กับจำนวนพารามิเตอร์ของโมเดลและขนาดของชุดข้อมูล

ในกรณีของพ็อด TPUv4 ของ Google หากโหนดใดโหนดหนึ่งทำงานล้มเหลว ก็สามารถกำหนดค่าสวิตช์ใหม่เพื่อแก้ไขปัญหาได้

Swing ยังตั้งข้อสังเกตอีกว่าแนวทางดังกล่าวช่วยให้สามารถใช้โทโพโลยีเครือข่ายต่างๆ ได้ ขึ้นอยู่กับรุ่น ตัวอย่างเช่น ในการทดสอบ Google พบว่าแบนด์วิดท์เครือข่ายเพิ่มขึ้นอย่างมากโดยใช้โทโพโลยีทอรัสที่บิดเบี้ยว ซึ่งตัวเร่งความเร็วจะถูกรวมเข้าด้วยกันในลักษณะที่คล้ายกับวงที่บิดเบี้ยว

แต่ในขณะที่อุปกรณ์ OCS ใหม่ของ Coherent อาจอนุญาตให้ผู้อื่นสร้างคลัสเตอร์สวิตช์แบบออพติคัลที่คล้ายกับของ Google แต่ Boujelbene จาก Dell Oro ตั้งข้อสังเกตว่า OCS ยังคงเป็นเทคโนโลยีที่ค่อนข้างใหม่ในดาต้าเซ็นเตอร์

“จนถึงขณะนี้ มีเพียง Google เท่านั้นที่สามารถปรับใช้ได้หลังจากพัฒนามาหลายปี en masse ในเครือข่ายศูนย์ข้อมูล” เธอกล่าว “นอกจากนี้ สวิตช์ OCS อาจจำเป็นต้องเปลี่ยนฐานไฟเบอร์ที่ติดตั้ง ทั้งนี้ขึ้นอยู่กับผู้ให้บริการคลาวด์” ®

ประทับเวลา:

เพิ่มเติมจาก ลงทะเบียน