โพสต์นี้ร่วมเขียนโดย Ramdev Wudali และ Kiran Mantripragada จาก Thomson Reuters
ใน 1992, รอยเตอร์ทอมสัน (TR) เปิดตัวบริการวิจัยกฎหมาย AI บริการแรก WIN (Westlaw Is Natural) ซึ่งเป็นนวัตกรรมในขณะนั้น เนื่องจากเครื่องมือค้นหาส่วนใหญ่รองรับเฉพาะคำและตัวเชื่อมต่อบูลีนเท่านั้น ตั้งแต่นั้นเป็นต้นมา TR ก็ประสบความสำเร็จในเหตุการณ์สำคัญอื่นๆ อีกมากมาย เนื่องจากผลิตภัณฑ์และบริการ AI ของบริษัทมีจำนวนและความหลากหลายเพิ่มขึ้นอย่างต่อเนื่อง สนับสนุนผู้เชี่ยวชาญด้านกฎหมาย ภาษี การบัญชี การปฏิบัติตามกฎระเบียบ และการบริการข่าวทั่วโลก ด้วยข้อมูลเชิงลึกของแมชชีนเลิร์นนิง (ML) หลายพันล้านรายการที่สร้างขึ้นทุกปี .
ด้วยบริการ AI ที่เพิ่มขึ้นอย่างมหาศาล ก้าวต่อไปของ TR คือการปรับปรุงนวัตกรรมและอำนวยความสะดวกในการทำงานร่วมกัน สร้างมาตรฐานและการนำโซลูชัน AI มาใช้ซ้ำในสายงานธุรกิจและลักษณะเฉพาะของผู้ปฏิบัติงานด้าน AI พร้อมๆ กับปฏิบัติตามแนวทางปฏิบัติที่ดีที่สุดขององค์กร:
- ทำให้เป็นอัตโนมัติและสร้างมาตรฐานให้กับความพยายามทางวิศวกรรมซ้ำๆ ที่ไม่แตกต่าง
- ตรวจสอบการแยกที่จำเป็นและการควบคุมข้อมูลที่ละเอียดอ่อนตามมาตรฐานการกำกับดูแลทั่วไป
- ให้การเข้าถึงทรัพยากรการคำนวณที่ปรับขนาดได้ง่าย
เพื่อตอบสนองความต้องการเหล่านี้ TR ได้สร้างแพลตฟอร์ม Enterprise AI ตามเสาหลักห้าประการต่อไปนี้: บริการข้อมูล พื้นที่ทำงานทดลอง การลงทะเบียนโมเดลส่วนกลาง บริการการปรับใช้โมเดล และการตรวจสอบโมเดล
ในโพสต์นี้ เราจะพูดถึงวิธีที่ TR และ AWS ทำงานร่วมกันเพื่อพัฒนา Enterprise AI Platform ตัวแรกของ TR ซึ่งเป็นเครื่องมือบนเว็บที่จะมอบความสามารถต่างๆ ตั้งแต่การทดลอง ML, การฝึกอบรม, การลงทะเบียนโมเดลส่วนกลาง, การปรับใช้โมเดล และการตรวจสอบโมเดล ความสามารถทั้งหมดนี้สร้างขึ้นเพื่อตอบสนองมาตรฐานความปลอดภัยที่พัฒนาตลอดเวลาของ TR และให้บริการที่ง่าย ปลอดภัย และเป็นไปตามข้อกำหนดแก่ผู้ใช้ปลายทาง เรายังแบ่งปันวิธีที่ TR เปิดใช้งานการตรวจสอบและการกำกับดูแลสำหรับโมเดล ML ที่สร้างขึ้นในหน่วยธุรกิจต่างๆ ด้วยกระจกบานเดียว
ความท้าทาย
ในอดีตที่ TR นั้น ML เป็นความสามารถสำหรับทีมที่มีนักวิทยาศาสตร์และวิศวกรข้อมูลขั้นสูง ทีมที่มีทรัพยากรที่มีทักษะสูงสามารถนำกระบวนการ ML ที่ซับซ้อนไปใช้ได้ตามความต้องการ แต่ก็เงียบหายไปอย่างรวดเร็ว วิธีการแบบแยกส่วนไม่ได้ให้การมองเห็นใด ๆ เพื่อให้การกำกับดูแลในการคาดการณ์การตัดสินใจที่สำคัญอย่างยิ่ง
ทีมธุรกิจ TR มีความรู้กว้างขวาง อย่างไรก็ตาม ทักษะทางเทคนิคและความพยายามด้านวิศวกรรมอย่างหนักที่จำเป็นใน ML ทำให้ยากต่อการใช้ความเชี่ยวชาญเชิงลึกเพื่อแก้ปัญหาทางธุรกิจด้วยพลังของ ML TR ต้องการทำให้ทักษะเป็นประชาธิปไตย ทำให้เข้าถึงผู้คนภายในองค์กรได้มากขึ้น
ทีมต่างๆ ใน TR ปฏิบัติตามหลักปฏิบัติและวิธีการของตนเอง TR ต้องการสร้างความสามารถที่ครอบคลุมตลอดวงจรชีวิตของ ML ให้กับผู้ใช้ เพื่อเร่งการส่งมอบโครงการ ML โดยทำให้ทีมสามารถมุ่งเน้นไปที่เป้าหมายทางธุรกิจ ไม่ใช่ความพยายามทางวิศวกรรมซ้ำๆ ที่ไม่แตกต่าง
นอกจากนี้ กฎระเบียบเกี่ยวกับข้อมูลและจริยธรรมของ AI ยังคงมีการพัฒนาอย่างต่อเนื่อง ซึ่งเป็นข้อบังคับสำหรับมาตรฐานการกำกับดูแลทั่วไปสำหรับโซลูชัน AI ของ TR
ภาพรวมโซลูชัน
แพลตฟอร์ม Enterprise AI ของ TR ได้รับการออกแบบเพื่อให้บริการที่เรียบง่ายและเป็นมาตรฐานแก่บุคคลต่างๆ โดยนำเสนอความสามารถสำหรับทุกขั้นตอนของวงจรชีวิต ML TR ได้ระบุห้าหมวดหมู่หลักที่ทำให้ข้อกำหนดของ TR ทั้งหมดเป็นโมดูล:
- บริการข้อมูล – เพื่อให้สามารถเข้าถึงสินทรัพย์ข้อมูลขององค์กรได้ง่ายและปลอดภัย
- พื้นที่ทำงานทดลอง – เพื่อให้ความสามารถในการทดลองและฝึกโมเดล ML
- การลงทะเบียนโมเดลกลาง – แค็ตตาล็อกองค์กรสำหรับโมเดลที่สร้างขึ้นในหน่วยธุรกิจต่างๆ
- บริการปรับใช้โมเดล – เพื่อให้ตัวเลือกการปรับใช้การอนุมานต่างๆ ตามแนวทางปฏิบัติ CI/CD ขององค์กรของ TR
- บริการตรวจสอบแบบจำลอง – เพื่อให้ความสามารถในการตรวจสอบข้อมูลและสร้างแบบจำลองอคติและการเลื่อนลอย
ดังที่แสดงในแผนภาพต่อไปนี้ บริการขนาดเล็กเหล่านี้สร้างขึ้นโดยคำนึงถึงหลักการสำคัญบางประการ:
- ลบความพยายามด้านวิศวกรรมที่ไม่แตกต่างไปจากผู้ใช้
- ให้ความสามารถที่จำเป็นด้วยการคลิกปุ่ม
- รักษาความปลอดภัยและควบคุมความสามารถทั้งหมดตามมาตรฐานองค์กรของ TR
- นำกระจกบานเดียวสำหรับกิจกรรม ML
ไมโครเซอร์วิสแพลตฟอร์ม AI ของ TR สร้างขึ้นด้วย อเมซอน SageMaker เป็นกลไกหลัก ส่วนประกอบแบบไร้เซิร์ฟเวอร์ของ AWS สำหรับเวิร์กโฟลว์ และบริการ AWS DevOps สำหรับแนวทางปฏิบัติ CI/CD SageMaker สตูดิโอ ใช้สำหรับการทดลองและการฝึกอบรม และการลงทะเบียนแบบจำลองของ SageMaker จะใช้ในการลงทะเบียนแบบจำลอง รีจีสทรีโมเดลกลางประกอบด้วยทั้งรีจิสทรีโมเดล SageMaker และ อเมซอน ไดนาโมดีบี ตาราง บริการโฮสติ้งของ SageMaker ใช้ในการปรับใช้โมเดลในขณะที่ จอภาพรุ่น SageMaker และ SageMaker ชี้แจง ใช้เพื่อตรวจสอบแบบจำลองสำหรับดริฟท์ ความเอนเอียง เครื่องคำนวณเมตริกแบบกำหนดเอง และความสามารถในการอธิบาย
ส่วนต่อไปนี้จะอธิบายบริการเหล่านี้โดยละเอียด
บริการข้อมูล
วงจรโครงการ ML แบบดั้งเดิมเริ่มต้นด้วยการค้นหาข้อมูล โดยทั่วไป นักวิทยาศาสตร์ข้อมูลใช้เวลา 60% ขึ้นไปเพื่อค้นหาข้อมูลที่ถูกต้องเมื่อต้องการ เช่นเดียวกับทุกองค์กร TR มีที่เก็บข้อมูลหลายแห่งที่ทำหน้าที่เป็นจุดเดียวของความจริงสำหรับโดเมนข้อมูลที่แตกต่างกัน TR ระบุที่เก็บข้อมูลองค์กรหลักสองแห่งที่ให้ข้อมูลสำหรับกรณีการใช้งาน ML ส่วนใหญ่: ที่เก็บอ็อบเจ็กต์และที่เก็บข้อมูลเชิงสัมพันธ์ TR สร้างบริการข้อมูลแพลตฟอร์ม AI เพื่อให้เข้าถึงที่เก็บข้อมูลทั้งสองอย่างราบรื่นจากพื้นที่ทำงานทดลองของผู้ใช้ และขจัดภาระของผู้ใช้ในการนำทางกระบวนการที่ซับซ้อนเพื่อรับข้อมูลด้วยตัวเอง แพลตฟอร์ม AI ของ TR ปฏิบัติตามข้อกำหนดและแนวทางปฏิบัติที่ดีที่สุดทั้งหมดที่กำหนดโดยทีม Data and Model Governance ซึ่งรวมถึงการประเมินผลกระทบของข้อมูลที่จำเป็นซึ่งช่วยให้ผู้ปฏิบัติงาน ML เข้าใจและปฏิบัติตามการใช้ข้อมูลอย่างมีจริยธรรมและเหมาะสม พร้อมด้วยกระบวนการอนุมัติอย่างเป็นทางการเพื่อให้แน่ใจว่ามีการเข้าถึงข้อมูลที่เหมาะสม หัวใจสำคัญของบริการนี้ เช่นเดียวกับบริการแพลตฟอร์มทั้งหมด คือความปลอดภัยและการปฏิบัติตามแนวทางปฏิบัติที่ดีที่สุดที่กำหนดโดย TR และอุตสาหกรรม
บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon ที่จัดเก็บออบเจกต์ (Amazon S3) ทำหน้าที่เป็นที่เก็บข้อมูลเนื้อหา TR สร้างกระบวนการเพื่อเข้าถึงข้อมูลอย่างปลอดภัยจากที่จัดเก็บข้อมูลดิบไปยังพื้นที่ทำงานการทดลองของผู้ใช้ ในขณะที่ยังคงรักษาสิทธิ์ที่จำเป็นและความสามารถในการตรวจสอบ Snowflake ใช้เป็นที่เก็บข้อมูลหลักเชิงสัมพันธ์ขององค์กร เมื่อผู้ใช้ร้องขอและขึ้นอยู่กับการอนุมัติจากเจ้าของข้อมูล บริการข้อมูล AI Platform จะให้ภาพรวมของข้อมูลแก่ผู้ใช้ที่พร้อมใช้งานในพื้นที่ทำงานการทดลองของพวกเขา
การเข้าถึงข้อมูลจากแหล่งต่าง ๆ เป็นปัญหาทางเทคนิคที่สามารถแก้ไขได้ง่าย แต่ความซับซ้อนที่ TR ได้แก้ไขคือการสร้างเวิร์กโฟลว์การอนุมัติที่ดำเนินการระบุเจ้าของข้อมูลโดยอัตโนมัติ ส่งคำขอการเข้าถึง ตรวจสอบให้แน่ใจว่าเจ้าของข้อมูลได้รับแจ้งว่ามีคำขอการเข้าถึงที่รอดำเนินการ และดำเนินการตามสถานะการอนุมัติเพื่อให้ข้อมูลแก่ ผู้ร้องขอ เหตุการณ์ทั้งหมดตลอดกระบวนการนี้ได้รับการติดตามและบันทึกเพื่อการตรวจสอบและการปฏิบัติตามข้อกำหนด
ดังแสดงในแผนภาพต่อไปนี้ TR ใช้ ฟังก์ชันขั้นตอนของ AWS เพื่อประสานเวิร์กโฟลว์และ AWS แลมบ์ดา เพื่อเรียกใช้ฟังก์ชัน Amazon API Gateway Amazon ใช้เพื่อแสดงการทำงานกับตำแหน่งข้อมูล API ที่จะใช้งานจากเว็บพอร์ทัล
การทดลองและพัฒนาแบบจำลอง
ความสามารถที่จำเป็นสำหรับการกำหนดมาตรฐานวงจรชีวิตของ ML คือสภาพแวดล้อมที่ช่วยให้นักวิทยาศาสตร์ข้อมูลสามารถทดลองกับเฟรมเวิร์ก ML และขนาดข้อมูลต่างๆ ได้ การเปิดใช้งานสภาพแวดล้อมที่ปลอดภัยและสอดคล้องในระบบคลาวด์ภายในไม่กี่นาทีช่วยลดภาระของนักวิทยาศาสตร์ข้อมูลจากภาระในการจัดการโครงสร้างพื้นฐานระบบคลาวด์ ข้อกำหนดด้านเครือข่าย และมาตรการมาตรฐานความปลอดภัย เพื่อมุ่งเน้นที่ปัญหาด้านวิทยาศาสตร์ข้อมูลแทน
TR สร้างพื้นที่ทำงานการทดลองที่ให้การเข้าถึงบริการต่างๆ เช่น AWS กาว, อเมซอน EMRและ SageMaker Studio เพื่อเปิดใช้งานการประมวลผลข้อมูลและความสามารถ ML ที่เป็นไปตามมาตรฐานความปลอดภัยระบบคลาวด์ขององค์กร และการแยกบัญชีที่จำเป็นสำหรับทุกหน่วยธุรกิจ TR พบกับความท้าทายต่อไปนี้ในขณะที่ใช้โซลูชัน:
- การประสานเสียงตั้งแต่เนิ่นๆ ไม่ได้เป็นไปโดยอัตโนมัติทั้งหมดและเกี่ยวข้องกับขั้นตอนที่ต้องทำด้วยตนเองหลายขั้นตอน การติดตามว่าปัญหาเกิดขึ้นที่ไหนไม่ใช่เรื่องง่าย TR เอาชนะข้อผิดพลาดนี้ด้วยการจัดการเวิร์กโฟลว์โดยใช้ Step Functions ด้วยการใช้ Step Functions การสร้างเวิร์กโฟลว์ที่ซับซ้อน การจัดการสถานะ และการจัดการข้อผิดพลาดกลายเป็นเรื่องง่ายขึ้นมาก
- เหมาะสม AWS Identity และการจัดการการเข้าถึง การกำหนดบทบาท (IAM) สำหรับพื้นที่ทำงานการทดลองเป็นเรื่องยากที่จะกำหนด เพื่อให้เป็นไปตามมาตรฐานการรักษาความปลอดภัยภายในของ TR และโมเดลที่มีสิทธิพิเศษน้อยที่สุด เดิมที บทบาทของพื้นที่ทำงานถูกกำหนดด้วยนโยบายแบบอินไลน์ ด้วยเหตุนี้ นโยบายแบบอินไลน์จึงขยายใหญ่ขึ้นตามกาลเวลาและกลายเป็นรายละเอียด ซึ่งเกินขีดจำกัดขนาดนโยบายที่อนุญาตสำหรับบทบาท IAM เพื่อลดปัญหานี้ TR เปลี่ยนไปใช้นโยบายที่จัดการโดยลูกค้ามากขึ้น และอ้างอิงถึงนโยบายเหล่านั้นในการกำหนดบทบาทของเวิร์กสเปซ
- ในบางครั้ง TR ถึงขีดจำกัดทรัพยากรเริ่มต้นที่ใช้ในระดับบัญชี AWS ซึ่งทำให้เกิดความล้มเหลวในบางครั้งในการเรียกใช้งาน SageMaker (เช่น งานฝึกอบรม) เนื่องจากถึงขีดจำกัดประเภททรัพยากรที่ต้องการแล้ว TR ทำงานอย่างใกล้ชิดกับทีมบริการของ SageMaker ในเรื่องนี้ ปัญหานี้ได้รับการแก้ไขหลังจากที่ทีม AWS เปิดตัว SageMaker เป็นบริการที่รองรับใน โควต้าบริการ ในเดือนมิถุนายน 2022
วันนี้ นักวิทยาศาสตร์ข้อมูลที่ TR สามารถเปิดตัวโครงการ ML โดยสร้างพื้นที่ทำงานอิสระและเพิ่มสมาชิกในทีมที่จำเป็นเพื่อทำงานร่วมกัน ขนาดไม่จำกัดที่นำเสนอโดย SageMaker อยู่ใกล้แค่ปลายนิ้ว โดยจัดเตรียมภาพเคอร์เนลแบบกำหนดเองที่มีขนาดต่างๆ กัน SageMaker Studio กลายเป็นส่วนประกอบสำคัญในแพลตฟอร์ม AI ของ TR อย่างรวดเร็ว และได้เปลี่ยนพฤติกรรมของผู้ใช้จากการใช้แอปพลิเคชันเดสก์ท็อปที่มีข้อจำกัดมาเป็นเอ็นจิ้นที่สร้างขึ้นตามวัตถุประสงค์ชั่วคราวที่ปรับขนาดได้ แผนภาพต่อไปนี้แสดงสถาปัตยกรรมนี้
การลงทะเบียนโมเดลกลาง
การลงทะเบียนแบบจำลองจัดเตรียมพื้นที่เก็บข้อมูลส่วนกลางสำหรับแบบจำลองการเรียนรู้ของเครื่อง TR ทั้งหมด ช่วยให้สามารถจัดการความเสี่ยงและความสมบูรณ์ของแบบจำลองเหล่านั้นในลักษณะที่เป็นมาตรฐานในทุกฟังก์ชันทางธุรกิจ และเพิ่มความคล่องตัวในการนำแบบจำลองที่มีศักยภาพไปใช้ซ้ำ ดังนั้นบริการจำเป็นต้องดำเนินการดังต่อไปนี้:
- ให้ความสามารถในการลงทะเบียนทั้งรุ่นใหม่และรุ่นเก่า ไม่ว่าจะพัฒนาภายในหรือภายนอก SageMaker
- ใช้เวิร์กโฟลว์การกำกับดูแล ช่วยให้นักวิทยาศาสตร์ข้อมูล นักพัฒนา และผู้มีส่วนได้ส่วนเสียสามารถดูและจัดการวงจรชีวิตของโมเดลโดยรวมได้
- เพิ่มความโปร่งใสและการทำงานร่วมกันโดยสร้างมุมมองแบบรวมศูนย์ของโมเดลทั้งหมดทั่วทั้ง TR ควบคู่ไปกับข้อมูลเมตาและตัวชี้วัดด้านสุขภาพ
TR เริ่มต้นการออกแบบด้วยการลงทะเบียนโมเดล SageMaker แต่ข้อกำหนดหลักข้อหนึ่งของ TR คือการให้ความสามารถในการลงทะเบียนโมเดลที่สร้างขึ้นภายนอก SageMaker TR ประเมินฐานข้อมูลเชิงสัมพันธ์ที่แตกต่างกัน แต่ลงเอยด้วยการเลือก DynamoDB เนื่องจากสคีมาข้อมูลเมตาสำหรับโมเดลที่มาจากแหล่งเดิมจะแตกต่างกันมาก นอกจากนี้ TR ไม่ต้องการกำหนดงานเพิ่มเติมใดๆ กับผู้ใช้ ดังนั้นพวกเขาจึงใช้การซิงโครไนซ์อัตโนมัติที่ราบรื่นระหว่างพื้นที่ทำงาน AI Platform การลงทะเบียน SageMaker กับการลงทะเบียน SageMaker ส่วนกลางโดยใช้ อเมซอน EventBridge กฎและบทบาท IAM ที่จำเป็น TR ปรับปรุงรีจิสทรีกลางด้วย DynamoDB เพื่อขยายขีดความสามารถในการลงทะเบียนโมเดลดั้งเดิมที่สร้างขึ้นบนเดสก์ท็อปของผู้ใช้
การลงทะเบียนโมเดลส่วนกลางของ AI Platform ของ TR ถูกรวมเข้ากับพอร์ทัล AI Platform และจัดเตรียมอินเทอร์เฟซแบบภาพเพื่อค้นหาโมเดล อัปเดตข้อมูลเมตาของโมเดล และทำความเข้าใจเมตริกพื้นฐานโมเดลและเมตริกการตรวจสอบที่กำหนดเองเป็นระยะ แผนภาพต่อไปนี้แสดงสถาปัตยกรรมนี้
การปรับใช้โมเดล
TR ระบุรูปแบบหลักสองรูปแบบเพื่อทำให้การปรับใช้เป็นแบบอัตโนมัติ:
- โมเดลที่พัฒนาโดยใช้ SageMaker ผ่าน SageMaker แปลงงานเป็นชุดเพื่อรับการอนุมานตามกำหนดเวลาที่ต้องการ
- โมเดลที่พัฒนานอก SageMaker บนเดสก์ท็อปในเครื่องโดยใช้ไลบรารีโอเพ่นซอร์ส ด้วยวิธีการนำคอนเทนเนอร์ของคุณเองมาใช้โดยใช้งานการประมวลผลของ SageMaker เพื่อรันโค้ดการอนุมานแบบกำหนดเอง ซึ่งเป็นวิธีที่มีประสิทธิภาพในการโยกย้ายโมเดลเหล่านั้นโดยไม่ต้องปรับโครงสร้างโค้ดใหม่
ด้วยบริการการปรับใช้ AI Platform ผู้ใช้ TR (นักวิทยาศาสตร์ข้อมูลและวิศวกร ML) สามารถระบุโมเดลจากแคตตาล็อกและใช้งานการอนุมานในบัญชี AWS ที่เลือกโดยระบุพารามิเตอร์ที่จำเป็นผ่านเวิร์กโฟลว์ที่ขับเคลื่อนด้วย UI
TR ทำให้การปรับใช้นี้เป็นไปโดยอัตโนมัติโดยใช้บริการ AWS DevOps เช่น AWS CodePipeline และ AWS CodeBuild. TR ใช้ Step Functions เพื่อจัดระเบียบเวิร์กโฟลว์ของการอ่านและประมวลผลข้อมูลล่วงหน้าเพื่อสร้างงานการอนุมานของ SageMaker TR ปรับใช้ส่วนประกอบที่จำเป็นเป็นรหัสโดยใช้ การก่อตัวของ AWS Cloud แม่แบบ แผนภาพต่อไปนี้แสดงสถาปัตยกรรมนี้
การตรวจสอบแบบจำลอง
วงจรชีวิตของ ML จะไม่สมบูรณ์หากไม่สามารถตรวจสอบโมเดลได้ ทีมการกำกับดูแลองค์กรของ TR ยังกำหนดและสนับสนุนให้ทีมธุรกิจตรวจสอบประสิทธิภาพของแบบจำลองเมื่อเวลาผ่านไปเพื่อจัดการกับความท้าทายด้านกฎระเบียบ TR เริ่มต้นด้วยการตรวจสอบแบบจำลองและข้อมูลสำหรับการดริฟท์ TR ใช้ SageMaker Model Monitor เพื่อจัดเตรียมข้อมูลพื้นฐานและการอนุมานความจริงพื้นๆ เพื่อตรวจสอบเป็นระยะว่าข้อมูลและการอนุมานของ TR เลื่อนลอยอย่างไร นอกจากเมตริกการตรวจสอบแบบจำลองของ SageMaker แล้ว TR ยังปรับปรุงความสามารถในการตรวจสอบโดยการพัฒนาเมตริกแบบกำหนดเองสำหรับแบบจำลองของตนโดยเฉพาะ สิ่งนี้จะช่วยให้นักวิทยาศาสตร์ข้อมูลของ TR เข้าใจว่าเมื่อใดควรฝึกโมเดลใหม่
นอกเหนือจากการตรวจสอบการดริฟท์แล้ว TR ยังต้องการเข้าใจอคติในแบบจำลองด้วย ความสามารถนอกกรอบของ SageMaker Clarify ใช้เพื่อสร้างบริการอคติของ TR TR ตรวจสอบทั้งข้อมูลและความเอนเอียงของแบบจำลอง และทำให้เมตริกเหล่านั้นพร้อมใช้งานสำหรับผู้ใช้ผ่านทางพอร์ทัล AI Platform
เพื่อช่วยให้ทุกทีมยอมรับมาตรฐานองค์กรเหล่านี้ TR ได้ทำให้บริการเหล่านี้เป็นอิสระและพร้อมใช้งานผ่านทางพอร์ทัล AI Platform ทีมธุรกิจของ TR สามารถเข้าไปในพอร์ทัลและปรับใช้งานการมอนิเตอร์โมเดลหรืองานการมอนิเตอร์อคติด้วยตนเอง และเรียกใช้งานตามกำหนดเวลาที่ต้องการ พวกเขาได้รับแจ้งเกี่ยวกับสถานะของงานและเมตริกสำหรับการทำงานทุกครั้ง
TR ใช้บริการของ AWS สำหรับการปรับใช้ CI/CD, การจัดการเวิร์กโฟลว์, เฟรมเวิร์กแบบไร้เซิร์ฟเวอร์ และตำแหน่งข้อมูล API เพื่อสร้างไมโครเซอร์วิสที่สามารถทริกเกอร์ได้อย่างอิสระ ดังที่แสดงในสถาปัตยกรรมต่อไปนี้
ผลลัพธ์และการปรับปรุงในอนาคต
แพลตฟอร์ม AI ของ TR เริ่มใช้งานจริงในไตรมาสที่ 3 ปี 2022 โดยมีส่วนประกอบหลักทั้ง XNUMX ส่วน ได้แก่ บริการข้อมูล พื้นที่ทำงานทดลอง การลงทะเบียนโมเดลส่วนกลาง การปรับใช้โมเดล และการตรวจสอบโมเดล TR จัดเซสชันการฝึกอบรมภายในสำหรับหน่วยธุรกิจเพื่อเข้าร่วมแพลตฟอร์มและเสนอวิดีโอการฝึกอบรมด้วยตนเอง
แพลตฟอร์ม AI ได้มอบความสามารถให้กับทีมของ TR ที่ไม่เคยมีมาก่อน ได้เปิดโอกาสที่หลากหลายสำหรับทีมการกำกับดูแลองค์กรของ TR ในการปรับปรุงมาตรฐานการปฏิบัติตามกฎระเบียบและรวมศูนย์กลางของการลงทะเบียน โดยให้มุมมองแบบกระจกบานเดียวสำหรับ ML ทุกรุ่นภายใน TR
TR ยอมรับว่าไม่มีผลิตภัณฑ์ใดดีที่สุดในการวางจำหน่ายครั้งแรก ส่วนประกอบทั้งหมดของ TR อยู่ในระดับที่แตกต่างกัน และทีมงาน Enterprise AI Platform ของ TR อยู่ในขั้นตอนการปรับปรุงอย่างต่อเนื่องเพื่อปรับปรุงคุณสมบัติของผลิตภัณฑ์ซ้ำๆ ขั้นตอนความก้าวหน้าในปัจจุบันของ TR รวมถึงการเพิ่มตัวเลือกการอนุมานของ SageMaker เพิ่มเติม เช่น ตำแหน่งข้อมูลแบบเรียลไทม์ อะซิงโครนัส และหลายรุ่น TR กำลังวางแผนที่จะเพิ่มความสามารถในการอธิบายโมเดลเป็นคุณสมบัติในบริการตรวจสอบโมเดล TR วางแผนที่จะใช้ความสามารถในการอธิบายของ SageMaker Clarify เพื่อพัฒนาบริการที่สามารถอธิบายได้ภายใน
สรุป
ตอนนี้ TR สามารถประมวลผลข้อมูลจำนวนมหาศาลได้อย่างปลอดภัยและใช้ความสามารถขั้นสูงของ AWS เพื่อนำโครงการ ML จากแนวคิดไปสู่การผลิตในช่วงเวลาหลายสัปดาห์ เมื่อเทียบกับเดือนก่อนหน้า ด้วยความสามารถนอกกรอบของบริการ AWS ทีมใน TR สามารถลงทะเบียนและตรวจสอบโมเดล ML ได้เป็นครั้งแรก บรรลุผลตามมาตรฐานการกำกับดูแลโมเดลที่พัฒนาขึ้นเรื่อยๆ TR ช่วยให้นักวิทยาศาสตร์ข้อมูลและทีมผลิตภัณฑ์สามารถปลดปล่อยความคิดสร้างสรรค์อย่างมีประสิทธิภาพเพื่อแก้ปัญหาที่ซับซ้อนที่สุด
หากต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับ Enterprise AI Platform ของ TR บน AWS โปรดดูที่ เซสชัน AWS re:Invent 2022. หากคุณต้องการเรียนรู้วิธีที่ TR เร่งการใช้แมชชีนเลิร์นนิงโดยใช้ AWS Data Lab โปรแกรม, อ้างถึง กรณีศึกษา.
เกี่ยวกับผู้เขียน
รามเดฟ วูดาลี เป็นสถาปนิกข้อมูล ช่วยออกแบบและสร้างแพลตฟอร์ม AI/ML เพื่อให้นักวิทยาศาสตร์ข้อมูลและนักวิจัยพัฒนาโซลูชันการเรียนรู้ของเครื่องโดยมุ่งเน้นไปที่วิทยาศาสตร์ข้อมูล ไม่ใช่ความต้องการด้านโครงสร้างพื้นฐาน ในเวลาว่าง เขาชอบพับกระดาษเพื่อสร้างโอริกามิเทสเซลเลชั่น และสวมเสื้อยืดที่ไม่เคารพ
กิรัญ มันตรีปราการ เป็นผู้อำนวยการอาวุโสของ AI Platform ที่ Thomson Reuters ทีมแพลตฟอร์ม AI มีหน้าที่รับผิดชอบในการเปิดใช้งานแอปพลิเคชันซอฟต์แวร์ AI ระดับการผลิตและเปิดใช้งานการทำงานของนักวิทยาศาสตร์ข้อมูลและนักวิจัยด้านการเรียนรู้ของเครื่อง ด้วยความหลงใหลในวิทยาศาสตร์ AI และวิศวกรรม Kiran ชอบเชื่อมช่องว่างระหว่างการวิจัยและการผลิตเพื่อนำนวัตกรรมที่แท้จริงของ AI ไปสู่ผู้บริโภคขั้นสุดท้าย
ภาวนา จิรุมมิลลา เป็น Sr. Resident Architect ที่ AWS เธอหลงใหลเกี่ยวกับข้อมูลและการดำเนินงาน ML และนำความกระตือรือร้นมากมายมาช่วยเหลือองค์กรต่างๆ ในการสร้างข้อมูลและกลยุทธ์ ML ในเวลาว่าง เธอชอบใช้เวลากับครอบครัวในการท่องเที่ยว เดินป่า ทำสวน และดูสารคดี
ศรีนิวาสะ ไชค์ เป็น Solutions Architect ที่ AWS ซึ่งตั้งอยู่ในเมืองบอสตัน เขาช่วยให้ลูกค้าองค์กรเร่งการเดินทางสู่ระบบคลาวด์ เขาหลงใหลเกี่ยวกับคอนเทนเนอร์และเทคโนโลยีแมชชีนเลิร์นนิง ในเวลาว่าง เขาชอบใช้เวลากับครอบครัว ทำอาหาร และท่องเที่ยว
ชิงเหว่ย ลี่ เป็นผู้เชี่ยวชาญด้าน Machine Learning ที่ Amazon Web Services เขาได้รับปริญญาเอกด้านการวิจัยการดำเนินงานหลังจากที่เขาทำลายบัญชีทุนวิจัยของที่ปรึกษาและล้มเหลวในการมอบรางวัลโนเบลที่เขาสัญญาไว้ ปัจจุบัน เขาช่วยลูกค้าในอุตสาหกรรมบริการทางการเงินและประกันภัยสร้างโซลูชันแมชชีนเลิร์นนิงบน AWS เวลาว่างชอบอ่านหนังสือและสอน
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- เพลโตบล็อคเชน Web3 Metaverse ข่าวกรอง ขยายความรู้. เข้าถึงได้ที่นี่.
- ที่มา: https://aws.amazon.com/blogs/machine-learning/how-thomson-reuters-built-an-ai-platform-using-amazon-sagemaker-to-accelerate-delivery-of-ml-projects/
- 100
- 2022
- 7
- a
- สามารถ
- เกี่ยวกับเรา
- เร่งความเร็ว
- เร่ง
- เข้า
- สามารถเข้าถึงได้
- ตาม
- ลงชื่อเข้าใช้
- การบัญชี
- ประสบความสำเร็จ
- การบรรลุ
- ได้รับ
- ข้าม
- การกระทำ
- การกระทำ
- เพิ่มเติม
- ที่อยู่
- นำมาใช้
- สูง
- หลังจาก
- AI
- แพลตฟอร์ม AI
- บริการ AI
- AI / ML
- ทั้งหมด
- ช่วยให้
- คู่ขนาน
- อเมซอน
- อเมซอน SageMaker
- Amazon Web Services
- จำนวน
- และ
- API
- การใช้งาน
- ประยุกต์
- เข้าใกล้
- วิธีการ
- การอนุมัติ
- สถาปัตยกรรม
- รอบ
- การอนุญาต
- โดยอัตโนมัติ
- อัตโนมัติ
- อัตโนมัติ
- ใช้ได้
- AWS
- ตาม
- baseline
- เพราะ
- ก่อน
- กำลัง
- ที่ดีที่สุด
- ปฏิบัติที่ดีที่สุด
- ระหว่าง
- อคติ
- พันล้าน
- บอสตัน
- สะพาน
- นำมาซึ่ง
- นำ
- Broke
- สร้าง
- การก่อสร้าง
- สร้าง
- สร้าง
- ภาระ
- ธุรกิจ
- ฟังก์ชั่นทางธุรกิจ
- ความสามารถในการ
- กรณี
- แค็ตตาล็อก
- หมวดหมู่
- ที่เกิดจาก
- ส่วนกลาง
- ส่วนกลาง
- ความท้าทาย
- ตรวจสอบ
- เลือก
- เลือก
- อย่างใกล้ชิด
- เมฆ
- โครงสร้างพื้นฐานคลาวด์
- ความปลอดภัยบนคลาวด์
- รหัส
- ร่วมมือ
- ร่วมมือ
- การทำงานร่วมกัน
- รวม
- มา
- ร่วมกัน
- เมื่อเทียบกับ
- สมบูรณ์
- ซับซ้อน
- ความซับซ้อน
- การปฏิบัติตาม
- ไม่ขัดขืน
- ส่วนประกอบ
- ส่วนประกอบ
- ประกอบด้วย
- การคำนวณ
- ถูกใช้
- ผู้บริโภค
- ภาชนะ
- ภาชนะบรรจุ
- เนื้อหา
- ต่อ
- ต่อเนื่องกัน
- ควบคุม
- แกน
- สร้าง
- ที่สร้างขึ้น
- การสร้าง
- ความคิดสร้างสรรค์
- วิกฤติ
- สำคัญมาก
- ปัจจุบัน
- ขณะนี้
- ประเพณี
- ลูกค้า
- ข้อมูล
- ดาต้าเลค
- การประมวลผล
- วิทยาศาสตร์ข้อมูล
- ฐานข้อมูล
- การตัดสินใจ
- ลึก
- ความเชี่ยวชาญอย่างลึกซึ้ง
- ค่าเริ่มต้น
- ส่งมอบ
- การจัดส่ง
- ทำให้เป็นประชาธิปไตย
- ปรับใช้
- การใช้งาน
- Deploys
- บรรยาย
- ออกแบบ
- เดสก์ท็อป
- รายละเอียด
- แน่นอน
- พัฒนา
- พัฒนา
- นักพัฒนา
- ที่กำลังพัฒนา
- พัฒนาการ
- ต่าง
- ยาก
- ผู้อำนวยการ
- สนทนา
- สารคดี
- โดเมน
- โดเมน
- ลง
- ก่อน
- ง่ายดาย
- อย่างง่ายดาย
- มีประสิทธิภาพ
- ที่มีประสิทธิภาพ
- ความพยายาม
- อำนาจ
- ทำให้สามารถ
- เปิดการใช้งาน
- ช่วยให้
- การเปิดใช้งาน
- กระตุ้นให้เกิดการ
- ปลายทาง
- เครื่องยนต์
- ชั้นเยี่ยม
- วิศวกร
- เครื่องยนต์
- ที่เพิ่มขึ้น
- ทำให้มั่นใจ
- การสร้างความมั่นใจ
- Enterprise
- ผู้ประกอบการ
- ความกระตือรือร้น
- สิ่งแวดล้อม
- ความผิดพลาด
- จำเป็น
- ตามหลักจริยธรรม
- ประเมิน
- เหตุการณ์
- เคย
- คาย
- การพัฒนา
- ตัวอย่าง
- การทดลอง
- ความชำนาญ
- ขยายออก
- อย่างยิ่ง
- อำนวยความสะดวก
- ล้มเหลว
- ครอบครัว
- ลักษณะ
- คุณสมบัติ
- สองสาม
- สุดท้าย
- ทางการเงิน
- บริการทางการเงิน
- หา
- หา
- ชื่อจริง
- ครั้งแรก
- โฟกัส
- โดยมุ่งเน้น
- ปฏิบัติตาม
- ดังต่อไปนี้
- ดังต่อไปนี้
- เป็นทางการ
- กรอบ
- ราคาเริ่มต้นที่
- เติมเต็ม
- อย่างเต็มที่
- ฟังก์ชั่น
- ฟังก์ชั่น
- อนาคต
- ช่องว่าง
- General
- สร้าง
- ได้รับ
- กระจก
- Go
- เป้าหมาย
- การกำกับดูแล
- ให้
- พื้น
- การเจริญเติบโต
- การจัดการ
- ยาก
- สุขภาพ
- ช่วย
- การช่วยเหลือ
- จะช่วยให้
- อย่างสูง
- โฮสติ้ง
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- อย่างไรก็ตาม
- HTML
- HTTPS
- ระบุ
- แยกแยะ
- ระบุ
- เอกลักษณ์
- ภาพ
- ส่งผลกระทบ
- การดำเนินการ
- การดำเนินการ
- การดำเนินการ
- กำหนด
- ปรับปรุง
- in
- รวมถึง
- เพิ่ม
- อิสระ
- อิสระ
- อุตสาหกรรม
- โครงสร้างพื้นฐาน
- แรกเริ่ม
- นักวิเคราะห์ส่วนบุคคลที่หาโอกาสให้เป็นไปได้มากที่สุด
- ข้อมูลเชิงลึก
- แทน
- ประกัน
- แบบบูรณาการ
- อินเตอร์เฟซ
- ภายใน
- ร่วมมือ
- ความเหงา
- ปัญหา
- IT
- การสัมภาษณ์
- งาน
- การเดินทาง
- คีย์
- ทราบ
- ความรู้
- ทะเลสาบ
- เปิดตัว
- เปิดตัว
- การเปิดตัว
- เรียนรู้
- การเรียนรู้
- มรดก
- กฎหมาย
- ชั้น
- ระดับ
- ห้องสมุด
- LIMIT
- ขีด จำกัด
- สด
- ในประเทศ
- เครื่อง
- เรียนรู้เครื่อง
- ทำ
- สำคัญ
- ทำให้
- การทำ
- จัดการ
- การจัดการ
- การจัดการ
- เอกสาร
- ลักษณะ
- คู่มือ
- หลาย
- วุฒิภาวะ
- มาตรการ
- สมาชิก
- เมตาดาต้า
- วิธีการ
- เมตริก
- ตัวชี้วัด
- microservices
- อพยพ
- ขั้น
- เหตุการณ์สำคัญ
- ใจ
- นาที
- บรรเทา
- ML
- แบบ
- โมเดล
- การตรวจสอบ
- การตรวจสอบ
- จอภาพ
- เดือน
- ข้อมูลเพิ่มเติม
- มากที่สุด
- หลาย
- โดยธรรมชาติ
- นำทาง
- จำเป็นต้อง
- ความต้องการ
- เครือข่าย
- ใหม่
- ข่าว
- ถัดไป
- รางวัลโนเบล
- จำนวน
- วัตถุ
- เป็นครั้งคราว
- เสนอ
- การเสนอ
- เสนอ
- ออนบอร์ด
- ONE
- โอเพนซอร์ส
- เปิด
- การดำเนินการ
- Options
- ประสาน
- organizacja
- แต่เดิม
- ด้านนอก
- ของตนเอง
- เจ้าของ
- บานหน้าต่าง
- กระดาษ
- พารามิเตอร์
- กิเลส
- หลงใหล
- รูปแบบ
- คน
- การปฏิบัติ
- เป็นระยะ
- ระยะ
- ท่อ
- การวางแผน
- แผน
- เวที
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- จุด
- นโยบาย
- นโยบาย
- พอร์ทัล
- ความเป็นไปได้
- โพสต์
- ที่มีศักยภาพ
- อำนาจ
- การปฏิบัติ
- การคาดการณ์
- ที่ต้องการ
- ประถม
- หลักการ
- รางวัล
- ปัญหา
- ปัญหาที่เกิดขึ้น
- กระบวนการ
- กระบวนการ
- การประมวลผล
- ผลิตภัณฑ์
- การผลิต
- ผลิตภัณฑ์
- มืออาชีพ
- โครงการ
- โครงการ
- โครงการ
- สัญญา
- ให้
- ให้
- ให้
- การให้
- Q3
- q3 2022
- อย่างรวดเร็ว
- พิสัย
- ตั้งแต่
- RE
- ถึง
- การอ่าน
- จริง
- เรียลไทม์
- ที่ได้รับ
- ทะเบียน
- รีจิสทรี
- กฎระเบียบ
- หน่วยงานกำกับดูแล
- ปล่อย
- การเผยแพร่
- เอาออก
- กรุ
- ขอ
- จำเป็นต้องใช้
- ความต้องการ
- การวิจัย
- นักวิจัย
- ทรัพยากร
- แหล่งข้อมูล
- รับผิดชอบ
- รอยเตอร์ส
- ความเสี่ยง
- บทบาท
- บทบาท
- กฎระเบียบ
- วิ่ง
- sagemaker
- การอนุมาน SageMaker
- ที่ปรับขนาดได้
- ขนาด
- กำหนด
- วิทยาศาสตร์
- นักวิทยาศาสตร์
- ไร้รอยต่อ
- ได้อย่างลงตัว
- ค้นหา
- เครื่องมือค้นหา
- ส่วน
- ปลอดภัย
- ปลอดภัย
- อย่างปลอดภัย
- ความปลอดภัย
- การส่ง
- ระดับอาวุโส
- มีความละเอียดอ่อน
- ให้บริการ
- serverless
- บริการ
- บริการ
- ครั้ง ราคา
- หลาย
- Share
- แสดง
- ง่าย
- ตั้งแต่
- เดียว
- ขนาด
- ขนาด
- มีฝีมือ
- ทักษะ
- ภาพย่อ
- So
- ซอฟต์แวร์
- ทางออก
- โซลูชัน
- แก้
- แหล่งที่มา
- ผู้เชี่ยวชาญ
- โดยเฉพาะ
- ใช้จ่าย
- การใช้จ่าย
- ระยะ
- ผู้มีส่วนได้เสีย
- มาตรฐาน
- มาตรฐาน
- ข้อความที่เริ่ม
- เริ่มต้น
- สหรัฐอเมริกา
- Status
- ขั้นตอน
- ขั้นตอน
- การเก็บรักษา
- จัดเก็บ
- ร้านค้า
- กลยุทธ์
- เพรียวลม
- สตูดิโอ
- อย่างเช่น
- ที่สนับสนุน
- ที่สนับสนุน
- เปลี่ยน
- การประสาน
- ตาราง
- เอา
- ภาษี
- การเรียนการสอน
- ทีม
- ทีม
- วิชาการ
- ทักษะทางเทคนิค
- เทคโนโลยี
- แม่แบบ
- เงื่อนไขการใช้บริการ
- พื้นที่
- ของพวกเขา
- ดังนั้น
- รอยเตอร์ทอมสัน
- ตลอด
- ตลอด
- เวลา
- ไปยัง
- เครื่องมือ
- การติดตาม
- แบบดั้งเดิม
- รถไฟ
- การฝึกอบรม
- แปลง
- ความโปร่งใส
- การเดินทาง
- มหึมา
- ทริกเกอร์
- เข้าใจ
- หน่วย
- หน่วย
- ปล่อย
- ไม่ จำกัด
- บันทึก
- ใช้
- ผู้ใช้งาน
- ผู้ใช้
- ความหลากหลาย
- ต่างๆ
- กว้างใหญ่
- ผ่านทาง
- วิดีโอ
- รายละเอียด
- ความชัดเจน
- ชม
- เว็บ
- บริการเว็บ
- web-based
- สัปดาห์ที่ผ่านมา
- ว่า
- ในขณะที่
- กว้าง
- ช่วงกว้าง
- จะ
- ชนะ
- ภายใน
- ไม่มี
- งาน
- ทำงาน
- ขั้นตอนการทำงาน
- ทั่วโลก
- จะ
- ปี
- ของคุณ
- ลมทะเล