คอมพิวเตอร์วิทัศน์โดยใช้ชุดข้อมูลสังเคราะห์ด้วย Amazon Rekognition Custom Labels และ Dassault Systèmes 3DEXCITE

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

นี่เป็นโพสต์ที่เขียนร่วมกับ Bernard Paques, CTO ของ Storm Reply และ Karl Herkt นักยุทธศาสตร์อาวุโสที่ Dassault Systèmes 3DExcite

แม้ว่าการมองเห็นด้วยคอมพิวเตอร์จะมีความสำคัญต่อการบำรุงรักษาทางอุตสาหกรรม การผลิต การขนส่ง และการใช้งานของผู้บริโภค การนำไปใช้นั้นถูกจำกัดโดยการสร้างชุดข้อมูลการฝึกอบรมด้วยตนเอง การสร้างภาพที่ติดฉลากในบริบททางอุตสาหกรรมนั้นดำเนินการด้วยตนเองเป็นหลัก ซึ่งสร้างความสามารถในการจดจำที่จำกัด ไม่ปรับขนาด และส่งผลให้ต้นทุนแรงงานและความล่าช้าในการรับรู้มูลค่าทางธุรกิจ สิ่งนี้ขัดกับความคล่องตัวทางธุรกิจที่เกิดจากการออกแบบผลิตภัณฑ์ วิศวกรรมผลิตภัณฑ์ และการกำหนดค่าผลิตภัณฑ์อย่างรวดเร็ว กระบวนการนี้ไม่ได้ปรับขนาดสำหรับผลิตภัณฑ์ที่ซับซ้อน เช่น รถยนต์ เครื่องบิน หรืออาคารสมัยใหม่ เนื่องจากในสถานการณ์ดังกล่าว โครงการการติดฉลากทุกโครงการมีความเฉพาะตัว (ที่เกี่ยวข้องกับผลิตภัณฑ์ที่ไม่ซ้ำกัน) ด้วยเหตุนี้ เทคโนโลยีการมองเห็นด้วยคอมพิวเตอร์จึงไม่สามารถนำไปใช้กับโปรเจ็กต์ขนาดใหญ่ที่มีลักษณะเฉพาะได้อย่างง่ายดายโดยไม่ต้องใช้ความพยายามอย่างมากในการเตรียมข้อมูล ซึ่งบางครั้งก็จำกัดการนำส่งกรณีการใช้งาน

ในบทความนี้ เราขอนำเสนอแนวทางใหม่ที่มีการสร้างระบบการมองเห็นด้วยคอมพิวเตอร์เฉพาะทางสูงจากไฟล์การออกแบบและ CAD เราเริ่มต้นด้วยการสร้างฝาแฝดดิจิทัลที่ถูกต้องและการสร้างภาพที่ติดฉลากสังเคราะห์ จากนั้นเราก็ดันภาพเหล่านี้ไปที่ ป้ายกำกับที่กำหนดเองของ Amazon Rekognition เพื่อฝึกโมเดลการตรวจจับวัตถุแบบกำหนดเอง ด้วยการใช้ทรัพย์สินทางปัญญาที่มีอยู่กับซอฟต์แวร์ เรากำลังทำให้คอมพิวเตอร์วิทัศน์มีราคาไม่แพงและเกี่ยวข้องกับบริบททางอุตสาหกรรมที่หลากหลาย

การปรับแต่งระบบการจดจำช่วยขับเคลื่อนผลลัพธ์ทางธุรกิจ

ระบบคอมพิวเตอร์วิทัศน์เฉพาะทางที่ผลิตจากฝาแฝดดิจิทัลมีข้อดีเฉพาะ ซึ่งสามารถอธิบายได้ในกรณีการใช้งานต่อไปนี้:

การตรวจสอบย้อนกลับสำหรับผลิตภัณฑ์ที่เป็นเอกลักษณ์ - แอร์บัส โบอิ้ง และผู้ผลิตเครื่องบินรายอื่นๆ กำหนดเอกลักษณ์เฉพาะตัว หมายเลขซีเรียลของผู้ผลิต (MSN) ไปยังเครื่องบินทุกลำที่ผลิต มีการจัดการตลอดกระบวนการผลิตทั้งหมด เพื่อสร้าง เอกสารสมควรเดินอากาศ และขออนุญาติบิน อา แฝดดิจิตอล (แบบจำลอง 3 มิติเสมือนที่แสดงถึงผลิตภัณฑ์ทางกายภาพ) สามารถได้มาจากการกำหนดค่าของ MSN แต่ละรายการ และสร้างระบบคอมพิวเตอร์วิทัศน์แบบกระจายที่ติดตามความคืบหน้าของ MSN นี้ทั่วทั้งโรงงานอุตสาหกรรม การจดจำแบบกำหนดเองทำให้ความโปร่งใสที่มอบให้กับสายการบินเป็นไปโดยอัตโนมัติ และแทนที่จุดตรวจส่วนใหญ่ที่สายการบินดำเนินการด้วยตนเอง การประกันคุณภาพอัตโนมัติสำหรับผลิตภัณฑ์ที่ไม่เหมือนใครสามารถนำไปใช้กับเครื่องบิน รถยนต์ อาคาร และแม้แต่การผลิตงานฝีมือ
เติมความเป็นจริงตามบริบท – ระบบคอมพิวเตอร์วิทัศน์ระดับมืออาชีพสามารถกำหนดขอบเขตภูมิทัศน์ที่จำกัด แต่มีความสามารถในการเลือกปฏิบัติที่สูงกว่า ตัวอย่างเช่น ในอุตสาหกรรมซ่อมบำรุง การหาไขควงในภาพนั้นไม่มีประโยชน์ คุณต้องระบุรุ่นไขควงหรือแม้แต่หมายเลขซีเรียล ในบริบทที่มีขอบเขตดังกล่าว ระบบการรู้จำแบบกำหนดเองมีประสิทธิภาพเหนือกว่าระบบการรู้จำทั่วไป เนื่องจากมีความเกี่ยวข้องมากกว่าในการค้นพบ ระบบการรู้จำแบบกำหนดเองช่วยให้ป้อนกลับได้อย่างแม่นยำผ่าน เติมความเป็นจริงโดยเฉพาะ จัดส่งใน HMI หรือในอุปกรณ์พกพา
การควบคุมคุณภาพแบบครบวงจร - ด้วย วิศวกรรมระบบคุณสามารถสร้างฝาแฝดดิจิทัลของโครงสร้างบางส่วน และสร้างระบบวิชันซิสเต็มคอมพิวเตอร์ที่ปรับให้เข้ากับขั้นตอนต่างๆ ของกระบวนการผลิตและกระบวนการผลิต การควบคุมด้วยภาพสามารถเชื่อมโยงกับเวิร์กสเตชันการผลิตได้ ทำให้สามารถตรวจสอบแบบ end-to-end และตรวจหาข้อบกพร่องได้ตั้งแต่เนิ่นๆ การรับรู้ที่กำหนดเอง สำหรับการตรวจสอบตั้งแต่ต้นทางถึงปลายทางช่วยป้องกันการเรียงซ้อนของข้อบกพร่องไปยังสายการประกอบ การลดอัตราการปฏิเสธและเพิ่มผลผลิตสูงสุดเป็นเป้าหมายสูงสุด
การตรวจสอบคุณภาพที่ยืดหยุ่น – การตรวจสอบคุณภาพสมัยใหม่ต้องปรับให้เข้ากับรูปแบบการออกแบบและการผลิตที่ยืดหยุ่น รูปแบบต่างๆ ในการออกแบบมาจากลูปป้อนกลับเกี่ยวกับการใช้ผลิตภัณฑ์และการบำรุงรักษาผลิตภัณฑ์ การผลิตที่ยืดหยุ่น เป็นความสามารถหลักสำหรับกลยุทธ์การผลิตตามคำสั่ง และสอดคล้องกับหลักการผลิตแบบลีนของการเพิ่มประสิทธิภาพต้นทุน ด้วยการรวมรูปแบบการออกแบบและตัวเลือกการกำหนดค่าในฝาแฝดดิจิทัล การจดจำแบบกำหนดเองช่วยให้สามารถปรับระบบวิชันซิสเต็มของคอมพิวเตอร์ให้เข้ากับแผนการผลิตและรูปแบบการออกแบบได้แบบไดนามิก

ปรับปรุงการมองเห็นคอมพิวเตอร์ด้วย Dassault Systèmes 3DEXCITE ที่ขับเคลื่อนโดย Amazon Rekognition

ภายใน Dassault Systèmes บริษัทที่มีความเชี่ยวชาญอย่างลึกซึ้งในด้านดิจิทัลทวิน ซึ่งเป็นบรรณาธิการซอฟต์แวร์ที่ใหญ่เป็นอันดับสองของยุโรปด้วย ทีมงาน 3DEXCITE กำลังสำรวจเส้นทางที่แตกต่างออกไป ตามที่ Karl Herkt อธิบาย “จะเกิดอะไรขึ้นถ้าแบบจำลองประสาทที่ได้รับการฝึกฝนจากภาพสังเคราะห์สามารถจดจำผลิตภัณฑ์ที่จับต้องได้” 3DEXCITE ได้แก้ปัญหานี้โดยการรวมเทคโนโลยีของพวกเขาเข้ากับโครงสร้างพื้นฐานของ AWS ซึ่งพิสูจน์ให้เห็นถึงความเป็นไปได้ของแนวทางที่แปลกประหลาดนี้ มันยังเป็นที่รู้จักกันในนาม การตรวจจับวัตถุข้ามโดเมนโดยที่โมเดลการตรวจจับเรียนรู้จากภาพที่ติดป้ายกำกับจากโดเมนต้นทาง (ภาพสังเคราะห์) และทำการคาดการณ์ไปยังโดเมนเป้าหมายที่ไม่มีป้ายกำกับ (ส่วนประกอบทางกายภาพ)

Dassault Systèmes 3DEXCITE และทีม AWS Prototyping ร่วมมือกันสร้างระบบสาธิตที่รู้จักส่วนต่างๆ ของกระปุกเกียร์อุตสาหกรรม ต้นแบบนี้สร้างขึ้นใน 3 สัปดาห์ และโมเดลที่ผ่านการฝึกอบรมได้รับคะแนน F98 ถึง 1% โมเดลการจดจำได้รับการฝึกอบรมทั้งหมดจากขั้นตอนของซอฟต์แวร์ ซึ่งไม่มีรูปภาพของชิ้นส่วนจริง จากการออกแบบและไฟล์ CAD ของกระปุกเกียร์อุตสาหกรรม 3DEXCITE ได้สร้างฝาแฝดดิจิทัลที่ถูกต้องทางสายตา พวกเขายังสร้างภาพที่ติดฉลากสังเคราะห์หลายพันรายการจากฝาแฝดดิจิทัล จากนั้นจึงใช้ Rekognition Custom Labels เพื่อฝึกโมเดลประสาทที่มีความเชี่ยวชาญสูงจากอิมเมจเหล่านี้ และจัดหา API การรู้จำที่เกี่ยวข้อง พวกเขาสร้างเว็บไซต์เพื่อเปิดใช้งานการจดจำจากเว็บแคมของส่วนใดส่วนหนึ่งของกระปุกเกียร์

ความหมายของ Amazon เป็นบริการ AI ที่ใช้เทคโนโลยีการเรียนรู้เชิงลึกเพื่อให้คุณสามารถดึงข้อมูลเมตาที่มีความหมายจากรูปภาพและวิดีโอ ซึ่งรวมถึงการระบุวัตถุ บุคคล ข้อความ ฉาก กิจกรรม และเนื้อหาที่อาจไม่เหมาะสม โดยไม่ต้องมีความเชี่ยวชาญด้านการเรียนรู้ของเครื่อง (ML) Amazon Rekognition ยังมีความสามารถในการวิเคราะห์ใบหน้าและการค้นหาใบหน้าที่แม่นยำสูง ซึ่งคุณสามารถใช้ตรวจจับ วิเคราะห์ และเปรียบเทียบใบหน้าสำหรับการตรวจสอบผู้ใช้ การนับคน และกรณีการใช้งานด้านความปลอดภัยได้หลากหลาย สุดท้าย ด้วย Rekognition Custom Labels คุณสามารถใช้ข้อมูลของคุณเองเพื่อสร้างการตรวจจับวัตถุและแบบจำลองการจัดประเภทรูปภาพ

การผสมผสานระหว่างเทคโนโลยี Dassault Systèmes สำหรับการสร้างภาพที่ติดฉลากสังเคราะห์ด้วย Rekognition Custom Labels สำหรับคอมพิวเตอร์วิทัศน์ทำให้เกิดเวิร์กโฟลว์ที่ปรับขนาดได้สำหรับระบบการจดจำ ความง่ายในการใช้งานเป็นปัจจัยบวกที่สำคัญที่นี่ เนื่องจากการเพิ่ม Rekognition Custom Labels ให้กับไปป์ไลน์ซอฟต์แวร์โดยรวมนั้นไม่ใช่เรื่องยาก—มันง่ายพอๆ กับการรวม API เข้ากับเวิร์กโฟลว์ ไม่จำเป็นต้องเป็นนักวิทยาศาสตร์ ML; เพียงส่งเฟรมที่จับภาพไปยัง AWS และรับผลลัพธ์ที่คุณสามารถเข้าสู่ฐานข้อมูลหรือแสดงในเว็บเบราว์เซอร์

สิ่งนี้ตอกย้ำถึงการปรับปรุงอย่างมากเหนือการสร้างชุดข้อมูลการฝึกอบรมด้วยตนเอง คุณสามารถบรรลุผลลัพธ์ที่ดีขึ้นได้เร็วยิ่งขึ้นและแม่นยำยิ่งขึ้น โดยไม่ต้องเสียเวลาทำงานที่มีราคาแพงและไม่จำเป็น ด้วยกรณีการใช้งานที่เป็นไปได้มากมาย การรวมกันของ Dassault Systèmes และ Rekognition Custom Labels มีศักยภาพในการให้ ROI ที่สำคัญและทันทีแก่ธุรกิจในปัจจุบัน

ภาพรวมโซลูชัน

ขั้นตอนแรกในโซลูชันนี้คือการแสดงรูปภาพที่สร้างชุดข้อมูลการฝึกอบรม ทำได้โดยแพลตฟอร์ม 3DEXCITE เราสามารถสร้างข้อมูลการติดฉลากโดยทางโปรแกรมได้โดยใช้สคริปต์ ความจริงของ Amazon SageMaker จัดเตรียมเครื่องมือคำอธิบายประกอบเพื่อติดป้ายกำกับรูปภาพและวิดีโอสำหรับงานจำแนกประเภทและตรวจจับวัตถุได้อย่างง่ายดาย ในการฝึกโมเดลใน Amazon Rekognition ไฟล์การติดฉลากต้องสอดคล้องกับรูปแบบ Ground Truth ป้ายกำกับเหล่านี้อยู่ใน JSON รวมถึงข้อมูลต่างๆ เช่น ขนาดรูปภาพ พิกัดของกรอบล้อมรอบ และ ID ของคลาส

จากนั้นอัปโหลดภาพสังเคราะห์และรายการไปยัง บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon (Amazon S3) ซึ่ง Rekognition Custom Labels สามารถนำเข้ามาเป็นส่วนประกอบของชุดข้อมูลการฝึก

เพื่อให้ Rekognition Custom Labels ทดสอบโมเดลกับชุดของอิมเมจส่วนประกอบจริง เราได้จัดเตรียมชุดรูปภาพของชิ้นส่วนเครื่องยนต์จริงที่ถ่ายด้วยกล้องและอัปโหลดไปยัง Amazon S3 เพื่อใช้เป็นชุดข้อมูลการทดสอบ

สุดท้าย Rekognition Custom Labels จะฝึกโมเดลการตรวจจับวัตถุที่ดีที่สุดโดยใช้ชุดข้อมูลการฝึกสังเคราะห์และชุดข้อมูลการทดสอบที่ประกอบด้วยรูปภาพของวัตถุจริง และสร้างจุดสิ้นสุดด้วยโมเดลที่เราสามารถใช้เรียกใช้การจดจำวัตถุในแอปพลิเคชันของเรา

ไดอะแกรมต่อไปนี้แสดงเวิร์กโฟลว์โซลูชันของเรา:

สร้างภาพสังเคราะห์

ภาพสังเคราะห์สร้างขึ้นจากแพลตฟอร์ม 3Dexperience ซึ่งเป็นผลิตภัณฑ์ของ Dassault Systèmes แพลตฟอร์มนี้ช่วยให้คุณสร้างและแสดงภาพที่เหมือนจริงโดยใช้ไฟล์ CAD (การออกแบบโดยใช้คอมพิวเตอร์ช่วย) ของวัตถุ เราสามารถสร้างรูปแบบต่างๆ ได้หลายพันแบบในเวลาไม่กี่ชั่วโมงโดยเปลี่ยนการกำหนดค่าการแปลงภาพบนแพลตฟอร์ม

ในต้นแบบนี้ เราเลือกชิ้นส่วนกระปุกเกียร์ที่มองเห็นได้ชัดเจนห้าส่วนต่อไปนี้สำหรับการตรวจจับวัตถุ ประกอบด้วยเรือนเกียร์ อัตราทดเกียร์ ฝาครอบแบริ่ง หน้าแปลน และเฟืองตัวหนอน

เราใช้วิธีการเสริมข้อมูลต่อไปนี้เพื่อเพิ่มความหลากหลายของภาพ และทำให้ข้อมูลสังเคราะห์มีความเหมือนจริงมากขึ้น ช่วยลดข้อผิดพลาดในการสรุปแบบจำลอง

ซูมเข้า / ออก – วิธีการนี้จะสุ่มซูมเข้าหรือออกวัตถุในภาพ
การหมุน – วิธีนี้จะหมุนวัตถุในภาพ และดูเหมือนว่ากล้องเสมือนจะสุ่มภาพวัตถุจากมุม 360 องศา
ปรับปรุงรูปลักษณ์และความรู้สึกของวัสดุ – เราระบุว่าสำหรับชิ้นส่วนเกียร์บางชิ้น รูปลักษณ์ของวัสดุจะดูสมจริงน้อยลงในการเรนเดอร์เบื้องต้น เราได้เพิ่มเอฟเฟกต์โลหะเพื่อปรับปรุงภาพสังเคราะห์
ใช้การตั้งค่าแสงที่แตกต่างกัน – ในต้นแบบนี้ เราจำลองสภาพแสงสองแบบ:
- คลังสินค้า - การกระจายแสงที่สมจริง เงาและการสะท้อนเป็นไปได้
- สตูดิโอ – แสงที่เป็นเนื้อเดียวกันถูกใส่ไว้รอบๆ วัตถุ สิ่งนี้ไม่สมจริง แต่ไม่มีเงาหรือเงาสะท้อน
ใช้ตำแหน่งจริงในการดูวัตถุแบบเรียลไทม์ – ในชีวิตจริง โดยทั่วไปแล้ววัตถุบางอย่าง เช่น หน้าแปลนและฝาครอบแบริ่ง มักถูกวางไว้บนพื้นผิว และแบบจำลองกำลังตรวจจับวัตถุตามด้านบนและด้านล่าง ดังนั้นเราจึงลบภาพการฝึกที่แสดงขอบบางของชิ้นส่วน หรือที่เรียกว่าตำแหน่งขอบ และเพิ่มภาพของวัตถุในตำแหน่งราบ
เพิ่มหลายวัตถุในภาพเดียว – ในสถานการณ์จริง ชิ้นส่วนเฟืองหลายชิ้นอาจปรากฏขึ้นในมุมมองเดียว ดังนั้นเราจึงเตรียมรูปภาพที่มีชิ้นส่วนเฟืองหลายชิ้น

บนแพลตฟอร์ม 3Dexperience เราสามารถใช้พื้นหลังต่างๆ กับรูปภาพได้ ซึ่งสามารถช่วยเพิ่มความหลากหลายของภาพได้มากขึ้น เนื่องจากมีเวลาจำกัด เราจึงไม่นำสิ่งนี้ไปใช้ในต้นแบบนี้

นำเข้าชุดข้อมูลการฝึกสังเคราะห์

ใน ML ข้อมูลที่ติดป้ายกำกับหมายความว่าข้อมูลการฝึกจะได้รับการใส่คำอธิบายประกอบเพื่อแสดงเป้าหมาย ซึ่งเป็นคำตอบที่คุณต้องการให้โมเดล ML คาดการณ์ ข้อมูลที่มีป้ายกำกับซึ่งสามารถใช้ได้โดย Rekognition Custom Labels ควรเป็นไปตามข้อกำหนดของไฟล์ Manifest Ground Truth ไฟล์ Manifest ประกอบด้วยบรรทัด JSON หนึ่งบรรทัดขึ้นไป แต่ละบรรทัดมีข้อมูลสำหรับภาพเดียว สำหรับข้อมูลการฝึกอบรมสังเคราะห์ ข้อมูลการติดฉลากสามารถสร้างขึ้นโดยทางโปรแกรมโดยอิงจากไฟล์ CAD และการกำหนดค่าการแปลงรูปภาพที่เรากล่าวถึงก่อนหน้านี้ ซึ่งช่วยประหยัดแรงงานคนจำนวนมากในการติดฉลาก สำหรับข้อมูลเพิ่มเติมเกี่ยวกับข้อกำหนดสำหรับการติดฉลากรูปแบบไฟล์ โปรดดูที่ สร้างไฟล์รายการ และ การแปลวัตถุในไฟล์รายการ. ต่อไปนี้คือตัวอย่างการติดป้ายกำกับรูปภาพ:

{ "source-ref": "s3://<bucket>/<prefix>/multiple_objects.png", "bounding-box": { "image_size": [ { "width": 1024, "height": 1024, "depth": 3 } ], "annotations": [ { "class_id": 1, "top": 703, "left": 606, "width": 179, "height": 157 }, { "class_id": 4, "top": 233, "left": 533, "width": 118, "height": 139 }, { "class_id": 0, "top": 592, "left": 154, "width": 231, "height": 332 }, { "class_id": 3, "top": 143, "left": 129, "width": 268, "height": 250 } ] }, "bounding-box-metadata": { "objects": [ { "confidence": 1 }, { "confidence": 1 }, { "confidence": 1 }, { "confidence": 1 } ], "class-map": { "0": "Gear_Housing", "1": "Gear_Ratio", "3": "Flange", "4": "Worm_Gear" }, "type": "groundtruth/object-detection", "human-annotated": "yes", "creation-date": "2021-06-18T11:56:01", "job-name": "3DEXCITE" }
}

หลังจากเตรียมไฟล์ Manifest แล้ว เราจะอัปโหลดไปยังบัคเก็ต S3 แล้วสร้างชุดข้อมูลการฝึกอบรมใน Rekognition Custom Labels โดยเลือกตัวเลือก นำเข้าภาพที่ติดป้ายกำกับโดย Amazon SageMaker Ground Truth.

หลังจากที่นำเข้าไฟล์ Manifest แล้ว เราสามารถดูข้อมูลการติดฉลากด้วยภาพบนคอนโซล Amazon Rekognition ซึ่งช่วยให้เรายืนยันว่ามีการสร้างและนำเข้าไฟล์รายการ โดยเฉพาะอย่างยิ่ง กล่องที่มีขอบเขตควรจัดแนวกับวัตถุในรูปภาพ และควรกำหนด ID คลาสของวัตถุอย่างถูกต้อง

สร้างชุดข้อมูลการทดสอบ

ภาพทดสอบถ่ายในชีวิตจริงด้วยโทรศัพท์หรือกล้องจากมุมต่างๆ และสภาพแสง เนื่องจากเราต้องการตรวจสอบความถูกต้องของแบบจำลอง ซึ่งเราฝึกโดยใช้ข้อมูลสังเคราะห์ เทียบกับสถานการณ์จริง คุณสามารถอัปโหลดอิมเมจทดสอบเหล่านี้ไปยังบัคเก็ต S3 แล้วนำเข้าเป็นชุดข้อมูลใน Rekognition Custom Labels หรือคุณสามารถอัปโหลดโดยตรงไปยังชุดข้อมูลจากเครื่องในพื้นที่ของคุณ

Rekognition Custom Labels ให้ความสามารถในการใส่คำอธิบายประกอบรูปภาพในตัว ซึ่งมีประสบการณ์คล้ายกับ Ground Truth คุณสามารถเริ่มงานการติดฉลากเมื่อมีการนำเข้าข้อมูลการทดสอบ สำหรับกรณีการใช้งานการตรวจจับวัตถุ ควรสร้างกรอบล้อมรอบวัตถุที่สนใจให้แน่น ซึ่งช่วยให้โมเดลเรียนรู้พื้นที่และพิกเซลที่เป็นของวัตถุเป้าหมายได้อย่างแม่นยำ นอกจากนี้ คุณควรติดป้ายกำกับทุกอินสแตนซ์ของออบเจ็กต์เป้าหมายในภาพทั้งหมด แม้กระทั่งส่วนที่มองไม่เห็นบางส่วนหรือปิดบังโดยออบเจ็กต์อื่น มิฉะนั้น โมเดลจะคาดการณ์เชิงลบที่ผิดพลาดมากกว่า

สร้างแบบจำลองการตรวจหาวัตถุข้ามโดเมน

Rekognition Custom Labels เป็นบริการที่มีการจัดการเต็มรูปแบบ คุณเพียงแค่ต้องจัดเตรียมชุดข้อมูลรถไฟและทดสอบ โดยจะฝึกชุดโมเดลและเลือกโมเดลที่มีประสิทธิภาพดีที่สุดตามข้อมูลที่ให้มา ในต้นแบบนี้ เราเตรียมชุดข้อมูลการฝึกอบรมสังเคราะห์ซ้ำๆ โดยทดลองกับการผสมผสานวิธีการเสริมภาพที่เราได้กล่าวถึงก่อนหน้านี้ โมเดลหนึ่งถูกสร้างขึ้นสำหรับชุดข้อมูลการฝึกแต่ละชุดใน Rekognition Custom Labels ซึ่งช่วยให้เราสามารถเปรียบเทียบและค้นหาชุดข้อมูลการฝึกที่เหมาะสมที่สุดสำหรับกรณีการใช้งานนี้โดยเฉพาะ แต่ละรุ่นมีจำนวนภาพการฝึกขั้นต่ำ มีความหลากหลายของภาพที่ดีและให้ความแม่นยำของแบบจำลองที่ดีที่สุด หลังจากทำซ้ำ 15 ครั้ง เราได้คะแนน F1 ที่ความแม่นยำของแบบจำลอง 98% โดยใช้รูปภาพการฝึกสังเคราะห์ประมาณ 10,000 ภาพ ซึ่งโดยเฉลี่ยแล้ว 2,000 ภาพต่อวัตถุ

ผลลัพธ์ของการอนุมานแบบจำลอง

รูปภาพต่อไปนี้แสดงโมเดล Amazon Rekognition ที่ใช้ในแอปพลิเคชันการอนุมานแบบเรียลไทม์ ตรวจพบส่วนประกอบทั้งหมดอย่างถูกต้องด้วยความมั่นใจสูง

คอมพิวเตอร์วิทัศน์โดยใช้ชุดข้อมูลสังเคราะห์ที่มี Amazon Rekognition Custom Labels และ Dassault Systèmes 3DEXCITE PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

สรุป

ในโพสต์นี้ เราสาธิตวิธีฝึกโมเดลการมองเห็นด้วยคอมพิวเตอร์ด้วยภาพที่สังเคราะห์อย่างหมดจด และวิธีที่โมเดลยังสามารถจดจำวัตถุในโลกแห่งความเป็นจริงได้อย่างน่าเชื่อถือ ซึ่งช่วยประหยัดความพยายามในการรวบรวมและติดฉลากข้อมูลการฝึกอบรมด้วยตนเองได้อย่างมาก ด้วยการสำรวจนี้ Dassault Systèmes กำลังขยายมูลค่าทางธุรกิจของโมเดลผลิตภัณฑ์ 3 มิติที่สร้างโดยนักออกแบบและวิศวกร เนื่องจากตอนนี้คุณสามารถใช้ข้อมูล CAD, CAE และ PLM ในระบบการจดจำสำหรับรูปภาพในโลกจริงได้

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับคุณสมบัติหลักและกรณีการใช้งาน Rekognition Custom Labels โปรดดูที่ ป้ายกำกับที่กำหนดเองของ Amazon Rekognition. หากรูปภาพของคุณไม่ได้ติดป้ายกำกับด้วย Ground Truth ซึ่งเป็นกรณีของโครงการนี้ โปรดดูที่ การสร้างไฟล์รายการ เพื่อแปลงข้อมูลการติดฉลากของคุณให้อยู่ในรูปแบบที่ Rekognition Custom Labels สามารถใช้ได้

เกี่ยวกับผู้เขียน

วู้ดดี้ บอร์รัคซิโน ปัจจุบันเป็นสถาปนิกโซลูชันอาวุโสด้าน Machine Learning Specialist ที่ AWS Woody ซึ่งตั้งอยู่ในเมืองมิลาน ประเทศอิตาลี ทำงานด้านการพัฒนาซอฟต์แวร์ก่อนมาร่วมงานกับ AWS ในปี 2015 ซึ่งเขาเติบโตขึ้นมาจากความหลงใหลในเทคโนโลยี Computer Vision และ Spatial Computing (AR/VR/XR) ความหลงใหลของเขาตอนนี้มุ่งเน้นไปที่นวัตกรรมเมตาเวิร์ส ติดตามเขาได้ที่ LinkedIn.

หญิงโหวปริญญาเอก เป็นสถาปนิกสร้างต้นแบบแมชชีนเลิร์นนิ่งที่ AWS ความสนใจหลักของเธอคือ Deep Learning, Computer Vision, NLP และการคาดการณ์ข้อมูลอนุกรมเวลา ในเวลาว่าง เธอชอบอ่านนิยายและเดินป่าในอุทยานแห่งชาติในสหราชอาณาจักร

เบอร์นาร์ด ปาคส์ ปัจจุบันเป็น CTO ของ Storm Reply ซึ่งเน้นที่โซลูชันอุตสาหกรรมที่ปรับใช้บน AWS Bernard ซึ่งตั้งอยู่ในปารีส ประเทศฝรั่งเศส เคยทำงานในตำแหน่ง Principal Solution Architect และในฐานะที่ปรึกษาหลักที่ AWS การมีส่วนร่วมของเขาในการปรับปรุงองค์กรให้ทันสมัยครอบคลุม AWS for Industrial, AWS CDK และปัจจุบันนี้เกิดจาก Green IT และระบบเสียง ติดตามเขาได้ที่ Twitter.

คาร์ล เฮิร์กต์ ปัจจุบันเป็น Senior Strategist ที่ Dassault Systèmes 3DExcite ในมิวนิก ประเทศเยอรมนี เขาสร้างการนำคอมพิวเตอร์วิทัศน์มาใช้งานอย่างสร้างสรรค์ซึ่งให้ผลลัพธ์ที่เป็นรูปธรรม ติดตามเขาได้ที่ LinkedIn.

ประทับเวลา: March 14, 2022

เพิ่มเติมจาก AWS Machine Learning AWS

รับข้อมูลเชิงลึกเกี่ยวกับพฤติกรรมการค้นหาของผู้ใช้ของคุณจาก Amazon Kendra โดยใช้ ML-powered serverless stack | บริการเว็บอเมซอน

คลัสเตอร์ต้นทาง:

AWS Machine Learning AWS

โหนดต้นทาง: 1840291

ประทับเวลา: May 25, 2023

วัดผลกระทบทางธุรกิจของ Amazon Personalize Recommendations

AWS Machine Learning AWS

โหนดต้นทาง: 1820243

ประทับเวลา: Mar 30, 2023

คอมพิวเตอร์วิทัศน์โดยใช้ชุดข้อมูลสังเคราะห์ที่มี Amazon Rekognition Custom Labels และ Dassault Systèmes 3DEXCITE

เผยแพร่ซ้ำโดยเพลโต

การปรับแต่งระบบการจดจำช่วยขับเคลื่อนผลลัพธ์ทางธุรกิจ

ปรับปรุงการมองเห็นคอมพิวเตอร์ด้วย Dassault Systèmes 3DEXCITE ที่ขับเคลื่อนโดย Amazon Rekognition

ภาพรวมโซลูชัน

สร้างภาพสังเคราะห์

นำเข้าชุดข้อมูลการฝึกสังเคราะห์

สร้างชุดข้อมูลการทดสอบ

สร้างแบบจำลองการตรวจหาวัตถุข้ามโดเมน

ผลลัพธ์ของการอนุมานแบบจำลอง

สรุป

เกี่ยวกับผู้เขียน

เพิ่มเติมจาก AWS Machine Learning AWS

วัดผลกระทบทางธุรกิจของ Amazon Personalize Recommendations

สตาร์ทอัพทั่ว AWS Accelerators ใช้ AI และ ML เพื่อแก้ปัญหาความท้าทายของลูกค้าที่สำคัญต่อภารกิจ

URL ที่กำหนดไว้ล่วงหน้าของ Amazon SageMaker Studio ที่ปลอดภัย ส่วนที่ 2: API ส่วนตัวพร้อมการตรวจสอบสิทธิ์ JWT

เร่งเวลาไปสู่ข้อมูลเชิงลึกทางธุรกิจด้วยการเชื่อมต่อโดยตรงกับ Amazon SageMaker Data Wrangler กับ Snowflake | บริการเว็บอเมซอน

สร้างการกำหนดเป้าหมายตามบริบทตามอนุกรมวิธานโดยใช้ AWS Media Intelligence และ Hugging Face BERT

คำแนะนำที่มีประสิทธิภาพและการค้นหาโดยใช้กราฟความรู้ IMDb – ตอนที่ 2

ปรับปรุงการวิจัยที่มีมูลค่าสูงด้วย Hugging Face และจุดสิ้นสุดการอนุมานแบบอะซิงโครนัสของ Amazon SageMaker

การปรับโมเดลอัตโนมัติของ Amazon SageMaker รองรับการสำรองอินสแตนซ์การฝึกอบรม SageMaker แล้ว

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้