เคล็ดลับในการปรับปรุงแบบจำลองฉลากแบบกำหนดเองของ Amazon Rekognition

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

ในโพสต์นี้ เราจะหารือเกี่ยวกับแนวทางปฏิบัติที่ดีที่สุดในการปรับปรุงประสิทธิภาพของแบบจำลองการมองเห็นคอมพิวเตอร์ของคุณโดยใช้ ป้ายกำกับที่กำหนดเองของ Amazon Rekognition. Rekognition Custom Labels เป็นบริการที่มีการจัดการเต็มรูปแบบเพื่อสร้างแบบจำลองคอมพิวเตอร์วิทัศน์แบบกำหนดเองสำหรับการจำแนกประเภทภาพและกรณีการใช้งานการตรวจจับวัตถุ Rekognition Custom Labels สร้างขึ้นจากโมเดลที่ผ่านการฝึกอบรมมาแล้วใน ความหมายของ Amazonซึ่งได้รับการฝึกอบรมเกี่ยวกับรูปภาพหลายสิบล้านภาพในหลากหลายหมวดหมู่ แทนที่จะใช้รูปภาพนับพัน คุณสามารถเริ่มต้นด้วยชุดรูปภาพฝึกหัดเล็กๆ (ไม่กี่ร้อยภาพหรือน้อยกว่านั้น) ที่เฉพาะเจาะจงกับกรณีการใช้งานของคุณ Rekognition Custom Labels ย่อความซับซ้อนที่เกี่ยวข้องกับการสร้างแบบจำลองที่กำหนดเอง โดยจะตรวจสอบข้อมูลการฝึกโดยอัตโนมัติ เลือกอัลกอริธึม ML ที่เหมาะสม เลือกประเภทอินสแตนซ์ ฝึกโมเดลตัวเลือกหลายตัวด้วยการตั้งค่าไฮเปอร์พารามิเตอร์ต่างๆ และส่งออกโมเดลที่ได้รับการฝึกที่ดีที่สุด Rekognition Custom Labels ยังมีอินเทอร์เฟซที่ใช้งานง่ายจาก คอนโซลการจัดการ AWS สำหรับการจัดการเวิร์กโฟลว์ ML ทั้งหมด รวมถึงการติดฉลากอิมเมจ การฝึกโมเดล การปรับใช้โมเดล และการแสดงภาพผลการทดสอบ

มีบางครั้งที่ความแม่นยำของแบบจำลองไม่ได้ดีที่สุด และคุณไม่มีตัวเลือกมากมายในการปรับพารามิเตอร์การกำหนดค่าของแบบจำลอง เบื้องหลังมีหลายปัจจัยที่มีบทบาทสำคัญในการสร้างแบบจำลองที่มีประสิทธิภาพสูง เช่น:

มุมภาพ
ความละเอียดของภาพ
อัตราส่วนภาพ
การเปิดรับแสง
ความชัดเจนและความสดใสของพื้นหลัง
ความคมชัดของสี
ขนาดข้อมูลตัวอย่าง

ต่อไปนี้คือขั้นตอนทั่วไปที่ต้องปฏิบัติตามเพื่อฝึกโมเดล Rekognition Custom Labels ระดับที่ใช้งานจริง:

ทบทวนอนุกรมวิธาน – กำหนดรายการแอตทริบิวต์/รายการที่คุณต้องการระบุในภาพ
รวบรวมข้อมูลที่เกี่ยวข้อง – นี่เป็นขั้นตอนที่สำคัญที่สุด ซึ่งคุณต้องรวบรวมรูปภาพที่เกี่ยวข้องซึ่งควรคล้ายกับที่คุณจะเห็นในสภาพแวดล้อมการผลิต ซึ่งอาจรวมถึงรูปภาพของวัตถุที่มีพื้นหลัง แสง หรือมุมกล้องต่างกัน จากนั้นคุณสร้างชุดข้อมูลการฝึกอบรมและการทดสอบโดยแยกภาพที่รวบรวมไว้ คุณควรรวมเฉพาะรูปภาพในโลกแห่งความเป็นจริงเป็นส่วนหนึ่งของชุดข้อมูลการทดสอบ และไม่ควรรวมรูปภาพที่สร้างขึ้นจากการสังเคราะห์ คำอธิบายประกอบของข้อมูลที่คุณรวบรวมมีความสำคัญต่อประสิทธิภาพของแบบจำลอง ตรวจสอบให้แน่ใจว่ากล่องที่ล้อมรอบวัตถุนั้นแน่นและฉลากนั้นถูกต้อง เราพูดถึงเคล็ดลับบางอย่างที่คุณสามารถพิจารณาได้เมื่อสร้างชุดข้อมูลที่เหมาะสมในภายหลังในโพสต์นี้
ทบทวนเมตริกการฝึกอบรม – ใช้ชุดข้อมูลก่อนหน้านี้เพื่อฝึกโมเดลและทบทวนเมตริกการฝึกอบรมสำหรับคะแนน F1 ความแม่นยำ และการเรียกคืน เราจะหารือในรายละเอียดเกี่ยวกับวิธีการวิเคราะห์เมตริกการฝึกอบรมในโพสต์นี้
ประเมินแบบจำลองที่ได้รับการฝึกอบรม – ใช้ชุดภาพที่มองไม่เห็น (ไม่ได้ใช้สำหรับการฝึกโมเดล) พร้อมป้ายกำกับที่รู้จักเพื่อประเมินการคาดคะเน ควรดำเนินการขั้นตอนนี้เสมอเพื่อให้แน่ใจว่าแบบจำลองดำเนินการตามที่คาดไว้ในสภาพแวดล้อมการผลิต
การฝึกอบรมซ้ำ (ไม่บังคับ) – โดยทั่วไป การฝึกโมเดลการเรียนรู้ด้วยเครื่องเป็นกระบวนการทำซ้ำเพื่อให้ได้ผลลัพธ์ที่ต้องการ แบบจำลองคอมพิวเตอร์วิทัศน์ก็ไม่ต่างกัน ตรวจสอบผลลัพธ์ในขั้นตอนที่ 4 เพื่อดูว่าจำเป็นต้องเพิ่มรูปภาพเพิ่มเติมในข้อมูลการฝึกหรือไม่ และทำซ้ำขั้นตอนที่ 3 – 5 ข้างต้น

ในโพสต์นี้ เรามุ่งเน้นที่แนวทางปฏิบัติที่ดีที่สุดเกี่ยวกับการรวบรวมข้อมูลที่เกี่ยวข้อง (ขั้นตอนที่ 2) และการประเมินเมตริกที่ได้รับการฝึกอบรม (ขั้นตอนที่ 3) เพื่อปรับปรุงประสิทธิภาพของแบบจำลองของคุณ

รวบรวมข้อมูลที่เกี่ยวข้อง

นี่เป็นขั้นตอนที่สำคัญที่สุดในการฝึกอบรมโมเดล Rekognition Custom Labels ระดับการผลิต โดยเฉพาะอย่างยิ่ง มีชุดข้อมูลสองชุด: การฝึกอบรมและการทดสอบ ข้อมูลการฝึกใช้สำหรับการฝึกโมเดล และคุณจำเป็นต้องใช้ความพยายามในการสร้างชุดการฝึกที่เหมาะสม รุ่นฉลากที่กำหนดเองได้รับการปรับให้เหมาะสมสำหรับ คะแนน F1 บนชุดข้อมูลการทดสอบเพื่อเลือกแบบจำลองที่แม่นยำที่สุดสำหรับโครงการของคุณ ดังนั้นจึงจำเป็นต้องดูแลจัดการชุดข้อมูลการทดสอบที่คล้ายกับโลกแห่งความจริง

จำนวนภาพ

เราแนะนำให้มีรูปภาพอย่างน้อย 15-20 ภาพต่อป้ายกำกับ การมีรูปภาพที่มีความหลากหลายมากขึ้นซึ่งสะท้อนถึงกรณีการใช้งานของคุณจะช่วยปรับปรุงประสิทธิภาพของโมเดล

ชุดข้อมูลที่สมดุล

ตามหลักการแล้ว แต่ละเลเบลในชุดข้อมูลควรมีจำนวนตัวอย่างใกล้เคียงกัน ไม่ควรมีความแตกต่างอย่างมากในจำนวนรูปภาพต่อป้ายกำกับ ตัวอย่างเช่น ชุดข้อมูลที่มีรูปภาพสำหรับป้ายกำกับสูงสุด 1,000 รูป เทียบกับ 50 รูปสำหรับป้ายกำกับอื่นคล้ายกับชุดข้อมูลที่ไม่สมดุล เราขอแนะนำให้หลีกเลี่ยงสถานการณ์ที่มีอัตราส่วนไม่เท่ากันที่ 1:50 ระหว่างป้ายกำกับที่มีรูปภาพน้อยที่สุด เทียบกับป้ายกำกับที่มีจำนวนรูปภาพสูงสุด

ภาพประเภทต่างๆ

รวมรูปภาพในชุดข้อมูลการฝึกอบรมและทดสอบที่คล้ายกับสิ่งที่คุณจะใช้ในโลกแห่งความเป็นจริง ตัวอย่างเช่น หากคุณต้องการจำแนกรูปภาพของห้องนั่งเล่นกับห้องนอน คุณควรรวมรูปภาพที่ว่างเปล่าและตกแต่งแล้วของทั้งสองห้อง

ต่อไปนี้เป็นภาพตัวอย่างห้องนั่งเล่นที่ตกแต่งแล้ว

ในทางตรงกันข้าม ต่อไปนี้เป็นตัวอย่างห้องนั่งเล่นที่ไม่มีเฟอร์นิเจอร์

ต่อไปนี้เป็นภาพตัวอย่างห้องนอนที่ตกแต่งแล้ว

ต่อไปนี้เป็นภาพตัวอย่างห้องนอนที่ยังไม่ได้ตกแต่ง

ภูมิหลังที่แตกต่างกัน

รวมรูปภาพที่มีพื้นหลังต่างกัน รูปภาพที่มีบริบทเป็นธรรมชาติสามารถให้ผลลัพธ์ที่ดีกว่าพื้นหลังธรรมดา

ต่อไปนี้เป็นภาพตัวอย่างลานหน้าบ้าน

ต่อไปนี้เป็นภาพตัวอย่างลานหน้าบ้านของบ้านหลังหนึ่งที่มีพื้นหลังต่างกัน

สภาพแสงที่แตกต่างกัน

รวมภาพที่มีแสงต่างกันเพื่อให้ครอบคลุมสภาพแสงต่างๆ ที่เกิดขึ้นระหว่างการอนุมาน (เช่น มีและไม่มีแฟลช) คุณยังสามารถรวมรูปภาพที่มีความอิ่มตัว เฉดสี และความสว่างที่แตกต่างกันได้

ต่อไปนี้เป็นภาพตัวอย่างดอกไม้ภายใต้แสงปกติ

ในทางตรงกันข้าม ภาพต่อไปนี้เป็นดอกไม้ชนิดเดียวกันภายใต้แสงจ้า

หลากหลายมุม

รวมภาพที่ถ่ายจากมุมต่างๆ ของวัตถุ ซึ่งจะช่วยให้แบบจำลองเรียนรู้ลักษณะต่างๆ ของวัตถุ

รูปภาพต่อไปนี้เป็นห้องนอนเดียวกันจากหลายมุม

เคล็ดลับในการปรับปรุงโมเดล Amazon Rekognition Custom Labels PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

อาจมีบางโอกาสที่ไม่สามารถรับภาพประเภทต่างๆ ได้ ในสถานการณ์เหล่านี้ สามารถสร้างอิมเมจสังเคราะห์โดยเป็นส่วนหนึ่งของชุดข้อมูลการฝึก สำหรับข้อมูลเพิ่มเติมเกี่ยวกับเทคนิคการแต่งภาพทั่วไป โปรดดูที่ การเสริมข้อมูล.

เพิ่มป้ายกำกับเชิงลบ

สำหรับการจัดประเภทรูปภาพ การเพิ่มป้ายกำกับเชิงลบสามารถช่วยเพิ่มความแม่นยำของแบบจำลองได้ ตัวอย่างเช่น คุณสามารถเพิ่มป้ายกำกับเชิงลบ ซึ่งไม่ตรงกับป้ายกำกับที่ต้องการ รูปภาพต่อไปนี้แสดงป้ายกำกับต่างๆ ที่ใช้ในการระบุดอกไม้ที่โตเต็มที่

การเพิ่มป้ายกำกับเชิงลบ not_fully_grown ช่วยให้โมเดลเรียนรู้คุณลักษณะที่ไม่ได้เป็นส่วนหนึ่งของ fully_grown ฉลาก.

จัดการกับความสับสนของฉลาก

วิเคราะห์ผลลัพธ์ในชุดข้อมูลทดสอบเพื่อระบุรูปแบบที่พลาดในชุดข้อมูลการฝึกอบรมหรือการทดสอบ บางครั้งก็ง่ายที่จะมองเห็นรูปแบบดังกล่าวโดยการตรวจสอบภาพด้วยสายตา ในภาพต่อไปนี้ โมเดลกำลังพยายามแก้ไขระหว่างป้ายหลังบ้านกับป้ายลานบ้าน

ในสถานการณ์สมมตินี้ การเพิ่มรูปภาพให้กับป้ายชื่อเหล่านี้ในชุดข้อมูลและยังกำหนดป้ายชื่อใหม่เพื่อให้แต่ละป้ายมีความแตกต่างกันสามารถช่วยเพิ่มความแม่นยำของแบบจำลองได้

การเสริมข้อมูล

ภายใน Rekognition Custom Labels เราทำการเพิ่มข้อมูลต่างๆ สำหรับการฝึกโมเดล รวมถึงการครอบตัดแบบสุ่มของภาพ การกระตุกของสี เสียง Gaussian แบบสุ่ม และอื่นๆ ตามกรณีการใช้งานเฉพาะของคุณ การเพิ่มการเสริมข้อมูลที่ชัดเจนยิ่งขึ้นลงในข้อมูลการฝึกของคุณอาจเป็นประโยชน์ ตัวอย่างเช่น หากคุณสนใจที่จะตรวจจับสัตว์ทั้งภาพสีและภาพขาวดำ คุณอาจได้รับความแม่นยำที่ดีขึ้นโดยการเพิ่มรูปภาพเดียวกันในเวอร์ชันขาวดำและสีลงในข้อมูลการฝึก

เราไม่แนะนำให้เสริมข้อมูลการทดสอบเว้นแต่ว่าการเสริมนั้นสะท้อนถึงกรณีการใช้งานจริงของคุณ

ทบทวนเมตริกการฝึกอบรม

คะแนน F1, ความแม่นยำ, การเรียกคืน และเกณฑ์การสันนิษฐานคือ ตัวชี้วัด ที่สร้างขึ้นเป็นผลลัพธ์ของการฝึกโมเดลโดยใช้ Rekognition Custom Labels โมเดลเหล่านี้ได้รับการปรับให้เหมาะสมสำหรับคะแนน F1 ที่ดีที่สุดตามชุดข้อมูลการทดสอบที่มีให้ เกณฑ์ที่สมมติขึ้นจะถูกสร้างขึ้นตามชุดข้อมูลการทดสอบด้วย คุณสามารถปรับเกณฑ์ได้ตามความต้องการทางธุรกิจของคุณในแง่ของความแม่นยำหรือการเรียกคืน

เนื่องจากเกณฑ์ที่สมมติขึ้นมีการตั้งค่าบนชุดข้อมูลการทดสอบ ชุดการทดสอบที่เหมาะสมควรสะท้อนถึงกรณีการใช้งานจริงในการผลิต หากชุดข้อมูลทดสอบไม่ได้เป็นตัวแทนของกรณีการใช้งาน คุณอาจเห็นคะแนน F1 ที่สูงเกินจริงและประสิทธิภาพของโมเดลที่ไม่ดีบนภาพจริงของคุณ

ตัวชี้วัดเหล่านี้มีประโยชน์เมื่อทำการประเมินเบื้องต้นของแบบจำลอง สำหรับระบบระดับการผลิต เราขอแนะนำให้ประเมินแบบจำลองกับชุดข้อมูลภายนอก (ภาพที่มองไม่เห็น 500–1,000 ภาพ) ที่เป็นตัวแทนของโลกแห่งความเป็นจริง ซึ่งช่วยประเมินว่าแบบจำลองจะดำเนินการอย่างไรในระบบการผลิต และระบุรูปแบบที่ขาดหายไปและแก้ไขด้วยการฝึกแบบจำลองใหม่ หากคุณเห็นว่าคะแนน F1 กับการประเมินจากภายนอกไม่ตรงกัน เราขอแนะนำให้คุณตรวจสอบว่าข้อมูลการทดสอบของคุณสะท้อนถึงกรณีการใช้งานจริงหรือไม่

สรุป

ในโพสต์นี้ เราได้แนะนำแนวทางปฏิบัติที่ดีที่สุดในการปรับปรุงโมเดล Rekognition Custom Labels ให้คุณทราบ เราสนับสนุนให้คุณเรียนรู้เพิ่มเติมเกี่ยวกับ การรับรู้ฉลากที่กำหนดเอง และลองใช้กับชุดข้อมูลเฉพาะธุรกิจของคุณ

เกี่ยวกับผู้แต่ง

Amit Gupta เป็นสถาปนิกอาวุโสด้านโซลูชันบริการ AI ที่ AWS เขาหลงใหลในการช่วยให้ลูกค้าได้รับโซลูชันแมชชีนเลิร์นนิงที่มีสถาปัตยกรรมที่ดีในวงกว้าง

โยเกช จตุรเวดี เป็นสถาปนิกโซลูชันที่ AWS โดยมุ่งเน้นด้านการมองเห็นด้วยคอมพิวเตอร์ เขาทำงานร่วมกับลูกค้าเพื่อจัดการกับความท้าทายทางธุรกิจโดยใช้เทคโนโลยีคลาวด์ นอกเวลางาน เขาชอบเดินป่า ท่องเที่ยว และดูกีฬา

ห่าวหยาง เป็นนักวิทยาศาสตร์ประยุกต์อาวุโสที่ทีม Amazon Rekognition Custom Labels ความสนใจในการวิจัยหลักของเขาคือการตรวจหาวัตถุและการเรียนรู้ด้วยคำอธิบายประกอบที่จำกัด ห่าวชอบดูภาพยนตร์ ถ่ายภาพ และกิจกรรมกลางแจ้ง

พัชมีน มิสทรี เป็นผู้จัดการผลิตภัณฑ์อาวุโสของ Amazon Rekognition Custom Labels นอกที่ทำงาน Pashmeen สนุกกับการเดินป่า ถ่ายภาพ และใช้เวลาอยู่กับครอบครัว

ประทับเวลา: September 9, 2022September 10, 2022

เพิ่มเติมจาก AWS Machine Learning AWS

Mendix เปลี่ยนแปลงประสบการณ์ของลูกค้าด้วย Generative AI และ Amazon Bedrock | อย่างไร อเมซอนเว็บเซอร์วิส

AWS Machine Learning AWS

โหนดต้นทาง: 1913698

ประทับเวลา: พฤศจิกายน 15, 2023

ปรับขนาด LLM ด้วย PyTorch 2.0 FSDP บน Amazon EKS – ตอนที่ 2 | อเมซอนเว็บเซอร์วิส

คลัสเตอร์ต้นทาง:

AWS Machine Learning AWS

โหนดต้นทาง: 1960833

ประทับเวลา: เมษายน 1, 2024

เคล็ดลับในการปรับปรุงโมเดล Amazon Rekognition Custom Labels ของคุณ

เผยแพร่ซ้ำโดยเพลโต

รวบรวมข้อมูลที่เกี่ยวข้อง

จำนวนภาพ

ชุดข้อมูลที่สมดุล

ภาพประเภทต่างๆ

ภูมิหลังที่แตกต่างกัน

สภาพแสงที่แตกต่างกัน

หลากหลายมุม

เพิ่มป้ายกำกับเชิงลบ

จัดการกับความสับสนของฉลาก

การเสริมข้อมูล

ทบทวนเมตริกการฝึกอบรม

สรุป

เกี่ยวกับผู้แต่ง

เพิ่มเติมจาก AWS Machine Learning AWS

ถ่ายโอนการเรียนรู้สำหรับโมเดลการจัดประเภทรูปภาพ TensorFlow ใน Amazon SageMaker

ฝึกโครงข่ายประสาทเทียมใหม่โดยอัตโนมัติด้วย Renate

ลดขยะอาหารเพื่อปรับปรุงความยั่งยืนและผลลัพธ์ทางการเงินในการค้าปลีกด้วย Amazon Forecast

เตรียมข้อมูลจาก Amazon EMR สำหรับแมชชีนเลิร์นนิงโดยใช้ Amazon SageMaker Data Wrangler

เรียกใช้โมเดล ML ทั้งมวลบน Amazon SageMaker

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้