ในโพสต์นี้ เราจะหารือเกี่ยวกับแนวทางปฏิบัติที่ดีที่สุดในการปรับปรุงประสิทธิภาพของแบบจำลองการมองเห็นคอมพิวเตอร์ของคุณโดยใช้ ป้ายกำกับที่กำหนดเองของ Amazon Rekognition. Rekognition Custom Labels เป็นบริการที่มีการจัดการเต็มรูปแบบเพื่อสร้างแบบจำลองคอมพิวเตอร์วิทัศน์แบบกำหนดเองสำหรับการจำแนกประเภทภาพและกรณีการใช้งานการตรวจจับวัตถุ Rekognition Custom Labels สร้างขึ้นจากโมเดลที่ผ่านการฝึกอบรมมาแล้วใน ความหมายของ Amazonซึ่งได้รับการฝึกอบรมเกี่ยวกับรูปภาพหลายสิบล้านภาพในหลากหลายหมวดหมู่ แทนที่จะใช้รูปภาพนับพัน คุณสามารถเริ่มต้นด้วยชุดรูปภาพฝึกหัดเล็กๆ (ไม่กี่ร้อยภาพหรือน้อยกว่านั้น) ที่เฉพาะเจาะจงกับกรณีการใช้งานของคุณ Rekognition Custom Labels ย่อความซับซ้อนที่เกี่ยวข้องกับการสร้างแบบจำลองที่กำหนดเอง โดยจะตรวจสอบข้อมูลการฝึกโดยอัตโนมัติ เลือกอัลกอริธึม ML ที่เหมาะสม เลือกประเภทอินสแตนซ์ ฝึกโมเดลตัวเลือกหลายตัวด้วยการตั้งค่าไฮเปอร์พารามิเตอร์ต่างๆ และส่งออกโมเดลที่ได้รับการฝึกที่ดีที่สุด Rekognition Custom Labels ยังมีอินเทอร์เฟซที่ใช้งานง่ายจาก คอนโซลการจัดการ AWS สำหรับการจัดการเวิร์กโฟลว์ ML ทั้งหมด รวมถึงการติดฉลากอิมเมจ การฝึกโมเดล การปรับใช้โมเดล และการแสดงภาพผลการทดสอบ
มีบางครั้งที่ความแม่นยำของแบบจำลองไม่ได้ดีที่สุด และคุณไม่มีตัวเลือกมากมายในการปรับพารามิเตอร์การกำหนดค่าของแบบจำลอง เบื้องหลังมีหลายปัจจัยที่มีบทบาทสำคัญในการสร้างแบบจำลองที่มีประสิทธิภาพสูง เช่น:
- มุมภาพ
- ความละเอียดของภาพ
- อัตราส่วนภาพ
- การเปิดรับแสง
- ความชัดเจนและความสดใสของพื้นหลัง
- ความคมชัดของสี
- ขนาดข้อมูลตัวอย่าง
ต่อไปนี้คือขั้นตอนทั่วไปที่ต้องปฏิบัติตามเพื่อฝึกโมเดล Rekognition Custom Labels ระดับที่ใช้งานจริง:
- ทบทวนอนุกรมวิธาน – กำหนดรายการแอตทริบิวต์/รายการที่คุณต้องการระบุในภาพ
- รวบรวมข้อมูลที่เกี่ยวข้อง – นี่เป็นขั้นตอนที่สำคัญที่สุด ซึ่งคุณต้องรวบรวมรูปภาพที่เกี่ยวข้องซึ่งควรคล้ายกับที่คุณจะเห็นในสภาพแวดล้อมการผลิต ซึ่งอาจรวมถึงรูปภาพของวัตถุที่มีพื้นหลัง แสง หรือมุมกล้องต่างกัน จากนั้นคุณสร้างชุดข้อมูลการฝึกอบรมและการทดสอบโดยแยกภาพที่รวบรวมไว้ คุณควรรวมเฉพาะรูปภาพในโลกแห่งความเป็นจริงเป็นส่วนหนึ่งของชุดข้อมูลการทดสอบ และไม่ควรรวมรูปภาพที่สร้างขึ้นจากการสังเคราะห์ คำอธิบายประกอบของข้อมูลที่คุณรวบรวมมีความสำคัญต่อประสิทธิภาพของแบบจำลอง ตรวจสอบให้แน่ใจว่ากล่องที่ล้อมรอบวัตถุนั้นแน่นและฉลากนั้นถูกต้อง เราพูดถึงเคล็ดลับบางอย่างที่คุณสามารถพิจารณาได้เมื่อสร้างชุดข้อมูลที่เหมาะสมในภายหลังในโพสต์นี้
- ทบทวนเมตริกการฝึกอบรม – ใช้ชุดข้อมูลก่อนหน้านี้เพื่อฝึกโมเดลและทบทวนเมตริกการฝึกอบรมสำหรับคะแนน F1 ความแม่นยำ และการเรียกคืน เราจะหารือในรายละเอียดเกี่ยวกับวิธีการวิเคราะห์เมตริกการฝึกอบรมในโพสต์นี้
- ประเมินแบบจำลองที่ได้รับการฝึกอบรม – ใช้ชุดภาพที่มองไม่เห็น (ไม่ได้ใช้สำหรับการฝึกโมเดล) พร้อมป้ายกำกับที่รู้จักเพื่อประเมินการคาดคะเน ควรดำเนินการขั้นตอนนี้เสมอเพื่อให้แน่ใจว่าแบบจำลองดำเนินการตามที่คาดไว้ในสภาพแวดล้อมการผลิต
- การฝึกอบรมซ้ำ (ไม่บังคับ) – โดยทั่วไป การฝึกโมเดลการเรียนรู้ด้วยเครื่องเป็นกระบวนการทำซ้ำเพื่อให้ได้ผลลัพธ์ที่ต้องการ แบบจำลองคอมพิวเตอร์วิทัศน์ก็ไม่ต่างกัน ตรวจสอบผลลัพธ์ในขั้นตอนที่ 4 เพื่อดูว่าจำเป็นต้องเพิ่มรูปภาพเพิ่มเติมในข้อมูลการฝึกหรือไม่ และทำซ้ำขั้นตอนที่ 3 – 5 ข้างต้น
ในโพสต์นี้ เรามุ่งเน้นที่แนวทางปฏิบัติที่ดีที่สุดเกี่ยวกับการรวบรวมข้อมูลที่เกี่ยวข้อง (ขั้นตอนที่ 2) และการประเมินเมตริกที่ได้รับการฝึกอบรม (ขั้นตอนที่ 3) เพื่อปรับปรุงประสิทธิภาพของแบบจำลองของคุณ
รวบรวมข้อมูลที่เกี่ยวข้อง
นี่เป็นขั้นตอนที่สำคัญที่สุดในการฝึกอบรมโมเดล Rekognition Custom Labels ระดับการผลิต โดยเฉพาะอย่างยิ่ง มีชุดข้อมูลสองชุด: การฝึกอบรมและการทดสอบ ข้อมูลการฝึกใช้สำหรับการฝึกโมเดล และคุณจำเป็นต้องใช้ความพยายามในการสร้างชุดการฝึกที่เหมาะสม รุ่นฉลากที่กำหนดเองได้รับการปรับให้เหมาะสมสำหรับ คะแนน F1 บนชุดข้อมูลการทดสอบเพื่อเลือกแบบจำลองที่แม่นยำที่สุดสำหรับโครงการของคุณ ดังนั้นจึงจำเป็นต้องดูแลจัดการชุดข้อมูลการทดสอบที่คล้ายกับโลกแห่งความจริง
จำนวนภาพ
เราแนะนำให้มีรูปภาพอย่างน้อย 15-20 ภาพต่อป้ายกำกับ การมีรูปภาพที่มีความหลากหลายมากขึ้นซึ่งสะท้อนถึงกรณีการใช้งานของคุณจะช่วยปรับปรุงประสิทธิภาพของโมเดล
ชุดข้อมูลที่สมดุล
ตามหลักการแล้ว แต่ละเลเบลในชุดข้อมูลควรมีจำนวนตัวอย่างใกล้เคียงกัน ไม่ควรมีความแตกต่างอย่างมากในจำนวนรูปภาพต่อป้ายกำกับ ตัวอย่างเช่น ชุดข้อมูลที่มีรูปภาพสำหรับป้ายกำกับสูงสุด 1,000 รูป เทียบกับ 50 รูปสำหรับป้ายกำกับอื่นคล้ายกับชุดข้อมูลที่ไม่สมดุล เราขอแนะนำให้หลีกเลี่ยงสถานการณ์ที่มีอัตราส่วนไม่เท่ากันที่ 1:50 ระหว่างป้ายกำกับที่มีรูปภาพน้อยที่สุด เทียบกับป้ายกำกับที่มีจำนวนรูปภาพสูงสุด
ภาพประเภทต่างๆ
รวมรูปภาพในชุดข้อมูลการฝึกอบรมและทดสอบที่คล้ายกับสิ่งที่คุณจะใช้ในโลกแห่งความเป็นจริง ตัวอย่างเช่น หากคุณต้องการจำแนกรูปภาพของห้องนั่งเล่นกับห้องนอน คุณควรรวมรูปภาพที่ว่างเปล่าและตกแต่งแล้วของทั้งสองห้อง
ต่อไปนี้เป็นภาพตัวอย่างห้องนั่งเล่นที่ตกแต่งแล้ว
ในทางตรงกันข้าม ต่อไปนี้เป็นตัวอย่างห้องนั่งเล่นที่ไม่มีเฟอร์นิเจอร์
ต่อไปนี้เป็นภาพตัวอย่างห้องนอนที่ตกแต่งแล้ว
ต่อไปนี้เป็นภาพตัวอย่างห้องนอนที่ยังไม่ได้ตกแต่ง
ภูมิหลังที่แตกต่างกัน
รวมรูปภาพที่มีพื้นหลังต่างกัน รูปภาพที่มีบริบทเป็นธรรมชาติสามารถให้ผลลัพธ์ที่ดีกว่าพื้นหลังธรรมดา
ต่อไปนี้เป็นภาพตัวอย่างลานหน้าบ้าน
ต่อไปนี้เป็นภาพตัวอย่างลานหน้าบ้านของบ้านหลังหนึ่งที่มีพื้นหลังต่างกัน
สภาพแสงที่แตกต่างกัน
รวมภาพที่มีแสงต่างกันเพื่อให้ครอบคลุมสภาพแสงต่างๆ ที่เกิดขึ้นระหว่างการอนุมาน (เช่น มีและไม่มีแฟลช) คุณยังสามารถรวมรูปภาพที่มีความอิ่มตัว เฉดสี และความสว่างที่แตกต่างกันได้
ต่อไปนี้เป็นภาพตัวอย่างดอกไม้ภายใต้แสงปกติ
ในทางตรงกันข้าม ภาพต่อไปนี้เป็นดอกไม้ชนิดเดียวกันภายใต้แสงจ้า
หลากหลายมุม
รวมภาพที่ถ่ายจากมุมต่างๆ ของวัตถุ ซึ่งจะช่วยให้แบบจำลองเรียนรู้ลักษณะต่างๆ ของวัตถุ
รูปภาพต่อไปนี้เป็นห้องนอนเดียวกันจากหลายมุม
อาจมีบางโอกาสที่ไม่สามารถรับภาพประเภทต่างๆ ได้ ในสถานการณ์เหล่านี้ สามารถสร้างอิมเมจสังเคราะห์โดยเป็นส่วนหนึ่งของชุดข้อมูลการฝึก สำหรับข้อมูลเพิ่มเติมเกี่ยวกับเทคนิคการแต่งภาพทั่วไป โปรดดูที่ การเสริมข้อมูล.
เพิ่มป้ายกำกับเชิงลบ
สำหรับการจัดประเภทรูปภาพ การเพิ่มป้ายกำกับเชิงลบสามารถช่วยเพิ่มความแม่นยำของแบบจำลองได้ ตัวอย่างเช่น คุณสามารถเพิ่มป้ายกำกับเชิงลบ ซึ่งไม่ตรงกับป้ายกำกับที่ต้องการ รูปภาพต่อไปนี้แสดงป้ายกำกับต่างๆ ที่ใช้ในการระบุดอกไม้ที่โตเต็มที่
การเพิ่มป้ายกำกับเชิงลบ not_fully_grown
ช่วยให้โมเดลเรียนรู้คุณลักษณะที่ไม่ได้เป็นส่วนหนึ่งของ fully_grown
ฉลาก.
จัดการกับความสับสนของฉลาก
วิเคราะห์ผลลัพธ์ในชุดข้อมูลทดสอบเพื่อระบุรูปแบบที่พลาดในชุดข้อมูลการฝึกอบรมหรือการทดสอบ บางครั้งก็ง่ายที่จะมองเห็นรูปแบบดังกล่าวโดยการตรวจสอบภาพด้วยสายตา ในภาพต่อไปนี้ โมเดลกำลังพยายามแก้ไขระหว่างป้ายหลังบ้านกับป้ายลานบ้าน
ในสถานการณ์สมมตินี้ การเพิ่มรูปภาพให้กับป้ายชื่อเหล่านี้ในชุดข้อมูลและยังกำหนดป้ายชื่อใหม่เพื่อให้แต่ละป้ายมีความแตกต่างกันสามารถช่วยเพิ่มความแม่นยำของแบบจำลองได้
การเสริมข้อมูล
ภายใน Rekognition Custom Labels เราทำการเพิ่มข้อมูลต่างๆ สำหรับการฝึกโมเดล รวมถึงการครอบตัดแบบสุ่มของภาพ การกระตุกของสี เสียง Gaussian แบบสุ่ม และอื่นๆ ตามกรณีการใช้งานเฉพาะของคุณ การเพิ่มการเสริมข้อมูลที่ชัดเจนยิ่งขึ้นลงในข้อมูลการฝึกของคุณอาจเป็นประโยชน์ ตัวอย่างเช่น หากคุณสนใจที่จะตรวจจับสัตว์ทั้งภาพสีและภาพขาวดำ คุณอาจได้รับความแม่นยำที่ดีขึ้นโดยการเพิ่มรูปภาพเดียวกันในเวอร์ชันขาวดำและสีลงในข้อมูลการฝึก
เราไม่แนะนำให้เสริมข้อมูลการทดสอบเว้นแต่ว่าการเสริมนั้นสะท้อนถึงกรณีการใช้งานจริงของคุณ
ทบทวนเมตริกการฝึกอบรม
คะแนน F1, ความแม่นยำ, การเรียกคืน และเกณฑ์การสันนิษฐานคือ ตัวชี้วัด ที่สร้างขึ้นเป็นผลลัพธ์ของการฝึกโมเดลโดยใช้ Rekognition Custom Labels โมเดลเหล่านี้ได้รับการปรับให้เหมาะสมสำหรับคะแนน F1 ที่ดีที่สุดตามชุดข้อมูลการทดสอบที่มีให้ เกณฑ์ที่สมมติขึ้นจะถูกสร้างขึ้นตามชุดข้อมูลการทดสอบด้วย คุณสามารถปรับเกณฑ์ได้ตามความต้องการทางธุรกิจของคุณในแง่ของความแม่นยำหรือการเรียกคืน
เนื่องจากเกณฑ์ที่สมมติขึ้นมีการตั้งค่าบนชุดข้อมูลการทดสอบ ชุดการทดสอบที่เหมาะสมควรสะท้อนถึงกรณีการใช้งานจริงในการผลิต หากชุดข้อมูลทดสอบไม่ได้เป็นตัวแทนของกรณีการใช้งาน คุณอาจเห็นคะแนน F1 ที่สูงเกินจริงและประสิทธิภาพของโมเดลที่ไม่ดีบนภาพจริงของคุณ
ตัวชี้วัดเหล่านี้มีประโยชน์เมื่อทำการประเมินเบื้องต้นของแบบจำลอง สำหรับระบบระดับการผลิต เราขอแนะนำให้ประเมินแบบจำลองกับชุดข้อมูลภายนอก (ภาพที่มองไม่เห็น 500–1,000 ภาพ) ที่เป็นตัวแทนของโลกแห่งความเป็นจริง ซึ่งช่วยประเมินว่าแบบจำลองจะดำเนินการอย่างไรในระบบการผลิต และระบุรูปแบบที่ขาดหายไปและแก้ไขด้วยการฝึกแบบจำลองใหม่ หากคุณเห็นว่าคะแนน F1 กับการประเมินจากภายนอกไม่ตรงกัน เราขอแนะนำให้คุณตรวจสอบว่าข้อมูลการทดสอบของคุณสะท้อนถึงกรณีการใช้งานจริงหรือไม่
สรุป
ในโพสต์นี้ เราได้แนะนำแนวทางปฏิบัติที่ดีที่สุดในการปรับปรุงโมเดล Rekognition Custom Labels ให้คุณทราบ เราสนับสนุนให้คุณเรียนรู้เพิ่มเติมเกี่ยวกับ การรับรู้ฉลากที่กำหนดเอง และลองใช้กับชุดข้อมูลเฉพาะธุรกิจของคุณ
เกี่ยวกับผู้แต่ง
Amit Gupta เป็นสถาปนิกอาวุโสด้านโซลูชันบริการ AI ที่ AWS เขาหลงใหลในการช่วยให้ลูกค้าได้รับโซลูชันแมชชีนเลิร์นนิงที่มีสถาปัตยกรรมที่ดีในวงกว้าง
โยเกช จตุรเวดี เป็นสถาปนิกโซลูชันที่ AWS โดยมุ่งเน้นด้านการมองเห็นด้วยคอมพิวเตอร์ เขาทำงานร่วมกับลูกค้าเพื่อจัดการกับความท้าทายทางธุรกิจโดยใช้เทคโนโลยีคลาวด์ นอกเวลางาน เขาชอบเดินป่า ท่องเที่ยว และดูกีฬา
ห่าวหยาง เป็นนักวิทยาศาสตร์ประยุกต์อาวุโสที่ทีม Amazon Rekognition Custom Labels ความสนใจในการวิจัยหลักของเขาคือการตรวจหาวัตถุและการเรียนรู้ด้วยคำอธิบายประกอบที่จำกัด ห่าวชอบดูภาพยนตร์ ถ่ายภาพ และกิจกรรมกลางแจ้ง
พัชมีน มิสทรี เป็นผู้จัดการผลิตภัณฑ์อาวุโสของ Amazon Rekognition Custom Labels นอกที่ทำงาน Pashmeen สนุกกับการเดินป่า ถ่ายภาพ และใช้เวลาอยู่กับครอบครัว
- AI
- ไอ อาร์ต
- เครื่องกำเนิดไออาร์ท
- หุ่นยนต์ไอ
- ความหมายของ Amazon
- ปัญญาประดิษฐ์
- ใบรับรองปัญญาประดิษฐ์
- ปัญญาประดิษฐ์ในการธนาคาร
- หุ่นยนต์ปัญญาประดิษฐ์
- หุ่นยนต์ปัญญาประดิษฐ์
- ซอฟต์แวร์ปัญญาประดิษฐ์
- AWS Machine Learning AWS
- คอนโซลการจัดการ AWS
- blockchain
- การประชุม blockchain ai
- เหรียญอัจฉริยะ
- ปัญญาประดิษฐ์สนทนา
- การประชุม crypto ai
- ดัล-อี
- การเรียนรู้ลึก ๆ
- google ai
- ระดับกลาง (200)
- เรียนรู้เครื่อง
- เพลโต
- เพลโตไอ
- เพลโตดาต้าอินเทลลิเจนซ์
- เกมเพลโต
- เพลโตดาต้า
- เพลโตเกม
- ขนาดไอ
- วากยสัมพันธ์
- ลมทะเล