การจัดประเภทรูปภาพเป็นเทคนิคการเรียนรู้ด้วยคอมพิวเตอร์ (ML) ที่อิงกับการมองเห็นของคอมพิวเตอร์ ซึ่งช่วยให้คุณจัดประเภทรูปภาพได้ ตัวอย่างการจัดประเภทภาพที่รู้จักกันดี ได้แก่ การจำแนกตัวเลขที่เขียนด้วยลายมือ การจำแนกภาพทางการแพทย์ และการจดจำใบหน้า การจัดหมวดหมู่รูปภาพเป็นเทคนิคที่มีประโยชน์กับแอปพลิเคชันทางธุรกิจมากมาย แต่การสร้างโมเดลการจัดหมวดหมู่รูปภาพที่ดีนั้นไม่ใช่เรื่องเล็กน้อย
ข้อควรพิจารณาหลายประการอาจมีบทบาทเมื่อประเมินโมเดล ML นอกเหนือจากความแม่นยำของโมเดลแล้ว เมตริกที่สำคัญอื่นๆ ที่เป็นไปได้คือเวลาฝึกโมเดลและเวลาอนุมาน ด้วยลักษณะการทำงานซ้ำๆ ของการพัฒนาโมเดล ML เวลาการฝึกอบรมที่เร็วขึ้นช่วยให้นักวิทยาศาสตร์ข้อมูลสามารถทดสอบสมมติฐานต่างๆ ได้อย่างรวดเร็ว การอนุมานที่เร็วขึ้นอาจมีความสำคัญในแอปพลิเคชันแบบเรียลไทม์
Amazon SageMaker JumpStart ให้การปรับแต่งแบบละเอียดในคลิกเดียวและการปรับใช้โมเดลที่ได้รับการฝึกอบรมล่วงหน้าที่หลากหลายในงาน ML ยอดนิยม ตลอดจนการเลือกโซลูชันแบบ end-to-end ที่แก้ปัญหาทั่วไปทางธุรกิจ คุณลักษณะเหล่านี้ช่วยขจัดภาระหนักออกจากแต่ละขั้นตอนของกระบวนการ ML ทำให้ง่ายต่อการพัฒนาโมเดลคุณภาพสูงและลดเวลาในการปรับใช้ JumpStart API ช่วยให้คุณสามารถปรับใช้ทางโปรแกรมและปรับแต่งโมเดลที่ได้รับการฝึกฝนล่วงหน้าซึ่งรองรับ JumpStart มากมายบนชุดข้อมูลของคุณเอง
คุณสามารถฝึกและปรับแต่งโมเดล ML ที่เพิ่มขึ้นใน JumpStart ได้ก่อนการปรับใช้ ในขณะที่เขียน 87 แบบจำลองการจัดหมวดหมู่ภาพที่อิงการเรียนรู้เชิงลึกมีอยู่ใน JumpStart
แต่รุ่นไหนจะให้ผลลัพธ์ดีที่สุด? ในโพสต์นี้ เรานำเสนอวิธีการเพื่อรันโมเดลหลายๆ โมเดลอย่างง่ายดาย และเปรียบเทียบผลลัพธ์ในสามมิติที่น่าสนใจ: ความแม่นยำของโมเดล เวลาฝึก และเวลาอนุมาน
ภาพรวมโซลูชัน
JumpStart ช่วยให้คุณฝึก ปรับแต่ง และปรับใช้โมเดลจากคอนโซล JumpStart โดยใช้ UI หรือ API ในโพสต์นี้ เราใช้เส้นทาง API และนำเสนอสมุดบันทึกที่มีสคริปต์ตัวช่วยต่างๆ คุณสามารถเรียกใช้สมุดบันทึกนี้และรับผลลัพธ์สำหรับการเปรียบเทียบรุ่นเหล่านี้อย่างง่ายดาย จากนั้นเลือกรุ่นที่เหมาะกับความต้องการทางธุรกิจของคุณมากที่สุดในแง่ของความแม่นยำของรุ่น เวลาในการฝึกอบรม และเวลาการอนุมาน
พื้นที่ ชุดข้อมูลสาธารณะ ที่ใช้ในโพสต์นี้ประกอบด้วยรูปภาพใบพืชที่เป็นโรคและมีสุขภาพดีเกือบ 55,000 ภาพที่รวบรวมภายใต้สภาวะควบคุม โดยมีป้ายกำกับระดับตั้งแต่ 0–38 ชุดข้อมูลนี้แบ่งออกเป็นชุดข้อมูลการฝึกอบรมและการตรวจสอบ โดยมีประมาณ 44,000 ภาพอยู่ระหว่างการฝึกอบรมและ 11,000 ภาพภายใต้การตรวจสอบ ต่อไปนี้คือภาพตัวอย่างบางส่วน
สำหรับแบบฝึกหัดนี้ เราเลือกโมเดลจากสองเฟรมเวิร์ก—PyTorch และ TensorFlow—ตามที่ JumpStart นำเสนอ อัลกอริทึมแบบจำลอง 15 แบบต่อไปนี้ครอบคลุมสถาปัตยกรรมโครงข่ายประสาทเทียมที่เป็นที่นิยมมากมายจากกรอบเหล่านี้:
pytorch-ic-alexnet-FT
pytorch-ic-densenet121-FT
pytorch-ic-densenet201-FT
pytorch-ic-googlenet-FT
pytorch-ic-mobilenet-v2-FT
pytorch-ic-resnet152-FT
pytorch-ic-resnet34-FT
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT
tensorflow-ic-imagenet-inception-resnet-v2-classification 4-FT
tensorflow-ic-imagenet-inception-v3-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-075-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT
tensorflow-ic-imagenet-resnet-v2-152-classification-4-FT
tensorflow-ic-tf2-preview-mobilenet-v2-classification-4-FT
เราใช้รุ่น tensorflow-ic-imagenet-inception-v3-classification-4-FT
เป็นฐานเทียบกับผลลัพธ์จากรุ่นอื่น ๆ ที่จะเปรียบเทียบ โมเดลพื้นฐานนี้ถูกเลือกโดยพลการ
รหัสที่ใช้ในการเรียกใช้การเปรียบเทียบนี้มีอยู่ใน ที่เก็บตัวอย่าง GitHub ของ AWS.
ผลสอบ
ในส่วนนี้ เรานำเสนอผลลัพธ์จากการวิ่งทั้ง 15 ครั้ง สำหรับการรันทั้งหมดนี้ ไฮเปอร์พารามิเตอร์ที่ใช้คือ epochs = 5, อัตราการเรียนรู้ = 0.001, ขนาดแบทช์ = 16
ความแม่นยำของแบบจำลอง เวลาฝึก และเวลาอนุมานจากแบบจำลอง tensorflow-ic-imagenet-inception-v3-classification-4-FT
ถูกใช้เป็นฐาน และผลลัพธ์จากรุ่นอื่นๆ ทั้งหมดจะแสดงเทียบกับรุ่นฐานนี้ ความตั้งใจของเราในที่นี้ไม่ใช่เพื่อแสดงให้เห็นว่ารุ่นใดดีที่สุด แต่เป็นการแสดงให้เห็นว่า ด้วย JumpStart API คุณสามารถเปรียบเทียบผลลัพธ์จากรุ่นต่างๆ แล้วเลือกรุ่นที่เหมาะกับกรณีการใช้งานของคุณมากที่สุดได้อย่างไร
ภาพหน้าจอต่อไปนี้เน้นรุ่นพื้นฐานที่มีการเปรียบเทียบรุ่นอื่นๆ ทั้งหมด
พล็อตต่อไปนี้แสดงมุมมองโดยละเอียดของความแม่นยำสัมพัทธ์เทียบกับเวลาการฝึกสัมพัทธ์ รุ่น PyTorch มีรหัสสีเป็นสีแดง และรุ่น TensorFlow เป็นสีน้ำเงิน
แบบจำลองที่เน้นด้วยวงรีสีเขียวในโครงเรื่องก่อนหน้านี้ดูเหมือนจะมีการผสมผสานที่ดีระหว่างความแม่นยำสัมพัทธ์และเวลาการฝึกสัมพัทธ์ต่ำ ตารางต่อไปนี้แสดงรายละเอียดเพิ่มเติมเกี่ยวกับโมเดลทั้งสามนี้
ชื่อรุ่น | ความแม่นยำสัมพัทธ์ | เวลาฝึกสัมพัทธ์ |
tensorflow-ic-imagenet-mobilenet-v2-050-224-การจำแนกประเภท-4-FT | 1.01 | 0.74 |
tensorflow-ic-imagenet-mobilenet-v2-140-224-การจำแนกประเภท-4-FT | 1.02 | 0.74 |
tensorflow-ic-bit-s-r101x1-ilsvrc2012-การจำแนกประเภท-1-FT | 1.04 | 1.16 |
พล็อตต่อไปนี้เปรียบเทียบความแม่นยำสัมพัทธ์กับเวลาอนุมานสัมพัทธ์ รุ่น PyTorch มีรหัสสีเป็นสีแดง และรุ่น TensorFlow เป็นสีน้ำเงิน
ตารางต่อไปนี้แสดงรายละเอียดเกี่ยวกับรุ่นทั้งสามในวงรีสีเขียว
ชื่อรุ่น | ความแม่นยำสัมพัทธ์ | เวลาอนุมานสัมพัทธ์ |
tensorflow-ic-imagenet-mobilenet-v2-050-224-การจำแนกประเภท-4-FT | 1.01 | 0.94 |
tensorflow-ic-imagenet-mobilenet-v2-140-224-การจำแนกประเภท-4-FT | 1.02 | 0.90 |
tensorflow-ic-bit-s-r101x1-ilsvrc2012-การจำแนกประเภท-1-FT | 1.04 | 1.43 |
โครงร่างทั้งสองแสดงให้เห็นอย่างชัดเจนว่าอัลกอริทึมแบบจำลองบางอย่างทำงานได้ดีกว่าแบบอื่นในสามมิติที่เลือก ความยืดหยุ่นที่นำเสนอผ่านแบบฝึกหัดนี้สามารถช่วยคุณเลือกอัลกอริทึมที่เหมาะสม และด้วยการใช้สมุดบันทึกที่ให้มา คุณสามารถเรียกใช้การทดสอบประเภทนี้กับโมเดลที่มีอยู่ 87 รุ่นได้อย่างง่ายดาย
สรุป
ในโพสต์นี้ เราได้แสดงวิธีใช้ JumpStart เพื่อสร้างแบบจำลองการจัดประเภทรูปภาพที่มีประสิทธิภาพสูงในหลายมิติที่น่าสนใจ เช่น ความแม่นยำของแบบจำลอง เวลาการฝึกอบรม และเวลาแฝงในการอนุมาน เรายังให้รหัสเพื่อเรียกใช้แบบฝึกหัดนี้ในชุดข้อมูลของคุณเอง คุณสามารถเลือกรุ่นใดก็ได้ที่น่าสนใจจาก 87 รุ่นที่มีอยู่ในปัจจุบันสำหรับการจัดประเภทรูปภาพในฮับรุ่น JumpStart เราขอแนะนำให้คุณลองใช้เลยวันนี้
สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับ JumpStart โปรดดูที่ SageMaker JumpStart.
เกี่ยวกับผู้เขียน
นพ. ราชุ เพ็ญมัจฉา เป็นสถาปนิกโซลูชันผู้เชี่ยวชาญด้าน AI/ML ในแพลตฟอร์ม AI ที่ AWS เขาได้รับปริญญาเอกจากมหาวิทยาลัยสแตนฟอร์ด เขาทำงานอย่างใกล้ชิดกับชุดบริการแบบใช้โค้ดน้อย/ไม่มีโค้ดใน SageMaker ซึ่งช่วยให้ลูกค้าสร้างและปรับใช้โมเดลและโซลูชันแมชชีนเลิร์นนิ่งได้อย่างง่ายดาย เมื่อไม่ได้ช่วยเหลือลูกค้าเขาชอบเดินทางไปที่ใหม่ๆ
ดร. Ashish Khetan เป็นนักวิทยาศาสตร์ประยุกต์อาวุโสที่มีอัลกอริทึมในตัวของ Amazon SageMaker และช่วยพัฒนาอัลกอริทึมการเรียนรู้ของเครื่อง เขาได้รับปริญญาเอกจาก University of Illinois Urbana-Champaign เขาเป็นนักวิจัยที่กระตือรือร้นในด้านแมชชีนเลิร์นนิงและการอนุมานทางสถิติ และได้ตีพิมพ์บทความจำนวนมากในการประชุม NeurIPS, ICML, ICLR, JMLR, ACL และ EMNLP
- AI
- ไอ อาร์ต
- เครื่องกำเนิดไออาร์ท
- หุ่นยนต์ไอ
- อเมซอน SageMaker
- Amazon SageMaker JumpStart
- ปัญญาประดิษฐ์
- ใบรับรองปัญญาประดิษฐ์
- ปัญญาประดิษฐ์ในการธนาคาร
- หุ่นยนต์ปัญญาประดิษฐ์
- หุ่นยนต์ปัญญาประดิษฐ์
- ซอฟต์แวร์ปัญญาประดิษฐ์
- AWS Machine Learning AWS
- blockchain
- การประชุม blockchain ai
- เหรียญอัจฉริยะ
- ปัญญาประดิษฐ์สนทนา
- การประชุม crypto ai
- ดัล-อี
- การเรียนรู้ลึก ๆ
- google ai
- ระดับกลาง (200)
- เรียนรู้เครื่อง
- เพลโต
- เพลโตไอ
- เพลโตดาต้าอินเทลลิเจนซ์
- เกมเพลโต
- เพลโตดาต้า
- เพลโตเกม
- ขนาดไอ
- วากยสัมพันธ์
- ลมทะเล