สร้างโมเดลการจัดประเภทภาพที่มีประสิทธิภาพสูงโดยใช้ Amazon SageMaker JumpStart

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

การจัดประเภทรูปภาพเป็นเทคนิคการเรียนรู้ด้วยคอมพิวเตอร์ (ML) ที่อิงกับการมองเห็นของคอมพิวเตอร์ ซึ่งช่วยให้คุณจัดประเภทรูปภาพได้ ตัวอย่างการจัดประเภทภาพที่รู้จักกันดี ได้แก่ การจำแนกตัวเลขที่เขียนด้วยลายมือ การจำแนกภาพทางการแพทย์ และการจดจำใบหน้า การจัดหมวดหมู่รูปภาพเป็นเทคนิคที่มีประโยชน์กับแอปพลิเคชันทางธุรกิจมากมาย แต่การสร้างโมเดลการจัดหมวดหมู่รูปภาพที่ดีนั้นไม่ใช่เรื่องเล็กน้อย

ข้อควรพิจารณาหลายประการอาจมีบทบาทเมื่อประเมินโมเดล ML นอกเหนือจากความแม่นยำของโมเดลแล้ว เมตริกที่สำคัญอื่นๆ ที่เป็นไปได้คือเวลาฝึกโมเดลและเวลาอนุมาน ด้วยลักษณะการทำงานซ้ำๆ ของการพัฒนาโมเดล ML เวลาการฝึกอบรมที่เร็วขึ้นช่วยให้นักวิทยาศาสตร์ข้อมูลสามารถทดสอบสมมติฐานต่างๆ ได้อย่างรวดเร็ว การอนุมานที่เร็วขึ้นอาจมีความสำคัญในแอปพลิเคชันแบบเรียลไทม์

Amazon SageMaker JumpStart ให้การปรับแต่งแบบละเอียดในคลิกเดียวและการปรับใช้โมเดลที่ได้รับการฝึกอบรมล่วงหน้าที่หลากหลายในงาน ML ยอดนิยม ตลอดจนการเลือกโซลูชันแบบ end-to-end ที่แก้ปัญหาทั่วไปทางธุรกิจ คุณลักษณะเหล่านี้ช่วยขจัดภาระหนักออกจากแต่ละขั้นตอนของกระบวนการ ML ทำให้ง่ายต่อการพัฒนาโมเดลคุณภาพสูงและลดเวลาในการปรับใช้ JumpStart API ช่วยให้คุณสามารถปรับใช้ทางโปรแกรมและปรับแต่งโมเดลที่ได้รับการฝึกฝนล่วงหน้าซึ่งรองรับ JumpStart มากมายบนชุดข้อมูลของคุณเอง

คุณสามารถฝึกและปรับแต่งโมเดล ML ที่เพิ่มขึ้นใน JumpStart ได้ก่อนการปรับใช้ ในขณะที่เขียน 87 แบบจำลองการจัดหมวดหมู่ภาพที่อิงการเรียนรู้เชิงลึกมีอยู่ใน JumpStart

แต่รุ่นไหนจะให้ผลลัพธ์ดีที่สุด? ในโพสต์นี้ เรานำเสนอวิธีการเพื่อรันโมเดลหลายๆ โมเดลอย่างง่ายดาย และเปรียบเทียบผลลัพธ์ในสามมิติที่น่าสนใจ: ความแม่นยำของโมเดล เวลาฝึก และเวลาอนุมาน

ภาพรวมโซลูชัน

JumpStart ช่วยให้คุณฝึก ปรับแต่ง และปรับใช้โมเดลจากคอนโซล JumpStart โดยใช้ UI หรือ API ในโพสต์นี้ เราใช้เส้นทาง API และนำเสนอสมุดบันทึกที่มีสคริปต์ตัวช่วยต่างๆ คุณสามารถเรียกใช้สมุดบันทึกนี้และรับผลลัพธ์สำหรับการเปรียบเทียบรุ่นเหล่านี้อย่างง่ายดาย จากนั้นเลือกรุ่นที่เหมาะกับความต้องการทางธุรกิจของคุณมากที่สุดในแง่ของความแม่นยำของรุ่น เวลาในการฝึกอบรม และเวลาการอนุมาน

พื้นที่ ชุดข้อมูลสาธารณะ ที่ใช้ในโพสต์นี้ประกอบด้วยรูปภาพใบพืชที่เป็นโรคและมีสุขภาพดีเกือบ 55,000 ภาพที่รวบรวมภายใต้สภาวะควบคุม โดยมีป้ายกำกับระดับตั้งแต่ 0–38 ชุดข้อมูลนี้แบ่งออกเป็นชุดข้อมูลการฝึกอบรมและการตรวจสอบ โดยมีประมาณ 44,000 ภาพอยู่ระหว่างการฝึกอบรมและ 11,000 ภาพภายใต้การตรวจสอบ ต่อไปนี้คือภาพตัวอย่างบางส่วน

สำหรับแบบฝึกหัดนี้ เราเลือกโมเดลจากสองเฟรมเวิร์ก—PyTorch และ TensorFlow—ตามที่ JumpStart นำเสนอ อัลกอริทึมแบบจำลอง 15 แบบต่อไปนี้ครอบคลุมสถาปัตยกรรมโครงข่ายประสาทเทียมที่เป็นที่นิยมมากมายจากกรอบเหล่านี้:

pytorch-ic-alexnet-FT
pytorch-ic-densenet121-FT
pytorch-ic-densenet201-FT
pytorch-ic-googlenet-FT
pytorch-ic-mobilenet-v2-FT
pytorch-ic-resnet152-FT
pytorch-ic-resnet34-FT
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT
tensorflow-ic-imagenet-inception-resnet-v2-classification 4-FT
tensorflow-ic-imagenet-inception-v3-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-075-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT
tensorflow-ic-imagenet-resnet-v2-152-classification-4-FT
tensorflow-ic-tf2-preview-mobilenet-v2-classification-4-FT

เราใช้รุ่น tensorflow-ic-imagenet-inception-v3-classification-4-FT เป็นฐานเทียบกับผลลัพธ์จากรุ่นอื่น ๆ ที่จะเปรียบเทียบ โมเดลพื้นฐานนี้ถูกเลือกโดยพลการ

รหัสที่ใช้ในการเรียกใช้การเปรียบเทียบนี้มีอยู่ใน ที่เก็บตัวอย่าง GitHub ของ AWS.

ผลสอบ

ในส่วนนี้ เรานำเสนอผลลัพธ์จากการวิ่งทั้ง 15 ครั้ง สำหรับการรันทั้งหมดนี้ ไฮเปอร์พารามิเตอร์ที่ใช้คือ epochs = 5, อัตราการเรียนรู้ = 0.001, ขนาดแบทช์ = 16

ความแม่นยำของแบบจำลอง เวลาฝึก และเวลาอนุมานจากแบบจำลอง tensorflow-ic-imagenet-inception-v3-classification-4-FT ถูกใช้เป็นฐาน และผลลัพธ์จากรุ่นอื่นๆ ทั้งหมดจะแสดงเทียบกับรุ่นฐานนี้ ความตั้งใจของเราในที่นี้ไม่ใช่เพื่อแสดงให้เห็นว่ารุ่นใดดีที่สุด แต่เป็นการแสดงให้เห็นว่า ด้วย JumpStart API คุณสามารถเปรียบเทียบผลลัพธ์จากรุ่นต่างๆ แล้วเลือกรุ่นที่เหมาะกับกรณีการใช้งานของคุณมากที่สุดได้อย่างไร

ภาพหน้าจอต่อไปนี้เน้นรุ่นพื้นฐานที่มีการเปรียบเทียบรุ่นอื่นๆ ทั้งหมด

พล็อตต่อไปนี้แสดงมุมมองโดยละเอียดของความแม่นยำสัมพัทธ์เทียบกับเวลาการฝึกสัมพัทธ์ รุ่น PyTorch มีรหัสสีเป็นสีแดง และรุ่น TensorFlow เป็นสีน้ำเงิน

แบบจำลองที่เน้นด้วยวงรีสีเขียวในโครงเรื่องก่อนหน้านี้ดูเหมือนจะมีการผสมผสานที่ดีระหว่างความแม่นยำสัมพัทธ์และเวลาการฝึกสัมพัทธ์ต่ำ ตารางต่อไปนี้แสดงรายละเอียดเพิ่มเติมเกี่ยวกับโมเดลทั้งสามนี้

ชื่อรุ่น	ความแม่นยำสัมพัทธ์	เวลาฝึกสัมพัทธ์
tensorflow-ic-imagenet-mobilenet-v2-050-224-การจำแนกประเภท-4-FT	1.01	0.74
tensorflow-ic-imagenet-mobilenet-v2-140-224-การจำแนกประเภท-4-FT	1.02	0.74
tensorflow-ic-bit-s-r101x1-ilsvrc2012-การจำแนกประเภท-1-FT	1.04	1.16

พล็อตต่อไปนี้เปรียบเทียบความแม่นยำสัมพัทธ์กับเวลาอนุมานสัมพัทธ์ รุ่น PyTorch มีรหัสสีเป็นสีแดง และรุ่น TensorFlow เป็นสีน้ำเงิน

ตารางต่อไปนี้แสดงรายละเอียดเกี่ยวกับรุ่นทั้งสามในวงรีสีเขียว

ชื่อรุ่น	ความแม่นยำสัมพัทธ์	เวลาอนุมานสัมพัทธ์
tensorflow-ic-imagenet-mobilenet-v2-050-224-การจำแนกประเภท-4-FT	1.01	0.94
tensorflow-ic-imagenet-mobilenet-v2-140-224-การจำแนกประเภท-4-FT	1.02	0.90
tensorflow-ic-bit-s-r101x1-ilsvrc2012-การจำแนกประเภท-1-FT	1.04	1.43

โครงร่างทั้งสองแสดงให้เห็นอย่างชัดเจนว่าอัลกอริทึมแบบจำลองบางอย่างทำงานได้ดีกว่าแบบอื่นในสามมิติที่เลือก ความยืดหยุ่นที่นำเสนอผ่านแบบฝึกหัดนี้สามารถช่วยคุณเลือกอัลกอริทึมที่เหมาะสม และด้วยการใช้สมุดบันทึกที่ให้มา คุณสามารถเรียกใช้การทดสอบประเภทนี้กับโมเดลที่มีอยู่ 87 รุ่นได้อย่างง่ายดาย

สรุป

ในโพสต์นี้ เราได้แสดงวิธีใช้ JumpStart เพื่อสร้างแบบจำลองการจัดประเภทรูปภาพที่มีประสิทธิภาพสูงในหลายมิติที่น่าสนใจ เช่น ความแม่นยำของแบบจำลอง เวลาการฝึกอบรม และเวลาแฝงในการอนุมาน เรายังให้รหัสเพื่อเรียกใช้แบบฝึกหัดนี้ในชุดข้อมูลของคุณเอง คุณสามารถเลือกรุ่นใดก็ได้ที่น่าสนใจจาก 87 รุ่นที่มีอยู่ในปัจจุบันสำหรับการจัดประเภทรูปภาพในฮับรุ่น JumpStart เราขอแนะนำให้คุณลองใช้เลยวันนี้

สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับ JumpStart โปรดดูที่ SageMaker JumpStart.

เกี่ยวกับผู้เขียน

นพ. ราชุ เพ็ญมัจฉา เป็นสถาปนิกโซลูชันผู้เชี่ยวชาญด้าน AI/ML ในแพลตฟอร์ม AI ที่ AWS เขาได้รับปริญญาเอกจากมหาวิทยาลัยสแตนฟอร์ด เขาทำงานอย่างใกล้ชิดกับชุดบริการแบบใช้โค้ดน้อย/ไม่มีโค้ดใน SageMaker ซึ่งช่วยให้ลูกค้าสร้างและปรับใช้โมเดลและโซลูชันแมชชีนเลิร์นนิ่งได้อย่างง่ายดาย เมื่อไม่ได้ช่วยเหลือลูกค้าเขาชอบเดินทางไปที่ใหม่ๆ

ดร. Ashish Khetan เป็นนักวิทยาศาสตร์ประยุกต์อาวุโสที่มีอัลกอริทึมในตัวของ Amazon SageMaker และช่วยพัฒนาอัลกอริทึมการเรียนรู้ของเครื่อง เขาได้รับปริญญาเอกจาก University of Illinois Urbana-Champaign เขาเป็นนักวิจัยที่กระตือรือร้นในด้านแมชชีนเลิร์นนิงและการอนุมานทางสถิติ และได้ตีพิมพ์บทความจำนวนมากในการประชุม NeurIPS, ICML, ICLR, JMLR, ACL และ EMNLP

ประทับเวลา: November 17, 2022November 21, 2022

ประทับเวลา: พฤศจิกายน 16, 2022

สร้างโมเดลการจัดหมวดหมู่ภาพที่มีประสิทธิภาพสูงโดยใช้ Amazon SageMaker JumpStart

เผยแพร่ซ้ำโดยเพลโต

ภาพรวมโซลูชัน

ผลสอบ

สรุป

เกี่ยวกับผู้เขียน

เพิ่มเติมจาก AWS Machine Learning AWS

ปรับแต่งและปรับใช้โมเดล Llama 2 อย่างคุ้มค่าใน Amazon SageMaker JumpStart ด้วย AWS Inferentia และ AWS Trainium | อเมซอนเว็บเซอร์วิส

ปรับแต่งโมเดล Whisper บน Amazon SageMaker พร้อม LoRA | อเมซอนเว็บเซอร์วิส

ข้อมูลเชิงลึกและธีมที่ดำเนินการได้ซึ่งขับเคลื่อนด้วย AI/ML สำหรับผู้ขายบุคคลที่สามของ Amazon ที่ใช้ AWS

ระบุป่าชายเลนโดยใช้คุณสมบัติภาพถ่ายดาวเทียมโดยใช้ Amazon SageMaker Studio และ Amazon SageMaker Autopilot – ตอนที่ 1

การปรับโมเดลอัตโนมัติของ Amazon SageMaker รองรับการสำรองอินสแตนซ์การฝึกอบรม SageMaker แล้ว

การเปิดใช้งานเวิร์กโฟลว์ ML แบบไฮบริดบน Amazon EKS และ Amazon SageMaker ด้วย Kubeflow เพียงคลิกเดียวในการปรับใช้ AWS

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้