Tips To Improve Your Amazon Rekognition Custom Labels Model

Được xuất bản lại bởi Plato

Người theo dõi: 0

Trong bài đăng này, chúng tôi thảo luận về các phương pháp hay nhất để cải thiện hiệu suất của các mô hình thị giác máy tính của bạn bằng cách sử dụng Nhãn tùy chỉnh Rekognition của Amazon. Rekognition Custom Labels là một dịch vụ được quản lý hoàn toàn để xây dựng các mô hình thị giác máy tính tùy chỉnh cho các trường hợp sử dụng phân loại hình ảnh và phát hiện đối tượng. Các Nhãn Tùy chỉnh Rekognition được xây dựng dựa trên các mô hình được đào tạo trước trong Nhận thức lại Amazon, vốn đã được đào tạo về hàng chục triệu hình ảnh trên nhiều thể loại. Thay vì hàng nghìn hình ảnh, bạn có thể bắt đầu với một tập hợp nhỏ các hình ảnh đào tạo (vài trăm hoặc ít hơn) dành riêng cho trường hợp sử dụng của bạn. Nhãn tùy chỉnh Rekognition giúp loại bỏ sự phức tạp liên quan đến việc xây dựng một mô hình tùy chỉnh. Nó tự động kiểm tra dữ liệu đào tạo, chọn các thuật toán ML phù hợp, chọn loại cá thể, đào tạo nhiều mô hình ứng viên với các cài đặt siêu tham số khác nhau và xuất ra mô hình được đào tạo tốt nhất. Rekognition Custom Labels cũng cung cấp giao diện dễ sử dụng từ Bảng điều khiển quản lý AWS để quản lý toàn bộ quy trình làm việc ML, bao gồm ghi nhãn hình ảnh, đào tạo mô hình, triển khai mô hình và trực quan hóa kết quả thử nghiệm.

Đôi khi độ chính xác của mô hình không phải là tốt nhất và bạn không có nhiều tùy chọn để điều chỉnh các thông số cấu hình của mô hình. Đằng sau hậu trường, có nhiều yếu tố đóng vai trò quan trọng để xây dựng một mô hình hoạt động hiệu quả, chẳng hạn như sau:

Góc ảnh
Độ phân giải hình ảnh
Tỷ lệ khung hình hình ảnh
Tiếp xúc với ánh sáng
Sự rõ ràng và sống động của nền
Độ tương phản màu
Kích thước dữ liệu mẫu

Sau đây là các bước chung cần tuân theo để đào tạo mô hình Nhãn tùy chỉnh nhận thức lại cấp sản xuất:

Đánh giá phân loại - Điều này xác định danh sách các thuộc tính / mục mà bạn muốn xác định trong một hình ảnh.
Thu thập dữ liệu có liên quan - Đây là bước quan trọng nhất, nơi bạn cần thu thập những hình ảnh có liên quan giống với những gì bạn sẽ thấy trong môi trường sản xuất. Điều này có thể liên quan đến hình ảnh của các đối tượng có nền, ánh sáng hoặc góc máy ảnh khác nhau. Sau đó, bạn tạo tập dữ liệu đào tạo và thử nghiệm bằng cách chia nhỏ các hình ảnh đã thu thập. Bạn chỉ nên bao gồm hình ảnh trong thế giới thực như một phần của tập dữ liệu thử nghiệm và không nên bao gồm bất kỳ hình ảnh nào được tạo tổng hợp. Các chú thích về dữ liệu bạn đã thu thập là rất quan trọng đối với hiệu suất của mô hình. Đảm bảo rằng các hộp bao quanh các đối tượng được chặt chẽ và các nhãn chính xác. Chúng tôi thảo luận một số mẹo mà bạn có thể cân nhắc khi xây dựng tập dữ liệu thích hợp ở phần sau của bài đăng này.
Xem lại các chỉ số đào tạo - Sử dụng các bộ dữ liệu trước đó để đào tạo một mô hình và xem xét các chỉ số đào tạo cho điểm F1, độ chính xác và thu hồi. Chúng tôi sẽ thảo luận chi tiết về cách phân tích các chỉ số đào tạo ở phần sau trong bài đăng này.
Đánh giá mô hình được đào tạo - Sử dụng một tập hợp các hình ảnh không nhìn thấy (không dùng để huấn luyện mô hình) với các nhãn đã biết để đánh giá các dự đoán. Bước này phải luôn được thực hiện để đảm bảo rằng mô hình hoạt động như mong đợi trong môi trường sản xuất.
Đào tạo lại (tùy chọn) - Nói chung, đào tạo bất kỳ mô hình học máy nào là một quá trình lặp đi lặp lại để đạt được kết quả mong muốn, một mô hình thị giác máy tính cũng không khác. Xem lại kết quả ở Bước 4, để xem có cần thêm nhiều hình ảnh vào dữ liệu huấn luyện hay không và lặp lại các Bước 3 - 5 ở trên.

Trong bài đăng này, chúng tôi tập trung vào các phương pháp hay nhất xoay quanh việc thu thập dữ liệu có liên quan (Bước 2) và đánh giá các chỉ số được đào tạo của bạn (Bước 3) để cải thiện hiệu suất mô hình của bạn.

Thu thập dữ liệu có liên quan

Đây là giai đoạn quan trọng nhất của việc đào tạo mô hình Nhãn tùy chỉnh Rekognition cấp sản xuất. Cụ thể, có hai bộ dữ liệu: đào tạo và kiểm tra. Dữ liệu đào tạo được sử dụng để đào tạo mô hình và bạn cần phải dành nỗ lực để xây dựng một nhóm đào tạo thích hợp. Các mô hình Nhãn tùy chỉnh Rekognition được tối ưu hóa cho Điểm F1 trên tập dữ liệu thử nghiệm để chọn mô hình chính xác nhất cho dự án của bạn. Do đó, điều cần thiết là phải quản lý một tập dữ liệu thử nghiệm giống với thế giới thực.

Số lượng hình ảnh

Chúng tôi khuyên bạn nên có tối thiểu 15-20 hình ảnh cho mỗi nhãn. Có nhiều hình ảnh với nhiều biến thể hơn phản ánh trường hợp sử dụng của bạn sẽ cải thiện hiệu suất của mô hình.

Tập dữ liệu cân bằng

Lý tưởng nhất là mỗi nhãn trong tập dữ liệu nên có số lượng mẫu tương tự nhau. Không nên có sự chênh lệch lớn về số lượng hình ảnh trên mỗi nhãn. Ví dụ: tập dữ liệu trong đó số lượng hình ảnh cao nhất cho một nhãn là 1,000 so với 50 hình ảnh cho một nhãn khác giống với một tập dữ liệu không cân bằng. Chúng tôi khuyên bạn nên tránh các trường hợp có tỷ lệ lệch nhau 1:50 giữa nhãn có số lượng hình ảnh ít nhất so với nhãn có số lượng hình ảnh cao nhất.

Thay đổi các loại hình ảnh

Bao gồm các hình ảnh trong tập dữ liệu đào tạo và kiểm tra giống với những gì bạn sẽ sử dụng trong thế giới thực. Ví dụ: nếu bạn muốn phân loại hình ảnh của phòng khách và phòng ngủ, bạn nên bao gồm hình ảnh trống và có đồ đạc của cả hai phòng.

Sau đây là một hình ảnh ví dụ của một phòng khách được trang bị nội thất.

Ngược lại, sau đây là một ví dụ về phòng khách không có đồ đạc.

Sau đây là hình ảnh ví dụ của một phòng ngủ được trang bị nội thất.

Sau đây là một hình ảnh ví dụ về một phòng ngủ không có đồ đạc.

Nền thay đổi

Bao gồm các hình ảnh có nền khác nhau. Hình ảnh có bối cảnh tự nhiên có thể mang lại kết quả tốt hơn so với nền đơn giản.

Sau đây là hình ảnh ví dụ về sân trước của một ngôi nhà.

Sau đây là hình ảnh ví dụ về sân trước của một ngôi nhà khác với một nền khác.

Điều kiện ánh sáng thay đổi

Bao gồm các hình ảnh có ánh sáng khác nhau để nó bao gồm các điều kiện ánh sáng khác nhau xảy ra trong quá trình suy luận (ví dụ: có và không có đèn flash). Bạn cũng có thể bao gồm các hình ảnh có độ bão hòa, màu sắc và độ sáng khác nhau.

Sau đây là một hình ảnh ví dụ về một bông hoa dưới ánh sáng bình thường.

Ngược lại, hình ảnh sau đây là của cùng một bông hoa dưới ánh sáng rực rỡ.

Các góc thay đổi

Bao gồm các hình ảnh được chụp từ nhiều góc độ khác nhau của đối tượng. Điều này giúp mô hình tìm hiểu các đặc điểm khác nhau của các đối tượng.

Những hình ảnh sau đây là phòng ngủ giống nhau từ các góc độ khác nhau.

Mẹo để cải thiện mô hình Nhãn tùy chỉnh Amazon Rekognition PlatoBlockchain Data Intelligence của bạn. Tìm kiếm dọc. Ái.

Có thể có những trường hợp không thể có được các hình ảnh thuộc nhiều loại khác nhau. Trong các tình huống đó, hình ảnh tổng hợp có thể được tạo như một phần của tập dữ liệu đào tạo. Để biết thêm thông tin về các kỹ thuật tăng hình ảnh phổ biến, hãy tham khảo Tăng cường dữ liệu.

Thêm nhãn phủ định

Đối với phân loại hình ảnh, việc thêm nhãn phủ định có thể giúp tăng độ chính xác của mô hình. Ví dụ: bạn có thể thêm nhãn phủ định, nhãn này không khớp với bất kỳ nhãn nào được yêu cầu. Hình ảnh sau đây đại diện cho các nhãn khác nhau được sử dụng để xác định hoa đã trưởng thành hoàn toàn.

Thêm nhãn phủ định not_fully_grown giúp mô hình tìm hiểu các đặc điểm không phải là một phần của fully_grown nhãn.

Xử lý nhầm lẫn nhãn

Phân tích kết quả trên tập dữ liệu kiểm tra để nhận ra bất kỳ mẫu nào bị bỏ sót trong tập dữ liệu đào tạo hoặc kiểm tra. Đôi khi, thật dễ dàng để phát hiện ra các mẫu như vậy bằng cách kiểm tra trực quan các hình ảnh. Trong hình ảnh sau đây, mô hình đang đấu tranh để giải quyết giữa nhãn sân sau và sân.

Trong trường hợp này, việc thêm nhiều hình ảnh vào các nhãn này trong tập dữ liệu và cũng xác định lại các nhãn để mỗi nhãn khác biệt có thể giúp tăng độ chính xác của mô hình.

Tăng dữ liệu

Bên trong Nhãn tùy chỉnh Rekognition, chúng tôi thực hiện nhiều phép tăng cường dữ liệu khác nhau để đào tạo mô hình, bao gồm cắt xén ngẫu nhiên hình ảnh, pha trộn màu sắc, tiếng ồn Gaussian ngẫu nhiên, v.v. Dựa trên các trường hợp sử dụng cụ thể của bạn, cũng có thể có lợi khi thêm các phần bổ sung dữ liệu rõ ràng hơn vào dữ liệu đào tạo của bạn. Ví dụ: nếu bạn quan tâm đến việc phát hiện động vật ở cả hình ảnh màu và đen trắng, bạn có thể có được độ chính xác cao hơn bằng cách thêm phiên bản màu đen và trắng và màu của cùng một hình ảnh vào dữ liệu huấn luyện.

Chúng tôi không khuyên bạn nên bổ sung dữ liệu thử nghiệm trừ khi việc tăng cường phản ánh các trường hợp sử dụng sản xuất của bạn.

Xem lại các chỉ số đào tạo

Điểm F1, độ chính xác, thu hồi và ngưỡng giả định là số liệu được tạo ra dưới dạng đầu ra của việc đào tạo mô hình bằng cách sử dụng Nhãn tùy chỉnh Rekognition. Các mô hình được tối ưu hóa cho điểm F1 tốt nhất dựa trên tập dữ liệu thử nghiệm được cung cấp. Ngưỡng giả định cũng được tạo dựa trên tập dữ liệu thử nghiệm. Bạn có thể điều chỉnh ngưỡng dựa trên yêu cầu kinh doanh của mình về độ chính xác hoặc thu hồi.

Bởi vì các ngưỡng giả định được đặt trên tập dữ liệu thử nghiệm, một tập hợp thử nghiệm thích hợp phải phản ánh trường hợp sử dụng sản xuất trong thế giới thực. Nếu tập dữ liệu thử nghiệm không đại diện cho trường hợp sử dụng, bạn có thể thấy điểm F1 cao giả tạo và hiệu suất mô hình kém trên hình ảnh trong thế giới thực của bạn.

Các chỉ số này rất hữu ích khi thực hiện đánh giá ban đầu về mô hình. Đối với hệ thống cấp sản xuất, chúng tôi khuyên bạn nên đánh giá mô hình dựa trên tập dữ liệu bên ngoài (500–1,000 hình ảnh không nhìn thấy) đại diện cho thế giới thực. Điều này giúp đánh giá mô hình sẽ hoạt động như thế nào trong hệ thống sản xuất và cũng xác định bất kỳ mẫu nào còn thiếu và sửa chúng bằng cách đào tạo lại mô hình. Nếu bạn thấy sự không khớp giữa điểm F1 và đánh giá bên ngoài, chúng tôi khuyên bạn nên kiểm tra xem dữ liệu thử nghiệm của mình có phản ánh trường hợp sử dụng trong thế giới thực hay không.

Kết luận

Trong bài đăng này, chúng tôi đã hướng dẫn bạn các phương pháp hay nhất để cải thiện mô hình Nhãn tùy chỉnh Rekognition. Chúng tôi khuyến khích bạn tìm hiểu thêm về Nhãn tùy chỉnh Rekognition và dùng thử cho bộ dữ liệu dành riêng cho doanh nghiệp của bạn.

Giới thiệu về tác giả

Amit Gupta là Kiến trúc sư Giải pháp Dịch vụ AI cấp cao tại AWS. Anh ấy đam mê tạo điều kiện cho khách hàng có các giải pháp máy học được kiến trúc tốt trên quy mô lớn.

Yogesh Chaturvedi là Kiến trúc sư Giải pháp tại AWS với trọng tâm là tầm nhìn máy tính. Anh ấy làm việc với khách hàng để giải quyết các thách thức kinh doanh của họ bằng cách sử dụng công nghệ đám mây. Ngoài công việc, anh ấy thích đi bộ đường dài, đi du lịch và xem thể thao.

Hào Dương là Nhà khoa học ứng dụng cao cấp tại nhóm Nhãn tùy chỉnh Rekognition của Amazon. Sở thích nghiên cứu chính của anh ấy là phát hiện và học đối tượng với các chú thích hạn chế. Ngoài công việc, Hào thích xem phim, chụp ảnh và các hoạt động ngoài trời.

Pashmeen là Giám đốc sản phẩm cấp cao cho các Nhãn tùy chỉnh Rekognition của Amazon. Ngoài công việc, Pashmeen thích đi bộ đường dài mạo hiểm, chụp ảnh và dành thời gian cho gia đình.

Dấu thời gian: Ngày 9 tháng 2022 năm XNUMXNgày 10 tháng 2022 năm XNUMX

Thêm từ Học máy AWS

Mendix đang chuyển đổi trải nghiệm của khách hàng bằng AI và Amazon Bedrock như thế nào | Dịch vụ web của Amazon

Học máy AWS

Nút nguồn: 1913698

Dấu thời gian: Tháng Mười Một 15, 2023

Mở rộng LLM bằng PyTorch 2.0 FSDP trên Amazon EKS – Phần 2 | Dịch vụ web của Amazon

Cụm nguồn:

Học máy AWS

Nút nguồn: 1960833

Dấu thời gian: Tháng Tư 1, 2024

Mẹo để cải thiện mô hình Nhãn tùy chỉnh Rekognition trên Amazon của bạn

Được xuất bản lại bởi Plato

Thu thập dữ liệu có liên quan

Số lượng hình ảnh

Tập dữ liệu cân bằng

Thay đổi các loại hình ảnh

Nền thay đổi

Điều kiện ánh sáng thay đổi

Các góc thay đổi

Thêm nhãn phủ định

Xử lý nhầm lẫn nhãn

Tăng dữ liệu

Xem lại các chỉ số đào tạo

Kết luận

Giới thiệu về tác giả

Thêm từ Học máy AWS

Chuyển giao việc học cho các mô hình phân loại hình ảnh TensorFlow trong Amazon SageMaker

Tự động đào tạo lại mạng lưới thần kinh với Renate

Giảm lãng phí thực phẩm để cải thiện tính bền vững và kết quả tài chính trong bán lẻ với Amazon Forecast

Chuẩn bị dữ liệu từ Amazon EMR cho machine learning bằng Amazon SageMaker Data Wrangler

Chạy các mô hình ML tổng hợp trên Amazon SageMaker

Về chúng tôi

Tìm kiếm dọc & Ai

Nền tảng

NHẬN THÔNG TIN

Tài khoản