Xử lý hình ảnh hàng loạt bằng nhãn tùy chỉnh Amazon Rekognition

Được xuất bản lại bởi Plato

Người theo dõi: 0

Nhận thức lại Amazon là một dịch vụ thị giác máy tính giúp bạn dễ dàng thêm phân tích hình ảnh và video vào các ứng dụng của mình bằng cách sử dụng công nghệ học sâu đã được chứng minh, có khả năng mở rộng cao, không yêu cầu chuyên môn về máy học (ML) để sử dụng. Với Amazon Rekognition, bạn có thể xác định các đối tượng, người, văn bản, cảnh và hoạt động trong hình ảnh và video, cũng như phát hiện bất kỳ nội dung không phù hợp nào. Amazon Rekognition cũng cung cấp khả năng phân tích khuôn mặt và tìm kiếm khuôn mặt có độ chính xác cao mà bạn có thể sử dụng để phát hiện, phân tích và so sánh khuôn mặt cho nhiều trường hợp sử dụng.

Nhãn tùy chỉnh Rekognition của Amazon cho phép bạn xác định các đối tượng và cảnh trong hình ảnh cụ thể cho nhu cầu kinh doanh của bạn. Ví dụ: bạn có thể tìm thấy biểu tượng của mình trong các bài đăng trên mạng xã hội, xác định sản phẩm của bạn trên các kệ hàng, phân loại các bộ phận máy móc trong dây chuyền lắp ráp, phân biệt cây khỏe mạnh và cây nhiễm bệnh, v.v. Bài đăng trên blog Xây dựng khả năng phát hiện thương hiệu của riêng bạn chỉ ra cách sử dụng Amazon Rekognition Custom Labels để xây dựng giải pháp toàn diện nhằm phát hiện logo thương hiệu trong hình ảnh và video.

Amazon Rekognition Custom Labels cung cấp trải nghiệm đơn giản từ đầu đến cuối, nơi bạn bắt đầu bằng cách gắn nhãn tập dữ liệu và Amazon Rekognition Custom Labels xây dựng mô hình ML tùy chỉnh cho bạn bằng cách kiểm tra dữ liệu và chọn thuật toán ML phù hợp. Sau khi mô hình của bạn được đào tạo, bạn có thể bắt đầu sử dụng nó ngay lập tức để phân tích hình ảnh. Nếu bạn muốn xử lý hình ảnh theo lô (chẳng hạn như một lần một ngày hoặc một tuần hoặc vào những thời điểm đã lên lịch trong ngày), bạn có thể cung cấp mô hình tùy chỉnh của mình vào những thời điểm đã lên lịch.

Trong bài đăng này, chúng tôi chỉ ra cách bạn có thể xây dựng giải pháp hàng loạt tối ưu về chi phí với Nhãn tùy chỉnh của Amazon Rekognition cung cấp mô hình tùy chỉnh của bạn vào thời điểm đã lên lịch, xử lý tất cả hình ảnh của bạn và cung cấp tài nguyên của bạn để tránh phát sinh thêm chi phí.

Tổng quan về giải pháp

Sơ đồ kiến trúc sau đây cho thấy cách bạn có thể thiết kế quy trình làm việc hiệu quả về chi phí và có khả năng mở rộng cao để xử lý hình ảnh theo lô với Amazon Rekognition Custom Labels. Nó tận dụng các dịch vụ AWS như Sự kiện Amazon, Chức năng bước AWS, Dịch vụ xếp hàng đơn giản trên Amazon (SQS của Amazon), AWS Lambdavà Dịch vụ lưu trữ đơn giản của Amazon (Amazon S3).

Giải pháp này sử dụng kiến trúc không máy chủ và các dịch vụ được quản lý, vì vậy nó có thể mở rộng theo yêu cầu và không yêu cầu cung cấp và quản lý bất kỳ máy chủ nào. Hàng đợi Amazon SQS tăng khả năng chịu lỗi tổng thể của giải pháp bằng cách tách việc nhập hình ảnh khỏi quá trình xử lý hình ảnh và cho phép gửi thông điệp đáng tin cậy cho mỗi hình ảnh được nhập. Step Functions giúp bạn dễ dàng xây dựng quy trình công việc trực quan để sắp xếp một loạt các tác vụ riêng lẻ, chẳng hạn như kiểm tra xem hình ảnh có sẵn sàng để xử lý và quản lý vòng đời trạng thái của dự án Amazon Rekognition Custom Labels hay không. Mặc dù kiến trúc sau cho thấy cách bạn có thể xây dựng giải pháp xử lý hàng loạt cho các Nhãn tùy chỉnh của Amazon Rekognition bằng cách sử dụng AWS Lambda, bạn có thể xây dựng một kiến trúc tương tự bằng cách sử dụng các dịch vụ như Cổng xa AWS.

Xử lý hình ảnh hàng loạt với Nhãn tùy chỉnh Amazon Rekognition PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Các bước sau đây mô tả quy trình làm việc tổng thể:

Khi một hình ảnh được lưu trữ trong nhóm Amazon S3, nó sẽ kích hoạt một thông báo được lưu trữ trong hàng đợi Amazon SQS.
Amazon EventBridge được định cấu hình để kích hoạt luồng công việc Chức năng từng bước AWS ở một tần suất nhất định (1 giờ theo mặc định).
Khi dòng công việc chạy, nó thực hiện các hành động sau:
1. Nó kiểm tra số lượng mặt hàng trong hàng đợi Amazon SQS. Nếu không có mục nào để xử lý trong hàng đợi, quy trình làm việc sẽ kết thúc.
2. Nếu có các mục cần xử lý trong hàng đợi, quy trình làm việc sẽ bắt đầu mô hình Nhãn tùy chỉnh của Amazon Rekognition.
3. Quy trình làm việc cho phép tích hợp Amazon SQS với chức năng AWS Lambda để xử lý những hình ảnh đó.
Khi tích hợp giữa hàng đợi Amazon SQS và AWS Lambda được bật, các sự kiện sau sẽ xảy ra:
1. AWS Lambda bắt đầu xử lý tin nhắn với chi tiết hình ảnh từ Amazon SQS.
2. Chức năng AWS Lambda sử dụng dự án Amazon Rekognition Custom Labels để xử lý hình ảnh.
3. Sau đó, hàm AWS Lambda đặt tệp JSON chứa các nhãn được tham chiếu vào nhóm cuối cùng. Hình ảnh cũng được chuyển từ nhóm nguồn sang nhóm cuối cùng.
Khi tất cả các hình ảnh được xử lý, quy trình hoạt động của Chức năng từng bước AWS sẽ thực hiện những việc sau:
1. Nó dừng mô hình Nhãn tùy chỉnh Rekognition của Amazon.
2. Nó vô hiệu hóa tích hợp giữa hàng đợi Amazon SQS và chức năng AWS Lambda bằng cách tắt trình kích hoạt.

Sơ đồ sau minh họa máy trạng thái Chức năng Bước AWS cho giải pháp này.

Xử lý hình ảnh hàng loạt với Nhãn tùy chỉnh Amazon Rekognition PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Điều kiện tiên quyết

Để triển khai giải pháp này, bạn cần các điều kiện tiên quyết sau:

Tài khoản AWS có quyền triển khai giải pháp bằng cách sử dụng Hình thành đám mây AWS, tạo ra Quản lý truy cập và nhận dạng AWS (IAM) vai trò và các nguồn lực khác.
Tên tài nguyên Amazon (ARN) của dự án Amazon Rekognition Custom Labels (gọi tắt là dự ánArn) và Tên tài nguyên Amazon (ARN) của phiên bản mô hình được tạo sau khi đào tạo mô hình (được tham chiếu là Dự ánPhiên bảnArn). Các giá trị này được yêu cầu để kiểm tra trạng thái của mô hình và cũng để phân tích hình ảnh bằng cách sử dụng mô hình.

Để tìm hiểu cách đào tạo một người mẫu, hãy xem Bắt đầu với Amazon Rekognition Custom Labels.

Triển khai

Để triển khai giải pháp bằng AWS CloudFormation trong tài khoản AWS của bạn, hãy làm theo các bước trong Repo GitHub. Nó tạo ra các tài nguyên sau:

Nhóm Amazon S3
Hàng đợi Amazon SQS
Quy trình làm việc của Chức năng từng bước AWS
Quy tắc Amazon EventBridge để kích hoạt quy trình làm việc
Vai trò IAM
Các hàm AWS Lambda

Bạn có thể thấy tên của các tài nguyên khác nhau được tạo bởi giải pháp trong phần đầu ra của Ngăn xếp CloudFormation.

Kiểm tra quy trình làm việc

Để kiểm tra quy trình làm việc của bạn, hãy hoàn thành các bước sau:

Tải hình ảnh mẫu lên nhóm S3 đầu vào được tạo bởi giải pháp (ví dụ: xxxx-sources3bucket-xxxx).
Trên bảng điều khiển Chức năng Bước, chọn máy trạng thái được tạo bởi giải pháp (ví dụ: CustomCVStateMachine-xxxx).

Bạn sẽ thấy máy trạng thái được kích hoạt bởi quy tắc Amazon EventBridge mỗi giờ.

Bạn có thể bắt đầu quy trình làm việc theo cách thủ công bằng cách chọn Bắt đầu thực hiện.
Khi hình ảnh được xử lý, bạn có thể chuyển đến nhóm S3 đầu ra (ví dụ: xxxx-final3bucket-xxxx) để xem đầu ra JSON cho mỗi hình ảnh.

Ảnh chụp màn hình sau đây hiển thị nội dung của nhóm S3 cuối cùng với các hình ảnh, cùng với đầu ra JSON tương ứng của chúng từ Nhãn tùy chỉnh Rekognition của Amazon.

Xử lý hình ảnh hàng loạt với Nhãn tùy chỉnh Amazon Rekognition PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Kết luận

Trong bài đăng này, chúng tôi đã chỉ ra cách bạn có thể xây dựng giải pháp hàng loạt tối ưu về chi phí với Nhãn tùy chỉnh của Amazon Rekognition có thể cung cấp mô hình tùy chỉnh của bạn vào thời gian đã định, xử lý tất cả hình ảnh và hủy cấp phép tài nguyên của bạn để tránh phát sinh thêm chi phí. Tùy thuộc vào trường hợp sử dụng của bạn, bạn có thể dễ dàng điều chỉnh khoảng thời gian đã lên lịch mà tại đó giải pháp sẽ xử lý hàng loạt. Để biết thêm thông tin về cách tạo, đào tạo, đánh giá và sử dụng mô hình phát hiện các đối tượng, cảnh và khái niệm trong hình ảnh, hãy xem bắt đầu với Amazon Rekognition Custom Labels.

Mặc dù giải pháp được mô tả trong bài đăng này cho thấy cách bạn có thể xử lý hình ảnh hàng loạt với Nhãn tùy chỉnh của Amazon Rekognition, nhưng bạn có thể dễ dàng tinh chỉnh giải pháp để xử lý hình ảnh hàng loạt với Amazon Lookout cho Tầm nhìn để phát hiện khuyết tật và dị thường. Với Amazon Lookout for Vision, các công ty sản xuất có thể tăng chất lượng và giảm chi phí hoạt động bằng cách nhanh chóng xác định sự khác biệt trong hình ảnh của các đối tượng trên quy mô lớn. Ví dụ: Amazon Lookout for Vision có thể được sử dụng để xác định các thành phần bị thiếu trong sản phẩm, hư hỏng đối với phương tiện hoặc cấu trúc, sự bất thường trong dây chuyền sản xuất, lỗi nhỏ trong tấm silicon và các vấn đề tương tự khác. Để tìm hiểu thêm về Amazon Lookout for Vision, hãy xem hướng dẫn dành cho nhà phát triển.

Về các tác giả

Rahul Srivastava là Kiến trúc sư Giải pháp Cấp cao tại Amazon Web Services và có trụ sở tại Vương quốc Anh. Ông có nhiều kinh nghiệm về kiến trúc khi làm việc với các khách hàng doanh nghiệp lớn. Anh ấy đang giúp khách hàng của chúng tôi về kiến trúc, áp dụng đám mây, phát triển sản phẩm có mục đích và tận dụng AI / ML để giải quyết các vấn đề kinh doanh trong thế giới thực.

Xử lý hình ảnh hàng loạt với Nhãn tùy chỉnh Amazon Rekognition PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái. Kashif Imran là Kiến trúc sư giải pháp chính tại Amazon Web Services. Anh ấy làm việc với một số khách hàng AWS lớn nhất đang tận dụng AI / ML để giải quyết các vấn đề kinh doanh phức tạp. Ông cung cấp hướng dẫn kỹ thuật và tư vấn thiết kế để triển khai các ứng dụng thị giác máy tính trên quy mô lớn. Chuyên môn của anh ấy bao gồm kiến trúc ứng dụng, serverless, container, NoSQL và máy học.