Các nhà xuất bản kỹ thuật số liên tục tìm cách hợp lý hóa và tự động hóa quy trình truyền thông của họ để tạo và xuất bản nội dung mới nhanh nhất có thể.
Nhiều nhà xuất bản có một thư viện hình ảnh lớn mà họ sử dụng cho các bài viết của mình. Những hình ảnh này có thể được sử dụng lại nhiều lần cho các câu chuyện khác nhau, đặc biệt khi nhà xuất bản có hình ảnh của những người nổi tiếng. Rất thường xuyên, một nhà báo có thể cần cắt bỏ một người nổi tiếng mong muốn từ một hình ảnh để sử dụng cho câu chuyện sắp tới của họ. Đây là một nhiệm vụ thủ công, lặp đi lặp lại nên được tự động hóa. Đôi khi, một tác giả có thể muốn sử dụng hình ảnh của một người nổi tiếng, nhưng hình ảnh đó có hai người và người nổi tiếng chính cần được cắt khỏi hình ảnh. Những lần khác, hình ảnh của người nổi tiếng có thể cần được định dạng lại để xuất bản lên nhiều nền tảng khác nhau như di động, mạng xã hội hoặc tin tức kỹ thuật số. Ngoài ra, tác giả có thể cần thay đổi tỷ lệ khung hình của hình ảnh hoặc đặt người nổi tiếng vào tiêu điểm rõ nét.
Trong bài đăng này, chúng tôi trình bày cách sử dụng Nhận thức lại Amazon để thực hiện phân tích hình ảnh. Amazon Rekognition giúp bạn dễ dàng thêm khả năng này vào các ứng dụng của mình mà không cần bất kỳ kiến thức chuyên môn về máy học (ML) nào và đi kèm với nhiều API khác nhau để đáp ứng các trường hợp sử dụng như phát hiện đối tượng, kiểm duyệt nội dung, nhận diện và phân tích khuôn mặt cũng như nhận dạng văn bản và người nổi tiếng, mà chúng tôi sử dụng trong ví dụ này.
Sản phẩm tính năng nhận dạng người nổi tiếng in Nhận thức lại Amazon tự động nhận dạng hàng chục nghìn nhân vật nổi tiếng trong hình ảnh và video bằng ML. Nhận dạng người nổi tiếng có thể phát hiện không chỉ sự hiện diện của người nổi tiếng nhất định mà còn cả vị trí trong ảnh.
Tổng quan về giải pháp
Trong bài đăng này, chúng tôi trình bày cách chúng tôi có thể chuyển ảnh, tên người nổi tiếng và tỷ lệ khung hình cho hình ảnh xuất ra để có thể tạo ra hình ảnh đã cắt của người nổi tiếng nhất định chụp khuôn mặt của họ ở giữa.
Khi làm việc với API phát hiện người nổi tiếng của Amazon Rekognition, nhiều phần tử được trả về trong phản hồi. Sau đây là một số yếu tố phản hồi chính:
- trận đấu tự tin – Điểm tin cậy khớp có thể được sử dụng để kiểm soát hành vi của API. Chúng tôi khuyên bạn nên áp dụng ngưỡng phù hợp cho điểm số này trong ứng dụng của mình để chọn điểm vận hành ưa thích của bạn. Ví dụ: bằng cách đặt ngưỡng 99%, bạn có thể loại bỏ các kết quả dương tính giả nhưng có thể bỏ lỡ một số kết quả khớp tiềm năng.
- Tên, Id và Url – Tên người nổi tiếng, ID Amazon Rekognition duy nhất và danh sách các URL như liên kết IMDb hoặc Wikipedia của người nổi tiếng để biết thêm thông tin.
- Giới hạnHộp – Tọa độ của vị trí hộp giới hạn hình chữ nhật cho từng khuôn mặt người nổi tiếng được công nhận.
- Giới tính đã biết – Bản sắc giới tính đã biết cho từng người nổi tiếng được công nhận.
- Cảm xúc – Cảm xúc thể hiện trên khuôn mặt của người nổi tiếng, chẳng hạn như vui, buồn hay tức giận.
- pose – Tạo dáng khuôn mặt người nổi tiếng, sử dụng ba trục lăn, cao độ và nghiêng.
- Nụ cười – Người nổi tiếng có cười hay không.
Một phần của phản hồi API từ Amazon Rekognition bao gồm mã sau:
Trong bài tập này, chúng tôi trình bày cách sử dụng phần tử hộp giới hạn để xác định vị trí của khuôn mặt, như thể hiện trong hình ảnh ví dụ sau. Tất cả các kích thước được biểu thị dưới dạng tỷ lệ của kích thước hình ảnh tổng thể, vì vậy các số trong phản hồi nằm trong khoảng từ 0–1. Ví dụ: trong phản hồi API mẫu, chiều rộng của hộp giới hạn là 0.1, có nghĩa là chiều rộng khuôn mặt là 10% tổng chiều rộng của hình ảnh.
Với hộp giới hạn này, giờ đây chúng tôi có thể sử dụng logic để đảm bảo rằng khuôn mặt vẫn nằm trong các cạnh của hình ảnh mới mà chúng tôi tạo. Chúng ta có thể áp dụng một số phần đệm xung quanh hộp giới hạn này để giữ khuôn mặt ở giữa.
Trong các phần tiếp theo, chúng tôi trình bày cách tạo đầu ra hình ảnh được cắt xén sau với Werner Vogels ở tiêu điểm sắc nét.
Chúng tôi khởi động một Amazon SageMaker notebook, cung cấp môi trường Python nơi bạn có thể chạy mã để chuyển hình ảnh tới Amazon Rekognition, sau đó tự động sửa đổi hình ảnh có tiêu điểm là người nổi tiếng.
Mã thực hiện các bước cấp cao sau:
- Đưa ra yêu cầu đối với
recognize_celebrities
API với hình ảnh và tên người nổi tiếng đã cho. - Lọc phản hồi cho thông tin hộp giới hạn.
- Thêm một số phần đệm vào hộp giới hạn để chúng tôi chụp một số nền.
Điều kiện tiên quyết
Đối với hướng dẫn này, bạn nên có các điều kiện tiên quyết sau:
Tải lên hình ảnh mẫu
Tải hình ảnh mẫu về người nổi tiếng lên bộ chứa S3 của bạn.
Chạy mã
Để chạy mã, chúng tôi sử dụng sổ ghi chép SageMaker, tuy nhiên, bất kỳ IDE nào cũng sẽ hoạt động sau khi cài đặt Python, gối và Boto3. Chúng tôi tạo sổ ghi chép SageMaker cũng như Quản lý truy cập và nhận dạng AWS (IAM) với các quyền cần thiết. Hoàn thành các bước sau:
- Tạo sổ tay và tên nó
automatic-cropping-celebrity
.
Chính sách thực thi mặc định, được tạo khi tạo sổ ghi chép SageMaker, có một chính sách đơn giản cấp cho vai trò quyền tương tác với Amazon S3.
- Cập nhật
Resource
ràng buộc với tên bộ chứa S3:
- Tạo một chính sách khác để thêm vào vai trò IAM của sổ ghi chép SageMaker để có thể gọi Nhận ra người nổi tiếng API:
- Trên bảng điều khiển SageMaker, chọn Trường hợp máy tính xách tay trong khung điều hướng.
- Định vị
automatic-cropping-celebrity
sổ tay và chọn Mở Jupyter. - Chọn Mới và conda_python3 làm hạt nhân cho sổ ghi chép của bạn.
Đối với các bước sau, hãy sao chép các khối mã vào sổ ghi chép Jupyter của bạn và chạy chúng bằng cách chọn chạy.
- Đầu tiên, chúng tôi nhập các chức năng và thư viện của trình trợ giúp:
- Đặt biến
- Tạo một khách hàng dịch vụ
- Chức năng nhận diện người nổi tiếng
- Chức năng lấy hộp giới hạn của người nổi tiếng đã cho:
- Chức năng thêm một số phần đệm vào hộp giới hạn, vì vậy chúng tôi chụp một số nền xung quanh khuôn mặt
- Chức năng lưu hình ảnh vào bộ nhớ máy tính xách tay và Amazon S3
- Sử dụng Python
main()
chức năng kết hợp các chức năng trước đó để hoàn thành quy trình lưu hình ảnh đã cắt mới của người nổi tiếng của chúng tôi:
Khi bạn chạy khối mã này, bạn có thể thấy rằng chúng tôi đã tìm thấy Werner Vogels và tạo một hình ảnh mới với khuôn mặt của anh ấy ở giữa.
Hình ảnh sẽ được lưu vào sổ ghi chép và cũng được tải lên bộ chứa S3.
Bạn có thể đưa giải pháp này vào một quy trình làm việc lớn hơn; ví dụ: một công ty xuất bản có thể muốn xuất bản khả năng này như một điểm cuối để định dạng lại và thay đổi kích thước hình ảnh một cách nhanh chóng khi xuất bản các bài báo về người nổi tiếng lên nhiều nền tảng.
Dọn dẹp
Để tránh phát sinh phí trong tương lai, hãy xóa các tài nguyên:
- Trên bảng điều khiển SageMaker, hãy chọn sổ ghi chép của bạn và trên Hoạt động menu, chọn Dừng.
- Sau khi dừng sổ ghi chép, trên Hoạt động menu, chọn Xóa bỏ.
- Trên bảng điều khiển IAM, hãy xóa vai trò thực thi SageMaker mà bạn đã tạo.
- Trên bảng điều khiển Amazon S3, xóa hình ảnh đầu vào và mọi tệp đầu ra khỏi bộ chứa S3 của bạn.
Kết luận
Trong bài đăng này, chúng tôi đã trình bày cách chúng tôi có thể sử dụng Amazon Rekognition để tự động hóa tác vụ sửa đổi hình ảnh thủ công để hỗ trợ quy trình công việc truyền thông. Điều này đặc biệt quan trọng trong ngành xuất bản, nơi tốc độ đóng vai trò quan trọng trong việc đưa nội dung mới ra một cách nhanh chóng và trên nhiều nền tảng.
Để biết thêm thông tin về cách làm việc với nội dung phương tiện, hãy tham khảo Media Intelligence trở nên thông minh hơn với Media2Cloud 3.0
Lưu ý
Đánh dấu Watkins là một Kiến trúc sư giải pháp trong nhóm Truyền thông và Giải trí. Anh ấy giúp khách hàng tạo ra các giải pháp AI/ML để giải quyết các thách thức kinh doanh của họ bằng cách sử dụng AWS. Anh ấy đã làm việc trên một số dự án AI/ML liên quan đến thị giác máy tính, xử lý ngôn ngữ tự nhiên, cá nhân hóa, ML biên, v.v. Rời xa cuộc sống chuyên nghiệp, anh ấy thích dành thời gian cho gia đình và nhìn hai đứa con nhỏ của mình lớn lên.
- Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
- Platoblockchain. Web3 Metaverse Intelligence. Khuếch đại kiến thức. Truy cập Tại đây.
- nguồn: https://aws.amazon.com/blogs/machine-learning/automatic-image-cropping-with-amazon-rekognition/
- :là
- $ LÊN
- 1
- 10
- 100
- 11
- 7
- 8
- 9
- a
- Có khả năng
- Giới thiệu
- truy cập
- Hoạt động
- Ngoài ra
- Sau
- AI / ML
- Tất cả
- đàn bà gan dạ
- Nhận thức lại Amazon
- phân tích
- và
- Một
- api
- API
- Các Ứng Dụng
- các ứng dụng
- Đăng Nhập
- Nộp đơn
- LÀ
- xung quanh
- bài viết
- AS
- khía cạnh
- Tài sản
- At
- tác giả
- tự động hóa
- Tự động
- Tự động
- tự động
- AWS
- VÒI
- lý lịch
- BE
- giữa
- Chặn
- Khối
- Hộp
- hộp
- kinh doanh
- by
- cuộc gọi
- CAN
- nắm bắt
- Chụp
- trường hợp
- Celeb
- người nổi tiếng
- Người nổi tiếng
- Trung tâm
- thách thức
- thay đổi
- tải
- Chọn
- lựa chọn
- mã
- kết hợp
- công ty
- hoàn thành
- máy tính
- Tầm nhìn máy tính
- sự tự tin
- An ủi
- chứa
- nội dung
- liên tục
- điều khiển
- có thể
- tạo
- tạo ra
- Tạo
- cây trồng
- khách hàng
- Mặc định
- chứng minh
- mong muốn
- phát hiện
- Phát hiện
- khác nhau
- kỹ thuật số
- kích thước
- Giao diện
- tải về
- e
- mỗi
- Cạnh
- hiệu lực
- thành phần
- các yếu tố
- loại bỏ
- Điểm cuối
- Giải trí
- Môi trường
- đặc biệt
- ví dụ
- thực hiện
- Tập thể dục
- chuyên môn
- bày tỏ
- Đối mặt
- khuôn mặt
- gia đình
- nổi tiếng
- Tập tin
- Các tập tin
- Tập trung
- tiếp theo
- Trong
- định dạng
- tìm thấy
- tươi
- từ
- chức năng
- chức năng
- xa hơn
- tương lai
- Giới Tính
- tạo ra
- được
- nhận được
- được
- cho
- Phát triển
- vui mừng
- Có
- cao
- giúp
- cấp độ cao
- Độ đáng tin của
- Hướng dẫn
- Tuy nhiên
- HTML
- http
- HTTPS
- ID
- xác định
- Bản sắc
- hình ảnh
- hình ảnh
- nhập khẩu
- quan trọng
- in
- bao gồm
- bao gồm
- ngành công nghiệp
- thông tin
- đầu vào
- Cài đặt
- Sự thông minh
- tương tác
- IT
- nhà báo
- jpg
- Giữ
- Key
- nổi tiếng
- Ngôn ngữ
- lớn
- phóng
- học tập
- thư viện
- Thư viện
- Cuộc sống
- Lượt thích
- LINK
- Danh sách
- ít
- địa phương
- địa điểm thư viện nào
- tìm kiếm
- máy
- học máy
- làm cho
- LÀM CHO
- nhãn hiệu
- nhiều
- Trận đấu
- Vấn đề
- Phương tiện truyền thông
- Menu
- Might
- ML
- di động
- điều độ
- sửa đổi
- chi tiết
- nhiều
- tên
- Tự nhiên
- Xử lý ngôn ngữ tự nhiên
- THÔNG TIN
- Cần
- nhu cầu
- Mới
- tin tức
- máy tính xách tay
- số
- vật
- Phát hiện đối tượng
- of
- on
- hoạt động
- gọi món
- Nền tảng khác
- nếu không thì
- đầu ra
- tổng thể
- cửa sổ
- đặc biệt
- con đường
- người
- Thực hiện
- thực hiện
- quyền
- Cá tính
- cá nhân
- Pitch
- Nền tảng
- plato
- Thông tin dữ liệu Plato
- PlatoDữ liệu
- Điểm
- điều luật
- Bài đăng
- tiềm năng
- ưa thích
- điều kiện tiên quyết
- sự hiện diện
- chính
- xử lý
- chuyên nghiệp
- dự án
- cung cấp
- xuất bản
- nhà xuất bản
- nhà xuất bản
- Xuất bản
- đặt
- Python
- Mau
- nâng cao
- nhanh chóng
- tỉ lệ
- công nhận
- công nhận
- công nhận
- nhận ra
- giới thiệu
- liên quan
- vẫn còn
- lặp đi lặp lại
- đại diện
- yêu cầu
- cần phải
- tài nguyên
- Thông tin
- phản ứng
- kết quả
- Kết quả
- trở lại
- ROI
- Vai trò
- Lăn
- chạy
- nhà làm hiền triết
- Lưu
- tiết kiệm
- Điểm số
- phần
- dịch vụ
- thiết lập
- một số
- nên
- hiển thị
- thể hiện
- Đơn giản
- Kích thước máy
- thông minh hơn
- So
- Mạng xã hội
- truyền thông xã hội
- giải pháp
- Giải pháp
- động SOLVE
- một số
- tốc độ
- Chi
- vuông
- Tuyên bố
- Các bước
- cổ phần
- dừng lại
- là gắn
- Những câu chuyện
- Câu chuyện
- hợp lý hóa
- như vậy
- phù hợp
- hỗ trợ
- Nhiệm vụ
- nhóm
- việc này
- Sản phẩm
- cung cấp their dịch
- Them
- Kia là
- hàng ngàn
- số ba
- ngưỡng
- thời gian
- thời gian
- đến
- hàng đầu
- Tổng số:
- độc đáo
- sắp tới
- tải lên
- sử dụng
- nhiều
- khác nhau
- phiên bản
- Video
- tầm nhìn
- hương
- xem
- cách
- TỐT
- nổi tiếng
- liệu
- cái nào
- chiều rộng
- Wikipedia
- sẽ
- với
- ở trong
- không có
- Công việc
- Luồng công việc
- đang làm việc
- sẽ
- Bạn
- trên màn hình
- zephyrnet