Tích hợp PaddleOCR với các Dự án Amazon SageMaker dành cho MLOps để thực hiện nhận dạng ký tự quang học trên các tài liệu nhận dạng PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Tích hợp PaddleOCR với Amazon SageMaker Projects cho MLOps để thực hiện nhận dạng ký tự quang học trên các tài liệu nhận dạng

Nhận dạng ký tự quang học (OCR) là nhiệm vụ chuyển đổi văn bản in hoặc viết tay thành văn bản được mã hóa bằng máy. OCR đã được sử dụng rộng rãi trong các tình huống khác nhau, chẳng hạn như điện hóa tài liệu và xác thực danh tính. Bởi vì OCR có thể làm giảm đáng kể nỗ lực thủ công để đăng ký thông tin quan trọng và đóng vai trò như một bước đầu tiên để hiểu khối lượng lớn tài liệu, một hệ thống OCR chính xác đóng một vai trò quan trọng trong kỷ nguyên chuyển đổi kỹ thuật số.

Cộng đồng nguồn mở và các nhà nghiên cứu đang tập trung vào cách cải thiện độ chính xác, tính dễ sử dụng của OCR, tích hợp với các mô hình được đào tạo trước, tính mở rộng và tính linh hoạt. Trong số nhiều khuôn khổ được đề xuất, PaddleOCR ngày càng được chú ý gần đây. Khung đề xuất tập trung vào việc đạt được độ chính xác cao trong khi cân bằng hiệu quả tính toán. Ngoài ra, các mô hình được đào tạo trước cho tiếng Trung và tiếng Anh khiến nó trở nên phổ biến trên thị trường sử dụng tiếng Trung. Xem Kho lưu trữ PaddleOCR GitHub để biết thêm chi tiết.

Tại AWS, chúng tôi cũng đã đề xuất các dịch vụ AI tích hợp sẵn sàng sử dụng mà không cần chuyên môn về máy học (ML). Để trích xuất văn bản và dữ liệu có cấu trúc như bảng và biểu mẫu từ tài liệu, bạn có thể sử dụng Văn bản Amazon. Nó sử dụng các kỹ thuật ML để đọc và xử lý bất kỳ loại tài liệu nào, trích xuất chính xác văn bản, chữ viết tay, bảng và các dữ liệu khác mà không cần nỗ lực thủ công.

Đối với các nhà khoa học dữ liệu muốn sử dụng một cách linh hoạt khung mã nguồn mở để phát triển mô hình OCR của riêng bạn, chúng tôi cũng cung cấp dịch vụ ML được quản lý đầy đủ Amazon SageMaker. SageMaker cho phép bạn triển khai các phương pháp hay nhất của MLOps trong suốt vòng đời ML, đồng thời cung cấp các mẫu và bộ công cụ để giảm bớt khối lượng nặng nhọc không phân biệt để đưa các dự án ML vào sản xuất.

Trong bài đăng này, chúng tôi tập trung vào việc phát triển các mô hình tùy chỉnh trong khuôn khổ PaddleOCR trên SageMaker. Chúng tôi đi qua vòng đời phát triển ML để minh họa cách SageMaker có thể giúp bạn xây dựng và đào tạo một mô hình, và cuối cùng triển khai mô hình đó như một dịch vụ web. Mặc dù chúng tôi minh họa giải pháp này bằng PaddleOCR, nhưng hướng dẫn chung vẫn đúng đối với các khuôn khổ tùy ý được sử dụng trên SageMaker. Để đi kèm với bài đăng này, chúng tôi cũng cung cấp mã mẫu trong Kho GitHub.

Khung PaddleOCR

Là một khung OCR được chấp nhận rộng rãi, PaddleOCR chứa các thuật toán phát hiện văn bản đa dạng thức, nhận dạng văn bản và end-to-end. Nó chọn Phân biệt Binarization (DB) và Mạng Nơron Tái chế (CRNN) làm các mô hình phát hiện và nhận dạng cơ bản, đồng thời đề xuất một loạt các mô hình, có tên PP-OCR, cho các ứng dụng công nghiệp sau một loạt các chiến lược tối ưu hóa.

Mô hình PP-OCR hướng tới các kịch bản chung và tạo thành một thư viện mô hình của các ngôn ngữ khác nhau. Nó bao gồm ba phần: phát hiện văn bản, phát hiện hộp và chỉnh sửa, và nhận dạng văn bản, được minh họa trong hình sau trên PaddleOCR kho GitHub chính thức. Bạn cũng có thể tham khảo bài nghiên cứu PP-OCR: Hệ thống OCR siêu nhẹ thực tế để biết thêm thông tin chi tiết.

Cụ thể hơn, PaddleOCR bao gồm ba tác vụ liên tiếp:

  • Phát hiện văn bản - Mục đích của việc dò tìm văn bản là định vị vùng văn bản trong ảnh. Các nhiệm vụ như vậy có thể dựa trên một mạng phân đoạn đơn giản.
  • Phát hiện và sửa chữa hộp - Mỗi hộp văn bản cần được chuyển đổi thành một hộp hình chữ nhật nằm ngang để nhận dạng văn bản tiếp theo. Để làm điều này, PaddleOCR đề xuất đào tạo một bộ phân loại hướng văn bản (nhiệm vụ phân loại hình ảnh) để xác định hướng văn bản.
  • Nhận dạng văn bản - Sau khi hộp văn bản được phát hiện, mô hình nhận dạng văn bản thực hiện suy luận trên mỗi hộp văn bản và xuất kết quả theo vị trí hộp văn bản. PaddleOCR áp dụng phương pháp CRNN được sử dụng rộng rãi.

PaddleOCR cung cấp các mô hình được đào tạo trước chất lượng cao có thể so sánh với các hiệu ứng thương mại. Bạn có thể sử dụng mô hình được đào tạo trước cho mô hình phát hiện, bộ phân loại hướng hoặc mô hình nhận dạng hoặc bạn có thể tinh chỉnh và đào tạo lại từng mô hình riêng lẻ để phục vụ cho trường hợp sử dụng của mình. Để tăng hiệu quả và hiệu quả của việc phát hiện tiếng Trung Phồn thể và tiếng Anh, chúng tôi minh họa cách tinh chỉnh mô hình nhận dạng văn bản. Mô hình được đào tạo trước mà chúng tôi chọn là ch_ppocr_mobile_v2.0_rec_train, là một mô hình nhẹ, hỗ trợ tiếng Trung, tiếng Anh và nhận dạng số. Sau đây là một ví dụ kết quả suy luận sử dụng chứng minh thư Hồng Kông.

Tích hợp PaddleOCR với các Dự án Amazon SageMaker dành cho MLOps để thực hiện nhận dạng ký tự quang học trên các tài liệu nhận dạng PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Trong các phần tiếp theo, chúng ta sẽ hướng dẫn cách tinh chỉnh mô hình được đào tạo trước bằng SageMaker.

Các phương pháp hay nhất về MLOps với SageMaker

SageMaker là một dịch vụ ML được quản lý hoàn toàn. Với SageMaker, các nhà khoa học và nhà phát triển dữ liệu có thể nhanh chóng và dễ dàng xây dựng và đào tạo các mô hình ML, sau đó trực tiếp triển khai chúng vào một môi trường được quản lý sẵn sàng cho sản xuất.

Nhiều nhà khoa học dữ liệu sử dụng SageMaker để tăng tốc vòng đời ML. Trong phần này, chúng tôi minh họa cách SageMaker có thể giúp bạn từ thử nghiệm đến sản xuất ML. Theo các bước tiêu chuẩn của một dự án ML, từ cụm từ thử nghiệm (phát triển mã và thử nghiệm), đến cụm từ hoạt động (tự động hóa quy trình xây dựng mô hình và đường ống triển khai), SageMaker có thể mang lại hiệu quả trong các bước sau:

  1. Khám phá dữ liệu và xây dựng mã ML với Xưởng sản xuất Amazon SageMaker vở
  2. Đào tạo và điều chỉnh mô hình bằng công việc đào tạo SageMaker.
  3. Triển khai mô hình với điểm cuối SageMaker để phục vụ mô hình.
  4. Sắp xếp quy trình làm việc với Đường ống Amazon SageMaker.

Sơ đồ sau minh họa kiến ​​trúc và quy trình làm việc này.

Tích hợp PaddleOCR với các Dự án Amazon SageMaker dành cho MLOps để thực hiện nhận dạng ký tự quang học trên các tài liệu nhận dạng PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Điều quan trọng cần lưu ý là bạn có thể sử dụng SageMaker theo cách mô-đun. Ví dụ: bạn có thể xây dựng mã của mình với môi trường phát triển tích hợp cục bộ (IDE) và đào tạo và triển khai mô hình của bạn trên SageMaker hoặc bạn có thể phát triển và đào tạo mô hình của mình trong các nguồn máy tính cụm của riêng bạn và sử dụng đường dẫn SageMaker để điều phối quy trình công việc và triển khai trên điểm cuối SageMaker. Điều này có nghĩa là SageMaker cung cấp một nền tảng mở để thích ứng với các yêu cầu của riêng bạn.

Xem mã trong của chúng tôi Kho GitHub và README để hiểu cấu trúc mã.

Cung cấp một dự án SageMaker

Bạn có thể sử dụng Dự án Amazon SageMaker để bắt đầu cuộc hành trình của bạn. Với dự án SageMaker, bạn có thể quản lý các phiên bản cho kho lưu trữ Git của mình để bạn có thể cộng tác giữa các nhóm hiệu quả hơn, đảm bảo tính nhất quán của mã và cho phép tích hợp liên tục và phân phối liên tục (CI / CD). Mặc dù sổ ghi chép rất hữu ích cho việc xây dựng và thử nghiệm mô hình, nhưng khi bạn có một nhóm các nhà khoa học dữ liệu và kỹ sư ML làm việc về một vấn đề ML, bạn cần một cách có thể mở rộng hơn để duy trì tính nhất quán của mã và kiểm soát phiên bản chặt chẽ hơn.

Các dự án của SageMaker tạo một mẫu MLOps được định cấu hình sẵn, bao gồm các thành phần thiết yếu để đơn giản hóa việc tích hợp PaddleOCR:

  • Kho lưu trữ mã để xây dựng hình ảnh vùng chứa tùy chỉnh để xử lý, đào tạo và suy luận, được tích hợp với các công cụ CI / CD. Điều này cho phép chúng tôi định cấu hình hình ảnh Docker tùy chỉnh của mình và đẩy lên Đăng ký container đàn hồi Amazon (Amazon ECR) để sẵn sàng sử dụng.
  • Đường dẫn SageMaker xác định các bước chuẩn bị dữ liệu, đào tạo, đánh giá mô hình và đăng ký mô hình. Điều này chuẩn bị cho chúng tôi sẵn sàng MLOps khi dự án ML đi vào sản xuất.
  • Các tài nguyên hữu ích khác, chẳng hạn như kho lưu trữ Git để kiểm soát phiên bản mã, nhóm mô hình chứa các phiên bản mô hình, trình kích hoạt thay đổi mã cho đường ống xây dựng mô hình và trình kích hoạt dựa trên sự kiện cho đường ống triển khai mô hình.

Bạn có thể sử dụng mã hạt giống SageMaker để tạo các dự án SageMaker tiêu chuẩn hoặc một mẫu cụ thể mà tổ chức của bạn đã tạo cho các thành viên trong nhóm. Trong bài đăng này, chúng tôi sử dụng tiêu chuẩn Mẫu MLOps để xây dựng hình ảnh, xây dựng mô hình và triển khai mô hình. Để biết thêm thông tin về cách tạo dự án trong Studio, hãy tham khảo Tạo dự án MLOps bằng Amazon SageMaker Studio.

Khám phá dữ liệu và xây dựng mã ML với SageMaker Studio Notebooks

Sổ ghi chép SageMaker Studio là sổ ghi chép cộng tác mà bạn có thể khởi chạy nhanh chóng vì bạn không cần thiết lập trước các phiên bản máy tính và lưu trữ tệp. Nhiều nhà khoa học dữ liệu thích sử dụng IDE dựa trên web này để phát triển mã ML, nhanh chóng gỡ lỗi API thư viện và khiến mọi thứ chạy với một mẫu dữ liệu nhỏ để xác thực tập lệnh đào tạo.

Trong máy tính xách tay Studio, bạn có thể sử dụng môi trường được tạo sẵn cho các khuôn khổ phổ biến như TensorFlow, PyTorch, Pandas và Scikit-Learn. Bạn có thể cài đặt các phần phụ thuộc vào hạt nhân được tạo sẵn hoặc xây dựng hình ảnh hạt nhân liên tục của riêng bạn. Để biết thêm thông tin, hãy tham khảo Cài đặt các thư viện và nhân bên ngoài trong Amazon SageMaker Studio. Máy tính xách tay Studio cũng cung cấp môi trường Python để kích hoạt các công việc đào tạo SageMaker, triển khai hoặc các dịch vụ AWS khác. Trong các phần sau, chúng tôi minh họa cách sử dụng sổ ghi chép Studio làm môi trường để kích hoạt các công việc đào tạo và triển khai.

SageMaker cung cấp một IDE mạnh mẽ; đó là một nền tảng ML mở, nơi các nhà khoa học dữ liệu có thể linh hoạt sử dụng môi trường phát triển ưa thích của họ. Đối với các nhà khoa học dữ liệu thích IDE cục bộ như PyCharm hoặc Visual Studio Code, bạn có thể sử dụng môi trường Python cục bộ để phát triển mã ML của mình và sử dụng SageMaker để đào tạo trong môi trường có thể mở rộng được quản lý. Để biết thêm thông tin, hãy xem Chạy công việc TensorFlow của bạn trên Amazon SageMaker với IDE PyCharm. Sau khi có một mô hình vững chắc, bạn có thể áp dụng các phương pháp hay nhất về MLOps với SageMaker.

Hiện tại, SageMaker cũng cung cấp Các phiên bản máy tính xách tay SageMaker là giải pháp kế thừa của chúng tôi cho môi trường Máy tính xách tay Jupyter. Bạn có thể linh hoạt chạy lệnh xây dựng Docker và sử dụng chế độ cục bộ SageMaker để đào tạo trên phiên bản máy tính xách tay của bạn. Chúng tôi cũng cung cấp mã mẫu cho PaddleOCR trong kho mã của chúng tôi: ./train_and_deploy/notebook.ipynb.

Tạo hình ảnh tùy chỉnh với mẫu dự án SageMaker

SageMaker sử dụng rộng rãi các vùng chứa Docker cho các tác vụ xây dựng và thời gian chạy. Bạn có thể chạy vùng chứa của riêng mình với SageMaker một cách dễ dàng. Xem thêm chi tiết kỹ thuật tại Sử dụng các thuật toán đào tạo của riêng bạn.

Tuy nhiên, là một nhà khoa học dữ liệu, việc xây dựng một vùng chứa có thể không đơn giản. Các dự án của SageMaker cung cấp một cách đơn giản để bạn quản lý các phụ thuộc tùy chỉnh thông qua đường ống CI / CD xây dựng hình ảnh. Khi bạn sử dụng dự án SageMaker, bạn có thể cập nhật hình ảnh đào tạo bằng Dockerfile vùng chứa tùy chỉnh của mình. Để biết hướng dẫn từng bước, hãy tham khảo Tạo các dự án Amazon SageMaker với đường ống CI / CD xây dựng hình ảnh. Với cấu trúc được cung cấp trong mẫu, bạn có thể sửa đổi mã được cung cấp trong kho lưu trữ này để tạo vùng chứa huấn luyện PaddleOCR.

Đối với bài đăng này, chúng tôi giới thiệu sự đơn giản của việc xây dựng một hình ảnh tùy chỉnh để xử lý, đào tạo và suy luận. Kho lưu trữ GitHub chứa ba thư mục:

Các dự án này tuân theo một cấu trúc tương tự. Lấy hình ảnh vùng chứa đào tạo làm ví dụ; các image-build-train/ kho chứa các tệp sau:

  • Tệp codebuild-buildspec.yml, được sử dụng để cấu hình Xây dựng mã AWS để hình ảnh có thể được tạo và đẩy lên Amazon ECR.
  • Dockerfile được sử dụng cho bản dựng Docker, chứa tất cả các phụ thuộc và mã đào tạo.
  • Điểm vào train.py cho tập lệnh huấn luyện, với tất cả các siêu tham số (chẳng hạn như tốc độ học và kích thước lô) có thể được định cấu hình làm đối số. Các đối số này được chỉ định khi bạn bắt đầu công việc đào tạo.
  • Các phụ thuộc.

Khi bạn đẩy mã vào kho lưu trữ tương ứng, nó sẽ kích hoạt Đường ống dẫn mã AWS để xây dựng vùng chứa đào tạo cho bạn. Hình ảnh vùng chứa tùy chỉnh được lưu trữ trong kho lưu trữ Amazon ECR, như được minh họa trong hình trước. Một quy trình tương tự được áp dụng để tạo ra hình ảnh suy luận.

Đào tạo mô hình với SDK đào tạo SageMaker

Sau khi mã thuật toán của bạn được xác thực và đóng gói vào một vùng chứa, bạn có thể sử dụng công việc đào tạo SageMaker để cung cấp một môi trường được quản lý để đào tạo mô hình. Môi trường này là tạm thời, có nghĩa là bạn có thể có các tài nguyên máy tính riêng biệt, an toàn (chẳng hạn như GPU) hoặc môi trường phân tán Đa GPU để chạy mã của mình. Khi quá trình đào tạo hoàn tất, SageMaker lưu các tạo tác mô hình kết quả vào một Dịch vụ lưu trữ đơn giản của Amazon (Amazon S3) vị trí mà bạn chỉ định. Tất cả dữ liệu nhật ký và siêu dữ liệu vẫn tồn tại trên Bảng điều khiển quản lý AWS, Studio và amazoncloudwatch.

Công việc đào tạo bao gồm một số phần thông tin quan trọng:

  • URL của nhóm S3 nơi bạn đã lưu trữ dữ liệu đào tạo
  • URL của nhóm S3 nơi bạn muốn lưu trữ kết quả đầu ra của công việc
  • Các tài nguyên máy tính được quản lý mà bạn muốn SageMaker sử dụng để đào tạo mô hình
  • Đường dẫn Amazon ECR nơi lưu trữ vùng chứa đào tạo

Để biết thêm thông tin về các công việc đào tạo, xem Mô hình xe lửa. Mã ví dụ cho công việc đào tạo có sẵn tại Experi-train-notebook.ipynb.

SageMaker làm cho các siêu tham số trong một CreateTrainingJob yêu cầu có sẵn trong vùng chứa Docker trong /opt/ml/input/config/hyperparameters.json tập tin.

Chúng tôi sử dụng vùng chứa đào tạo tùy chỉnh làm điểm nhập và chỉ định môi trường GPU cho cơ sở hạ tầng. Tất cả các siêu tham số có liên quan đều được chi tiết hóa dưới dạng tham số, cho phép chúng tôi theo dõi từng cấu hình công việc riêng lẻ và so sánh chúng với theo dõi thử nghiệm.

Bởi vì quy trình khoa học dữ liệu rất thiên về nghiên cứu, nên thường có nhiều thử nghiệm chạy song song. Điều này yêu cầu một cách tiếp cận theo dõi tất cả các thử nghiệm khác nhau, các thuật toán khác nhau và các tập dữ liệu và siêu tham số có khả năng khác nhau đã thử. Thử nghiệm Amazon SageMaker cho phép bạn tổ chức, theo dõi, so sánh và đánh giá các thử nghiệm ML của mình. Chúng tôi cũng chứng minh điều này trong Experi-train-notebook.ipynb. Để biết thêm chi tiết, hãy tham khảo Quản lý Học máy với Thử nghiệm Amazon SageMaker.

Triển khai mô hình để phục vụ mô hình

Đối với việc triển khai, đặc biệt là phục vụ mô hình thời gian thực, nhiều nhà khoa học dữ liệu có thể khó thực hiện nếu không có sự trợ giúp từ các nhóm vận hành. SageMaker làm cho việc triển khai mô hình được đào tạo của bạn vào sản xuất trở nên đơn giản với SDK Python của SageMaker. Bạn có thể triển khai mô hình của mình cho các dịch vụ lưu trữ của SageMaker và nhận một điểm cuối để sử dụng cho việc suy luận trong thời gian thực.

Trong nhiều tổ chức, các nhà khoa học dữ liệu có thể không chịu trách nhiệm duy trì cơ sở hạ tầng điểm cuối. Tuy nhiên, việc kiểm tra mô hình của bạn như một điểm cuối và đảm bảo các hành vi dự đoán chính xác thực sự là trách nhiệm của các nhà khoa học dữ liệu. Do đó, SageMaker đã đơn giản hóa các nhiệm vụ triển khai bằng cách thêm một bộ công cụ và SDK cho việc này.

Đối với trường hợp sử dụng trong bài đăng, chúng tôi muốn có khả năng thời gian thực, tương tác, độ trễ thấp. Suy luận thời gian thực là lý tưởng cho khối lượng công việc suy luận này. Tuy nhiên, có nhiều lựa chọn thích ứng với từng yêu cầu cụ thể. Để biết thêm thông tin, hãy tham khảo Triển khai các mô hình để suy luận.

Để triển khai hình ảnh tùy chỉnh, các nhà khoa học dữ liệu có thể sử dụng SageMaker SDK, được minh họa tại

thử nghiệm-triển khai-notebook.ipynb.

Trong tạp chí create_model yêu cầu, định nghĩa vùng chứa bao gồm ModelDataUrl tham số, xác định vị trí Amazon S3 nơi lưu trữ các tạo tác mô hình. SageMaker sử dụng thông tin này để xác định nơi sao chép các tạo tác mô hình. Nó sao chép các hiện vật sang /opt/ml/model thư mục để sử dụng bởi mã suy luận của bạn. Các servepredictor.py là điểm đầu vào để phân phát, với tạo tác mô hình được tải khi bạn bắt đầu triển khai. Để biết thêm thông tin, hãy xem Sử dụng mã suy luận của riêng bạn với các dịch vụ lưu trữ.

Sắp xếp quy trình làm việc của bạn với SageMaker Pipelines

Bước cuối cùng là gói mã của bạn dưới dạng quy trình làm việc ML từ đầu đến cuối và áp dụng các phương pháp hay nhất về MLOps. Trong SageMaker, khối lượng công việc xây dựng mô hình, một đồ thị vòng có hướng (DAG), được quản lý bởi SageMaker Pipelines. Pipelines là một dịch vụ được quản lý hoàn toàn hỗ trợ điều phối và theo dõi dòng dữ liệu. Ngoài ra, vì Pipelines được tích hợp với SageMaker Python SDK, bạn có thể tạo lập trình các đường ống của mình bằng giao diện Python cấp cao mà chúng tôi đã sử dụng trước đây trong bước đào tạo.

Chúng tôi cung cấp một ví dụ về mã đường ống để minh họa việc triển khai tại đường dẫn.

Đường ống bao gồm bước tiền xử lý để tạo tập dữ liệu, bước đào tạo, bước điều kiện và bước đăng ký mô hình. Vào cuối mỗi lần chạy đường ống, các nhà khoa học dữ liệu có thể muốn đăng ký mô hình của họ để kiểm soát phiên bản và triển khai mô hình hoạt động tốt nhất. Sổ đăng ký mô hình SageMaker cung cấp một vị trí trung tâm để quản lý các phiên bản mô hình, mô hình danh mục và kích hoạt triển khai mô hình tự động với trạng thái phê duyệt của một mô hình cụ thể. Để biết thêm chi tiết, hãy tham khảo Đăng ký và Triển khai Mô hình với Sổ đăng ký Mô hình.

Trong một hệ thống ML, điều phối quy trình làm việc tự động giúp ngăn chặn sự suy giảm hiệu suất của mô hình, nói cách khác là sự trôi dạt mô hình. Việc phát hiện sớm và chủ động các sai lệch về dữ liệu cho phép bạn thực hiện các hành động sửa chữa, chẳng hạn như đào tạo lại các mô hình. Bạn có thể kích hoạt đường dẫn SageMaker để đào tạo lại phiên bản mới của mô hình sau khi phát hiện thấy sai lệch. Kích hoạt của một đường ống cũng có thể được xác định bởi Giám sát mô hình Amazon SageMaker, trong đó liên tục giám sát chất lượng của các mô hình trong sản xuất. Với khả năng thu thập dữ liệu để ghi lại thông tin, Model Monitor hỗ trợ theo dõi dữ liệu và chất lượng mô hình, độ chệch và theo dõi độ lệch phân bổ tính năng. Để biết thêm chi tiết, hãy xem Giám sát các mô hình về chất lượng, độ chệch và khả năng giải thích của dữ liệu và mô hình.

Kết luận

Trong bài đăng này, chúng tôi đã minh họa cách chạy khung công tác PaddleOCR trên SageMaker cho các tác vụ OCR. Để giúp các nhà khoa học dữ liệu dễ dàng tham gia SageMaker, chúng tôi đã đi qua vòng đời phát triển ML, từ xây dựng thuật toán, đào tạo, lưu trữ mô hình như một dịch vụ web để suy luận trong thời gian thực. Bạn có thể sử dụng mã mẫu mà chúng tôi cung cấp để di chuyển một khuôn khổ tùy ý sang nền tảng SageMaker. Hãy dùng thử cho dự án ML của bạn và cho chúng tôi biết những câu chuyện thành công của bạn.


Về các tác giả

Tích hợp PaddleOCR với các Dự án Amazon SageMaker dành cho MLOps để thực hiện nhận dạng ký tự quang học trên các tài liệu nhận dạng PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.Junyi (Jackie) LIU là Nhà khoa học ứng dụng cao cấp tại AWS. Cô có nhiều năm kinh nghiệm làm việc trong lĩnh vực máy học. Cô có kinh nghiệm thực tế phong phú trong việc phát triển và triển khai các giải pháp xây dựng mô hình học máy trong các thuật toán dự đoán chuỗi cung ứng, hệ thống khuyến nghị quảng cáo, OCR và lĩnh vực NLP.

Tích hợp PaddleOCR với các Dự án Amazon SageMaker dành cho MLOps để thực hiện nhận dạng ký tự quang học trên các tài liệu nhận dạng PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.Yến Vệ Thôi, Tiến sĩ, là Kiến trúc sư Giải pháp Chuyên gia về Học máy tại AWS. Anh bắt đầu nghiên cứu máy học tại IRISA (Viện Nghiên cứu Khoa học Máy tính và Hệ thống Ngẫu nhiên), và có nhiều năm kinh nghiệm xây dựng các ứng dụng công nghiệp hỗ trợ trí tuệ nhân tạo trong thị giác máy tính, xử lý ngôn ngữ tự nhiên và dự đoán hành vi người dùng trực tuyến. Tại AWS, anh ấy chia sẻ kiến ​​thức chuyên môn về miền và giúp khách hàng khai phá tiềm năng kinh doanh cũng như thúc đẩy kết quả có thể thực hiện được với công nghệ máy học trên quy mô lớn. Ngoài công việc, anh ấy thích đọc sách và đi du lịch.

Tích hợp PaddleOCR với các Dự án Amazon SageMaker dành cho MLOps để thực hiện nhận dạng ký tự quang học trên các tài liệu nhận dạng PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.Yi-An CHEN là Nhà phát triển phần mềm tại Amazon Lab 126. Cô có hơn 10 năm kinh nghiệm trong việc phát triển các sản phẩm dựa trên công nghệ máy học trên nhiều lĩnh vực khác nhau, bao gồm cá nhân hóa, xử lý ngôn ngữ tự nhiên và thị giác máy tính. Ngoài giờ làm việc, cô ấy thích chạy bộ và đạp xe.

Dấu thời gian:

Thêm từ Học máy AWS