Chỉ định và trích xuất thông tin từ tài liệu bằng tính năng Truy vấn mới trong Amazon Textract PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Chỉ định và trích xuất thông tin từ tài liệu bằng tính năng Truy vấn mới trong Amazon Textract

Văn bản Amazon là một dịch vụ máy học (ML) tự động trích xuất văn bản, chữ viết tay và dữ liệu từ bất kỳ tài liệu hoặc hình ảnh nào. Amazon Textract hiện cung cấp sự linh hoạt để chỉ định dữ liệu bạn cần trích xuất từ ​​tài liệu bằng cách sử dụng tính năng Truy vấn mới trong API phân tích tài liệu. Bạn không cần phải biết cấu trúc của dữ liệu trong tài liệu (bảng, biểu mẫu, trường ngụ ý, dữ liệu lồng nhau) hoặc lo lắng về các biến thể giữa các phiên bản và định dạng tài liệu.

Trong bài đăng này, chúng tôi thảo luận về các chủ đề sau:

  • Câu chuyện thành công từ khách hàng AWS và lợi ích của tính năng Truy vấn mới
  • Cách API phân tích truy vấn tài liệu giúp trích xuất thông tin từ tài liệu
  • Hướng dẫn về bảng điều khiển Amazon Textract
  • Mã ví dụ để sử dụng API phân tích truy vấn tài liệu
  • Cách xử lý phản hồi với thư viện trình phân tích cú pháp Amazon Textract

Lợi ích của tính năng Truy vấn mới

Các giải pháp OCR truyền thống đấu tranh để trích xuất dữ liệu một cách chính xác từ hầu hết các tài liệu bán cấu trúc và phi cấu trúc do có sự khác biệt đáng kể về cách trình bày dữ liệu trên nhiều phiên bản và định dạng của các tài liệu này. Bạn cần triển khai mã hậu xử lý tùy chỉnh hoặc xem xét thủ công thông tin được trích xuất từ ​​các tài liệu này. Với tính năng Truy vấn, bạn có thể chỉ định thông tin mình cần dưới dạng câu hỏi ngôn ngữ tự nhiên (ví dụ: “Tên khách hàng là gì”) và nhận thông tin chính xác (“John Doe”) như một phần của phản hồi API. Tính năng này sử dụng kết hợp các mô hình hình ảnh, không gian và ngôn ngữ để trích xuất thông tin bạn tìm kiếm với độ chính xác cao. Tính năng Truy vấn được đào tạo trước trên nhiều loại tài liệu bán cấu trúc và phi cấu trúc. Một số ví dụ bao gồm bảng sao kê lương, bảng sao kê ngân hàng, W-2, mẫu đơn xin vay, giấy thế chấp, thẻ vắc xin và bảo hiểm.

"Amazon Textract cho phép chúng tôi tự động hóa nhu cầu xử lý tài liệu của khách hàng. Với tính năng Truy vấn, chúng tôi sẽ có thể trích xuất dữ liệu từ nhiều loại tài liệu với độ linh hoạt và độ chính xác cao hơn nữa," Robert Jansen, Giám đốc điều hành tại TekStream Solutions cho biết. 'Chúng tôi coi đây là một chiến thắng lớn về năng suất cho các khách hàng doanh nghiệp của chúng tôi, những khách hàng sẽ có thể sử dụng khả năng Truy vấn như một phần của giải pháp IDP của chúng tôi để nhanh chóng lấy thông tin quan trọng ra khỏi tài liệu của họ."

"Amazon Textract cho phép chúng tôi trích xuất văn bản cũng như các phần tử có cấu trúc như Biểu mẫu và Bảng từ hình ảnh với độ chính xác cao. Amazon Textract Queries đã giúp chúng tôi cải thiện đáng kể chất lượng trích xuất thông tin từ một số tài liệu quan trọng trong kinh doanh như bảng dữ liệu an toàn hoặc thông số kỹ thuật vật liệu" Thorsten Warnecke, Hiệu trưởng cho biết | Trưởng phòng PC Analytics, Tư vấn quản lý Camelot. 'Hệ thống truy vấn ngôn ngữ tự nhiên cung cấp tính linh hoạt và độ chính xác cao, điều này đã giảm tải cho quá trình xử lý sau của chúng tôi và cho phép chúng tôi thêm các tài liệu mới vào các công cụ trích xuất dữ liệu của mình nhanh hơn."

Cách API phân tích truy vấn tài liệu giúp trích xuất thông tin từ tài liệu

Các công ty đã tăng cường áp dụng các nền tảng kỹ thuật số, đặc biệt là trong bối cảnh đại dịch COVID-19. Hầu hết các tổ chức hiện cung cấp một phương thức kỹ thuật số để có được các dịch vụ và sản phẩm của họ bằng cách sử dụng điện thoại thông minh và các thiết bị di động khác, mang lại sự linh hoạt cho người dùng nhưng cũng tăng thêm quy mô mà tại đó các tài liệu kỹ thuật số cần được xem xét, xử lý và phân tích. Trong một số khối lượng công việc, ví dụ: tài liệu thế chấp, thẻ tiêm chủng, hồ sơ thanh toán, thẻ bảo hiểm và các tài liệu khác phải được phân tích kỹ thuật số, thì mức độ phức tạp của việc trích xuất dữ liệu có thể trở nên trầm trọng hơn theo cấp số nhân vì những tài liệu này thiếu định dạng chuẩn hoặc có những thay đổi đáng kể về định dạng dữ liệu trên các phiên bản khác nhau của tài liệu.

Ngay cả các giải pháp OCR mạnh mẽ cũng phải vật lộn để trích xuất dữ liệu một cách chính xác từ các tài liệu này và bạn có thể phải thực hiện quá trình hậu xử lý tùy chỉnh cho các tài liệu này. Điều này bao gồm ánh xạ các biến thể có thể có của khóa biểu mẫu với tên trường gốc của khách hàng hoặc bao gồm học máy tùy chỉnh để xác định thông tin cụ thể trong tài liệu phi cấu trúc.

API truy vấn tài liệu phân tích mới trong Amazon Textract có thể trả lời các câu hỏi được viết bằng ngôn ngữ tự nhiên như "Lãi suất là bao nhiêu?" và thực hiện phân tích AI và ML mạnh mẽ trên tài liệu để tìm ra thông tin mong muốn và trích xuất từ ​​tài liệu mà không cần xử lý hậu kỳ. Tính năng Truy vấn không yêu cầu bất kỳ đào tạo mô hình tùy chỉnh hoặc thiết lập các mẫu hoặc cấu hình. Bạn có thể nhanh chóng bắt đầu bằng cách tải lên tài liệu của mình và chỉ định câu hỏi về những tài liệu đó thông qua bảng điều khiển Amazon Textract, Giao diện dòng lệnh AWS (AWS CLI) hoặc AWS SDK.

Trong các phần tiếp theo của bài đăng này, chúng tôi đi qua các ví dụ chi tiết về cách sử dụng chức năng mới này trên các trường hợp sử dụng khối lượng công việc phổ biến và cách sử dụng API phân tích truy vấn tài liệu để thêm sự nhanh nhẹn vào quá trình số hóa khối lượng công việc của bạn.

Sử dụng tính năng Truy vấn trên bảng điều khiển Amazon Textract

Trước khi bắt đầu với API và các mẫu mã, hãy xem lại bảng điều khiển Amazon Textract. Hình ảnh sau đây cho thấy một ví dụ về thẻ tiêm chủng trên Truy vấn cho API phân tích tài liệu trên bảng điều khiển Amazon Textract. Sau khi bạn tải tài liệu lên bảng điều khiển Amazon Textract, hãy chọn Truy vấn trong Định cấu hình tài liệu tiết diện. Sau đó, bạn có thể thêm các truy vấn dưới dạng câu hỏi ngôn ngữ tự nhiên. Sau khi bạn thêm tất cả các truy vấn của mình, hãy chọn Áp dụng cấu hình. Câu trả lời cho các câu hỏi nằm trên Truy vấn tab.

Chỉ định và trích xuất thông tin từ tài liệu bằng tính năng Truy vấn mới trong Amazon Textract PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Mã ví dụ

Trong phần này, chúng tôi giải thích cách gọi API phân tích tài liệu với tham số Truy vấn để nhận câu trả lời cho các câu hỏi ngôn ngữ tự nhiên về tài liệu. Tài liệu đầu vào có định dạng mảng byte hoặc nằm trong Dịch vụ lưu trữ đơn giản của Amazon (Amazon S3). Bạn chuyển các byte hình ảnh vào một thao tác API Textract của Amazon bằng cách sử dụng thuộc tính Bytes. Ví dụ, bạn có thể sử dụng Bytes thuộc tính để chuyển một tài liệu được tải từ hệ thống tệp cục bộ. Các byte hình ảnh được chuyển bằng cách sử dụng Bytes thuộc tính phải được mã hóa base64. Mã của bạn có thể không cần mã hóa byte tệp tài liệu nếu bạn đang sử dụng AWS SDK để gọi các hoạt động API Textract của Amazon. Ngoài ra, bạn có thể chuyển các hình ảnh được lưu trữ trong bộ chứa S3 sang hoạt động API Textract của Amazon bằng cách sử dụng S3Object bất động sản. Các tài liệu được lưu trữ trong nhóm S3 không cần phải được mã hóa base64.

Bạn có thể sử dụng tính năng Truy vấn để nhận câu trả lời từ các loại tài liệu khác nhau như hồ sơ thanh toán, thẻ tiêm chủng, tài liệu thế chấp, bảng sao kê ngân hàng, biểu mẫu W-2, biểu mẫu 1099 và các loại tài liệu khác. Trong các phần tiếp theo, chúng tôi xem xét một số tài liệu này và chỉ ra cách hoạt động của tính năng Truy vấn.

Cuống phiếu lương

Trong ví dụ này, chúng tôi hướng dẫn các bước để phân tích một paystub bằng cách sử dụng tính năng Truy vấn, như được hiển thị trong hình ảnh ví dụ sau.

Chỉ định và trích xuất thông tin từ tài liệu bằng tính năng Truy vấn mới trong Amazon Textract PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Chúng tôi sử dụng mã Python mẫu sau:

import boto3
import json #create a Textract Client
textract = boto3.client('textract') image_filename = "paystub.jpg" response = None
with open(image_filename, 'rb') as document: imageBytes = bytearray(document.read()) # Call Textract AnalyzeDocument by passing a document from local disk
response = textract.analyze_document( Document={'Bytes': imageBytes}, FeatureTypes=["QUERIES"], QueriesConfig={ "Queries": [{ "Text": "What is the year to date gross pay", "Alias": "PAYSTUB_YTD_GROSS" }, { "Text": "What is the current gross pay?", "Alias": "PAYSTUB_CURRENT_GROSS" }] })

Đoạn mã sau là lệnh AWS CLI mẫu:

aws textract analyze-document —document '{"S3Object":{"Bucket":"your-s3-bucket","Name":"paystub.jpg"}}' —feature-types '["QUERIES"]' —queries-config '{"Queries":[{"Text":"What is the year to date gross pay", "Alias": "PAYSTUB_YTD_GROSS"}]}' 

Hãy phân tích phản hồi mà chúng tôi nhận được cho hai truy vấn mà chúng tôi đã chuyển đến API phân tích tài liệu trong ví dụ trước. Phản hồi sau đã được cắt bớt để chỉ hiển thị các phần có liên quan:

{ "BlockType":"QUERY", "Id":"cbbba2fa-45be-452b-895b-adda98053153", #id of first QUERY "Relationships":[ { "Type":"ANSWER", "Ids":[ "f2db310c-eaa6-481d-8d18-db0785c33d38" #id of first QUERY_RESULT ] } ], "Query":{ "Text":"What is the year to date gross pay", #First Query "Alias":"PAYSTUB_YTD_GROSS" } }, { "BlockType":"QUERY_RESULT", "Confidence":87.0, "Text":"23,526.80", #Answer to the first Query "Geometry":{...}, "Id":"f2db310c-eaa6-481d-8d18-db0785c33d38" #id of first QUERY_RESULT }, { "BlockType":"QUERY", "Id":"4e2a17f0-154f-4847-954c-7c2bf2670c52", #id of second QUERY "Relationships":[ { "Type":"ANSWER", "Ids":[ "350ab92c-4128-4aab-a78a-f1c6f6718959"#id of second QUERY_RESULT ] } ], "Query":{ "Text":"What is the current gross pay?", #Second Query "Alias":"PAYSTUB_CURRENT_GROSS" } }, { "BlockType":"QUERY_RESULT", "Confidence":95.0, "Text":"$ 452.43", #Answer to the Second Query "Geometry":{...}, "Id":"350ab92c-4128-4aab-a78a-f1c6f6718959" #id of second QUERY_RESULT }

Câu trả lời có một BlockType of QUERY hiển thị câu hỏi đã được hỏi và Relationships phần có ID cho khối có câu trả lời. Câu trả lời là trong BlockType of QUERY_RESULT. Bí danh được chuyển vào làm đầu vào cho API tài liệu phân tích sẽ được trả về như một phần của phản hồi và có thể được sử dụng để gắn nhãn câu trả lời.

Chúng tôi sử dụng Trình phân tích cú pháp phản hồi Textract của Amazon để chỉ trích xuất các câu hỏi, bí danh và câu trả lời tương ứng cho những câu hỏi đó:

import trp.trp2 as t2 d = t2.TDocumentSchema().load(response)
page = d.pages[0] # get_query_answers returns a list of [query, alias, answer]
query_answers = d.get_query_answers(page=page)
for x in query_answers: print(f"{image_filename},{x[1]},{x[2]}") from tabulate import tabulate
print(tabulate(query_answers, tablefmt="github"))

Đoạn mã trước trả về các kết quả sau:

|------------------------------------|-----------------------|-----------|
| What is the current gross pay? | PAYSTUB_CURRENT_GROSS | $ 452.43 |
| What is the year to date gross pay | PAYSTUB_YTD_GROSS | 23,526.80 |

Bạn có thể tìm thấy nhiều câu hỏi hơn và mã đầy đủ trong sổ tay trên Repo GitHub.

Giấy thế chấp

API truy vấn tài liệu phân tích cũng hoạt động tốt với các ghi chú thế chấp như sau.

Chỉ định và trích xuất thông tin từ tài liệu bằng tính năng Truy vấn mới trong Amazon Textract PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Quá trình gọi API và xử lý kết quả giống như ví dụ trước. Bạn có thể tìm thấy ví dụ về mã đầy đủ trên Repo GitHub.

Đoạn mã sau hiển thị các câu trả lời mẫu thu được bằng cách sử dụng API:

|------------------------------------------------------------|----------------------------------|---------------|
| When is this document dated? | MORTGAGE_NOTE_DOCUMENT_DATE | March 4, 2022 |
| What is the note date? | MORTGAGE_NOTE_DATE | March 4, 2022 |
| When is the Maturity date the borrower has to pay in full? | MORTGAGE_NOTE_MATURITY_DATE | April, 2032 |
| What is the note city and state? | MORTGAGE_NOTE_CITY_STATE | Anytown, ZZ |
| what is the yearly interest rate? | MORTGAGE_NOTE_YEARLY_INTEREST | 4.150% |
| Who is the lender? | MORTGAGE_NOTE_LENDER | AnyCompany |
| When does payments begin? | MORTGAGE_NOTE_BEGIN_PAYMENTS | April, 2022 |
| What is the beginning date of payment? | MORTGAGE_NOTE_BEGIN_DATE_PAYMENT | April, 2022 |
| What is the initial monthly payments? | MORTGAGE_NOTE_MONTHLY_PAYMENTS | $ 2500 |
| What is the interest rate? | MORTGAGE_NOTE_INTEREST_RATE | 4.150% |
| What is the principal amount borrower has to pay? | MORTGAGE_NOTE_PRINCIPAL_PAYMENT | $ 500,000 |

Thẻ tiêm chủng

Tính năng Truy vấn Textract của Amazon cũng hoạt động rất tốt để trích xuất thông tin từ thẻ tiêm chủng hoặc thẻ giống với nó, như trong ví dụ sau.

Chỉ định và trích xuất thông tin từ tài liệu bằng tính năng Truy vấn mới trong Amazon Textract PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Quá trình gọi API và phân tích cú pháp kết quả giống như được sử dụng cho một paystub. Sau khi chúng tôi xử lý phản hồi, chúng tôi nhận được thông tin sau:

|------------------------------------------------------------|--------------------------------------|--------------|
| What is the patients first name | PATIENT_FIRST_NAME | Major |
| What is the patients last name | PATIENT_LAST_NAME | Mary |
| Which clinic site was the 1st dose COVID-19 administrated? | VACCINATION_FIRST_DOSE_CLINIC_SITE | XYZ |
| Who is the manufacturer for 1st dose of COVID-19? | VACCINATION_FIRST_DOSE_MANUFACTURER | Pfizer |
| What is the date for the 2nd dose covid-19? | VACCINATION_SECOND_DOSE_DATE | 2/8/2021 |
| What is the patient number | PATIENT_NUMBER | 012345abcd67 |
| Who is the manufacturer for 2nd dose of COVID-19? | VACCINATION_SECOND_DOSE_MANUFACTURER | Pfizer |
| Which clinic site was the 2nd dose covid-19 administrated? | VACCINATION_SECOND_DOSE_CLINIC_SITE | CVS |
| What is the lot number for 2nd dose covid-19? | VACCINATION_SECOND_DOSE_LOT_NUMBER | BB5678 |
| What is the date for the 1st dose covid-19? | VACCINATION_FIRST_DOSE_DATE | 1/18/21 |
| What is the lot number for 1st dose covid-19? | VACCINATION_FIRST_DOSE_LOT_NUMBER | AA1234 |
| What is the MI? | MIDDLE_INITIAL | M |

Mã đầy đủ có thể được tìm thấy trong sổ ghi chép trên Repo GitHub.

Thẻ bảo hiểm

Tính năng Truy vấn cũng hoạt động tốt với các thẻ bảo hiểm như sau.

Chỉ định và trích xuất thông tin từ tài liệu bằng tính năng Truy vấn mới trong Amazon Textract PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Quá trình gọi API và xử lý kết quả giống như đã trình bày trước đó. Ví dụ về mã đầy đủ có sẵn trong sổ ghi chép trên Repo GitHub.

Sau đây là các câu trả lời mẫu thu được bằng cách sử dụng API:

|-------------------------------------|-----------------------------------|---------------|
| What is the insured name? | INSURANCE_CARD_NAME | Jacob Michael |
| What is the level of benefits? | INSURANCE_CARD_LEVEL_BENEFITS | SILVER |
| What is medical insurance provider? | INSURANCE_CARD_PROVIDER | Anthem |
| What is the OOP max? | INSURANCE_CARD_OOP_MAX | $6000/$12000 |
| What is the effective date? | INSURANCE_CARD_EFFECTIVE_DATE | 11/02/2021 |
| What is the office visit copay? | INSURANCE_CARD_OFFICE_VISIT_COPAY | $55/0% |
| What is the specialist visit copay? | INSURANCE_CARD_SPEC_VISIT_COPAY | $65/0% |
| What is the member id? | INSURANCE_CARD_MEMBER_ID | XZ 9147589652 |
| What is the plan type? | INSURANCE_CARD_PLAN_TYPE | Pathway X-EPO |
| What is the coinsurance amount? | INSURANCE_CARD_COINSURANCE | 30% |

Các phương pháp hay nhất để tạo truy vấn

Khi tạo các truy vấn của bạn, hãy xem xét các phương pháp hay nhất sau:

  • Nói chung, hãy hỏi một câu hỏi ngôn ngữ tự nhiên bắt đầu bằng “Cái gì”, “Ở đâu” hoặc “Là ai”. Ngoại lệ là khi bạn đang cố gắng trích xuất các cặp khóa-giá trị tiêu chuẩn, trong trường hợp đó, bạn có thể chuyển tên khóa dưới dạng truy vấn.
  • Tránh những câu hỏi sai ngữ pháp hoặc sai ngữ pháp, vì những câu hỏi này có thể dẫn đến những câu trả lời không mong muốn. Ví dụ: một truy vấn không hợp lệ là "Khi nào?" trong khi một câu hỏi được hình thành tốt là "Liều vắc-xin đầu tiên được tiêm khi nào?"
  • Nếu có thể, hãy sử dụng các từ trong tài liệu để tạo truy vấn. Mặc dù tính năng Truy vấn cố gắng so khớp từ viết tắt và từ đồng nghĩa với một số thuật ngữ phổ biến trong ngành như “SSN”, “ID thuế” và “Số an sinh xã hội”, việc sử dụng ngôn ngữ trực tiếp từ tài liệu sẽ cải thiện kết quả. Ví dụ: nếu tài liệu nói “tiến độ công việc”, hãy cố gắng tránh sử dụng các biến thể như “tiến độ dự án”, “tiến độ chương trình” hoặc “trạng thái công việc”.
  • Tạo một truy vấn có chứa các từ từ cả tiêu đề hàng và tiêu đề cột. Ví dụ: trong ví dụ về thẻ tiêm chủng trước đó, để biết ngày tiêm chủng thứ hai, bạn có thể đóng khung câu hỏi là "Liều thứ hai được tiêm vào ngày nào?"
  • Các câu trả lời dài làm tăng độ trễ phản hồi và có thể dẫn đến hết thời gian. Cố gắng đặt những câu hỏi có câu trả lời ít hơn 100 từ.
  • Chỉ chuyển tên khóa vì câu hỏi hoạt động khi cố gắng trích xuất các cặp khóa-giá trị tiêu chuẩn từ một biểu mẫu. Chúng tôi khuyên bạn nên đóng khung các câu hỏi đầy đủ cho tất cả các trường hợp sử dụng trích xuất khác.
  • Càng cụ thể càng tốt. Ví dụ:
    • Khi tài liệu có nhiều phần (chẳng hạn như “Bên vay” và “Bên vay”) và cả hai phần đều có trường gọi là “SSN”, hãy hỏi “SSN cho Bên vay là gì?” và "SSN cho Người cùng vay là gì?"
    • Khi tài liệu có nhiều trường liên quan đến ngày tháng, hãy cụ thể hóa bằng ngôn ngữ truy vấn và hỏi "Ngày tài liệu được ký vào là gì?" hoặc "Ngày sinh của ứng dụng là gì?" Tránh hỏi những câu hỏi mơ hồ như "Ngày tháng là ngày nào?"
  • Nếu bạn biết trước bố cục của tài liệu, hãy đưa ra các gợi ý về vị trí để cải thiện độ chính xác của kết quả. Ví dụ: hỏi "Ngày ở trên cùng là ngày nào?" hoặc "Ngày ở bên trái là gì?" hoặc "Ngày ở dưới cùng là ngày nào?"

Để biết thêm thông tin về tính năng Truy vấn, hãy tham khảo Textract tài liệu hướng dẫn.

Kết luận

Trong bài đăng này, chúng tôi đã cung cấp thông tin tổng quan về tính năng Truy vấn mới của Amazon Textract để nhanh chóng và dễ dàng truy xuất thông tin từ các tài liệu như bảng thanh toán, phiếu thế chấp, thẻ bảo hiểm và thẻ tiêm chủng dựa trên các câu hỏi ngôn ngữ tự nhiên. Chúng tôi cũng đã mô tả cách bạn có thể phân tích cú pháp JSON phản hồi.

Để biết thêm thông tin, xem Phân tích tài liệu hoặc xem bảng điều khiển Amazon Textract và dùng thử tính năng này.


Về các tác giả

Chỉ định và trích xuất thông tin từ tài liệu bằng tính năng Truy vấn mới trong Amazon Textract PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.Uday Narayanan là một Kiến trúc sư Giải pháp Sr. tại AWS. Anh ấy thích giúp khách hàng tìm ra các giải pháp sáng tạo cho những thách thức kinh doanh phức tạp. Các lĩnh vực trọng tâm cốt lõi của ông là phân tích dữ liệu, hệ thống dữ liệu lớn và máy học. Trong thời gian rảnh rỗi, anh ấy thích chơi thể thao, say sưa xem các chương trình truyền hình và đi du lịch.

Chỉ định và trích xuất thông tin từ tài liệu bằng tính năng Truy vấn mới trong Amazon Textract PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.Rafael Caixeta là một Kiến trúc sư Giải pháp Sr. tại AWS có trụ sở tại California. Anh ấy có hơn 10 năm kinh nghiệm phát triển kiến ​​trúc cho đám mây. Các lĩnh vực cốt lõi của anh ấy là không máy chủ, vùng chứa và học máy. Trong thời gian rảnh rỗi, anh ấy thích đọc sách viễn tưởng và đi du lịch khắp thế giới.

Chỉ định và trích xuất thông tin từ tài liệu bằng tính năng Truy vấn mới trong Amazon Textract PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái. Navneeth Nair là Giám đốc Sản phẩm Cấp cao, Kỹ thuật của nhóm Amazon Textract. Anh ấy tập trung vào việc xây dựng các dịch vụ dựa trên máy học cho khách hàng AWS.

Chỉ định và trích xuất thông tin từ tài liệu bằng tính năng Truy vấn mới trong Amazon Textract PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.Martin Schade là một SA Sản phẩm ML cao cấp với nhóm Amazon Textract. Ông có hơn 20 năm kinh nghiệm với các giải pháp công nghệ, kỹ thuật và kiến ​​trúc liên quan đến internet. Anh gia nhập AWS vào năm 2014, lần đầu tiên hướng dẫn một số khách hàng AWS lớn nhất về cách sử dụng các dịch vụ AWS có khả năng mở rộng và hiệu quả nhất, sau đó tập trung vào AI / ML với trọng tâm là thị giác máy tính. Hiện tại, anh ấy bị ám ảnh bởi việc trích xuất thông tin từ các tài liệu.

Dấu thời gian:

Thêm từ Học máy AWS