OCR để trích xuất dữ liệu từ sổ ghi phân phối PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

OCR để trích xuất dữ liệu từ các cổng phân phối



OCR để trích xuất dữ liệu từ các cổng phân phối

Tìm kiếm một giải pháp tự động hóa doanh nghiệp? Không cần tìm đâu xa!

.cta-first-blue {chuyển tiếp: tất cả 0.1s khối-bezier (0.4, 0, 0.2, 1) 0s; bán kính đường viền: 0px; font-weight: bold; font-size: 16px; chiều cao dòng: 24px; đệm: 12px 24px; nền: # 546fff; màu trắng; chiều cao: 56px; text-align: left; hiển thị: inline-flex; flex-hướng: hàng; -moz-box-align: trung tâm; align-các mục: trung tâm; khoảng cách giữa các chữ cái: 0px; box-sizing: border-box; border-width: 2px! important; border: solid # 546fff! important; } .cta-first-blue: hover {color: # 546fff; nền: trắng; quá trình chuyển đổi: tất cả 0.1s khối-bezier (0.4, 0, 0.2, 1) 0s; border-width: 2px! important; border: solid # 546fff! important; } .cta-second-black {chuyển tiếp: all 0.1s khối-bezier (0.4, 0, 0.2, 1) 0s; bán kính đường viền: 0px; font-weight: bold; font-size: 16px; chiều cao dòng: 24px; đệm: 12px 24px; nền: trắng; màu: # 333; chiều cao: 56px; text-align: left; hiển thị: inline-flex; flex-hướng: hàng; -moz-box-align: trung tâm; align-các mục: trung tâm; khoảng cách giữa các chữ cái: 0px; box-sizing: border-box; border-width: 2px! important; border: solid # 333! important; } .cta-second-black: hover {color: white; nền: # 333; quá trình chuyển đổi: tất cả 0.1s khối-bezier (0.4, 0, 0.2, 1) 0s; border-width: 2px! important; border: solid # 333! important; } .column1 {min-width: 240px; max-width: vừa với nội dung; padding-right: 4%; } .column2 {min-width: 200px; max-width: vừa với nội dung; } .cta-main {display: flex; }


Biên bản giao hàng là một tài liệu chính thức đi kèm với việc giao hàng và là một bản ghi về loại và số lượng của mặt hàng được giao. Một bản sao của ghi chú thường được trả lại cho người bán để làm bằng chứng cho việc giao hàng. Với sự số hóa ngày càng tăng của thị trường, việc quản lý dữ liệu tự động của các cổng giao hàng đã trở nên quan trọng. Hãy để chúng tôi xem cách các công cụ OCR có thể giúp trích xuất dữ liệu từ các cổng phân phối.

var contentTitle = “Mục lục”; // Đặt tiêu đề của bạn ở đây, để tránh tạo tiêu đề cho nó sau này var ToC = “

“+ ContentTitle +”

“; ToC + = “

“; var tocDiv = document.getElementById ('dynamicictocnative'); tocDiv.outerHTML = ToC;


Tầm quan trọng của khung giao hàng

Sổ giao hàng hoặc phiếu giao hàng tương tự như hóa đơn ở chỗ nó chứa thông tin chi tiết về người mua, thông tin chi tiết về người bán và loại mặt hàng được vận chuyển. Nó khác với hóa đơn ở chỗ không có bất kỳ thông tin nào về giá cả (thông thường). Còn được gọi là 'giấy gửi hàng' hoặc 'giấy nhận hàng', nó được phát hành bởi người bán, người gửi hàng, người vận chuyển hoặc người giao nhận hàng hóa và được gửi trực tiếp đến khách hàng và bất kỳ người trung gian nào chịu trách nhiệm đưa sản phẩm đến tay khách hàng.

Mặc dù không có quy tắc tiêu chuẩn hoặc quy tắc nghiêm ngặt nào về những gì một khung phân phối phải chứa, nhưng một khung phân phối thường bao gồm các thông tin sau:

  • Tên và địa chỉ của người bán / nhà cung cấp
  • Tên và địa chỉ của người mua / khách hàng
  • Ngày đặt hàng,
  • Ngày giao hàng,
  • Ngày giao hàng dự kiến
  • Số thứ tự / tên
  • Danh sách hàng hóa bao gồm trong giao hàng
  • Có thể giao hàng xa hơn, ví dụ: giao hàng 1 trong 3

Sổ giao hàng có thể chứa các chi tiết như số đăng ký và thông tin ngân hàng của người bán cho mục đích bảo hiểm hoặc cho khách hàng mới.

Sổ giao hàng có giá trị (hoặc phiếu giao hàng có giá trị) có thể ghi giá cả của sản phẩm, nhưng các ghi chú đó phải được đính kèm với hóa đơn.

Sự khác biệt giữa bảng kê giao hàng có giá trị và hóa đơn là hóa đơn trước đây không hợp lệ cho các mục đích tính thuế và chỉ là bằng chứng về việc giao hàng. Mặt khác, hóa đơn được sử dụng trong thuế và chứa dữ liệu thuế của người mua và người bán, giá của sản phẩm cũng như bất kỳ loại thuế GTGT và thuế khác hiện hành nào.

Bảng kê giao hàng cho phép người bán xử lý tốt hơn các sản phẩm đã vận chuyển và tổng quan về năng suất của chúng. Nó giúp khách hàng (người mua) kiểm tra xem họ đã nhận được sản phẩm đã thanh toán chưa. Thông thường, người mua phải ký vào ghi chú để cho người mua biết rằng việc giao hàng đã được thực hiện theo đúng thứ tự.

OCR để trích xuất dữ liệu từ các cổng phân phối

Muốn trích xuất dữ liệu từ PDF tài liệu, chuyển đổi PDF sang XML or tự động hóa trích xuất bảng? Kiểm tra Nanonets ' Trình quét PDF or Trình phân tích cú pháp PDF để chuyển đổi PDF sang cơ sở dữ liệu mục!

.cta-first-blue {chuyển tiếp: tất cả 0.1s khối-bezier (0.4, 0, 0.2, 1) 0s; bán kính đường viền: 0px; font-weight: bold; font-size: 16px; chiều cao dòng: 24px; đệm: 12px 24px; nền: # 546fff; màu trắng; chiều cao: 56px; text-align: left; hiển thị: inline-flex; flex-hướng: hàng; -moz-box-align: trung tâm; align-các mục: trung tâm; khoảng cách giữa các chữ cái: 0px; box-sizing: border-box; border-width: 2px! important; border: solid # 546fff! important; } .cta-first-blue: hover {color: # 546fff; nền: trắng; quá trình chuyển đổi: tất cả 0.1s khối-bezier (0.4, 0, 0.2, 1) 0s; border-width: 2px! important; border: solid # 546fff! important; } .cta-second-black {chuyển tiếp: all 0.1s khối-bezier (0.4, 0, 0.2, 1) 0s; bán kính đường viền: 0px; font-weight: bold; font-size: 16px; chiều cao dòng: 24px; đệm: 12px 24px; nền: trắng; màu: # 333; chiều cao: 56px; text-align: left; hiển thị: inline-flex; flex-hướng: hàng; -moz-box-align: trung tâm; align-các mục: trung tâm; khoảng cách giữa các chữ cái: 0px; box-sizing: border-box; border-width: 2px! important; border: solid # 333! important; } .cta-second-black: hover {color: white; nền: # 333; quá trình chuyển đổi: tất cả 0.1s khối-bezier (0.4, 0, 0.2, 1) 0s; border-width: 2px! important; border: solid # 333! important; } .column1 {min-width: 240px; max-width: vừa với nội dung; padding-right: 4%; } .column2 {min-width: 200px; max-width: vừa với nội dung; } .cta-main {display: flex; }


Những thách thức trong việc trích xuất thủ công dữ liệu khung phân phối

Biên bản giao hàng thường được nhận cùng với lô hàng / sản phẩm tại quầy tiếp nhận của một công ty hoặc nhà kho, tùy thuộc vào thực tiễn kinh doanh được áp dụng. Trong cả hai trường hợp, nhân viên nhận lô hàng - nhân viên văn phòng hoặc nhân viên kho, tùy từng trường hợp - phải so sánh các chi tiết trong sổ giao hàng với các chi tiết trong đơn đặt hàng, hóa đơn và / hoặc gói hàng gửi . Sau đó, cô ấy ký vào sổ, nếu đó là bản chất của nó, và nộp một bản sao của nó vào hồ sơ công ty.

Nhân viên này, rất có thể, có quá nhiều nhiệm vụ trong danh mục đầu tư của cô ấy và việc quản lý kho giao hàng có thể chỉ là sợi dây cuối cùng khiến tinh thần của cô ấy suy sụp.

Việc kiểm tra các mặt hàng được liệt kê trong bảng kê với các mặt hàng được giao là quy trình một lần và phải được thực hiện trong thời gian thực. Lưu trữ và nộp hồ sơ giao hàng là một hoạt động sau khi giao hàng và có thể trở nên tẻ nhạt, nhàm chán và tốn thời gian. Việc lưu trữ và lập hồ sơ còn phức tạp hơn nữa do các định dạng và bố cục khác nhau của các cổng gửi. Phiếu xuất kho có thể ở dạng bản cứng được gửi bằng tay hoặc fax, tệp đính kèm email hoặc dưới dạng trao đổi dữ liệu điện tử (EDI). Ở hầu hết các công ty, dữ liệu trong các cổng phân phối phải được nhập vào cơ sở dữ liệu, cho các mục đích quản lý hàng tồn kho, các hoạt động lưu trữ và kiểm toán.

Có thể tốn thời gian và tẻ nhạt khi trích xuất thủ công dữ liệu từ các cổng phân phối ở nhiều định dạng này. Điều này thường dẫn đến sai sót và dẫn đến sự chậm trễ trong việc xử lý tài liệu. Những thách thức phổ biến trong việc trích xuất thủ công dữ liệu từ các cổng phân phối bao gồm,

  • Thời gian tiêu thụ, đặc biệt là khi công ty phát triển và số lượng mua hàng tăng lên.
  • Quá nhiều email và giấy yêu cầu tổ chức và lưu trữ tệp vật lý.
  • Thiếu dữ liệu không khớp giữa dữ liệu trong đơn đặt hàng, hóa đơn và cổng giao hàng.
  • Các mặt hàng bị thất lạc và bị lãng quên; điều này đặc biệt đúng khi người bán gửi email phiếu giao hàng ngay sau khi hàng hóa được gửi đi. Vào thời điểm nhận hàng, thư có ghi nhãn giao hàng có thể bị chôn sâu trong hộp thư của người nhận, do đó dẫn đến nhầm lẫn.

Việc trích xuất dữ liệu thủ công từ các ổ cắm phân phối và việc nhập chúng vào cơ sở dữ liệu không được thực hiện theo các bước xác minh có thể có tỷ lệ lỗi cao tới 4%. Quy tắc nhập dữ liệu 1-10-100 nổi tiếng trong giới nhập dữ liệu - việc xác minh độ chính xác của dữ liệu tại điểm nhập có giá 1 đô la, dọn dẹp lỗi có giá 10 đô la ở dạng hàng loạt và các lỗi chưa được sửa chữa khiến công ty mất 100 đô la trở lên.

Cổng giao hàng OCR

Phần mềm trích xuất dữ liệu có thể được sử dụng để trích xuất có chọn lọc dữ liệu từ các ổ cắm phân phối. Nhận dạng ký tự quang học hoặc OCR, phần mềm trích xuất dữ liệu từ tài liệu được quét, hình ảnh máy ảnh và pdf chỉ hình ảnh, phù hợp nhất cho việc trích xuất tự động dữ liệu từ các ổ cắm phân phối.

Có rất nhiều loại phần mềm OCR được sử dụng để trích xuất dữ liệu trong ngành công nghiệp ngày nay. Loại thô sơ nhất chỉ đơn giản là trích xuất tất cả văn bản từ tài liệu gửi và việc phân loại sâu hơn và trích xuất dữ liệu có ý nghĩa cần nỗ lực của con người.

OCR để trích xuất dữ liệu từ các cổng phân phối
Trích xuất dữ liệu bằng phần mềm OCR thô sơ

Thế hệ thứ hai của OCR - OCR theo vùng hoặc dựa trên mẫu - trích xuất dữ liệu cụ thể từ tài liệu gửi, tùy thuộc vào vị trí hoặc “vùng” của nó trong tài liệu.

OCR để trích xuất dữ liệu từ các cổng phân phối
Trích xuất dữ liệu bằng phần mềm OCR khu vực

OCR thế hệ thứ ba như Nanonet sử dụng khả năng AI và ML để trích xuất thông tin có ý nghĩa từ các phiếu giao hàng một cách thông minh. Các công cụ OCR nhận thức này có khả năng học các định dạng và phong cách mới của ổ cắm phân phối khi sử dụng và do đó giảm thiểu sự can thiệp của con người.

OCR để trích xuất dữ liệu từ các cổng phân phối
Trích xuất dữ liệu bằng Nanonet

OCR docket phân phối tốt phải có các tính năng sau:

  • Khả năng trích xuất dữ liệu có thể có cấu trúc, cấu trúc kém và / hoặc không có cấu trúc trong khung phân phối ban đầu. Tính thống nhất của dữ liệu được trích xuất từ ​​các nguồn khác nhau này được kích hoạt bằng cách sử dụng tính năng trích xuất dữ liệu dựa trên AI.
  • Khả năng chuyển đổi dữ liệu trích xuất thành nhiều định dạng có thể đọc / chỉnh sửa để sử dụng tiếp theo.
  • Bảo mật dữ liệu – sản phẩm được mua bởi một công ty có thể rất nhạy cảm và bí mật vì nó có thể là một phần của các quy trình được cấp bằng sáng chế và đăng ký nhãn hiệu của công ty. Phần mềm trích xuất dữ liệu phải có khả năng đảm bảo bảo vệ dữ liệu khỏi hành vi trộm cắp, hack và quản lý yếu kém.


Bạn muốn tự động hóa các công việc thủ công lặp đi lặp lại? Kiểm tra phần mềm xử lý tài liệu dựa trên quy trình làm việc Nanonets của chúng tôi. Trích xuất dữ liệu từ hóa đơn, chứng minh thư hoặc bất kỳ tài liệu nào trên chế độ lái tự động!

.cta-first-blue {chuyển tiếp: tất cả 0.1s khối-bezier (0.4, 0, 0.2, 1) 0s; bán kính đường viền: 0px; font-weight: bold; font-size: 16px; chiều cao dòng: 24px; đệm: 12px 24px; nền: # 546fff; màu trắng; chiều cao: 56px; text-align: left; hiển thị: inline-flex; flex-hướng: hàng; -moz-box-align: trung tâm; align-các mục: trung tâm; khoảng cách giữa các chữ cái: 0px; box-sizing: border-box; border-width: 2px! important; border: solid # 546fff! important; } .cta-first-blue: hover {color: # 546fff; nền: trắng; quá trình chuyển đổi: tất cả 0.1s khối-bezier (0.4, 0, 0.2, 1) 0s; border-width: 2px! important; border: solid # 546fff! important; } .cta-second-black {chuyển tiếp: all 0.1s khối-bezier (0.4, 0, 0.2, 1) 0s; bán kính đường viền: 0px; font-weight: bold; font-size: 16px; chiều cao dòng: 24px; đệm: 12px 24px; nền: trắng; màu: # 333; chiều cao: 56px; text-align: left; hiển thị: inline-flex; flex-hướng: hàng; -moz-box-align: trung tâm; align-các mục: trung tâm; khoảng cách giữa các chữ cái: 0px; box-sizing: border-box; border-width: 2px! important; border: solid # 333! important; } .cta-second-black: hover {color: white; nền: # 333; quá trình chuyển đổi: tất cả 0.1s khối-bezier (0.4, 0, 0.2, 1) 0s; border-width: 2px! important; border: solid # 333! important; } .column1 {min-width: 240px; max-width: vừa với nội dung; padding-right: 4%; } .column2 {min-width: 200px; max-width: vừa với nội dung; } .cta-main {display: flex; }


Ưu điểm của Cổng giao hàng dựa trên AI OCR

Một số lợi ích của việc sử dụng các công cụ OCR được hỗ trợ bởi AI như Nanonet để quản lý dữ liệu của các ổ cắm phân phối là:

  • Độ chính xác của dữ liệu: OCRs tận dụng AI có thể giảm thiểu hoặc thậm chí loại bỏ hoàn toàn các lỗi do con người gây ra do mệt mỏi hoặc giám sát.
  • Tiết kiệm thời gian: Việc nhập dữ liệu thủ công từ phiếu giao hàng có thể tốn nhiều thời gian và OCR có thể tiết kiệm phần lớn thời gian của nhân viên cho các hoạt động lặp đi lặp lại thông thường. OCR hỗ trợ AI trích xuất dữ liệu liên quan từ bất kỳ tài liệu nào trong 27 giây so với 3.5 phút để chụp thủ công.
  • Định hướng lại nhân viên: Thời gian dành cho nhân viên do tự động hóa trích xuất dữ liệu khung phân phối có thể được định tuyến lại cho các nhiệm vụ hiệu quả có thể nâng cao kỹ năng của họ và lợi nhuận của công ty.
  • Dữ liệu tập trung: Dữ liệu được phần mềm OCR thu thập có thể được lưu trữ ở một vị trí tập trung và do đó tất cả các bên liên quan của công ty sẽ có thể truy cập được.
  • Bảo mật dữ liệu: Khả năng thực hiện kiểm tra ở các cấp độ khác nhau của quá trình tự động hóa do OCR khởi xướng có thể tăng cường bảo mật dữ liệu.
  • Khả năng mở rộng: Khi doanh nghiệp mở rộng, việc có một hệ thống thủ công để quản lý hóa đơn là rất cồng kềnh. OCR có thể hợp lý hóa quy trình quản lý phiếu giao hàng, dẫn đến các cải tiến về quy mô.
  • Tích hợp với các hệ thống tự động hóa khác của công ty. Với việc siêu tự động hóa đang dần tìm được chỗ đứng trong lĩnh vực kinh doanh, việc sử dụng OCR trong lĩnh vực quản lý biên lai giao hàng có thể giúp tích hợp hoạt động vào hệ thống lớn hơn bao trùm tổ chức.


Bạn muốn sử dụng tự động hóa quy trình bằng robot? Kiểm tra phần mềm xử lý tài liệu dựa trên quy trình làm việc Nanonets. Không có mã. Không có nền tảng phức tạp.

.cta-first-blue {chuyển tiếp: tất cả 0.1s khối-bezier (0.4, 0, 0.2, 1) 0s; bán kính đường viền: 0px; font-weight: bold; font-size: 16px; chiều cao dòng: 24px; đệm: 12px 24px; nền: # 546fff; màu trắng; chiều cao: 56px; text-align: left; hiển thị: inline-flex; flex-hướng: hàng; -moz-box-align: trung tâm; align-các mục: trung tâm; khoảng cách giữa các chữ cái: 0px; box-sizing: border-box; border-width: 2px! important; border: solid # 546fff! important; } .cta-first-blue: hover {color: # 546fff; nền: trắng; quá trình chuyển đổi: tất cả 0.1s khối-bezier (0.4, 0, 0.2, 1) 0s; border-width: 2px! important; border: solid # 546fff! important; } .cta-second-black {chuyển tiếp: all 0.1s khối-bezier (0.4, 0, 0.2, 1) 0s; bán kính đường viền: 0px; font-weight: bold; font-size: 16px; chiều cao dòng: 24px; đệm: 12px 24px; nền: trắng; màu: # 333; chiều cao: 56px; text-align: left; hiển thị: inline-flex; flex-hướng: hàng; -moz-box-align: trung tâm; align-các mục: trung tâm; khoảng cách giữa các chữ cái: 0px; box-sizing: border-box; border-width: 2px! important; border: solid # 333! important; } .cta-second-black: hover {color: white; nền: # 333; quá trình chuyển đổi: tất cả 0.1s khối-bezier (0.4, 0, 0.2, 1) 0s; border-width: 2px! important; border: solid # 333! important; } .column1 {min-width: 240px; max-width: vừa với nội dung; padding-right: 4%; } .column2 {min-width: 200px; max-width: vừa với nội dung; } .cta-main {display: flex; }


Sự phù hợp của Nanonet như một khung phân phối OCR

Nanonets là một công cụ OCR do AI điều khiển, phù hợp nhất để trích xuất dữ liệu từ các cổng phân phối do các lý do sau:

  • Phát hiện chính xác cấu trúc bảng của mục hàng có chứa các tài liệu như biểu mẫu.
  • Tất cả các mục nhập chi tiết đơn hàng có ở các dạng như tên, sản phẩm, số lượng, v.v.
  • Dữ liệu có thể được trích xuất dưới dạng đầu ra JSON có thể cho phép xây dựng các ứng dụng và nền tảng tùy chỉnh.
  • Mặc dù cung cấp một API và tài liệu tuyệt vời cho các nhà phát triển, phần mềm này cũng lý tưởng cho các tổ chức không có nhóm nhà phát triển nội bộ.
  • Nó là một công cụ thực sự không có mã
  • Tích hợp dễ dàng Nanonet với hầu hết các phần mềm CRM, ERP, dịch vụ nội dung hoặc RPA.
  • Xử lý nhiều ngôn ngữ: Nanonet OCR có thể nhận dạng văn bản viết tay, hình ảnh của văn bản bằng nhiều ngôn ngữ cùng một lúc, hình ảnh có độ phân giải thấp, hình ảnh có phông chữ mới hoặc chữ thảo và các kích thước khác nhau, hình ảnh có văn bản bóng, văn bản nghiêng, văn bản không có cấu trúc ngẫu nhiên, nhiễu hình ảnh, hình ảnh mờ và hơn thế nữa. Điều này, như có thể hiểu, đặc biệt liên quan đến việc giao hàng giữa các quốc gia khác nhau hoặc phải vận chuyển hàng hóa giữa các khu vực sử dụng các ngôn ngữ khác nhau.
  • Làm việc với dữ liệu tùy chỉnh thông qua việc sử dụng dữ liệu tùy chỉnh để đào tạo các mô hình OCR.
  • Độc lập với các định dạng: Nanonet hoàn toàn không bị ràng buộc bởi khuôn mẫu của tài liệu. Bạn có thể nắm bắt dữ liệu một cách nhận thức trong các bảng hoặc mục hàng hoặc bất kỳ định dạng nào khác.
  • Nhiều công cụ nhập dữ liệu như Nanonets, đi kèm với đội ngũ hỗ trợ kỹ thuật mạnh mẽ có thể giúp vượt qua các thách thức và khai thác toàn bộ tiềm năng của các hoạt động nhập dữ liệu tự động.

Các trường hợp sử dụng xử lý tài liệu thông minh của Nanonets giúp các tổ chức áp dụng tự động hóa một cách liền mạch. Dưới đây là một số nghiên cứu điển hình thú vị:

Lấy đi

Việc trích xuất dữ liệu từ các cổng phân phối có thể khó khăn và tốn thời gian khi được thực hiện thủ công. Phần mềm trích xuất dữ liệu dựa trên AI như Nanonets có thể giúp tự động hóa quy trình. Việc sử dụng AI-OCR trong bước cuối cùng của quy trình Mua sắm để trả tiền đi kèm với các lợi ích hấp dẫn như tiết kiệm thời gian và chi phí, quy trình phê duyệt được tổ chức hợp lý và cuối cùng là lợi nhuận tốt hơn.


var contentTitle = “Mục lục”; // Đặt tiêu đề của bạn ở đây, để tránh tạo tiêu đề cho nó sau này var ToC = “

“+ ContentTitle +”

“; ToC + = “

“; var tocDiv = document.getElementById ('dynamicictocnative'); tocDiv.outerHTML = ToC;

Ống nano API OCR & OCR trực tuyến có nhiều điều thú vị trường hợp sử dụng that có thể tối ưu hóa hiệu suất kinh doanh của bạn, tiết kiệm chi phí và thúc đẩy tăng trưởng. Tìm ra cách các trường hợp sử dụng của Nanonets có thể áp dụng cho sản phẩm của bạn.


Dấu thời gian:

Thêm từ AI & Máy học