이미지에서 텍스트 또는 데이터를 추출하는 방법

플라톤에 의해 재발행

팔로워 : 0

이미지에서 텍스트를 추출하는 것은 번거로운 과정일 수 있습니다. 대부분의 사람들은 이미지에서 텍스트/데이터를 수동으로 입력합니다. 그러나 처리해야 할 이미지가 많을 때 시간이 많이 걸리고 비효율적입니다.

이미지를 텍스트로 변환하는 변환기 이미지에서 텍스트를 추출하는 깔끔한 방법을 제공합니다.

이러한 도구는 잘 작동하지만 추출된 텍스트/데이터는 종종 구조화되지 않은 방식으로 표시되어 많은 사후 처리가 발생합니다.

An AI 기반 OCR Nanonets는 이미지에서 텍스트를 가져와서 추출된 데이터를 깔끔하고 조직적이며 구조화된 방식으로 표시할 수 있습니다.

Nanonets는 이미지에서 정확하고 규모에 맞게 여러 언어로 데이터를 추출합니다. Nanonets는 추출된 텍스트를 완전히 사용자 정의할 수 있는 깔끔하게 구조화된 형식으로 표시하는 유일한 텍스트 인식 OCR입니다. 캡처된 데이터는 테이블, 라인 항목 또는 기타 형식으로 표시될 수 있습니다.

아래 이미지를 업로드하려면 클릭하세요.
Nanonets의 OCR은 파일의 내용을 자동으로 인식하여 텍스트로 변환합니다.
추출된 텍스트를 원시 텍스트 파일로 다운로드하거나 API를 통해 통합

차례

다음은 Nanonets OCR을 사용하여 이미지에서 텍스트를 감지하고 추출하는 세 가지 고급 방법입니다. PDF에서 텍스트 추출s, PDF에서 데이터 추출s 또는 PDF 구문 분석 및 기타 문서 유형:

나노넷을 사용하여 이미지에서 텍스트 추출

에 대한 무료 온라인 OCR이 필요합니다. 이미지를 텍스트로, PDF를 표로, PDF를 텍스트로및 PDF 데이터 추출? 온라인에서 나노넷을 확인하세요 OCR API 실행하고 무료로 맞춤형 OCR 모델 구축을 시작하십시오!

Nanonets에는 아래 나열된 특정 이미지 유형에 대해 사전 훈련된 OCR 모델이 있습니다. 사전 훈련된 각 OCR 모델은 이미지 유형의 텍스트를 이름, 주소, 날짜, 만료 등과 같은 적절한 필드와 정확하게 연관시키고 추출된 텍스트를 깔끔하고 조직적인 방식으로 표시하도록 훈련됩니다.

송장
영수증
운전 면허증 (미국)
여권

나노 넷 온라인 OCR 및 OCR API 많은 흥미가있다 사용 사례.

[포함 된 콘텐츠]

영수증 이미지에서 텍스트를 추출하는 나노넷

1 단계 : 적절한 OCR 모델 선택

로그인 Nanonets로 이동하고 텍스트 및 데이터를 추출하려는 이미지에 적합한 OCR 모델을 선택합니다. 사전 훈련된 OCR 모델이 요구 사항에 적합하지 않은 경우 사용자 지정 OCR 모델을 만드는 방법을 알아보기 위해 건너뛸 수 있습니다.

2 단계 : 파일 추가

텍스트를 추출할 파일/이미지를 추가합니다. 원하는 만큼 이미지를 추가할 수 있습니다.

단계 3 : 테스트

모델이 실행되고 이미지에서 텍스트를 추출할 때까지 몇 초 정도 기다립니다.

4 단계 : 확인

오른쪽의 테이블뷰를 확인하여 각 파일에서 추출한 텍스트를 빠르게 확인하세요. 텍스트가 올바르게 인식되고 적절한 필드 또는 태그와 일치하는지 쉽게 다시 확인할 수 있습니다.

이 단계에서 필드 값과 레이블을 편집/수정하도록 선택할 수도 있습니다. 나노넷은 이미지 템플릿에 구속되지 않습니다.

추출 된 데이터는 "List View"또는 "JSON"형식으로 표시 할 수 있습니다.

이미지 PlatoBlockchain 데이터 인텔리전스에서 텍스트 또는 데이터를 추출하는 방법. 수직 검색. 일체 포함. — 목록 또는 JSON 출력으로 표시되는 추출된 텍스트

확인하는 각 값 또는 필드 옆의 확인란을 선택하거나 "데이터 확인"을 클릭하여 즉시 진행할 수 있습니다.

5 단계 : 내보내기

모든 파일이 확인되면. 깔끔하게 구성된 데이터를 xml, xlsx 또는 csv 파일로 내보낼 수 있습니다.

나노 넷은 흥미 롭다 사용 사례 독특한 고객 성공 사례. Nanonets가 비즈니스의 생산성을 높이는 방법을 알아보십시오.

Nanonet으로 사용자 지정 OCR 모델을 구축하는 것은 쉽습니다. 일반적으로 모든 언어로 된 모든 이미지 또는 문서 유형에 대한 모델을 25분 이내에 구축, 교육 및 배포할 수 있습니다(모델 교육에 사용된 파일 수에 따라 다름).

이 방법의 처음 4단계를 수행하려면 아래 비디오를 시청하십시오.

[포함 된 콘텐츠]

나노 넷으로 자신 만의 OCR 모델을 훈련시키는 방법

1 단계 : 자신 만의 OCR 모델 만들기

로그인 Nanonets에 연결하고 "자신의 OCR 모델 만들기"를 클릭합니다.

2 단계 : 교육 파일 / 이미지 업로드

OCR 모델 학습에 사용할 샘플 파일을 업로드합니다. 빌드하는 OCR 모델의 정확성은이 단계에서 업로드 된 파일 / 이미지의 품질과 양에 따라 크게 달라집니다.

3 단계 : 파일 / 이미지에 텍스트 주석 달기

이제 적절한 필드 또는 레이블로 각 텍스트 또는 데이터에 주석을 답니다. 이 중요한 단계는 OCR 모델이 이미지에서 적절한 텍스트를 추출하고 필요에 맞는 사용자 지정 필드와 연결하도록 가르칩니다.

새 레이블을 추가하여 텍스트 또는 데이터에 주석을 달 수도 있습니다. Nanonets는 이미지 템플릿에 구속되지 않는다는 것을 기억하십시오!

4 단계 : 사용자 지정 OCR 모델 훈련

모든 교육 파일 / 이미지에 대한 주석이 완료되면 "Train Model"을 클릭합니다. 훈련을 위해 파일 및 대기중인 모델 수에 따라 훈련에는 일반적으로 20 분 ~ 2 시간이 걸립니다. 당신은 할 수 있습니다 업그레이드 이 단계 (일반적으로 20 분 미만)에서 더 빠른 결과를 얻으려면 유료 플랜으로 전환합니다.

Nanonets는 딥 러닝을 활용하여 다양한 OCR 모델을 구축하고 정확성을 위해 서로 테스트합니다. 그런 다음 Nanonets는 입력 및 정확도 수준을 기반으로 최상의 OCR 모델을 선택합니다.

“모델 메트릭스”탭은 나노 넷이 구축 된 모든 모델 중에서 최상의 OCR 모델을 선택할 수 있도록하는 다양한 측정 및 비교 분석을 보여줍니다. 더 높은 수준의 정확도를 달성하기 위해 더 넓은 범위의 훈련 이미지와 더 나은 주석을 제공하여 모델을 재 훈련 할 수 있습니다.

또는 정확성이 만족 스러우면 "테스트"를 클릭하여이 사용자 지정 OCR 모델이 텍스트 / 데이터를 추출해야하는 이미지 또는 파일 샘플에서 예상대로 작동하는지 테스트 및 확인합니다.

5 단계 : 데이터 테스트 및 확인

몇 가지 샘플 이미지를 추가하여 사용자 지정 OCR 모델을 테스트 및 확인합니다.

추출 된 텍스트의 정확성 확인 — 추출된 텍스트의 정확성 테스트 및 확인

텍스트가 인식되고 추출되어 적절하게 표시되면 파일을 내보냅니다. 아래에서 볼 수 있듯이 추출된 데이터가 정리되어 깔끔한 형식으로 표시됩니다.

축하합니다. 이제 특정 유형의 이미지에서 텍스트를 추출하기 위해 사용자 지정 OCR 모델을 구축하고 훈련했습니다!

귀하의 비즈니스는 디지털 문서, 이미지 또는 PDF의 텍스트 인식을 처리합니까? 이미지에서 텍스트를 정확하게 추출하는 방법이 궁금하십니까?

NanoNets API로 자신의 OCR 모델 학습

여기입니다 열차 상세 안내 자신의 OCR 모델을 사용하여 나노 넷 API. 에서 선적 서류 비치, Python, Shell, Ruby, Golang, Java 및 C #에서 코드 샘플을 실행할 준비가 된 것을 알 수있을뿐만 아니라 다양한 엔드 포인트에 대한 자세한 API 사양도 확인할 수 있습니다.

다음은 Nanonets API를 사용하여 자신의 모델을 학습시키는 단계별 가이드입니다.

1 단계 : Repo 복제

git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm

2 단계 : 무료 API 키 받기

에서 무료 API 키 받기 https://app.nanonets.com/#/keys

3 단계 : API 키를 환경 변수로 설정

export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE

4 단계 : 새 모델 생성

python ./code/create-model.py

참고 : 다음 단계에 필요한 MODEL_ID가 생성됩니다.

5 단계 : 환경 변수로 모델 ID 추가

export NANONETS_MODEL_ID=YOUR_MODEL_ID

6 단계 : 교육 데이터 업로드

감지하려는 물체의 이미지를 수집하십시오. 폴더에 데이터 세트가 준비되면 images (이미지 파일), 데이터 세트 업로드를 시작합니다.

python ./code/upload-training.py

7 단계 : 모델 훈련

이미지가 업로드되면 모델 교육을 시작하십시오.

python ./code/train-model.py

8 단계 : 모델 상태 얻기

이 모델은 훈련하는 데 ~ 30 분이 걸립니다. 모델이 훈련되면 이메일을 받게됩니다. 그 동안 모델의 상태를 확인하십시오

watch -n 100 python ./code/model-state.py

9 단계 : 예측하기

모델이 훈련되면 모델을 사용하여 예측할 수 있습니다

python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg

다른 OCR API보다 Nanonet을 사용하는 이점은 이미지에서 텍스트를 추출하는 것과 관련하여 더 나은 정확도 이상입니다. 다음은 텍스트 인식을 위해 Nanonets OCR을 대신 사용해야 하는 7가지 이유입니다.

1. 사용자 지정 데이터 작업

대부분의 OCR 소프트웨어는 작업할 수 있는 데이터 유형에 대해 매우 엄격합니다. 사용 사례에 대한 OCR 모델을 교육하려면 요구 사항 및 사양과 관련하여 상당한 유연성이 필요합니다. 송장 처리용 OCR은 여권용 OCR과 크게 다릅니다! 나노넷은 이러한 엄격한 제한에 얽매이지 않습니다. Nanonets는 고유한 데이터를 사용하여 비즈니스의 특정 요구 사항을 충족하는 데 가장 적합한 OCR 모델을 교육합니다.

2. 비영어권 또는 다국어 작업

Nanonets는 맞춤형 데이터를 사용한 훈련에 중점을 두고 있기 때문에 모든 언어 또는 여러 언어로 된 이미지에서 텍스트를 동시에 추출할 수 있는 단일 OCR 모델을 구축하는 데 고유한 위치에 있습니다.

3. 후처리 불필요

OCR 모델을 사용하여 추출된 텍스트는 지능적으로 구조화되고 이해할 수 있는 형식으로 표시되어야 합니다. 그렇지 않으면 데이터를 의미 있는 정보로 재구성하는 데 상당한 시간과 자원이 소요됩니다. 대부분의 OCR 도구는 단순히 이미지에서 데이터를 가져와 덤프하지만 Nanonets는 관련 데이터만 추출하여 지능적으로 구조화된 필드로 자동 정렬하여 보고 이해하기 쉽습니다.

4. 지속적으로 배운다

기업은 종종 동적으로 변화하는 요구 사항과 요구 사항에 직면합니다. 잠재적인 장애물을 극복하기 위해 Nanonets를 사용하면 새 데이터로 모델을 쉽게 재교육할 수 있습니다. 이를 통해 OCR 모델이 예상치 못한 변화에 적응할 수 있습니다.

5. 일반적인 데이터 제약 조건을 쉽게 처리

Nanonets는 AI, ML 및 딥 러닝 기술을 활용하여 텍스트 인식 및 추출에 큰 영향을 미치는 일반적인 데이터 제약을 극복합니다. Nanonets OCR은 손으로 쓴 텍스트, 한 번에 여러 언어로 된 텍스트 이미지, 저해상도 이미지, 새로운 글꼴 또는 다양한 크기의 필기체 글꼴이 있는 이미지, 그림자 텍스트가 있는 이미지, 기울어진 텍스트, 임의의 비정형 텍스트, 이미지 노이즈, 흐린 이미지를 인식하고 처리할 수 있습니다. 그리고 더. 기존 OCR API는 이러한 제약 조건에서 수행할 준비가 되어 있지 않습니다. 실제 시나리오에서는 일반적이지 않은 매우 높은 수준의 데이터가 필요합니다.

6. 사내 개발자 팀이 필요하지 않습니다.

비즈니스 요구 사항에 맞게 Nanonets API를 개인화하기 위해 개발자를 고용하고 인재를 확보하는 것에 대해 걱정할 필요가 없습니다. Nanonets는 번거롭지 않은 통합을 위해 구축되었습니다. 또한 Nanonet을 대부분의 CRM, ERP 또는 RPA 소프트웨어와 쉽게 통합할 수 있습니다.

7. 사용자 정의, 사용자 정의, 사용자 정의

Nanonets OCR로 원하는 만큼의 텍스트/데이터 필드를 캡처할 수 있습니다. 특정 텍스트 인식 및 텍스트 추출 요구 사항에 맞는 사용자 지정 유효성 검사 규칙을 구축할 수도 있습니다. Nanonets는 문서 템플릿에 전혀 구속되지 않습니다. 테이블이나 라인 항목 또는 기타 형식으로 데이터를 캡처할 수 있습니다!

Nanonets에는 비즈니스 성과를 최적화하고 비용을 절감하며 성장을 촉진 할 수있는 많은 사용 사례가 있습니다. 찾아 Nanonets의 사용 사례를 제품에 적용하는 방법

또는 체크 아웃 나노 넷 OCR API 행동하고 커스텀 구축 시작 OCR 무료 모델!

업데이트 7월 2022: 이 게시물은 원래 에 게시되었습니다. 10월 2020 이후 업데이트되었습니다. 규칙적으로.

여기 슬라이드가 있습니다 이 기사의 결과를 요약합니다. 여기 대체 버전 이 게시물의.

타임 스탬프 : 2022 년 7 월 17 일2022 년 7 월 18 일

타임 스탬프 : 10년 2023월 XNUMX일

차례