PDF에서 쉽게 복사하여 붙여넣는 방법

플라톤에 의해 재발행

팔로워 : 0

PDF 파일의 내용을 복사하는 데 어려움을 겪는 것은 현실입니다. 표, 텍스트, 이미지 등을 추출하려고 할 때 다 추출했다고 생각하고 복사를 누른 다음 붙여넣으려고 하면 절반만 추출되었거나 서식이 엉망인 것을 발견하게 됩니다. 위로. 실망스럽죠?

복사-붙여넣기 과정은 올바른 도구와 기술을 사용하여 쉽게 수행할 수 있습니다. 이 포괄적인 가이드는 서식을 유지하면서 PDF 파일의 텍스트, 이미지, 표 및 기타 데이터를 복사하여 붙여넣는 다양한 방법을 안내합니다.

1. PDF에서 텍스트 복사 및 붙여넣기

학문적 목적, 콘텐츠 생성, 법적 이유 또는 단순히 참조를 위해 PDF에서 텍스트를 복사해야 할 수도 있습니다. 구조화된 PDF 또는 구조화되지 않은 PDF에서 텍스트를 복사할 수 있는 몇 가지 방법을 살펴보겠습니다.

ㅏ. Adobe Acrobat Reader의 선택 도구 사용

Adobe Acrobat Reader는 가장 널리 사용되는 프로그램 중 하나입니다. PDF 뷰어를 사용할 수 있습니다. 추가 소프트웨어를 설치하고 싶지 않거나 새로운 서비스에 가입하고 싶지 않다면 Acrobat Reader에 내장된 텍스트 선택 도구를 사용하세요.

PlatoBlockchain Data Intelligence를 통해 PDF에서 쉽게 복사하여 붙여넣는 방법. 수직 검색. 일체 포함.

시작하려면 다음 단계를 따르세요.

Adobe Acrobat Reader에서 PDF를 엽니다.
도구 모음에서 "도구 선택" 버튼(화살표 아이콘)을 클릭하여 PDF의 텍스트를 강조 표시합니다.
클릭하고 드래그하여 텍스트를 선택합니다. 필요한 경우 여러 페이지에서 선택할 수 있습니다.
텍스트를 강조 표시하고, 마우스 오른쪽 버튼을 클릭하고, “복사”를 선택하거나, Windows에서는 Ctrl+C를, Mac에서는 Command+C를 사용하세요.
Ctrl+V 또는 Cmd+V를 사용하여 텍스트를 붙여넣습니다.

이 방법은 간단한 PDF에 이상적입니다. 세그먼트의 콘텐츠를 수동으로 복사하여 대상 문서에 붙여넣을 수 있습니다. Acrobat Reader는 다른 리더와 달리 서식을 잘 유지합니다.

Acrobat Reader는 여러 열과 이미지가 텍스트, 표, 컬러 배경의 텍스트와 혼합되어 있는 복잡한 PDF를 처리하는 데 어려움을 겪습니다. 복사한 텍스트는 서식이 손실되어 일반 텍스트로 붙여넣어질 수 있으므로 나중에 수동으로 정리하거나 편집해야 합니다.

PDF에서 대량 텍스트를 추출하는 데는 적합하지 않을 수 있습니다. 예를 들어 공급업체 계약을 처리하고 수백 개의 PDF에서 주요 용어와 조항을 추출하는 작업은 지루하고 시간이 많이 걸릴 수 있습니다. 스캔한 페이지는 텍스트를 복사하기가 훨씬 더 어렵습니다.

전반적으로 Acrobat Reader에 내장된 텍스트 복사 기능은 PDF에서 몇 줄이나 단락을 빠르게 가져오는 데 적합합니다.

비. Microsoft Word 또는 Google Docs에서 PDF를 엽니다.

Microsoft Word 및 Google Docs를 사용하면 PDF 파일에서 텍스트를 열고 편집하고 추출할 수 있습니다. 이러한 도구를 활용하는 방법은 다음과 같습니다.

Microsoft Word 사용:

데스크탑에서 MS Word를 엽니다.
파일 > 열기 > PDF를 찾아보고 선택합니다.
Word에서는 PDF를 편집 가능한 문서로 변환합니다.
이제 이 문서의 텍스트를 자유롭게 복사하여 붙여넣을 수 있습니다.

Word를 사용하면 글꼴, 색상, 위치 등의 서식을 유지한다는 이점이 있습니다. 그러나 서식이 복잡하지 않고 텍스트가 많은 PDF에 가장 적합합니다. 스캔한 문서가 제대로 변환되지 않을 수 있습니다.

Google 문서도구 사용:

PDF를 Google 드라이브에 업로드하세요.
파일을 마우스 오른쪽 버튼으로 클릭하고 'Google Docs로 열기'를 선택하세요.
콘텐츠를 새 Google 문서로 가져옵니다.
필요에 따라 텍스트를 선택하고 복사합니다.

Google Docs는 통합 OCR 기능을 사용하여 스캔한 문서에서 텍스트를 추출할 수 있습니다. 그러나 서식이 손실되는 경우가 많기 때문에 PDF에서 원시 텍스트를 가져오는 데 가장 적합합니다.

두 도구 모두 PDF에서 텍스트를 빠르고 간단하게 추출할 수 있습니다. 그러나 특히 복잡한 파일을 처리할 때 완벽한 형식의 변환을 보장할 수는 없습니다. 누락된 문자, 뒤죽박죽된 문장, 서식 문제는 변환된 문서에서 익숙하므로 텍스트를 재사용하려면 수동으로 정리해야 합니다. 또한 이 접근 방식은 수백 페이지에서 텍스트를 추출하는 데 실용적이지 않습니다.

씨. 온라인 변환기에 파일 업로드

PDF에서 추출을 단순화하는 무료 온라인 PDF-텍스트 변환기가 많이 있습니다. 이러한 도구는 PDF를 TXT 또는 DOC와 같은 형식으로 변환하여 내용을 쉽게 복사할 수 있도록 합니다.

인기 있는 온라인 OCR 도구 중 일부는 다음과 같습니다.

온라인 PDF 추출기를 사용할 때의 일반적인 단계는 다음과 같습니다.

도구 웹사이트로 이동합니다.
PDF를 선택하려면 "파일 선택" 또는 "업로드"를 클릭하세요.
출력 형식을 TXT, DOC/DOCX 또는 기타 형식으로 설정합니다.
변환을 시작하려면 "변환"을 클릭하세요.
변환된 파일을 컴퓨터에 다운로드하세요.
텍스트 파일을 열고 필요에 따라 복사하여 붙여넣습니다.

대부분의 온라인 변환기는 몇 가지 기본 사용법을 무료로 제공합니다. 그러나 특정 고급 기능과 증가된 제한에는 유료 구독이 필요할 수 있습니다. 또한 민감한 데이터를 업로드하기 전에 개인정보 보호정책에 유의하세요.

편리하기는 하지만 PDF의 복잡한 레이아웃에서는 이러한 도구가 제대로 작동하지 않을 수 있습니다. 그들은 전통적인 OCR 기술을 사용하여 텍스트를 추출하기 때문에 비표준 글꼴, 다중 열 레이아웃, 텍스트와 혼합된 이미지, 표 및 색상이 있는 배경으로 인해 어려움을 겪습니다.

추출된 텍스트는 원래 형식을 잃어버리고 수동으로 수정해야 하는 경우가 많습니다. 이는 대량 처리 계약서, 보고서 및 명세서에 시간이 많이 걸리고 비효율적일 수 있습니다.

2. PDF에서 이미지 복사 및 붙여넣기

자신의 문서와 프레젠테이션에 사용하기 위해 PDF에서 차트나 스케치를 추출할 수 있습니다. 품질을 유지하면서 PDF 파일에서 이미지를 복사하는 몇 가지 방법은 다음과 같습니다.

ㅏ. 스크린샷 도구를 사용하여 PDF 캡처

스크린샷 도구는 PDF 페이지의 특정 부분을 이미지로 추출하려는 경우 매우 편리할 수 있습니다.

스크린샷 도구를 사용할 때의 일반적인 단계는 다음과 같습니다.

PDF 파일을 열고 이미지가 있는 페이지로 이동합니다.
Snagit, Greenshot 또는 Windows 내장 도구와 같은 스크린샷 도구를 실행합니다.
복사하고 싶은 부분의 스크린샷을 찍으세요.
스크린샷이 컴퓨터에 저장됩니다.
스크린샷을 자르거나 추가로 편집해야 하는 경우 이미지 편집기에서 스크린샷을 엽니다.

스크린샷 도구를 사용하면 전체 페이지를 추출할 필요가 없을 때 PDF에서 이미지를 쉽게 캡처할 수 있습니다. 특정 차트, 다이어그램, 로고 또는 기타 그래픽 요소의 스크린샷을 찍을 수 있습니다.

그러나 이 방법은 큰 PDF에서 여러 이미지를 추출해야 하는 경우 지루할 수 있으며 기본 텍스트가 아닌 그림을 캡처하므로 텍스트 검색 가능성을 유지하지 않습니다.

비. Acrobat Pro의 스냅샷 도구 사용

Acrobat Pro 사용자인 경우 스냅샷 도구를 사용하여 PDF에서 이미지를 복사할 수 있습니다.

사용법은 다음과 같습니다.

Acrobat Pro에서 PDF를 엽니다.
추출하려는 이미지가 포함된 페이지 영역을 클릭하고 끌어서 선택합니다.
마우스 오른쪽 버튼을 클릭하여 드롭다운 메뉴를 엽니다.
"스냅샷 찍기"를 선택하세요
스냅샷 도구는 PDF 페이지의 선택한 영역을 클립보드에 이미지로 복사합니다. CTRL+V를 사용하여 이미지 편집 또는 문서 소프트웨어에 붙여넣을 수 있습니다.

스냅샷 도구는 PDF 문서 차트, 다이어그램, 스케치 또는 기타 시각적 요소를 빠르게 가져오는 데 유용합니다. 또한, 캡처한 이미지를 JPG, PNG 등과 같은 형식으로 내보낼 수 있습니다.

PDF에서 이미지를 클릭하면 도구를 통해 해당 이미지를 직접 추출할 수 있습니다. 또한 선택한 영역에서 OCR을 실행하는 '텍스트 인식' 옵션이 있어 스캔한 문서나 PDF 내부 이미지에서 텍스트를 추출하는 데 도움이 될 수 있습니다.

스냅샷 도구는 서식과 시각적 요소를 유지하면서 PDF 페이지의 특정 부분을 효과적으로 복사합니다. 그러나 유료 Acrobat Pro 구독에 대한 액세스가 필요합니다. US$19.99/월.

또 다른 제한 사항은 스냅샷 도구가 한 번에 한 페이지에서만 작동한다는 점입니다. 이는 스캔한 PDF에서 여러 이미지를 추출해야 하거나 한 번에 수백 개의 파일을 처리해야 하는 경우 지루할 수 있습니다.

씨. PDF 페이지를 이미지 파일로 변환

PDF 문서에서 모든 이미지를 추출해야 하는 경우 PDF 페이지를 이미지 파일로 변환하는 것이 도움이 될 수 있습니다. Smallpdf, IlovePDF 및 PDF2Go와 같은 온라인 변환기를 사용하면 PDF 페이지를 JPG, PNG 및 TIFF와 같은 이미지 형식으로 대량 변환할 수 있습니다.

다음 단계를 수행하십시오 :

PDF2JPG와 같은 온라인 변환기 도구에 PDF를 업로드하세요.
출력 형식으로 JPG 또는 PNG를 선택합니다.
이미지로 변환하려는 페이지를 선택하세요.
PDF를 이미지 추출로 시작하려면 "변환"을 클릭하세요.
선택한 각 페이지의 이미지가 포함된 ZIP 폴더를 다운로드하세요.
이미지 파일을 열고 필요에 따라 복사합니다.

PDF의 텍스트는 이미지로 변환할 때 손실될 수 있으므로 이 접근 방식은 주로 텍스트보다는 PDF에서 차트, 다이어그램, 사진 및 기타 그래픽 요소를 추출하는 데 적합합니다.

PDF 페이지를 이미지로 변환하는 작업은 지루할 수 있으며, 특히 수백 페이지를 동시에 처리해야 하는 경우 더욱 그렇습니다. 온라인 도구는 변환할 수 있는 페이지 수를 제한하는 경우가 많습니다. 게다가 별도의 이미지 파일을 관리하다 보면 금방 정리가 되지 않을 수 있습니다.

짧은 PDF에서 몇 개의 차트나 사진을 빠르게 가져오는 데 적합하지만, 긴 문서나 eBook에서 이미지를 대량으로 추출할 때 이 접근 방식에는 제한이 있습니다.

3. PDF에서 데이터 복사 및 붙여넣기

PDF에서 숫자 값이나 표로 작성된 정보와 같은 특정 데이터를 추출해야 하는 경우 데이터 추출용으로 설계된 특정 도구를 활용하는 것이 좋습니다. 다음은 몇 가지 효과적인 방법입니다.

여러 PDF에서 데이터를 복사하고 싶나요? MS Excel의 데이터 가져오기 기능은 놀라운 효과를 발휘합니다. PDF 파일의 테이블과 데이터를 Excel 스프레드시트로 자동 추출할 수 있습니다.

Excel의 데이터 가져오기 탭에 액세스하여 PDF에서 테이블을 추출하는 방법

다음과 같은 간단한 단계를 수행하십시오.

Excel을 열고 데이터 탭으로 이동합니다.
데이터 가져오기 > 파일에서> PDF를 클릭합니다.
데이터를 가져오려는 PDF 파일을 선택합니다. Excel은 문서에서 테이블을 자동으로 감지하고 추출합니다.
데이터 가져오기 대화 상자에는 데이터 미리보기가 표시됩니다. 가져오려는 테이블을 선택하고 로드를 클릭합니다.
추출된 PDF 데이터는 스프레드시트에 테이블로 삽입되어 데이터 분석이 가능합니다.

데이터 추출은 텍스트 PDF에 적합합니다. 사용자는 하나 이상의 PDF 파일에서 가져올 테이블을 하나 이상 선택할 수 있습니다. Excel에서는 데이터를 행과 열로 지능적으로 분리할 수 있습니다. 또한 사용자는 필터를 추가하거나 Excel 내에서 가져온 데이터를 변환할 수 있습니다. 이를 통해 추가 분석 및 대시보드 작성을 위해 PDF의 사용 가능한 데이터를 Excel로 쉽고 빠르게 가져올 수 있습니다.

Excel은 열이나 이미지와 같은 복잡한 레이아웃이 포함된 스캔한 문서나 PDF에서 데이터를 추출하는 데 어려움을 겪습니다. 명확하게 정의된 데이터 테이블과 격자형 레이아웃을 갖춘 텍스트 PDF에서 최적의 성능을 발휘합니다. PDF 데이터가 테이블에 깔끔하게 정리되어 있는 경우 Excel을 활용하면 수동으로 복사하고 붙여넣고 서식을 다시 지정하는 작업을 상당히 줄일 수 있습니다.

스캔한 문서나 복잡한 보고서에 잠겨 있는 구조화되지 않은 데이터에 대해서는 더욱 발전된 데이터 추출 기능이 필요합니다.

Tabula 및 Excalibur와 같은 오픈 소스 라이브러리는 PDF 파일에서 데이터 테이블을 추출하기 위한 좋은 옵션을 제공합니다. 이러한 도구는 테이블을 감지하여 행과 열로 분할하고 데이터를 CSV 또는 Excel 파일로 내보낼 수 있습니다.

일반적으로 워크플로는 다음과 같습니다.

컴퓨터에 오픈 소스 소프트웨어를 다운로드하여 설치하십시오.
PDF를 가져옵니다.
추출하려는 테이블의 행과 열을 잘라냅니다.
'추출된 데이터 미리보기 및 내보내기' 버튼을 클릭합니다.
미리보기에서 데이터를 확인합니다. 잘 보이면 '내보내기'를 클릭하십시오.
원하는 형식(CSV 또는 XLS)을 선택하고 파일을 저장하세요.
저장된 파일을 Excel에서 열고 필요한 셀을 복사한 후 Excel 스프레드시트에 붙여넣습니다.

오픈 소스 PDF 추출 도구는 Excel에 내장된 옵션보다 더 고급 기능을 제공하지만 각 문서를 설정하고 처리하는 데 더 많은 수동 작업이 필요할 수 있습니다. 이러한 도구를 효과적으로 사용하려면 기술에 대한 지식이 더 높아야 할 수도 있습니다.

이러한 도구는 테이블 주위에 텍스트나 그래픽이 많지 않은 깔끔한 PDF 레이아웃에서 테이블 형식 데이터를 추출하는 데 가장 효과적입니다. 그러나 복잡한 보고서나 명세서에 포함된 스캔한 문서나 구조화되지 않은 데이터로 인해 어려움을 겪을 수 있습니다.

Nanonets는 고급 OCR 및 자동화 기능을 갖춘 AI 기반 문서 처리 플랫폼으로, PDF 및 스캔한 문서에서 텍스트, 이미지, 데이터를 정확하게 추출할 수 있습니다.

주요 역량

여러 텍스트 열, 이미지, 표 및 기타 요소가 포함된 복잡한 레이아웃을 정확하게 처리할 수 있습니다. Nanonets는 기계 학습(ML)과 자연어 처리(NLP)를 활용하여 문서 구조를 "보고" "이해"합니다. 이를 통해 상황에 맞는 텍스트 및 데이터 추출이 가능하고 올바른 읽기 순서와 데이터 관계가 유지됩니다.

Nanonets는 송장, 명세서, ID 카드, 설문지 등과 같은 PDF 및 스캔한 문서에서 텍스트, 표, 이미지, QR 코드, 바코드 및 기타 요소를 자동으로 추출할 수 있습니다. 고급 OCR 및 AI 기능을 통해 플랫폼은 구조화된 데이터와 구조화되지 않은 데이터를 쉽게 캡처할 수 있습니다.

기존 도구와 달리 정보만 캡처하는 것이 아닙니다. 사전 정의된 유효성 검사 규칙과 승인 계층을 설정하여 추출된 데이터가 시스템에 추가되기 전에 정확하고 비즈니스 요구 사항을 준수하는지 확인할 수 있습니다. 이는 다운스트림 비즈니스 프로세스에서 비용이 많이 드는 오류와 예외를 제거하는 데 도움이 됩니다.

Nanonets는 REST API, Zapier 또는 웹후크를 통해 널리 사용되는 비즈니스 시스템과 원활하게 통합되어 파일을 플랫폼으로 자동 수집하고 추출된 데이터를 다른 애플리케이션으로 내보낼 수 있으므로 수동 정렬, 분류, 이름 변경 또는 데이터 입력이 필요하지 않습니다. .

앱이 연결되고 워크플로가 설정되면 PDF 및 스캔한 문서에서 데이터 추출 및 수집이 자동 조종 장치에서 실행될 수 있습니다. 이를 통해 직원들은 일상적인 문서 처리 작업에서 벗어나 부가가치가 있는 작업에 집중할 수 있습니다.

예제

매일 수백 개의 PDF를 처리하는 채용 회사를 운영한다고 가정해 보겠습니다. 귀하의 팀은 이력서와 지원서에서 이름, 이메일 주소, 전화번호, 기술 및 경험을 수동으로 추출합니다. Nanonets를 사용하면 OCR PDF에 대한 자동화된 파이프라인을 생성하고 이력서에서 대규모로 구조화된 데이터를 추출할 수 있습니다. 이 플랫폼은 이력서 레이아웃을 이해하고 정확한 데이터 필드를 추출하므로 수동 개입을 최소화하면서 대량의 문서를 신속하게 처리할 수 있습니다.

Gmail, Google Drive, OneDrive 및 Dropbox에서 문서 자동 가져오기를 설정할 수 있습니다. Microsoft Dynamics, QuickBooks 및 Xero와 같은 도구와의 통합을 통해 추출된 데이터를 비즈니스 시스템으로 자동으로 라우팅할 수 있습니다. 또한 인기 있는 워크플로 자동화 플랫폼인 Zapier와 통합되어 5,000개가 넘는 앱을 연결합니다.

예를 들어 OCR이 Google Drive에 업로드된 PDF 형식으로 재개하고 이름, 이메일 및 전화번호를 Google 시트로 추출한 다음 Zapier를 사용하여 이러한 연락처를 CRM에 추가하고 HR에 작업을 할당하는 자동화된 워크플로를 만들 수 있습니다. 대표자들은 잠재력이 높은 후보자들에 대한 후속 조치를 취합니다.

컨텍스트를 잃지 않고 다양한 통화, 언어, 레이아웃 및 형식의 문서를 처리할 수 있습니다. AI는 훈련 데이터와 수동 개입을 통해 학습하여 정확도를 높입니다.

시작하는 방법?

5~10개 문서의 샘플 세트를 업로드하고 추출하려는 텍스트에 주석을 추가하면 Nanonets가 자동으로 문서에 맞는 맞춤형 AI 모델을 구축합니다. 한 달에 수천 페이지를 처리할 수 있으며 95%의 정확도를 유지합니다.

Nanonets의 가격은 사용량을 기준으로 책정되므로 소규모로 시작하여 필요에 따라 확장할 수 있습니다. 처음 500페이지는 무료이며 세 가지 AI 모델에 액세스할 수 있으므로 커밋하기 전에 여러 문서 유형에서 Nanonet을 테스트할 수 있습니다.

마무리

PDF에서 복사하고 붙여넣는 것이 번거로운 일이 될 필요는 없습니다. 올바른 도구와 기술을 사용하면 프로세스를 단순화하고 능률화할 수 있습니다.

가장 좋은 접근 방식은 특정 요구 사항과 문서에 따라 다릅니다. PDF의 복잡성, 작업 흐름 요구 사항, 데이터 개인 정보 보호 정책 등을 평가합니다. 상황에 맞는 모든 조건을 충족하는 솔루션을 찾는 것은 장기적인 효율성에 매우 중요합니다. 목표는 PDF 텍스트를 복사하는 수동 작업을 없애는 것입니다. 한 달에 몇 개의 문서를 처리하든, 매일 수천 페이지를 처리하든 관계없이 귀하의 삶을 더 쉽게 만들어 주는 솔루션이 존재합니다.

SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
PlatoData.Network 수직 생성 Ai. 자신에게 권한을 부여하십시오. 여기에서 액세스하십시오.
PlatoAiStream. 웹3 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
플라톤ESG. 탄소, 클린테크, 에너지, 환경, 태양광, 폐기물 관리. 여기에서 액세스하십시오.
PlatoHealth. 생명 공학 및 임상 시험 인텔리전스. 여기에서 액세스하십시오.
출처: https://nanonets.com/blog/copy-and-paste-from-pdf/

타임 스탬프 : 2024년 ２월 8일

타임 스탬프 : 2022 년 5 월 9 일

PDF에서 쉽게 복사하여 붙여넣는 방법

플라톤에 의해 재발행

1. PDF에서 텍스트 복사 및 붙여넣기

ㅏ. Adobe Acrobat Reader의 선택 도구 사용

비. Microsoft Word 또는 Google Docs에서 PDF를 엽니다.

씨. 온라인 변환기에 파일 업로드

2. PDF에서 이미지 복사 및 붙여넣기

ㅏ. 스크린샷 도구를 사용하여 PDF 캡처

비. Acrobat Pro의 스냅샷 도구 사용

씨. PDF 페이지를 이미지 파일로 변환

3. PDF에서 데이터 복사 및 붙여넣기

주요 역량

예제

시작하는 방법?

마무리

더보기 AI 및 머신 러닝

소액 현금 조정: 모범 사례 및 자동화

워크플로 자동화 가이드 및 5년을 위한 2022가지 최고의 워크플로 소프트웨어

8년 상위 2022 러시아 OCR 소프트웨어

Excel 자동화: 스프레드시트를 슈퍼 도구로 변환

10 Beste OCR 소프트웨어 | OCR Texterkennung Vergleich

구매 주문 자동화

PDF에서 텍스트를 읽거나 추출하는 방법

회사 소개

수직 검색 및 인공 지능

플랫폼

연결 유지

계정