PDF 텍스트 추출 (OCR)
스캔된 PDF나 이미지로 된 PDF에서 텍스트를 인식하여 추출합니다.
한국어, 영어, 한영 혼용을 지원합니다.
💡 일반 PDF vs 스캔 PDF
• 일반 PDF(텍스트 선택 가능) → PDFKit의 PDF→텍스트 변환이 더 빠르고 정확합니다
• 스캔 PDF(이미지로 구성된 PDF) → 이 도구가 OCR로 텍스트를 인식합니다
• 일반 PDF(텍스트 선택 가능) → PDFKit의 PDF→텍스트 변환이 더 빠르고 정확합니다
• 스캔 PDF(이미지로 구성된 PDF) → 이 도구가 OCR로 텍스트를 인식합니다
언어 선택
PDF 파일을 여기에 끌어다 놓으세요
스캔 PDF 또는 이미지로 구성된 PDF 파일
⚠️ 안내
• 페이지가 많을수록 처리 시간이 길어집니다 (1페이지당 약 5~30초)
• 첫 실행 시 언어 데이터를 다운로드합니다 (한국어 약 10MB)
• 모든 처리는 브라우저에서 이루어지며 PDF가 서버로 전송되지 않습니다
• 텍스트 선택이 가능한 일반 PDF는 PDFKit을 이용하세요
• 페이지가 많을수록 처리 시간이 길어집니다 (1페이지당 약 5~30초)
• 첫 실행 시 언어 데이터를 다운로드합니다 (한국어 약 10MB)
• 모든 처리는 브라우저에서 이루어지며 PDF가 서버로 전송되지 않습니다
• 텍스트 선택이 가능한 일반 PDF는 PDFKit을 이용하세요
자주 묻는 질문
Q. 일반 PDF와 스캔 PDF의 차이가 뭔가요?
텍스트가 선택되는 일반 PDF는 PDFKit 텍스트추출 도구를 이용하세요. 이 도구는 스캔된 이미지형 PDF 전용입니다.
Q. 여러 페이지 PDF도 처리되나요?
네, 전체 페이지를 순서대로 OCR 처리하여 텍스트를 추출합니다.
Q. 처리 속도가 느린 이유는?
페이지당 이미지 렌더링 후 AI OCR을 수행하므로 페이지 수에 비례하여 시간이 걸립니다.