온라인 OCR
설치 없이 사용할 수 있는 무료 온라인 OCR 텍스트 인식 서비스. 이미지에서 텍스트를 추출 가능.
온라인 OCR 소개
브라우저에서 완전히 실행되는 Tesseract.js를 사용하여 이미지에서 텍스트를 추출합니다. 업로드, 드래그 앤 드롭, 클립보드 붙여넣기(Ctrl+V)로 모든 이미지를 받을 수 있으며, 10가지 인식 언어인 영어, 간체 중국어, 번체 중국어, 일본어, 한국어, 프랑스어, 독일어, 스페인어, 러시아어, 아랍어를 지원합니다.
사용 방법
1. 드롭 영역을 클릭하거나, 이미지를 드롭 영역으로 드래그하거나, 클립보드에서 붙여넣습니다. 2. 드롭다운에서 인식 언어를 선택합니다. 3. Recognize를 클릭하고 진행률 표시줄을 확인합니다. 4. 추출된 텍스트와 신뢰도 점수를 검토한 후 Copy를 클릭합니다.
언어 및 신뢰도
언어 팩은 Tesseract.js가 필요에 따라 가져오므로, 특정 언어의 첫 실행 시 해당 학습 데이터를 다운로드하며 시간이 더 걸릴 수 있습니다. 결과 카드에는 텍스트와 함께 엔진의 신뢰도 백분율이 표시됩니다. 신뢰도가 낮으면 일반적으로 소스 이미지가 흐릿하거나, 대비가 낮거나, 장식적인 글꼴임을 의미합니다.
▶첫 인식이 느린 이유는 무엇인가요?
Tesseract.js는 최초 사용 시 언어 모델(예: eng.traineddata)을 다운로드하고 이후 캐시합니다. 동일한 언어로의 후속 실행은 더 빠릅니다.
▶인식 정확도가 낮은 이유는 무엇인가요?
일반적인 원인: 소스가 흐릿하거나 저해상도, 복잡한 배경, 특이한 글꼴, 손글씨. 선명하고 조명이 좋으며 대비가 높은 이미지를 사용하고 올바른 언어를 선택하세요.
▶한 이미지에서 여러 언어를 인식할 수 있나요?
아니요. 드롭다운은 한 번에 하나의 언어만 선택할 수 있습니다. 다국어가 혼합된 텍스트의 경우 언어별로 한 번씩 인식을 실행하세요.
▶내 이미지가 서버에 업로드되나요?
아니요. OCR은 브라우저의 Tesseract.js를 통해 로컬에서 실행됩니다. 네트워크를 통해 가져오는 것은 언어 모델뿐이며, 이미지는 기기를 떠나지 않습니다.
이 도구가 당신에게 도움이 되었다면, 저에게 커피 한 잔 사주세요.
제게 커피 한 잔 사주세요.