알아두면 득이 되는 얘기들

이미지를 텍스트로 추출해주는 OCR 사이트

몽인몽 2024. 4. 14. 13:05

이미지 텍스트 추출 OCR

 

OCR 이란?

간단히 말하자면, OCR(Optical Character Reader)광학식 문자판독기, 이미지에 포함되어 있는 문자나 글자를 추출하고 인식하여, 편집 가능한 텍스트로 변환해주는 것을 뜻합니다.

 

저는 직업상 이미지나 PDF 파일로 되어 있는 문서를 받아 편집해서 사용해야 하는 경우가 종종 있는데요, 그런 경우 아주 요긴하게 사용할 수 있는 것이 바로 OCR입니다.

OCR이 없다면 이미지나 PDF 파일에 있는 문자들을 하나하나 타이핑해서 써야 하겠죠..? 그야말로 노력 낭비, 시간 낭비이겠죠..^^;

 

OCR 기술은 정말 빠르게 발전하고 있는 것 같아요. 예전에는 오타나 오류가 너무 많아서, 이 많은 오류를 잡아내고 있느니 차라리 타이핑 노가다를 하고 말지.. 이런 경우도 많았답니다.

그런데 요즘엔 70-80% 이상 정확하게 추출해주기 때문에 진짜 편하더라구요. 기술의 발전이 정말 놀랍죠?

그럼 이런 OCR을 어떻게 이용할 수 있는지 알아볼까요?

 

OCR 이용 방법

OCR을 이용하는 방법에는 여러 가지가 있습니다.

크게 나눠서 보면,

 

1. OCR 소프트웨어를 이용하는 방법

2. OCR 사이트를 이용하는 방법

3. OCR 을 사용하는 방법

 

이렇게 세 가지로 나눌 수 있을 것 같네요요즘에는 OCR 전문 프로그램이 아니더라도, 프로그램의 기능 중 하나로 OCR이 들어가 있는 경우도 많습니다

 

그중에서 제가 소개하려고 하는 건, OCR 사이트를 이용하는 방법입니다.

따로 프로그램이나 앱을 설치할 필요도 없고, 회원가입도 필요 없고, 돈도 필요 없고, 그냥 사이트에 접속해서 이미지만 넣어주면 변환된 텍스트를 바로 받을 수 있는 아주 편리한 방법이죠.

 

OCR 사이트도 유료/무료, 기능 등 다양하지만, 무료로 사용할 수 있는 것들 중 제가 사용해보고 정확성과 편리성, 속도 등에서 만족했던 사이트들을 소개하려고 합니다.

 

https://www.ocr.best/

 

Free Online OCR Converter – Convert Image & PDF to Text

Extracts information from unstructured docs and images ML finds, extracts, and cleans extraction points (template -free)

www.ocr.best

 

ocr.best이미지와 PDF를 편집 가능한 텍스트로 정확하게 변환하는 AI 기반 도구입니다.

이 사이트를 첫 번째로 추천하는 이유는 일일 한도도 없고, 회원가입을 해야 하는 것도 아니고모든 기능이 무료라는 것입니다. 게다가 무료라기엔 정확성, 속도, 성능 면에서 뛰어납니다.

 

사용법도 아주 간단해요.

‘ocr.best’를 입력하고 사이트로 들어갑니다. (영어가 보기 불편하신 분들은 구글 번역을 이용하시면 됩니다)

 

먼저 상단 메뉴를 보면, [PDF To Text] [PDF To Word] [Image To Text] 세 가지로 되어 있는 것을 볼 수 있습니다.

변환하려는 파일이 PDF인지 이미지인지에 따라 선택하시면 됩니다.

이미지 텍스트 추출 OCR

 

저는 [Image To Text]를 선택하고, 이미지를 하나 올려볼게요.

파일을 드래그해서 가져오거나, 문서 아이콘을 클릭해서 파일을 올려주세요.

 

이미지 텍스트 추출 OCR

 

업로드된 이미지에 제가 올린 이미지가 올라갑니다.

아래 로봇이 아닙니다체크하고, [Submit] 버튼을 눌러줍니다.

 

이미지 텍스트 추출 OCR

 

그러면 변환되고 있다는 표시가 뜨고, 잠시 후에 아래와 같이, 이미지 옆에 변환된 텍스트가 보입니다. 

 

이미지 텍스트 추출 OCR

 

텍스트 부분을 클릭해서 복사해도 되고, 왼쪽 상단에 [Download Zip]을 클릭해서 파일을 다운받아도 됩니다.

다른 작업을 또 하고 싶으면 왼쪽 상단의 [Start over]를 눌러주고, 위의 과정을 다시 하면 됩니다.

 

만약 작업할 문서가 여러 장이면 한꺼번에 여러 개를 올려도 됩니다. PDF 문서같은 경우, 여러 페이지를 하나의 파일로 올려도 되구요. 물론 양이 많을수록 속도는 느려지겠죠.

 

이 사이트의 최대 장점일일 한도와 용량의 제한을 두지 않는 것인데, 제가 해본 바로는 용량이 너무 크면 진행이 멈춰버리더라구요. 많은 양을 작업해야하면 페이지를 나눠서 하는 것이 좋습니다.

 

다른 사이트들도  변환 과정은 위와 아주 비슷합니다.

 

1. 이미지 파일 올리고, 

2. 변환하기 누르고, 

3. 잠시 기다리면 변환된 텍스트가 뜨고, 

4. 텍스트를 복사하든지 다운로드 받든지 하면 됩니다.

 

진짜 넘넘 쉽죠? 그런데 퀄리티는 상당히 만족하실 거에요. 원본 이미지가 아주 엉망이 아닌 이상 상당히 정확하게 추출이 되더라구요무료로 이런 퀄리티의 작업물을 얻을 수 있다니 저같이 OCR 기능이 꼭 필요한 사람에겐 넘넘 땡큐입니다. ^^

 

 

그럼 다른 사이트들도 간단히 살펴보겠습니다.

 

 

https://www.imagetotext.info/

 

Image to Text (Extract Text From Image)

Sign in with us today Enter your email and password to sign in your account Sign up with us today Enter your email and password to sign up your account Don't have an account? Sign Up Already have an account? Sign in

www.imagetotext.info

 

구성은 보시다시피 OCR.best와 흡사합니다. 그런데 이 사이트에는 OCR.best 보다 다양한 기능이 있어요.

화면 아래쪽을 보면 파일을 다양한 형식으로 변환할 수 있는 메뉴들이 있습니다.

 

특히 상단 메뉴 중 [Image Translator]라고 이미지의 문자를 추출해서 내가 원하는 언어로 번역까지 해주는 기능이 있는데, 이 기능도 아주 유용하게 사용하실 때가 있을 겁니다.

 

이미지 텍스트 추출 OCR

 

그럼 [Image Translator]를 한번 사용해 볼까요?

상단 메뉴에서 [Image Translator]를 선택하고, 파일을 올려줍니다.

파일은 [Browse]를 클릭해서 [From Device]에서 해당 파일을 선택하거나, 드래그해서 끌어와도 됩니다.

 

이미지 텍스트 추출 OCR

 

다음, 어떤 언어로 변환할 것인지 선택해야 하는데요, 

저는 [English]로 되어 있는 파일을, [Korean]으로 변환하도록 선택할게요.

그리고 아래 [Convert] 버튼 클릭!

 

이미지 텍스트 추출 OCR

 

그럼 아래 오른쪽 화면과 같이, 이미지의 영문 텍스트가 한글로 번역되어 나옵니다. 

이미지 텍스트 추출 OCR

 

언어도 아주 다양하게 지원되고 있으니 기회가 되면 한번 사용해 보세요.

, 이 사이트는 파일이 5Mb가 넘어갈 경우 유료 가입을 해야 합니다. 

 

 

https://www.imagetotext.cc/

 

이미지를 텍스트로 변환

저희 온라인 OCR (광학 문자 인식) 서비스를 사용하면 사용자가 이미지에서 텍스트를 쉽게 추출할 수 있습니다. 사진을 업로드하고 즉시 텍스트를 받아보세요.

www.imagetotext.cc

 

이 사이트도 이용방법은 위와 비슷합니다.  [Image Translator] 기능도 있구요.

파일을 드래그하거나 [기기에서 파일을 선택하세요] 클릭해서 올려주고, 아래 [Submit] 버튼 클릭해주면 됩니다.

 

이미지 텍스트 추출 OCR

 

텍스트가 나오면 오른쪽에 문서 아이콘 클릭해서 복사하면 됩니다.

 

여기서 [select language]를 클릭하면, 추출된 텍스트를 다른 언어로 번역까지 할 수 있습니다.

(아래 예시에서 추출된 한글을 영어로 번역해 보았습니다)

이미지 텍스트 추출 OCR

 

이 사이트는 가입도 필요없이 모두 무료라는 장점문자를 추출해서 바로 번역까지 할 수 있는 편리한 기능이 있습니다.

단, 제가 사용해본 바로는 용량이 커지면 속도가 많이 느려지고 가끔 사이트 자체가 멈춰버리는 경우가 있긴 하더군요.   

 

 

 

https://imagetranslator.io/

 

Image Translator - Translate Text From Image

Image translator is an online OCR-based tool that translates text on images in a fraction of a second, to translate image just upload a photo & this picture translator will do the rest

imagetranslator.io

 

이 사이트는 [Image Translator] 기능이 주가 되고, 자체적으로 간단한 이미지 조정을 할 수 있어, 포토샵같은 이미지 편집 프로그램이 없는 사람들이 간단하게 이용할 수 있다는 장점이 있습니다.

 

사이트의 상단이나 하단에 보면 다양한 메뉴들이 있는 걸 알 수 있어요.

이미지를 그레이스케일로 바꿔 준다거나, 배경을 제거해준다거나, 이미지의 색상을 밝게 혹은 어둡게 조정할 수 있습니다.

 

이미지 텍스트 추출 OCR

 

이미지 텍스트 추출 OCR

 

텍스트 추출 방법은 위와 흡사합니다.

상단 메뉴에서 [Image to text] 선택하고, 드래그하거나 Browse에서 파일을 열거나 혹은 링크 주소로도 불러올 수 있습니다.

 

이미지 텍스트 추출 OCR

 

이미지가 올라오면, [Extract Now] 버튼 클릭, 추출된 이미지가 나오면 다운로드하거나 복사하면 됩니다.

 

이미지 텍스트 추출 OCR

 

이미지 텍스트 추출 OCR

 

다른 무료 사이트들보다 다양한 기능이 있지만 파일 용량 5Mb까지만 가능합니다.

 

 

이렇게 해서 이미지에서 텍스트를 추출해주는 OCR 사이트 네 가지를 알아보았습니다.

사람에 따라 자주 필요하진 않을 수 있지만 가끔은 꼭 필요한 기능이니 알아두시고 유용하게 이용하셨으면 합니다.

그럼 전 이만!

 

반응형