zipi

VuPoint에 들어 있는 문자인식 IRIS의 성능은?? [OCR, 문자인식 사용하기] 본문

리뷰

VuPoint에 들어 있는 문자인식 IRIS의 성능은?? [OCR, 문자인식 사용하기]

zipi 2012.03.28 07:47


VuPoint의 패키지 안에는 CD 2장이 들어 있습니다. 둘 모두 OCR 프로그램으로 스캔한 이미지파일을 문자로 인식해 변환해 주는 프로그램입니다.

두 시디 중 IRIS프로그램이 경우 한국어가 지원합니다. Readiris Pro 11 버전이며, 쉐어웨어나 기능제한판이 아닌 시리얼넘버가 들어 있는 정품입니다.

현재 Readiris Pro 12 버전이 다운로드 전용으로 130달러 정도에 팔리고 있는데 VuPoint 구매할 가격에 구버전이지만 OCR 프로그램 정품까지 따라오는 격입니다.

이번 프로그램에서는 이 OCR 프로그램을 소개해 보도록 하겠습니다.



간단히 사용하는 IRIS PRO 11 

CD를 넣고 설치를 완료하면 IRIS PRO를 사용할 수 있습니다.

영문버전이라 아쉽지만 쉽게 사용할 수 있습니다. 마법사를 통해 Image파일을 선택하고 출력할 파일을 지정하면 됩니다. PDF나 rtf(MS-Word) 파일을 지정하는게 제일 좋습니다.


위처럼 위자드를 이용하면 쉽게 사용할 수 있습니다.

Image Files를 선택한 후 출력을 변경하면 됩니다. 저의 경우 Word rtf 출력을 사용하였습니다. 지원하는 출력이 굉장히 많지만 doc 파일이 없는것이 아쉽습니다.

위 파일 모두 이미지와 사진이 같이 나오며, 스캔 내용 중 사진 부분만 따로 출력하고, 글 부분은 인식하여 저장됩니다.



위에서 이미지 파일을 고르면 위 화면처럼 나타납니다. 가운데 편집창에서 약간의 수정을 할 수 있습니다.

모든 내용이 글자일 경우 바로 저장하면 되지만, 중간에 사진이 있을 경우 약간 손을 바줘야 정확하게 문자가 인식이 됩니다.

위 사진에서 주황색 박스는 글자를 나타내며, 보라색 박스는 사진이 됩니다. 잘 보시면 사진이 제대로 선택이 안되어 있거나, 사진 내에 주황색 박스가 있습니다. 이부분을 잘 조절하면 완벽한 문자인식이 됩니다.




문자인식 결과

위와 같은 스캔 결과를 프로그램을 통해 바꾸어 봤습니다. 거의 완벽에 가깝게 인식이 됩니다.

다만 필기체 형식 같은 경우 인식이 제대로 안되었습니다.



MS Word로 보면 위처럼 나타납니다.

단순히 문자의 경우 잘 인식하지만, 위처럼 글씨체가 특이한 경우 인식이 잘 안되기도 합니다. 또한 문자인식 속도 또한 빠른편입니다. 한장 변환하는데 2~3초 정도로 상당히 빠른 수준입니다.



위 두 사진은 왼쪽이 스캔한 결과이고 우측이 스캔한 것을 IRIS를 통해 인식한 결과입니다.

문자가 주류인 책의 경우 위처럼 높은 인식률을 보이고 있습니다. 또한 우측에 있는 내용까지 표현하는 것까지 지원됩니다. 




위 사진도 좌측이 스캔한 결과이고 우측의 경우 OCR로 인식한 결과입니다.

사진 부분도 정확히 들어갔으며, 문자 인식의 경우 조금 다른점이 있긴 하지만 이정도면 조금만 수정을 거치면 완벽하게 인식이 되었다고 생각됩니다.





책을 스캔한 결과입니다. 두개의 사진을 넣었더니 워드에 한 파일로 나왔습니다. 위와 같이 스캔이 되었습니다. 정확한 위치에 된 것이 아니라 문자로 변환하다 보니 위치가 조금 바뀐 듯 하지만 주석 입력 부분까지 잘 인식되었습니다. 페이지 까지도 정확히 인식이 되었네요.



위에서 스캔한 원본의 경우 300DPI 컬러로 스캔하였습니다. 보정없이 바로 넣은 것입니다. 아래 파일은 스캔한 이미지와 그것을 인식한 결과물입니다. 

rtf파일인데 꼭 MS-Word로 보세요. 워드패드로 볼 경우 제대로 나오지 않습니다.

IRIS는 VuPoint 뿐 아니라 다른 스캐너에서 스캔한 결과물에서도 사용할 수 있습니다.


OCR결과.zip


이 글은 에누리 체험단으로 선정되어 작성한 것으로 제품을 무상으로 지원받아 작성하였습니다.




신고
4 Comments
  • 프로필사진 Favicon of http://www.tisdory.com BlogIcon 철한자구/서해대교 2012.03.29 22:02 신고 ocr은 말만 자주 들었지, 직접 활용하는걸 자세히 보지는 못해서 생소했었는데 말이죠 ㅎ
  • 프로필사진 Favicon of http://zipi.me BlogIcon zipi 2012.04.01 11:53 신고 잘 활용할 일이 없죠.

    예전에 한번 사용해 본적이 있는데, 인식률이 꽝...
    그런데 이제는 엄청 좋아졌나 봅니다.
  • 프로필사진 trinity0625 2012.07.29 20:12 신고 쓰셔보니까 어떠시던지요 ㅎ
    전 ABBYY FINEREADER 11 이 프로그램 쓰고 있는데, 인식율이 상당히 마음에 들던데,
    가격도 최근에 할인 행사 시작해서 소비자층이 다가가기에 부담이 크게 줄었다 생각합니다..
    한국어 인터페이스가 상당히 편리하기도 하구요.
    http://finereader.abbyy.com/korean_ocr_software/
    학생들 대상으로 한 특별 할인 행사도 있다고 하니, 학생들에게도 좋은 기회네요.
  • 프로필사진 Favicon of http://zipi.me BlogIcon zipi 2012.07.29 20:42 신고 abbyy 제품도 번들로 있던거 같았습니다만, 제 번들에서는 한국어 인식이 안되더라구요.

    IRIS 제품 자체는 꽤 인식률이 좋지만, 폰트가 다른경우 인식이 잘 안되는 단점이 있더라구요.
댓글쓰기 폼