본문 바로가기
리뷰

VuPoint에 들어 있는 문자인식 IRIS의 성능은?? [OCR, 문자인식 사용하기]

by zipi 2012. 3. 28.
반응형


VuPoint의 패키지 안에는 CD 2장이 들어 있습니다. 둘 모두 OCR 프로그램으로 스캔한 이미지파일을 문자로 인식해 변환해 주는 프로그램입니다.

두 시디 중 IRIS프로그램이 경우 한국어가 지원합니다. Readiris Pro 11 버전이며, 쉐어웨어나 기능제한판이 아닌 시리얼넘버가 들어 있는 정품입니다.

현재 Readiris Pro 12 버전이 다운로드 전용으로 130달러 정도에 팔리고 있는데 VuPoint 구매할 가격에 구버전이지만 OCR 프로그램 정품까지 따라오는 격입니다.

이번 프로그램에서는 이 OCR 프로그램을 소개해 보도록 하겠습니다.



간단히 사용하는 IRIS PRO 11 

CD를 넣고 설치를 완료하면 IRIS PRO를 사용할 수 있습니다.

영문버전이라 아쉽지만 쉽게 사용할 수 있습니다. 마법사를 통해 Image파일을 선택하고 출력할 파일을 지정하면 됩니다. PDF나 rtf(MS-Word) 파일을 지정하는게 제일 좋습니다.


위처럼 위자드를 이용하면 쉽게 사용할 수 있습니다.

Image Files를 선택한 후 출력을 변경하면 됩니다. 저의 경우 Word rtf 출력을 사용하였습니다. 지원하는 출력이 굉장히 많지만 doc 파일이 없는것이 아쉽습니다.

위 파일 모두 이미지와 사진이 같이 나오며, 스캔 내용 중 사진 부분만 따로 출력하고, 글 부분은 인식하여 저장됩니다.



위에서 이미지 파일을 고르면 위 화면처럼 나타납니다. 가운데 편집창에서 약간의 수정을 할 수 있습니다.

모든 내용이 글자일 경우 바로 저장하면 되지만, 중간에 사진이 있을 경우 약간 손을 바줘야 정확하게 문자가 인식이 됩니다.

위 사진에서 주황색 박스는 글자를 나타내며, 보라색 박스는 사진이 됩니다. 잘 보시면 사진이 제대로 선택이 안되어 있거나, 사진 내에 주황색 박스가 있습니다. 이부분을 잘 조절하면 완벽한 문자인식이 됩니다.




문자인식 결과

위와 같은 스캔 결과를 프로그램을 통해 바꾸어 봤습니다. 거의 완벽에 가깝게 인식이 됩니다.

다만 필기체 형식 같은 경우 인식이 제대로 안되었습니다.



MS Word로 보면 위처럼 나타납니다.

단순히 문자의 경우 잘 인식하지만, 위처럼 글씨체가 특이한 경우 인식이 잘 안되기도 합니다. 또한 문자인식 속도 또한 빠른편입니다. 한장 변환하는데 2~3초 정도로 상당히 빠른 수준입니다.



위 두 사진은 왼쪽이 스캔한 결과이고 우측이 스캔한 것을 IRIS를 통해 인식한 결과입니다.

문자가 주류인 책의 경우 위처럼 높은 인식률을 보이고 있습니다. 또한 우측에 있는 내용까지 표현하는 것까지 지원됩니다. 




위 사진도 좌측이 스캔한 결과이고 우측의 경우 OCR로 인식한 결과입니다.

사진 부분도 정확히 들어갔으며, 문자 인식의 경우 조금 다른점이 있긴 하지만 이정도면 조금만 수정을 거치면 완벽하게 인식이 되었다고 생각됩니다.





책을 스캔한 결과입니다. 두개의 사진을 넣었더니 워드에 한 파일로 나왔습니다. 위와 같이 스캔이 되었습니다. 정확한 위치에 된 것이 아니라 문자로 변환하다 보니 위치가 조금 바뀐 듯 하지만 주석 입력 부분까지 잘 인식되었습니다. 페이지 까지도 정확히 인식이 되었네요.



위에서 스캔한 원본의 경우 300DPI 컬러로 스캔하였습니다. 보정없이 바로 넣은 것입니다. 아래 파일은 스캔한 이미지와 그것을 인식한 결과물입니다. 

rtf파일인데 꼭 MS-Word로 보세요. 워드패드로 볼 경우 제대로 나오지 않습니다.

IRIS는 VuPoint 뿐 아니라 다른 스캐너에서 스캔한 결과물에서도 사용할 수 있습니다.


OCR결과.zip


이 글은 에누리 체험단으로 선정되어 작성한 것으로 제품을 무상으로 지원받아 작성하였습니다.




반응형

댓글