2005. 8. 17. 17:13

Character  Recognition


 


Google : 문자인식    Google : Character Recognition


Online Character Recognition (Pen based handwriting) : KAIST AI & Pattern Recognition lab : Demo : HMM based on-line handwriting recognition : 온라인 필기 인식기란 손으로 쓴 글씨를 바로 인식하여 컴퓨터에 입력 하는 시스템이다. 키보드 입력을 대체하여 필기 입력을 사용함으로써 컴퓨터에 익숙하지 않은 사람들도 부담 없이, 편리하게 이용할 수 있으며, 이동 중에도 간편하게 사용할 수 있어서 최근 들어 널리 보급되고 있는 PDA (Personal Digital Assistant), 전자수첩, 전자책 (e-book), 이동전화 등 휴대형 단말기의 입력수단으로 활용되고 있다 ....... 필기는 다양한 변형을 내재하고 있다. 동일한 사람이 동일한 내용을 필기하는 경우에도 그 모양과 크기에서 서로 차이가 나며, 사람에 따른 고유한 필기 습관에 따라 글씨의 모양, 크기, 그리고 필기 순서에 많은 차이가 존재한다. 특히 휴대용 단말기의 경우에는 불안정한 상태에서의 필기로 인하여 불균형성이 더욱 증대된다. 특히 한글의 경우에는 자모의 2차원적인 결합이라는 한글 고유의 특성에 따라 공간적인 변형 및 자모 간의 연결을 통한 변형이 심하다. 이에 따라 지금까지 개발되어온 많은 한글 필기 인식기는 자모의 모양을 제한하거나 자모간의 연결을 제한하는 등 사용자의 필기 형태에 제약을 가하여 불편함을 주고 있다. 한 예로서 현재 시장에 출하된 Palm Pilot의 경우에는 ‘graffiti’ 라는 특정 형태의 필기만을 허용하고 있다.

Offline Chararcter Recognition (handwritten) : KAIST AI & Pattern Recognition lab : Demo : Postprocessing of handwritten Hangul recognition using pair-wise grapheme discrimnation (자모 단위 유사쌍 구분을 이용한 필기체 한글인식의 후처리) : 한글은 자모의 조합으로 이루어져 있으며, 이런 특성상 조합가능한 글자의 수는 11,172 자이다. 하지만 하나의 인식기로 전부를 구분해내기는 매우 어렵다. 특히 필기체 문자의 경우 필기자 간의 변이가 상당히 커서, 인식은 더욱 어려워진다. 예를들어 필기자가 바뀌어서 생기는 변이 (intra-class variation) 는 동일한 필기자가 다른 글씨를 쓸 때 생기는 변이 (inter-class variation) 보다 큰 경우가 많다 .......... 그리고 한글이 자모의 조합으로 이루어진다는 특징 때문에 유사한 형태를 가지는 문자쌍이 많이 나타나게 된다 ..... 하나의 인식기로 필기자간의 변이 흡수나 유사한 형태의 문자쌍의 차이를 식별하기는 매우 어려우며, 인식기의 성능도 떨어지게 된다. 따라서, 인식기의 부족한 점을 보완하고 전체 시스템의 성능을 향상시킬 수 있는 후처리기의 도입이 필요하다 ......... 후처리를 수행하는 방법은 크게 문맥 정보를 이용하는 후처리방법과 글자의 특징을 이용하는 후처리 방법으로 나눌 수 있다. 문맥정보를 이용하는 경우 사전이나 언어 모델을 이용하여 기존 인식기의 오류를 정정할 수 있다. 이 방법은 단어나 문장 등을 대상으로 인식을 수행하는 인식기에 적용이 가능하다. 글자의 특징을 이용하는 후처리 방법은 자주 혼동되는 유사쌍을 구분할 수 있는 구분기를 사용함으로써 오류를 정정하게 된다. 이 방법은 단어와 문장뿐 아니라 낱자를 대상으로 인식을 수행하는 인식기에도 적용이 가능하다 .........

문서 분석 및 인식 : 고려대 Computer Vision & Pattern Recognition lab : Research : 문서 분석과 자연영상에서의 문자열 추출은 문서 및 영상을 이해하기 위한 가장 기초적이고 중요한 문제이다. 문자 인식은 이미 많은 상용화된 제품들이 많이 있는 반면에 복잡한 문서나 자연 영상(Scene Image)등을 분석하고 인식하는 일은 아직 쉽게 풀리지 않는 어려운 문제이다. 여러가지 환경에서 문자를 찾아내고 분석하여, 이미 많은 연구가 되어있는 문자 인식기(OCR) 모듈을 부착함으로써 여러가지 응용에 사용될수 있다


문서인식 (Optical Character Recognition : OCR) :  Perceptcom : 아르미 :  OCR 시스템이란 말 그대로 책, 잡지, 신문 등의 기존 인쇄 자료들을 사람이 직접 입력하지 않고 스캐너를 통해 이미지 형태로 읽어 들여 데이터의 내용을 분석, 그림영역과 글자영역으로 구분한 후 글자 영역의 문자들을 일반 문서편집기에서 수정, 편집이 가능한 텍스트(Text)의 형태로 변환하여 주는 자동입력 시스템을 말합니다.


PCAI : Optical Character Recognition





요새 공부하던것..
공부하는것..
재미있는것..?


출처 : blog.naver.com/hongcom

'Hobby > Computer' 카테고리의 다른 글

사이버독도사건  (1) 2005.10.28
W.S. #00  (0) 2005.10.27
정렬 알고리즘 모음집  (0) 2005.08.17
가짜, 진짜, 아즈키.  (3) 2005.08.11
C 프로그래머를 위한 C++ 강좌..  (0) 2005.08.11
Posted by 아즈키