우당탕탕 개발일기
한글 OCR 참고 자료 본문
OCR은 사람이 직접 입력하지 않고 스캐너를 통해 이미지 형태로 읽어들여 데이터의 내용을 분석하고 그림 영역과 글자 영역으로 구분한 후 글자 영역의 문자들을 일반 문서 편집기에 수정, 편집이 가능한 텍스트의 형태로 변환하여 주는 자동 입력 시스템
https://junstar92.tistory.com/154
https://github.com/junstar92/hangul-syllable-recognition
모델의 예측결과 중에서 상위 다섯 개의 결과도 보여주고 있습니다.
https://d2.naver.com/helloworld/8344782
인공지능을 학습할 때 사용할 데이터는 텍스트(또는 텍스트로 분류되는 것)가 있는 이미지와 텍스트가 아닌 것이 있는 이미지, 2가지로 만들면 된다.
정확한 판단을 위해서는 Positive 사례와 Negative 사례를 각각 최소 3,000장 이상 준비해 학습 데이터로 구축하는 것이 좋다.
학습 모델은 Inception, VGG 등 어떤 모델 사용해도 무방하다. Inception-v3 모델과 TensorFlow을 조합해 사용했을 때의 정확도는 96%였다.
https://github.com/clovaai/deep-text-recognition-benchmark
\TRBA (TPS-ResNet-BiLSTM-Attn) : 대소문자 구분 못함
TRBA (case-sensitive version) : 대소문자 구분
--> 영어라서 그런듯. 나는 한글 인식률이 높아야한다!
https://brunch.co.kr/@kakao-it/318
카카오 OCR에서 사용하는 사물 탐지 모델은 YOLO와 거의 흡사한 구조를 가진 EAST(efficient and accurate scene text detector)를 기반으로 하되 조금 변형된 모델이다.
https://velog.io/@vanang7/%EA%B5%AD%EB%AC%B8-%EC%98%A4%ED%94%88%EC%86%8C%EC%8A%A4-OCR
이 기술은 경계할 것. 저작권 시비 가능성
https://yunwoong.tistory.com/58
코드 짜는 법
https://da-nika.tistory.com/85
https://bslife.tistory.com/61?category=767584
'What I Learned > etc.' 카테고리의 다른 글
[git] 작업 중 다른 브랜치로 이동해야할 때 좋은 git stash (0) | 2022.08.23 |
---|---|
WIL (0) | 2022.08.08 |
[알고리즘] 이분탐색 (0) | 2022.03.28 |
[HTTP] HTTP 메소드 GET, POST (0) | 2022.02.08 |
[firebase] firebase import 오류 (0) | 2022.02.07 |