우당탕탕 개발일기

한글 OCR 참고 자료 본문

What I Learned/etc.

한글 OCR 참고 자료

rilee 2022. 7. 28. 16:36
728x90

 OCR은 사람이 직접 입력하지 않고 스캐너를 통해 이미지 형태로 읽어들여 데이터의 내용을 분석하고 그림 영역과 글자 영역으로 구분한 후 글자 영역의 문자들을 일반 문서 편집기에 수정, 편집이 가능한 텍스트의 형태로 변환하여 주는 자동 입력 시스템

 

https://cvml.tistory.com/16

 

[#00] OCR? 딥러닝을 이용해 문자 인식하기 - 개념 정리

OCR - Optical Character Recognition  OCR은 사람이 직접 입력하지 않고 스캐너를 통해 이미지 형태로 읽어들여 데이터의 내용을 분석하고 그림 영역과 글자 영역으로 구분한 후 글자 영역의 문자들을 일

cvml.tistory.com

https://junstar92.tistory.com/154

 

한글 음절 인식기(OCR)

Github : github.com/junstar92/hangul-syllable-recognition 머신러닝, 딥러닝을 공부하면서 OCR, 특히 한글 OCR에 대해서 한번 직접 구현해보고 싶었고, 한글 텍스트 탐지 및 인식을 시작하기 전에 가볍게 한글..

junstar92.tistory.com

https://github.com/junstar92/hangul-syllable-recognition

 

GitHub - junstar92/hangul-syllable-recognition: hangul syllable recognition 한글 음절 인식기

hangul syllable recognition 한글 음절 인식기. Contribute to junstar92/hangul-syllable-recognition development by creating an account on GitHub.

github.com

 모델의 예측결과 중에서 상위 다섯 개의 결과도 보여주고 있습니다.

 

https://d2.naver.com/helloworld/8344782

인공지능을 학습할 때 사용할 데이터는 텍스트(또는 텍스트로 분류되는 것)가 있는 이미지와 텍스트가 아닌 것이 있는 이미지, 2가지로 만들면 된다. 

정확한 판단을 위해서는 Positive 사례와 Negative 사례를 각각 최소 3,000장 이상 준비해 학습 데이터로 구축하는 것이 좋다.

학습 모델은 Inception, VGG 등 어떤 모델 사용해도 무방하다. Inception-v3 모델과 TensorFlow을 조합해 사용했을 때의 정확도는 96%였다.

 

https://github.com/clovaai/deep-text-recognition-benchmark

 

GitHub - clovaai/deep-text-recognition-benchmark: Text recognition (optical character recognition) with deep learning methods.

Text recognition (optical character recognition) with deep learning methods. - GitHub - clovaai/deep-text-recognition-benchmark: Text recognition (optical character recognition) with deep learning ...

github.com

\TRBA (TPS-ResNet-BiLSTM-Attn) : 대소문자 구분 못함

TRBA (case-sensitive version) : 대소문자 구분

--> 영어라서 그런듯. 나는 한글 인식률이 높아야한다!

 

https://brunch.co.kr/@kakao-it/318

 

카카오 OCR 시스템 구성과 모델

[카카오AI리포트] 모종훈, 오형석 | 대부분의 사람들은 카카오의 수많은 텍스트 데이터에 초점을 맞추지만, 카카오의 다양한 서비스에서 가장 필요로 하는 핵심적인 기술 중 하나는 이미지 내의

brunch.co.kr

카카오 OCR에서 사용하는 사물 탐지 모델은 YOLO와 거의 흡사한 구조를 가진 EAST(efficient and accurate scene text detector)를 기반으로 하되 조금 변형된 모델이다.

 

https://medium.com/@sunwoopark/%EB%94%A5%EB%9F%AC%EB%8B%9D%EC%9D%84-%ED%99%9C%EC%9A%A9%ED%95%9C-%ED%95%9C%EA%B8%80%EB%AC%B8%EC%9E%A5-ocr-%ED%94%84%EB%A1%9C%EC%A0%9D%ED%8A%B8-hclt-2019-bb9d17622412

 

딥러닝을 활용한 한글문장 OCR 프로젝트, HCLT 2019

2019년 4월부터 10월까지 6개월동안 딥러닝 개인프로젝트를 진행했고 그 과정에서 주제선정부터 논문작성까지 배우고 느낀것들을 정리해보려 한다

medium.com

 

https://velog.io/@vanang7/%EA%B5%AD%EB%AC%B8-%EC%98%A4%ED%94%88%EC%86%8C%EC%8A%A4-OCR

 

국문 OCR 오픈소스 소개

OCR은 Digitization의 관문 OCR의 역사는 오래되었으나, 근래들어 기업들의 활용도가 높아 지고 있으며 시장 역시 2025년 133억 달러에 이를 것을 예상할 정도로 커지고 있습니다. OCR이 중요한 이유는

velog.io

https://scienceon.kisti.re.kr/commons/util/originalView.do?dbt=CFKO&cn=CFKO201821464987120&oCn=NPAP12688214&pageCode=PG11&journal=NPRO00377584 

 

원문보기 - ScienceON

 

scienceon.kisti.re.kr

이 기술은 경계할 것. 저작권 시비 가능성

 

https://yunwoong.tistory.com/58

 

[ OCR ] 파이썬 Tesseract OCR 활용 (기본) - Python

OCR이라는 기술은 정확히는 몰라도 한 번쯤은 들어봤거나 차량 번호판 인식, 카드번호 인식과 같이 이미 직ㆍ간접적으로 경험해 본 적이 있을 것입니다. OCR(Optical character recognition)의 역사는 생각

yunwoong.tistory.com

코드 짜는 법

 

https://da-nika.tistory.com/85

 

Table Detection using Deep Learning 따라하기

원문 : https://blog.goodaudience.com/table-detection-using-deep-learning-7182918d778 Table Detection using Deep Learning For a specific task I had to solve I recently came across some interesting p..

da-nika.tistory.com

 

https://bslife.tistory.com/61?category=767584 

 

[python] PDF에서 Text 추출하기 (Extract elements from a PDF using Python)

Library Name pdfminer.six Document | Source https://pdfminersix.readthedocs.io/en/latest/index.html How to Install # pip install pdfminer.six 1. pdf elements 까지 전부 추출 from pdfminer.high_level..

bslife.tistory.com

https://taptorestart.tistory.com/entry/PDF%EB%A5%BC-%ED%85%8D%EC%8A%A4%ED%8A%B8%EB%A1%9C-%EB%B0%94%EA%BF%94%EC%A3%BC%EB%8A%94-pdfminersix-pypdf2-pdfplumber-%EB%B9%84%EA%B5%90%ED%95%B4%EB%B3%B4%EA%B8%B0

 

PDF를 텍스트로 바꿔주는 pdfminer.six, pypdf2, pdfplumber 비교해보기

여기 2030년 자율주행 서비스 일상화, 미래 모빌리티 선도국가 도약란 국토교통부의 보도자료가 있다. 보도자료는 보통 PDF와 HWP 파일로 공개된다. 이 중 PDF를 텍스트로 변경해보고 싶다. 많이 쓰

taptorestart.tistory.com

 

728x90

'What I Learned > etc.' 카테고리의 다른 글

[git] 작업 중 다른 브랜치로 이동해야할 때 좋은 git stash  (0) 2022.08.23
WIL  (0) 2022.08.08
[알고리즘] 이분탐색  (0) 2022.03.28
[HTTP] HTTP 메소드 GET, POST  (0) 2022.02.08
[firebase] firebase import 오류  (0) 2022.02.07