Programa que viabiliza a OCR (Optical Character Reading - leitura óptica de caracteres) de um PDF.

Last update: Oct 11, 2021

Related tags

Overview

Este programa tem o intuito de ser um modificador de arquivos PDF. Os arquivos PDFs podem ser 3: PDFs verdadeiros - em que podem ser selecionados o tipo de texto, PDFs-de-imagem - arquivos feitos de imagens e que o conteúdo é "aprisionado" e não pode ser acessado. Como terceiro tipo temos o PDFs-buscáveis: estes são os PDFs que resultam de aplicação OCR (Optical Character Recognition - Reconhecimento óptico de caracter), em que o documento é analizado e estruturado com uma nova camada de texto por detrás da camada de imagem do PDF-de-Imagem.

A criação do terceiro tipo de PDF a partir do segundo tipo é o intuito deste programa. Para isto é necessário a aplicação de alguns programas externos ao python.

Abaixo listarei o processo que utilizei para instalar estes programas externos:

Além de ter o python instalado e um ambiente virtual iniciado, é necessário utilizar o comando pip: pip install ocrmypdf. Esta biblioteca é um conjunto de pacotes que atuará sobre o PDF.

Primeiro de tudo, caso seja usuário de windows, é necessário ter um administrador de pacotes chamado Chocolotey . Após ter instalado ele, é necessário escrever os seguintes comandos:

choco install --pre tesseract
choco install ghostscript

Para mais informações sobre esse processo, caso utilizar MacOS ou Linux, acesse aqui.

Programa que viabiliza a OCR (Optical Character Reading - leitura óptica de caracteres) de um PDF.

Related tags

Overview

Owner

Daniel Soares Saldanha

Augmenting Anchors by the Detector Itself

This repository contains the code for the paper "SCANimate: Weakly Supervised Learning of Skinned Clothed Avatar Networks"

Detecting Text in Natural Image with Connectionist Text Proposal Network (ECCV'16)

Code for CVPR2021 paper "Learning Salient Boundary Feature for Anchor-free Temporal Action Localization"

Apply different text recognition services to images of handwritten documents.

OCR of Chicago 1909 Renumbering Plan

Single Shot Text Detector with Regional Attention

Volume Control using OpenCV

PianoVisuals - Create background videos synced with piano music using opencv

Image augmentation library in Python for machine learning.

FastOCR is a desktop application for OCR API.

Creating of virtual elements of the graphical interface using opencv and mediapipe.

DouZero is a reinforcement learning framework for DouDizhu - 斗地主AI

Recognizing the text contents from a scanned visiting card

pulse2percept: A Python-based simulation framework for bionic vision

Image Smoothing and Blurring Using OpenCV

textspotter - An End-to-End TextSpotter with Explicit Alignment and Attention

Code for the ACL2021 paper "Combining Static Word Embedding and Contextual Representations for Bilingual Lexicon Induction"

graph learning code for ogb

The code for CVPR2022 paper "Likert Scoring with Grade Decoupling for Long-term Action Assessment".