Desenvolvimento de uma ferramenta computacional para recuperação e correção de textos digitalizados
DOI:
https://doi.org/10.5335/rbca.2013.2719Keywords:
OCR. Léxicos. Histogramas de Projeção. Correção ortográfica.Abstract
Atualmente, há diversas ferramentas computacionais voltadas para identificação e reconhecimento de palavras em arquivos digitais, onde um grande problema tem sido o tratamento de ruídos (falhas de aquisição e erros ortográficos). Estas inconveniências fazem com que os algoritmos de reconhecimento apresentem resultados abaixo do esperado. Este trabalho implementa uma solução para o reconhecimento de palavras com maior qualidade, aplicando algoritmos de remoção de ruído e melhora de contraste, bem como a adoção de um léxico aliado ao módulo de reconhecimento dos caracteres. Os resultados obtidos a partir dos testes de validação e correção das palavras com problemas com taxas de aproveitamento dentro dos limites esperados.Downloads
Download data is not yet available.
Downloads
Published
2013-05-17
Issue
Section
Original Paper
License

Todos os artigos estão licenciados com a licença Creative Commons Atribuição-NãoComercial-SemDerivações 4.0 Internacional. Autores que publicam nesta revista concordam com os seguintes termos:
a) Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
b) Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
c) Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).
How to Cite
[1]
2013. Desenvolvimento de uma ferramenta computacional para recuperação e correção de textos digitalizados. Brazilian Journal of Applied Computing. 5, 1 (May 2013), 71–83. DOI:https://doi.org/10.5335/rbca.2013.2719.