sábado, 22 de maio de 2010

OCR... scan > edit > save as

As aplicações de OCR já foram mais comuns. Antigamente qualquer scanner trazia um software de OCR (reconhecimento de caracteres ópticos) para que pudéssemos usar  o periférico de uma maneira mais completa. Afinal o que faz o OCR? digitaliza o documento a partir do scanner e permite exportar os "caracteres" para uma aplicação de texto. Basicamente, extrai as letras e símbolos de uma imagem, possibilitando a sua edição no processador de texto. Aplicações como esta existiam ás dúzias e nestes dias são poucas as que custam menos de 1 cêntimo; lembro-me da dificuldade em obter bons resultados a partir de jornais e revistas por exemplo, do problema do papel reciclado, que devido á sua composição (impurezas) enganava o software com caracteres errados, etc.; a que vos sugiro hoje é fabulosa, leve e muito eficaz, tendo uma opção interessante (OCR a partir de um ficheiro PDF). Se possuem um scanner ou multifunções, esta aplicação pode fazer muito jeito e poupar tempo a reescrever textos impressos.
http://www.paperfile.net/freeocr.exe
linguagem pt/br (descompactar, abrir freeOCR, settings, open lang, drop)
http://tesseract-ocr.googlecode.com/files/tesseract-2.01.por.tar.gz 

2 comentários:

Elvio disse...

Mt bom, costumo utilizar no escritório.
Para funcionar a 100% convém instalar a lingua Portuguesa que não vem de origem:
http://www.paperfile.net/ocr_lang.htm

Vitor M.C.Neves disse...

Obrigado Elvio

Já adicionei o link para download