Existen varios programas en linux (ocrfeeder, gscan2pdf o el mismo XSane con tesseract u otros motores gráficos…) que permiten reconocer texto de imágenes utilizando el proceso de reconocimiento óptico de caracteres OCR. Son programas efectivos, pero a veces para obtener buenos resultados requieren bastante configuración, así que si solo necesitamos extraer textos y convertirlos en archivo editables de forma ocasional, existen soluciones online que nos pueden sacar de un aprieto, de todas las que he probado, mi preferida es Free Online OCR.
Este servicio gratuito y sin necesidad de registro, permite convertir documentos escaneados, fotos y capturas de pantalla en documentos editables (incluyendo la función de busqueda e indexado en PDFs). Entre los formatos de entrada admitidos están: PDF, GIF, BMP, JPEG, TIFF o PNG que se pueden exportar a formatos: DOC, PDF, RTF y TXT.
Free Online OCR además detecta el tipo de fuente, incluso en los archivos con baja resolución como faxes o capturas de pantalla, y mantiene el formato original.
Fuente: http://lamiradadelreplicante.wordpress.com/
No hay comentarios:
Publicar un comentario