Google anuncia el inicio del proyecto OCRopus, un OCR libre de alta calidad
Cita:
Según Thomas Breuel, director del proyecto y profesor de Ingeniería Informática en la Technical University of Kaiserslautern (Alemania) y máximo responsable del grupo de investigación Image Understanding and Pattern Recognition que depende del German Research Center for Artificial Intelligence, “el objetivo es avanzar en el estado de la técnica del reconocimiento óptico y tecnologías relacionadas, y proveer un OCR de alta calidad adecuado para la conversión de documentos, bibliotecas electrónicas, usuarios con dificultades de visión, análisis de documentos históricos y uso general”.
Su desarrollo, que se calcula que durará por lo menos tres años, se basará en parte en el OCR Tesseract desarrollado por HP y que Google (por supuesto)liberó hace unos meses.
El equipo de desarrollo pretende que este OCR pueda trabajar con textos escritos en el mayor número de idiomas posible. El hecho de que OCRopus genere archivos HTML es una ventaja en este sentido puesto que existe la posibilidad al menos teórica de reproducir muchos idiomas de forma estándar.
Además será capaz de reconocer SPAM basado en imágenes. ¿Qué quiere decir esto último exactamente? No tenemos la menor idea, pero no nos van a negar que no suena interesante, no?
más info
fuente: DATAFULL
Re: Google anuncia el inicio del proyecto OCRopus, un OCR libre de alta calidad
mire uste...
....btw tengo un ingles terrible che, tenian que escucharme decir "German Research Center for Artificial Intelligence" hahahahaha
Re: Google anuncia el inicio del proyecto OCRopus, un OCR libre de alta calidad
Re: Google anuncia el inicio del proyecto OCRopus, un OCR libre de alta calidad
En síntesis un programita que te permite convertir un texto escaneado en texto editable... osea, vos escaneás un texto, éste normalmente te queda en formato de imagen, bueno, con un OCR (Optical character recognition) podés transformarlo en un documento de texto, abrirlo con en bloc de notas o word o cualquier editor de textos y hacerle los cambios que quieras.
Re: Google anuncia el inicio del proyecto OCRopus, un OCR libre de alta calidad
Re: Google anuncia el inicio del proyecto OCRopus, un OCR libre de alta calidad
yo tengo el omnipage y estaba chocho con ese pero la otra vez tuve que escanear un documento que tenia tablas, texto solo y fotos, fue un quilombo poder modificar todo -.-"
3 años hay que esperar? we, esperaremos :P