Tesseract, c'est un OCR (reconnaissance optique de caractères) développé par les laboratoires HP entre 1985 et 1995. Depuis ce temps, il reste un des meilleurs OCR développé mais a commencé à prendre la poussière.
Quelques ingénieurs HP ont donc sollicité Google pour les aider à remettre le projet à flot et à le publier finalement sous licence libre sur Sourceforge.
L'OCR ne supporte pour le moment que l'anglais et n'analyse pas "encore" le layout de la page mais Google affirme tout de même que cela reste un des OCR les plus précis disponible actuellement.
Quelques ingénieurs HP ont donc sollicité Google pour les aider à remettre le projet à flot et à le publier finalement sous licence libre sur Sourceforge.
L'OCR ne supporte pour le moment que l'anglais et n'analyse pas "encore" le layout de la page mais Google affirme tout de même que cela reste un des OCR les plus précis disponible actuellement.
Liens
Tesseract (300 Clics)
Plus d'actualités dans cette catégorie
Commentaires
cauet:
HP publie Tesseract sous lience libre!
J'aimerais bien compiler ce truc pour voir.. c'est apparemment du C++
J'vais aller me chercher la démo de C++ Builder pour tester ça..
J'vais aller me chercher la démo de C++ Builder pour tester ça..
ovh:
HP publie Tesseract sous lience libre!
Vérifie d'abord le compilo utilisé lors du dev du soft. 9 chances sur 10 c'est pour Visual C++ (heureusement celui-ci est gratuit en version "express").
cauet:
HP publie Tesseract sous lience libre!
Beuuuuuuuu me dit pas que c'est incompatible?
Poire:
HP publie Tesseract sous lience libre!
quand c'est qu'il font des librairies multi system