ASTORM

OCR de meilleure qualité

Dans un précédent billet, j'avais fait un petit exemple avec tesseract (version 3.00) qui illustre le fonctionnement de la librarie pour reconnaître du texte dans une image. L'ayant essayé récemment sur des images avec du texte français, les résultats ne sont (vraiment) pas concluants.

Lire la suite...

OCR avec tesseract

Tesseract est une librairie permettant de faire de la reconnaissance de caractères dans une image (OCR). Ce billet est un petit tutorial pour utiliser la librairie en C++ sous linux gentoo. Pour avoir une idée du résultat, il y a l'excellent outil online free-ocr.

Lire la suite...