Scanner sous Linux

Sachez que l'USB est accessible sous forme d'un port SCSI émulé (c'est à dire que l'on fait croire à la machine qu'il s'agit d'un port SCSI, car elle sait le gérer). Donc, que vous ayez un scanner USB, ou SCSI, ce didacticiel est fait pour vous !


Simple Scan

apt-get install simple-scan

Il est tellement simple d'utilisation qu'il m'est inutile de le détailler. Vous verrez par vous même !


OCR avec YAGF

apt-get install yagf tesseract-ocr-fra

YAGF après installation peut être dans le menu Bureautique et non Graphisme. Il s'agit d'un logiciel de reconnaissance de caractère (OCR). L'utilitaire Tesseract est indispensable pour la langue utilisée (il y en a 27 de reconnues). Son efficacité dépend pour beaucoup de la qualité de l'image scannée.


Dans un premier temps, choisir une image ou lancer le scanner ou importer à partir d'un fichier PDF (menu File puis « import from PDF »). Ensuite choisir la langue puis éventuellement faire un cadre avec la souris sur la zone à traiter (cadre bleu / un clic droit permet de le supprimer si mal fait).

Cliquer sur OCR en rouge pour traiter une image et en vert pour plusieurs pages.

Eventuellement, il est possible de corriger les fautes d'orthographe (icône abc à droite).

Enfin on peut tout enregistrer (icône avec un crayon sur une disquette) ou faire un copier-coller.



Kooka – simple et puissant

Kooka offre l'avantage d'avoir une ergonomie conviviale et tout les outils nécessaires à un travail rapide et efficace. Vou pourrez effectuer des réglages précis et même faire de la reconnaissance de caractères (OCR).


Ouvrez Kooka à partir du menu, ou en tapant ALT+F2 et en entrant « kooka » dans la fenêtre qui s'ouvre.


Choisissez le scanner (si vous en avez plusieurs) et validez.


Suivant votre résolution d'écran, la fenêtre de kooka peut montrer plus ou moins d'informations. En déplaçant les doubles barres (en rouge ci-dessous), vous augmenterez la taille des différentes parties de l'environnement de travail.


Si vous voulez approfondir, cliquez sur le menu configuration :




Scanner une photographie



L'espace de travail est divisé en quatre partie.

A gauche, en bas, la partie dédiée au scanner, qui permet d'agir sur les paramètres de ce dernier, et de lancer la numérisation.

A gauche, en haut, la partie dédiée à l'image, où l'on trouve la fenêtre d'aperçu et la Galerie des images scannées.

A droite, la fenêtre présentant « le résultat », ou plus simplement l'image que l'on vient de scanner et aussi sur laquelle on applique des modifications.

En haut, un menu contenant des outils pour modifier ou adapter l'image scannée.


Pour scanner, rien de plus simple. Dans la partie en bas à gauche, définir les réglages et cliquer sur Aperçu.


Ce dernier apparaîtra dans la partie supérieur. Ici, on peut avec la souris, définir la zone à scanner.


Ensuite, revenir en bas et cliquer sur Numérisation finale. Vous devrez choisir le format du fichier ; le png est un bon compromis taille/qualité, car il ne présente pas de déformation de l'image, tout en étant compressé.


Une barre de défilement montre l'avancement de la scannérisation. Au bout de quelques instants (dépend de la rapidité de votre scanner), l'image scannée apparaît à droite.


Si vous vous êtes trompé dans l'orientation de l'image, inutile de recommencer. Cliquer (bouton droit) au centre de l'image. Un menu apparaît, permettant d'agir sur celle-ci. Certaines des possibilités sont présentes dans le menu en haut.


Cette image se trouve dans un répertoire temporaire de Kooka. Pour l'enregistrer dans vos dossiers de travail, allez dans la partie « image » et cliquez sur l'onglet Galerie et faites un clic droit sur l'image pour l'enregistrer.


Un menu apparaît pour définir la destination.



Kooka, module OCR

Comme tout bon logiciel de scanérisation, Kooka est pourvu d'un module OCR, c'est à dire de reconnaissance de caractères. Vous pourrez avec lui « extraire » du texte d'une image scannée, pour l'insérer ensuite dans un traitement de texte.


La résolution d'image minimum pour une reconnaissance correcte est de 200ppp, mais 300ppp sont recommandés. Scannez l'image en Lineart (l'OCR ne fonctionne pas sur une image en couleur) ou mode Trait.

Cliquez sur Numérisation finale.


Dans le menu des outils, les deux icônes après celle de l'impression, sont celles de l'OCR.


La première permet de traiter toute l'image scannée. Ceci peut être lourd surtout si les textes qui vous intéressent sont dans une partie déterminée de l'image. La deuxième icône permet de traiter une partie de l'image (celle encadrée). Si vous décidez d'utiliser cette deuxième option, dans l'Afficheur d'images, dans la partie de droite, faites un cadre avec la souris (clic gauche, en continu), en rouge ci-dessous.


Cliquez sur l'icône de votre choix. Un cadre apparaît, afin de déterminer les réglages du traitement, puis validez (vous pouvez laisser par défaut, ou modifier par la suite suivant le résultat de l'OCR).

Après un certain temps de calcul qui dépend de la puissance de votre processeur, de la taille de la zone traitée et de la résolution de l'image ...

Une fenêtre apparaît avec le résultat (plus ou moins correct) de la reconnaissance de caractères, comme dans l'image ci-dessous, avec dans la partie basse, le texte reconnu.


Dans l'image ci-dessous, l'OCR a été fait sur une image couleur, et n'a pas fonctionné ...


En bas à droite, cliquez sur Ouvrir dans Kate (petit traitement de texte), pour récupérer le texte. Il est possible que Kate ne se lance pas. Ouvrez le séparément, puis dans la fenêtre de résultat de l'OCR, faites un Ctrl+A puis un Ctrl+C et dans Kate, un Ctrl+V. Vous pouvez utiliser d'autres logiciels, comme des éléments de Koffice, etc. ...

Mais l'intermédiaire de Kate est nécessaire pour OpenOffice ou StarOffice.

Les « _ » signifient que des caractères n'ont pas été reconnus. Relancez l'OCR avec de nouveaux réglages ou scannez avec une meilleure résolution.

Dans Kate, vous pourrez ensuite sélectionner les parties qui vous intéressent et les coller dans un traitement de texte plus évolué.




Retourner en haut de la page

Dernière mise à jour juillet 2016


archilinux.org - architecture, linux et infographie

découvrir, utiliser le système gnu/linux et les logiciels libres, par la pratique










ARCHITECTURE


LINUX


TECHNIQUES


MATERIEL


DIVERS


Rechercher :


Voir le glossaire pour les termes employés


A propos de ce site et de l'auteur


Accueil du site


me contacter