Outils pour utilisateurs

Outils du site


ocr

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
ocr [2013/05/28 08:40]
florian
ocr [2023/03/17 09:56] (Version actuelle)
Ligne 2: Ligne 2:
  
 Commande pour OCRiser un fichier pdf image : Commande pour OCRiser un fichier pdf image :
-<​code>​ocrlauncher img2ocrpdfcs ​<fichier source> <fichier destination>​ <​ocrmode>​ <​jobqueueid>​ <fichier texte> <fichier config></​code>​+<​code>​IMG2OCRPDFCS ​<fichier source> <fichier destination>​ <​ocrmode>​ <​jobqueueid>​ <fichier texte> <fichier config></​code>​
   * <fichier source> ​ : le fichier à OCRiser.   * <fichier source> ​ : le fichier à OCRiser.
   * <fichier desination > : le nom du fichier après OCRisation.   * <fichier desination > : le nom du fichier après OCRisation.
   * <​ocrmode>​ : le numéro de la tentative.   * <​ocrmode>​ : le numéro de la tentative.
   * <fichier config > : le fichier de configuration opcsdk.conf   * <fichier config > : le fichier de configuration opcsdk.conf
 +
 +Exemple:
 +<​code>​
 +C:​\usr\local\nchp\opcsdk\IMG2OCRPDFCS.exe monfichier.pdf monfichier.ocr.pdf 0 0 monfichier.txt C:​\nchp\etc\nchp\ezged\opcsdk.conf ​
 +</​code>​
 +
 +====== OCR PDF + CB ======
 +Commande pour OCRiser avec lecture de code à barres:
 +<​code>​
 +IMG2OCRPDFCBCS <ficher source> <fichier destination>​ <​ocrmode>​ <​jobqueueid>​ <fichier texte> <fichier config> <​page_1_seule>​ <type cb> <code page> <max bc> <​resolution>​ <​orientation>​ <max inclinaison>​ <​zone>​
 +</​code>​
 +
 +
 +====== OCR Paramètres ======
 +
 +Paramètres modifiable du fichier opcsdk.conf
 +
 +par défaut l'ocr est limité en taille d'​image à 8400 pixels en largeur et 8400 pixels en hauteur
 +**pour autoriser l'OCR sur les fichiers plus gros** vous pouvez ajouter ces paramètres au fichier opcsdk.conf
 +
 +<​code>​
 +Kernel.Img.Max.Pix.X = 32000
 +Kernel.Img.Max.Pix.Y = 32000
 +</​code>​
 +ATTENTION, les performances peuvent être dégradées et nous ne garantissons pas la sortie correcte du fichier Ocrisé, en effet nous avons constatés des bugs de rendu d'​image sur certains plans noir et blanc dépassant le A0. Nous vous conseillons donc de garder les formats d'​origine dans ces cas. 32000 est le maximum, ne le dépassez pas.
 +
 +**pour définir le format de sortie en PDF/A** Modifier ce paramètre qui par défaut est en PDF1.4
 +
 +<​code>​
 +Converters.Text.PDFImageOnText.Compatibility = PDF-A
 +</​code>​
 +
 +**pour définir le format par défaut de compression MRC couleur**
 +0 = No compression
 +1 = Haute compression qualité minimale
 +2 = Moyenne compression qualité bonne
 +3 = Faible compression qualité sans perte
 +
 +<​code>​
 +Converters.Text.PDFImageOnText.UseMRC = 2
 +</​code>​
 +
 +**pour définir le qualité des couleurs** quand MRC n'est pas utilisé (noir et blanc par exemple)
 +1 = Haute compression qualité minimale
 +2 = Moyenne compression qualité bonne
 +3 = Faible compression qualité sans perte
 +
 +<​code>​
 +Converters.Text.PDFImageOnText.ColorQuality = 2
 +</​code>​
 +
  
 ====== Conversion vers Office ====== ====== Conversion vers Office ======
Ligne 23: Ligne 74:
 Sinon en testant la conversion en ligne de commande vous aurez un joli message d'​erreur : Sinon en testant la conversion en ligne de commande vous aurez un joli message d'​erreur :
   Erreur 18 :​API_ERROR_ERR   Erreur 18 :​API_ERROR_ERR
 +  ​
 +====== Problèmes d'OCR et résolutions ======
 +
 +===== Pas d'OCR sur certains documents =====
 +Symptôme : Des documents types .docx, .msg voire certains pdf, ne sont pas OCRisés.
 +
 +Résolution:​ Vérifiez que le .NET Framework 3.5 est bien installé.
 +
 +{{wiki:​install_net35_win2012.png?​800x496}}
ocr.1369730449.txt.gz · Dernière modification: 2023/03/17 09:56 (modification externe)