Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
| ocr [2013/01/21 09:54] – florian | ocr [2023/03/17 09:56] (Version actuelle) – modification externe 127.0.0.1 | ||
|---|---|---|---|
| Ligne 1: | Ligne 1: | ||
| + | ====== OCR PDF ====== | ||
| + | |||
| Commande pour OCRiser un fichier pdf image : | Commande pour OCRiser un fichier pdf image : | ||
| - | < | + | < |
| * <fichier source> | * <fichier source> | ||
| * <fichier desination > : le nom du fichier après OCRisation. | * <fichier desination > : le nom du fichier après OCRisation. | ||
| * < | * < | ||
| * <fichier config > : le fichier de configuration opcsdk.conf | * <fichier config > : le fichier de configuration opcsdk.conf | ||
| + | |||
| + | Exemple: | ||
| + | < | ||
| + | C: | ||
| + | </ | ||
| + | |||
| + | ====== OCR PDF + CB ====== | ||
| + | Commande pour OCRiser avec lecture de code à barres: | ||
| + | < | ||
| + | IMG2OCRPDFCBCS <ficher source> <fichier destination> | ||
| + | </ | ||
| + | |||
| + | |||
| + | ====== OCR Paramètres ====== | ||
| + | |||
| + | Paramètres modifiable du fichier opcsdk.conf | ||
| + | |||
| + | par défaut l'ocr est limité en taille d' | ||
| + | **pour autoriser l'OCR sur les fichiers plus gros** vous pouvez ajouter ces paramètres au fichier opcsdk.conf | ||
| + | |||
| + | < | ||
| + | Kernel.Img.Max.Pix.X = 32000 | ||
| + | Kernel.Img.Max.Pix.Y = 32000 | ||
| + | </ | ||
| + | ATTENTION, les performances peuvent être dégradées et nous ne garantissons pas la sortie correcte du fichier Ocrisé, en effet nous avons constatés des bugs de rendu d' | ||
| + | |||
| + | **pour définir le format de sortie en PDF/A** Modifier ce paramètre qui par défaut est en PDF1.4 | ||
| + | |||
| + | < | ||
| + | Converters.Text.PDFImageOnText.Compatibility = PDF-A | ||
| + | </ | ||
| + | |||
| + | **pour définir le format par défaut de compression MRC couleur** | ||
| + | 0 = No compression | ||
| + | 1 = Haute compression qualité minimale | ||
| + | 2 = Moyenne compression qualité bonne | ||
| + | 3 = Faible compression qualité sans perte | ||
| + | |||
| + | < | ||
| + | Converters.Text.PDFImageOnText.UseMRC = 2 | ||
| + | </ | ||
| + | |||
| + | **pour définir le qualité des couleurs** quand MRC n'est pas utilisé (noir et blanc par exemple) | ||
| + | 1 = Haute compression qualité minimale | ||
| + | 2 = Moyenne compression qualité bonne | ||
| + | 3 = Faible compression qualité sans perte | ||
| + | |||
| + | < | ||
| + | Converters.Text.PDFImageOnText.ColorQuality = 2 | ||
| + | </ | ||
| + | |||
| + | |||
| + | ====== Conversion vers Office ====== | ||
| + | Voici comment tester la conversion en ligne de commande : | ||
| + | < | ||
| + | * <fichier source> | ||
| + | * <fichier desination > : le nom du fichier une fois qu'il sera converti. | ||
| + | * < | ||
| + | * < | ||
| + | * <fichier texte> : fichier vers lequel sera extrait le texte | ||
| + | * <fichier config > : le fichier de configuration opcsdk.conf | ||
| + | * < | ||
| + | |||
| + | /!\ Si vous souhaitez convertir vers le format **docx** vérifiez que le **.Net Framework 3.5** est bien installé sur votre serveur. | ||
| + | |||
| + | Sinon en testant la conversion en ligne de commande vous aurez un joli message d' | ||
| + | Erreur 18 : | ||
| + | | ||
| + | ====== Problèmes d'OCR et résolutions ====== | ||
| + | |||
| + | ===== Pas d'OCR sur certains documents ===== | ||
| + | Symptôme : Des documents types .docx, .msg voire certains pdf, ne sont pas OCRisés. | ||
| + | |||
| + | Résolution: | ||
| + | |||
| + | {{wiki: | ||