OCRExtraitBlocTexte (Fonction)

DOCUMENTATION EN LIGNE
DE WINDEV, WEBDEV ET WINDEV MOBILE

Version :

Accueil | Connexion | Français

Aide / WLangage / Fonctions WLangage / Fonctions standard / Fonctions OCR

WINDEV

WEBDEV

WINDEV Mobile

Autres

Voir Aussi

OCRExtraitBlocTexte (Fonction)

En anglais : OCRExtractTextBlock

Renvoie tous les blocs texte d'une image.

Exemple

MonImage est une Image
MonTableauDeBlocsTexte est un tableau de ocrBlocTexte
MonTableauDeBlocsTexte = OCRExtraitBlocTexte(MonImage)

Syntaxe

<Résultat> = OCRExtraitBlocTexte(<Image à manipuler>)

<Résultat> : Tableau de variables de type ocrBlocTexte

Tableau de variables de type ocrBlocTexte.

<Image à manipuler> : Nom de champ, variable de type Image, chaîne de caractères

Image dans laquelle la lecture des blocs de texte doit être effectuée. Cette image peut correspondre :
à un champ Image,
à une variable de type Image,
à une rubrique de type Mémo Image,
au chemin d'un fichier image.
au chemin d'un fichier PDF.
Attention : ce fichier ne doit contenir qu'une seule page.
Rappel : il est possible d'extraire une page d'un fichier PDF dans une image grâce à la fonction PDFExtraitPage. Cette image peut être traitée par la fonction OCRExtraitBlocTexte.

Remarques

Le moteur Legacy est utilisé. Les modèles personnels (fichier .traineddata) doivent être compatibles avec ce moteur.
Il est nécessaire d'avoir les modèles .traineddata.

Afin d'améliorer la qualité du résultat obtenu, il est conseillé de :
- Avoir une image de bonne résolution.
- Recadrer l'image autour du texte si possible (évitez les zones inutiles).
- Limiter l'inclinaison du texte. Si l'image est légèrement en biais, l'OCR peut arriver à détecter le texte, mais la qualité sera détériorée.
  Les images en biais peuvent être lues.
- Limiter le nombre de modèles/langues utilisés.
Si l'image manipulée correspond à un champ Image, il faut savoir que l'image source est directement manipulée. Par conséquent, les modifications réalisées dans le champ Image (taille de l'image par exemple) ne seront pas prises en compte. Pour prendre en compte ces modifications, il est nécessaire d'enregistrer l'image.
Si l'image manipulée correspond à un fichier PDF (via un champ Image ou non), la qualité du PDF est forcée à 300 DPI.
L'OCR est disponible uniquement pour détecter un texte imprimé. Il n'est pas disponible pour une écriture manuscrite.
Le texte "blanc" n'est pas reconnu.

Liste des exemples associés :

Exemples unitaires (WINDEV) : Les fonctions OCR

[ + ] Cet exemple montre l'utilisation des fonctions OCR de WINDEV.
Ces fonctions permettent d'analyser une image afin d'en extraire le texte.
Il est possible de spécifier la langue du document analysé afin de détecter plus finement.
Il est également possible de récupérer les positions des blocs de texte trouvés.

Classification Métier / UI : Code métier

Composante : wd290ocr.dll

Voir Aussi

Version minimum requise

Version 26

Documentation également disponible pour…

Commentaires

Cliquez sur [Ajouter] pour publier un commentaire

Dernière modification : 03/04/2023

Signaler une erreur ou faire une suggestion | Aide en ligne locale