- Vue d'ensemble (Overview)
- Document Processing Contracts
- Notes de publication
- À propos des contrats de traitement de documents
- Classe Zone
- Interface ActivitéIPersisted
- Classe PrettyBoxConverter
- Interface ActivitéIClassifier
- Interface FournisseurIClassifieurCapacités
- Classe TypeDocumentClassifieur
- Classe RésultatClassifieur
- Classe ActivitéCodeClassifieur
- Classe ActivitéClassifieurNatif
- Classe ActivitéClassifieurCodeAsync
- Classe CapacitéClassifieurTypeDocument
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ActivitéExtracteurCodeAsync
- Classe ActivitéExtracteurCode
- Classe ExtracteurTypeDocument
- Classe ExtracteurDocumentTypeCapacités
- Classe ExtracteurChampCapacités
- Classe ActivitéExtracteurNatif
- Classe ExtracteurRésultat
- FieldValue Class
- FieldValueResult Class
- Interface FournisseurICapabilities
- Interface ActivitéIExtractor
- Classe ChargeUtileExtracteur
- Énumération PrioritéActionDocument
- Classe DocumentActionData
- Énumération StatutActionDocument
- Énumération TypeActionDocument
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe DonnéesUtilisateur
- Classe Documents
- Classe RésultatDivisionDocument
- Classe ExtensionDom
- Classe Page
- Classe SectionPage
- Classe Polygone
- Classe ConvertisseurPolygones
- Classe de métadonnées
- Classe GroupeMot
- Classe Mot
- Énumération SourceTraitement
- Classe CelluleRésultatsTable
- Classe ValeurTableRésultats
- Classe InformationsColonnesTableRésultats
- Classe TableRésultats
- Énumération Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Énumération TypeSection
- Énumération TypeGroupeMot
- ProjectionTexteIDocument Interface
- Classe RésultatClassification
- Classe RésultatExtraction
- Classe ResultatsDocument
- Classe ResultatsLimitesDocument
- Classe ResultatsDonnéesPoint
- Classe RésultatsValeur
- Classe ResultatsContenuRéference
- Classe ResultatsValeurJetons
- Classe ResultatsChampDérivé
- Énumération ResultatsSourceDonnées
- Classe ResultatsConstantes
- Classe ChampValeurSimple
- Classe ValeurChampTable
- Classe GroupeDocument
- Classe DocumentTaxonomie
- Classe TypeDocument
- Classe Champ
- Énumération TypeChamp
- FieldValueDetails Class
- Classe InfoLangage
- Classe SaisieMétadonnées
- Énumération TypeTexte
- Classe TypeFieldTypeField Class
- Interface ActivitéISuivi
- ITrainableActivity Interface
- Interface ActivitéClassifieurITrainable
- Interface ActivitéExtracteurITrainable
- Classe ActivitéFormationClassifieurCodeAsync
- Classe ActivitéFormationClassifieurCode
- Classe ActivitéFormationClassifieurNatif
- Classe ActivitéFormationExtracteurCodeAsync
- Classe ActivitéFormationExtracteurCode
- Classe ActivitéFormationExtracteurNative
- Classe BasicDataPoint : aperçu
- Classe GestionnaireRésultatExtraction - aperçu
- Document Understanding ML
- Serveur local OCR Document Understanding
- Document Understanding
- Notes de publication
- À propos du package d’activités Document Understanding
- Compatibilité du projet
- Configuration de la connexion externe
- Définir le mot de passe du PDF
- Merge PDFs
- Get PDF Page Count
- Extraire le texte PDF (Extract PDF Text)
- Extract PDF Images
- Extract PDF Page Range
- Extraire les données du document
- Create Validation Task and Wait
- Attendre la tâche de validation et reprendre
- Create Validation Task
- Classer un document (Classify Document)
- Créer une tâche de validation de classification (Create Classification Validation Task)
- Créer une tâche de validation de classification et attendre (Create Classification Validation Task and Wait)
- Attendre la tâche de validation de la classification et reprendre
- IntelligentOCR
- Notes de publication
- À propos du package d'activités IntelligentOCR
- Compatibilité du projet
- Load Taxonomy
- Digitize Document
- Classify Document Scope
- Keyword Based Classifier
- Classifieur de projet Document Understanding (Document Understanding Project Classifier)
- Intelligent Keyword Classifier
- Create Document Classification Action
- Créer une action de validation de document (Create Document Validation Action)
- Retrieve Document Validation Artifacts
- Attendre l'action de classification du document et reprendre
- Tester l'étendue des classifieurs
- Outil d'entraînement de classifieur basé sur des mots-clés
- Intelligent Keyword Classifier Trainer
- Data Extraction Scope
- Extracteur de projet Document Understanding (Document Understanding Project Extractor)
- Entraîneur d’extracteur de projet Document Understanding
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Caviarder le document
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Tester l'étendue des extracteurs
- Export Extraction Results
- Extracteur d'apprentissage automatique
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Classifieur génératif
- Extracteur génératif
- Configuration de l'authentification
- Valider des documents avec des actions App
- Valider manuellement des documents numérisés
- Extraction de données basée sur des ancres à l'aide de l'Extracteur de formulaires intelligent
- Station de validation
- Activités génératives - Bonnes pratiques
- Extracteur génératif - Bonnes pratiques
- Classifieur génératif - Bonnes pratiques
- Services ML
- OCR
- Contrats OCR
- Notes de publication
- À propos des contrats OCR
- Compatibilité du projet
- Interface ActivitéIOCR
- Classe OCRCodeAsync
- Classe ActivitéCodeOCR
- Classe ActivitéOCRNatif
- Classe Caractère
- Classe RésultatOCR
- Classe Mot
- Énumération StylesPolice
- Énumération RotationOCR
- Classe OCRCapabilities
- Classe BaseCaptureOCR
- Classe UsineCaptureOCR
- Classe BaseContrôleCapture
- Énumération UtilisationCaptureMoteur
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Non listé] Abbyy
- Notes de publication
- À propos du package d'activités Abbyy
- Compatibilité du projet
- Reconnaissance optique des caractères ABBYY (ABBYY OCR)
- Reconnaissance optique des caractères ABBYY Cloud (ABBYY Cloud OCR)
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Classer un document (Classify Document)
- Traiter le document (Process Document)
- Valider le document (Validate Document)
- Exporter le document (Export Document)
- Obtenir le champ (Get Field)
- Obtenir la table (Get Table)
- Prepare Validation Station Data
- [Non listé] Abbyy intégré
Activités Document Understanding
UiPath.OmniPage.Activities
La reconnaissance de l'écriture manuscrite ne fonctionne que pour le texte imprimé à la main, où les caractères n'ont aucun lien. La taille idéale pour un document est comprise entre 25 et 45 pixels.
Description
Extrait une chaîne et ses informations à partir d'un élément d'interface utilisateur ou d'une image indiqués à l'aide du moteur de reconnaissance optique de caractères OmniPage . Le OmniPage OCR est une alternative aux autres moteurs OCR dans toutes les activités qui nécessitent l'implémentation d'un moteur OCR. Voici quelques exemples d’activités qui peuvent être utilisées avec OmniPage OCR:Cliquer sur le texte OCR, Pointer le texte OCR, Double-cliquer sur le texte OCR , Obtenir le texte OCR, Trpuver l'emplacement du texte OCR, Numériser le document, Étendue de l'écran CV, Obtenir texte CV.
Le package UiPath.OmniPage.Activities, v1.9.0 ou version ultérieure, a été mis à niveau vers .NET5 core. Ce changement implique que .NET5 Framework soit installé sur votre machine si le package est exécuté dans un workflow hérité non-Windows.
L'activité OmniPage OCR est compatible avec le package UiPath.IntelligentOCR.Activities, v2.0.0 ou version ultérieure, et peut être utilisée dans n'importe quel contexte OCR.
Compatibilité du projet
Windows - Héritage | Windows
Configuration
Panneau propriétés
Commun
- NomAffichage (DisplayName) - Nom affiché de l'activité.
Entrée
- Image : l'image à traiter. Ce champ prend uniquement en charge les variables
Image.
Divers
- Privé (Private) - Si cette option est sélectionnée, les valeurs des variables et des arguments ne sont plus enregistrées au niveau Détaillé (Verbose).
Options
-
EnginePack : spécifie quel moteur intégré doit être utilisé pour le traitement de l'image. Il existe deux options, comme suit : Basique : prend en charge un large éventail de langues. Développé : contient une prise en charge supplémentaire pour les langues asiatiques, arabes, thaï, hébreu et vietnamien. Consultez la liste de toutes les langues disponibles pour le module Basic à la fin de cette page.
Remarque :Pour utiliser le moteur Extended , vous devez installer manuellement le package UiPath.OmniPage.Bundle.Extended dans le projet en cours à partir du Gestionnaire de packages.
-
ExtractWords - If selected, extracts the on-screen position of all detected words.
-
Language - The language used by the OCR engine. The default option is auto, meaning that the language is automatically detected. Multiple languages can be used separated by commas.
Remarque :You can use settings for multiple languages at the same time. For example, you can set "eng,fra" to process images that contain both English as well as French content.
Notez que les paramètres de langue japonais, coréen et chinois appellent un moteur de reconnaissance dédié. Une seule de ces langues doit être sélectionnée à la fois et ne doit être combinée avec aucune langue non asiatique.
Les textes courts intégrés en anglais peuvent être reconnus sans que l'anglais soit sélectionné comme langue de reconnaissance.
-
Profil : choisissez un profil de prétraitement pour l'image ou l'élément d'IU spécifié afin d'obtenir une meilleure lecture OCR. Les options suivantes sont disponibles :
- Aucun : n'applique pas de profil de prétraitement. Il s'agit de l'option par défaut.
- Écran : prétraitement adapté aux applications de bureau à distance ;
- Numérisation : prétraitement adapté aux fichiers numérisés ;
- Héritage : utilise les paramètres par défaut du moteur pour le prétraitement des images.
-
Échelle (Scale) - Facteur d'échelle de l'élément de l'interface utilisateur ou de l'image sélectionné(e). Plus le nombre est élevé, plus vous agrandissez l'image. Cela peut permettre une meilleure reconnaissance optique des caractères et est recommandé pour les petites images. Si vous souhaitez réduire la taille, les valeurs comprises entre 0 et 1 sont également acceptées. Par défaut, la valeur est 1.
Remarque :Si vous souhaitez utiliser cette activité OCR du package UiPath.OmniPage.Activities v1.8.0 dans Studio v19.10, installez le package UiPath.CoreIPC , version 2.0.1 ou ultérieure.
Important :Les images de grande taille peuvent entraîner une erreur lorsque le facteur d'échelle est supérieur à 1.
Sortie
- Result - The text extracted by the OCR engine along with their on-screen position, stored in a
KeyValuePair<Rectangle,String>. This field supports onlyKeyValuePair<Rectangle,String>. - Text - The text extracted by the OCR engine, stored in a String variable. This field supports only
Stringvariables.
Langues prises en charge
Le tableau suivant présente une liste de toutes les langues prises en charge par l'OCR OmniPage, ainsi que leurs codes de langue correspondants.
Table 1. Langues et codes linguistiques pris en charge pour OmniPage OCR - Langues du pack basique
| Code de langue | |
|---|---|
| Afrikaans | AFR |
| Albanais | SQI |
| Aymara | AYM |
| Basque | EUS |
| Bemba | BEM |
| Pieds-Noirs | BLA |
| Brésilien | QBP |
| breton | BRE |
| Bugotu | BGT |
| Bulgare | BUL |
| biélorusse | BEL |
| Catalan | CAT |
| Chamorro | CHA |
| Tchétchène | CHE |
| Corse | COS |
| croate | HRV |
| Corbeau | CRO |
| Tchèque | CES |
| Danois | DAN |
| Néerlandais | NLD |
| Anglais | ENG |
| Esquimau (Inuit) | QES |
| Espéranto | EPO |
| estonien | EST |
| féroïen | FAO |
| Fidjien | FIJ |
| Finnois | FIN |
| Français | FRA |
| frison | FRY |
| Frioulan | FUR |
| Gaélique (irlandais) | GLE |
| Gaélique (écossais) | GLA |
| galicien | GLG |
| Ganda | LUG |
| Allemand | DEU |
| Grec | ELL |
| Guarani | GRN |
| Hani * | HNI |
| Hawaïen | HAW |
| Hongrois | HUN |
| Islandais | ISL |
| Ido | IDO |
| Indonésien | IND |
| Interlingua | INA |
| Italien | ITA |
| Kasub | CSB |
| Kawasaki * | WBM |
| Kikuyu | KIK |
| Kongo | KON |
| Kpelle | KPE |
| Kurde * | KUR |
| latin | LAT |
| letton | LAV |
| lituanien | LIT |
| Luba | LUA |
| luxembourgeois | LTZ |
| macédonien | MKD |
| Malgache | MLG |
| malais | MSA |
| Malinké | MLQ |
| Maltais | MLT |
| Maori | MRI |
| maya | MYN |
| Miao * | HMN |
| Minangkabau | min |
| Mohawk | MOH |
| Moldave | MOL |
| nahuatl | NAH |
| Norvégien | NOR |
| Nyanja | NYA |
| occidental | OCC |
| Ojibwé | OJI |
| Papiamento | PAP |
| Anglais pidgin | TPI |
| Polonais | POL |
| Portugais | POR |
| Provençal | PRV |
| quechua | QUE |
| rhétique | ROH |
| Roumain | RON |
| Tsigane | ROM |
| Rwanda | KIN |
| Rundi | Exécuter (Run) |
| Russe | RUS |
| Sami | SMI |
| Sami, Lule | SMJ |
| Sami du Nord | SME |
| Sami du sud | SMA |
| Samoa | SMO |
| sarde | SRD |
| Serbe | SRP |
| Serbe, Latino | QSL |
| Shona | SNA |
| Sioux | DAK |
| slovaque | SLK |
| slovène | SLV |
| Somalien | SOM |
| Sorabe (Wend) | WEN |
| Sotho | SOT |
| Espagnol | SPA |
| sundanais | Dim |
| Swahili | SWA |
| Swazi | SSW |
| Suédois | SWE |
| Tagalog | TGL |
| tahitien | TAH |
| Pirez | QTI |
| Tongien | TON |
| Tswana (Chuana) | TSN |
| Tun * | TUG |
| Turque | TUR |
| Ukrainien | UKR |
| Visayan | QIS |
| gallois | CYM |
| Wolof | WOL |
| Xhosa | XHO |
| zapotèque | ZAP |
| Zulu | ZUL |
| = Cette langue ne peut être gérée que si elle est écrite à l'aide de l'alphabet latin. |
Tableau 2. Langues et codes linguistiques pris en charge pour OmniPage OCR - Langues étendues du pack
| Code de langue | |
|---|---|
| Toutes les langues incluses dans le pack de base | |
| Japonais | JPN |
| Chinois simplifié | QCS |
| Chinois traditionnel | QCT |
| Coréen | KOR |
| Thaï | THA |
| Arabe | ARA |
| Hébreu | HEB |
| Vietnamien (latin) | VIE |
The Extended Pack can be used with the ISO/DIS 639-3 language codes mentioned above, with the ISO 639-1 and ISO 639-2 language codes, or with the actual name of the language.