- Vue d'ensemble (Overview)
- Document Processing Contracts
- Notes de publication
- À propos des contrats de traitement de documents
- Classe Zone
- Interface ActivitéIPersisted
- Classe PrettyBoxConverter
- Interface ActivitéIClassifier
- Interface FournisseurIClassifieurCapacités
- Classe TypeDocumentClassifieur
- Classe RésultatClassifieur
- Classe ActivitéCodeClassifieur
- Classe ActivitéClassifieurNatif
- Classe ActivitéClassifieurCodeAsync
- Classe CapacitéClassifieurTypeDocument
- Classe ActivitéExtracteurCodeAsync
- Classe ActivitéExtracteurCode
- Classe ExtracteurTypeDocument
- Classe ExtracteurDocumentTypeCapacités
- Classe ExtracteurChampCapacités
- Classe ActivitéExtracteurNatif
- Classe ExtracteurRésultat
- Interface FournisseurICapabilities
- Interface ActivitéIExtractor
- Classe ChargeUtileExtracteur
- Énumération PrioritéActionDocument
- Classe DocumentActionData
- Énumération StatutActionDocument
- Énumération TypeActionDocument
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe DonnéesUtilisateur
- Classe Documents
- Classe RésultatDivisionDocument
- Classe ExtensionDom
- Classe Page
- Classe SectionPage
- Classe Polygone
- Classe ConvertisseurPolygones
- Classe de métadonnées
- Classe GroupeMot
- Classe Mot
- Énumération SourceTraitement
- Classe CelluleRésultatsTable
- Classe ValeurTableRésultats
- Classe InformationsColonnesTableRésultats
- Classe TableRésultats
- Énumération Rotation
- Énumération TypeSection
- Énumération TypeGroupeMot
- ProjectionTexteIDocument Interface
- Classe RésultatClassification
- Classe RésultatExtraction
- Classe ResultatsDocument
- Classe ResultatsLimitesDocument
- Classe ResultatsDonnéesPoint
- Classe RésultatsValeur
- Classe ResultatsContenuRéference
- Classe ResultatsValeurJetons
- Classe ResultatsChampDérivé
- Énumération ResultatsSourceDonnées
- Classe ResultatsConstantes
- Classe ChampValeurSimple
- Classe ValeurChampTable
- Classe GroupeDocument
- Classe DocumentTaxonomie
- Classe TypeDocument
- Classe Champ
- Énumération TypeChamp
- Classe InfoLangage
- Classe SaisieMétadonnées
- Énumération TypeTexte
- Classe TypeFieldTypeField Class
- Interface ActivitéISuivi
- ITrainableActivity Interface
- Interface ActivitéClassifieurITrainable
- Interface ActivitéExtracteurITrainable
- Classe ActivitéFormationClassifieurCodeAsync
- Classe ActivitéFormationClassifieurCode
- Classe ActivitéFormationClassifieurNatif
- Classe ActivitéFormationExtracteurCodeAsync
- Classe ActivitéFormationExtracteurCode
- Classe ActivitéFormationExtracteurNative
- Numériseur de Document Understanding
- Document Understanding ML
- Serveur local OCR Document Understanding
- Document Understanding
- Notes de publication
- À propos du package d’activités Document Understanding
- Compatibilité du projet
- Définir le mot de passe du PDF
- Merge PDFs
- Get PDF Page Count
- Extraire le texte PDF (Extract PDF Text)
- Extract PDF Images
- Extract PDF Page Range
- Extraire les données du document
- Create Validation Task and Wait
- Attendre la tâche de validation et reprendre
- Create Validation Task
- Classer un document (Classify Document)
- Créer une tâche de validation de classification (Create Classification Validation Task)
- Créer une tâche de validation de classification et attendre (Create Classification Validation Task and Wait)
- Attendre la tâche de validation de la classification et reprendre
- IntelligentOCR
- Notes de publication
- À propos du package d'activités IntelligentOCR
- Compatibilité du projet
- Configuration de l'authentification
- Load Taxonomy
- Digitize Document
- Classify Document Scope
- Keyword Based Classifier
- Classifieur de projet Document Understanding (Document Understanding Project Classifier)
- Intelligent Keyword Classifier
- Create Document Classification Action
- Attendre l'action de classification du document et reprendre
- Tester l'étendue des classifieurs
- Outil d'entraînement de classifieur basé sur des mots-clés
- Intelligent Keyword Classifier Trainer
- Data Extraction Scope
- Extracteur de projet Document Understanding (Document Understanding Project Extractor)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Tester l'étendue des extracteurs
- Export Extraction Results
- Services ML
- OCR
- Contrats OCR
- Notes de publication
- À propos des contrats OCR
- Compatibilité du projet
- Interface ActivitéIOCR
- Classe OCRCodeAsync
- Classe ActivitéCodeOCR
- Classe ActivitéOCRNatif
- Classe Caractère
- Classe RésultatOCR
- Classe Mot
- Énumération StylesPolice
- Énumération RotationOCR
- Classe OCRCapabilities
- Classe BaseCaptureOCR
- Classe UsineCaptureOCR
- Classe BaseContrôleCapture
- Énumération UtilisationCaptureMoteur
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Non listé] Abbyy
- Notes de publication
- À propos du package d'activités Abbyy
- Compatibilité du projet
- Reconnaissance optique des caractères ABBYY (ABBYY OCR)
- Reconnaissance optique des caractères ABBYY Cloud (ABBYY Cloud OCR)
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Classer un document (Classify Document)
- Traiter le document (Process Document)
- Valider le document (Validate Document)
- Exporter le document (Export Document)
- Obtenir le champ (Get Field)
- Obtenir la table (Get Table)
- Prepare Validation Station Data
- [Non listé] Abbyy intégré
Activités Document Understanding
OmniPage OCR
UiPath.OmniPage.Activities
Extrait une chaîne et ses informations d'un élément d'interface utilisateur ou d'une image indiqué à l'aide du moteur OCR OmniPage . OmniPage OCR est une alternative aux autres moteurs OCR, dans toutes les activités qui nécessitent des implémentations de moteur OCR. Voici quelques exemples d'activités qui peuvent être utilisées avec OmniPage OCR:Cliquer sur le texte OCR, Hover Texte OCR, Double-cliquer surle texte OCR , Get OCR Text, Find OCR Text Position, Digitize Document, CV Screen Scope, CV Get Text.
Panneau propriétés
Commun
- NomAffichage (DisplayName) - Nom affiché de l'activité.
Entrée
- Image : l'image que vous souhaitez traiter. Ce champ ne prend en charge que
Image
variables.
Divers
- Privé (Private) - Si cette option est sélectionnée, les valeurs des variables et des arguments ne sont plus enregistrées au niveau Détaillé (Verbose).
Options
- EnginePack : spécifie le moteur intégré devant être utilisé pour le traitement de l'image. Il existe deux options, comme suit : Basique (Basic) - Prend en charge un large éventail de langues, Avancé ( Extended ) - Contient une prise en charge supplémentaire pour les langues asiatiques, arabe, thaï, hébreu et vietnamien. Consultez la liste de toutes les langues disponibles pour le module de base à la fin de cette page.
Remarque : pour utiliser le moteur Extended , vous devez installer manuellement le package UiPath.OmniPage.Bundle.Extended dans le projet en cours à partir du gestionnairede packages .
- Extraire les mots (ExtractWords ) : si cette option est sélectionnée, elle extrait la position à l'écran de tous les mots détectés.
- Langue (Language) - La langue utilisée par le moteur OCR. L'option par défaut est auto, ce qui signifie que la langue est automatiquement détectée. Plusieurs langues peuvent être utilisées, séparées par des virgules.
Remarque :
You can use settings for multiple languages at the same time. For example, you can set "eng,fra" to process images that contain both English as well as French content.
Notez que les paramètres de langue japonais, coréen et chinois appellent un moteur de reconnaissance dédié. Une seule de ces langues doit être sélectionnée à la fois et ne doit être combinée avec aucune langue non asiatique.
Les textes courts intégrés en anglais peuvent être reconnus sans que l'anglais soit sélectionné comme langue de reconnaissance.
- Profil : choisissez un profil de prétraitement pour l'image ou l'élément d'IU spécifié afin d'obtenir une meilleure lecture OCR. Les options suivantes sont disponibles :
- Aucun : n'applique pas de profil de prétraitement. Il s'agit de l'option par défaut ;
- Écran : prétraitement adapté aux applications de bureau à distance ;
- Numérisation : prétraitement adapté aux fichiers numérisés ;
- Héritage : utilise les paramètres par défaut du moteur pour le prétraitement des images.
- Échelle (Scale) - Facteur d'échelle de l'élément de l'interface utilisateur ou de l'image sélectionné(e). Plus le nombre est élevé, plus vous agrandissez l'image. Cela peut permettre une meilleure reconnaissance optique des caractères et est recommandé pour les petites images. Si vous souhaitez réduire la taille, les valeurs comprises entre 0 et 1 sont également acceptées. Par défaut, la valeur est 1.
Remarque : si vous souhaitez utiliser cette activité OCR depuis le package UiPath.OmniPage.Activities v1.8.0 dans Studio v19.10, installez le package UiPath.CoreIPC , version 2.0.1 ou ultérieure.Important : les images de grande taille peuvent entraîner une erreur lorsque le facteur d'échelle est supérieur à 1.
Sortie
- Résultat (Result ) : le texte extrait par le moteur OCR avec sa position à l'écran, stocké dans un
KeyValuePair<Rectangle,String>
. Ce champ prend en charge uniquementKeyValuePair<Rectangle,String>
. - Texte : le texte extrait par le moteur OCR, stocké dans une variable String. Ce champ ne prend en charge que
String
variables.
Le tableau suivant présente une liste de toutes les langues prises en charge par l'OCR OmniPage, ainsi que leurs codes de langue correspondants.
Code de langue | |
---|---|
Afrikaans |
AFR |
Albanais |
SQI |
Aymara |
AYM |
Basque |
EUS |
Bemba |
BEM |
Pieds-Noirs |
BLA |
Brésilien |
QBP |
breton |
BRE |
Bugotu |
BGT |
Bulgare |
BUL |
biélorusse |
BEL |
Catalan |
CAT |
Chamorro |
CHA |
Tchétchène |
CHE |
Corse |
COS |
croate |
HRV |
Corbeau |
CRO |
Tchèque |
CES |
Danois |
DAN |
Néerlandais |
NLD |
Anglais |
ENG |
Esquimau (Inuit) |
QES |
Espéranto |
EPO |
estonien |
EST |
féroïen |
FAO |
Fidjien |
FIJ |
Finnois |
FIN |
Français |
FRA |
frison |
FRY |
Frioulan |
FUR |
Gaélique (irlandais) |
GLE |
Gaélique (écossais) |
GLA |
galicien |
GLG |
Ganda |
LUG |
Allemand |
DEU |
Grec |
ELL |
Guarani |
GRN |
Hani * |
HNI |
Hawaïen |
HAW |
Hongrois |
HUN |
Islandais |
ISL |
Ido |
IDO |
Indonésien |
IND |
Interlingua |
INA |
Italien |
ITA |
Kasub |
CSB |
Kawasaki * |
WBM |
Kikuyu |
KIK |
Kongo |
KON |
Kpelle |
KPE |
Kurde * |
KUR |
latin |
LAT |
letton |
LAV |
lituanien |
LIT |
Luba |
LUA |
luxembourgeois |
LTZ |
macédonien |
MKD |
Malgache |
MLG |
malais |
MSA |
Malinké |
MLQ |
Maltais |
MLT |
Maori |
MRI |
maya |
MYN |
Miao * |
HMN |
Minangkabau |
min |
Mohawk |
MOH |
Moldave |
MOL |
nahuatl |
NAH |
Norvégien |
NOR |
Nyanja |
NYA |
occidental |
OCC |
Ojibwé |
OJI |
Papiamento |
PAP |
Anglais pidgin |
TPI |
Polonais |
POL |
Portugais |
POR |
Provençal |
PRV |
quechua |
QUE |
rhétique |
ROH |
Roumain |
RON |
Tsigane |
ROM |
Rwanda |
KIN |
Rundi |
Exécuter (Run) |
Russe |
RUS |
Sami |
SMI |
Sami, Lule |
SMJ |
Sami du Nord |
SME |
Sami du sud |
SMA |
Samoa |
SMO |
sarde |
SRD |
Serbe |
SRP |
Serbe, Latino |
QSL |
Shona |
SNA |
Sioux |
DAK |
slovaque |
SLK |
slovène |
SLV |
Somalien |
SOM |
Sorabe (Wend) |
WEN |
Sotho |
SOT |
Espagnol |
SPA |
sundanais |
Dim |
Swahili |
SWA |
Swazi |
SSW |
Suédois |
SWE |
Tagalog |
TGL |
tahitien |
TAH |
Pirez |
QTI |
Tongien |
TON |
Tswana (Chuana) |
TSN |
Tun * |
TUG |
Turque |
TUR |
Ukrainien |
UKR |
Visayan |
QIS |
gallois |
CYM |
Wolof |
WOL |
Xhosa |
XHO |
zapotèque |
ZAP |
Zulu |
ZUL |
= Cette langue ne peut être gérée que si elle est écrite à l'aide de l'alphabet latin. |
Code de langue | |
---|---|
Toutes les langues incluses dans le pack de base | |
Japonais |
JPN |
Chinois simplifié |
QCS |
Chinois traditionnel |
QCT |
Coréen |
KOR |
Thaï |
THA |
Arabe |
ARA |
Hébreu |
HEB |
Vietnamien (latin) |
VIE |