document-understanding
latest
false
- Vue d'ensemble (Overview)
- Démarrage
- Activités (Activities)
- Tableaux de bord Insights.
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d'ensemble (Overview)
- Activités Document Understanding
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Classifieur génératif
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Consommation de données
- Appels API
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesAustralie - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Fiches de paie - Paquet ML
- Passeports - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Limitations du trafic
- Configuration OCR
- Pipelines
- Services OCR
- Langues prises en charge
- Apprentissage profond
- Licences
Activités IntelligentOCR
Guide de l'utilisateur de Document Understanding
Last updated 14 nov. 2024
Activités IntelligentOCR
Avec les activités IntelligentOCR, vous pouvez traiter vos documents de façon approfondie, ce qui vous permet non seulement de numériser, d'extraire, de classer et de valider des documents, mais également d'entraîner votre extracteur et vos classifieurs sur vos données spécifiques, afin qu'ils soient plus rapides et plus précis. Les étapes impliquées dans la création de processus Document UnderstandingTM à l’aide d’activités OCR intelligentes sont :
- Créez la taxonomie : définissez des types de documents et convertissez-les en variable de modèle d’objet document à l’aide de l’activité Charger la taxonomie (Load Taxonomy).
- Numérisez les documents : préparez les documents pour que les robots puissent les traiter à l’aide d’un moteur OCR, en stockant leur texte dans une variable String ainsi que les informations de base les concernant dans un fichier de Modèle d’objet document.
- Classez les documents : préparez les documents à l’aide de certains classifieurs, afin que les robots puissent identifier les types de fichiers en cours de traitement.
- Validez la classification des documents : vérifiez et confirmez que les documents ont été correctement classés.
- Entraînez vos classifieurs : configurez vos classifieurs en fonction des retours reçus lors de la validation de la classification.
- Extrayez les données des documents : identifiez et extrayez des informations spécifiques dans vos documents à l’aide de différents extracteurs, avant de les soumettre à une validation.
- Validez les documents extraits : vérifiez et validez les documents que vous avez traités, classés et extraits, en utilisant les retours des membres de votre équipe dans Action Center.
- Entraînez vos extracteurs : configurez vos extracteurs en fonction des retours reçus lors de la validation de l’extraction.
- Utiliser les données exportées : une fois que vous avez validé les données extraites, vous pouvez les utiliser telles quelles ou les exporter en tant que variable DataSet à l’aide de l’activité Exporter les résultats d’extraction (Export Extraction Results).
Avant de commencer à utiliser IntelligentOCR.Activities, vérifiez les caractéristiques suivantes :
- Configurabilité élevée, impliquant également une courbe d’apprentissage élevée.
- Présence de plusieurs objets et activités, afin de répondre à une exigence de flexibilité.
- Réutilisabilité réduite en raison des complexités suivantes :
- Vous devez paramétrer de nombreuses configurations à l’intérieur du workflow.
- Vous devez transmettre des arguments explicites d’une activité à une autre de façon répétée, par exemple :
- Taxonomie
- Document Object Model
- Texte
- Résultats de la classification
- Résultats de l'extraction