- Vue d'ensemble (Overview)
- Démarrage
- Activités (Activities)
- Tableaux de bord Insights.
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d'ensemble (Overview)
- Activités Document Understanding
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Classifieur génératif
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Consommation de données
- Appels API
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesAustralie - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Fiches de paie - Paquet ML
- Passeports - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Limitations du trafic
- Configuration OCR
- Pipelines
- Services OCR
- Langues prises en charge
- Apprentissage profond
- Licences
Guide de l'utilisateur de Document Understanding
Activités Document Understanding
Avec DocumentUnderstanding.Activities, vous pouvez gérer vos documents à l'aide d'une approche unifiée, en stockant toutes les informations du processus Document UnderstandingTM dans un objet Données du Document. De plus, DocumentUnderstanding.Activities est intégré aux projets Modern, ce qui permet sa réutilisation.
Nous sommes conscients des limitations actuelles du package DocumentUnderstanding.Activities, que nous prévoyons de résoudre bientôt. Les fonctionnalités suivantes ne sont pas encore disponibles :
- Prise en charge du fractionnement des documents.
- Règles métier.
- Modèles d’entraînement.
- Prise en charge des modèles des locataires autres que ceux où l’automatisation est déployée.
- Prise en charge d’Automation Suite.
Les sections ci-dessous décrivent chaque phase du processus Document Understanding via des activités Document Understanding.
Le traitement des documents fait référence à la préparation des fichiers PDF en vue de l’extraction. Grâce aux activités Document Understanding, vous pouvez :
- Extraire du texte, des images et des pages spécifiques, ou fusionner plusieurs PDF.
- Modifier le mot de passe des documents PDF chiffrés
Pour traiter des fichiers PDF avec des activités Document Understanding, utilisez les activités suivantes :
Activité | Description |
---|---|
Définir le mot de passe du PDF | Modifie le mot de passe d'un fichier PDF spécifié. |
Merge PDFs | Relie une collection d'objets fichier. |
Get PDF Page Count | Fournit le nombre total de pages dans un fichier PDF. |
Extraire le texte PDF (Extract PDF Text) | Extrait le texte d'un document PDF. |
Extract PDF Images | L'activité extrait toutes les images qu'elle trouve dans le fichier PDF. |
Extract PDF Page Range | Extrait une plage spécifiée de pages d'un document PDF. |
Utilisez l’activité Extraire les données du document (Extract Document Data) pour :
- Extraire les données d’un fichier d’entrée enregistré en tant qu’objet Données du document.
- Stockez les résultats de l’extraction dans le même objet Données du document.
Les Données du document constituent une ressource servant à la fois de variable d’entrée et de sortie dans vos workflows Document Understanding. L’objet Données du document contient toutes les informations nécessaires concernant un document spécifique. Si vous classez un document, l’objet inclut le Type de document. Si vous extrayez des données, l’objet contient les champs extraits correspondants. Quelle que soit l’activité, les données du document contiendront systématiquement le texte du document et le Modèle d’objet document (DOM).
Indiquez le fichier comme entrée la première fois que vous utilisez l’activité Extraire les données du document (Extract Document Data) uniquement. La sortie, nommée Données du document, doit être réutilisée tout au long du workflow pour éviter de procéder à une nouvelle numérisation du même fichier, laquelle coûte 1 AI Unit par page.
Pour en savoir plus, consultez la page Données du document.
Utilisez l’activité Classer un document (Classify Document) pour :
- Choisir entre différents modèles de classification.
- Exporter les données classifiées dans un objet Données du document.
L’étape de validation du processus du document fait référence à l’envoi des documents traités pour qu’ils soient validés par les membres de votre équipe dans Action Center. Vous pouvez également configurer le processus de validation des documents dans Action Center à l’aide des activités suivantes :
Activité | Description |
---|---|
Create Validation Task | Crée une action de validation pour suspendre le workflow jusqu’à ce qu’elle soit terminée. |
Attendre la tâche de validation et reprendre | Suspend l’action jusqu’à la fin de la validation, puis la reprend automatiquement. |
Create Validation Task and Wait | Crée une action dans Action Center pour visualiser et modifier les résultats de l’extraction, et suspend le workflow jusqu’à la fin de l’action. |
Créer une tâche de validation de classification (Create Classification Validation Task) | Crée une action pour vérifier les données du document classées sans attendre qu’elle se termine. |
Créer une tâche de validation de classification et attendre (Create Classification Validation Task and Wait) | Crée une action pour vérifier les données classées et attend qu’elle soit terminée avant de reprendre le workflow. |
Attendre la tâche de validation de la classification et reprendre | Attend la fin d’une action de validation de la classification avant de reprendre le workflow. |