- Vue d'ensemble (Overview)
- Démarrage
- Activités (Activities)
- Tableaux de bord Insights.
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d'ensemble (Overview)
- Activités Document Understanding
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Classifieur génératif
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Consommation de données
- Appels API
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesAustralie - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Fiches de paie - Paquet ML
- Passeports - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Limitations du trafic
- Configuration OCR
- Pipelines
- Services OCR
- Langues prises en charge
- Apprentissage profond
- Licences
Guide de l'utilisateur de Document Understanding
Vue d'ensemble (Overview)
Vous pouvez utiliser les fonctionnalités de Document UnderstandingTM de différentes manières :
- Le package DocumentUnderstanding.Activities est disponible avec Studio Web, Studio X et Studio Desktop. Il est préconfiguré lorsque vous créez une automatisation à partir d’un fichier, ainsi que dans le suivi de votre processus après publication d’une version de projet.
- Dans le cadre de l’utilisation du package IntelligentOCR, conçu pour les projets Windows ou hérités depuis Windows et préconfiguré dans le modèle de processus Document Understanding.
- Avec les appels API cloud, dans le cadre de l’utilisation de Document Understanding en tant que service via le langage de programmation de votre choix.
Si vous êtes un RPA Developer, vous pouvez utiliser DocumentUnderstanding.Activities dans vos projets cloud. L’utilisation de Document Understanding vous permet de gérer toutes les données d’un document au sein d’un seul objet d’entrée/sortie nommé Données du document. Par ailleurs, afin de profiter facilement des modèles prêts à l’emploi, les activités Document Understanding ne nécessitent pas de définir la taxonomie des types de documents.
Vous pouvez facilement configurer une automatisation à l’aide de certaines des activités suivantes, via le Générateur d’automatisation d’extraction disponible dans Document Understanding, UiPath Marketplace et Studio Web :
- Extraire le texte PDF (Extract PDF Text)
- Extract PDF Images
- Extract PDF Page Range
- Extraire les données du document
N’oubliez pas que les activités Document Understanding ne prennent pas encore en charge les fonctionnalités suivantes : fractionnement, entraînement (ajustement automatique des modèles), prise en charge des locataires production/développement, prise en charge locale, ainsi que l’utilisation de plusieurs méthodes d’extraction par type de document.
Si vous démarrez de nouveaux projets d’automatisation se servant de projets modernes (créés à l’aide de l’expérience Active Learning), vous pouvez utiliser le package DocumentUnderstanding.Activities.
En tant que développeur RPA souhaitant essayer le package IntelligentOCR, vous pouvez utiliser différents modèles d’extraction et de classification en fonction de vos besoins. Si un modèle ne convient pas à vos besoins, vous pouvez utiliser d’autres extracteurs ou classifieurs comme alternative. Vous pouvez également modifier la taxonomie, le Modèle d’objet document (DOM) et les résultats de l’extraction en utilisant le code RPA pendant le runtime.
Une courbe d’apprentissage plus longue est cependant requise pour utiliser IntelligentOCR, car sa flexibilité implique davantage de complexité, ainsi qu’un fonctionnement avec plusieurs activités et plusieurs types de données.
Avec IntelligentOCR, vous pouvez intégrer votre propre classifieur, extracteur ou moteur OCR. Consultez les exemples de code de traitement des documents pour découvrir des exemples d’implémentation.
Vous pouvez utiliser des appels API en tant qu’alternative à l’approche par automatisation des processus robotisés (RPA). Les appels API vous permettent de récupérer des informations détaillées sur votre projet, y compris les extracteurs et les classifieurs utilisés, de faciliter l’utilisation des API de numérisation, de classer et d’extraire des données de documents à l’aide de modèles spécialisés et génératifs, ainsi que de valider les informations précédemment numérisées, classées et extraites.
Pour utiliser les API, vous pouvez utiliser n'importe quel langage de programmation/script (puisque les appels sont effectués via HTTP), y compris la RPA.
Vous pouvez accéder aux API via Swagger : dans la barre d’outils du service Document Understanding, recherchez dans la liste déroulante API REST et sélectionnez Infrastructure.