- Vue d'ensemble (Overview)
- Démarrage
- Activités (Activities)
- Tableaux de bord Insights.
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d'ensemble (Overview)
- Activités Document Understanding
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Classifieur génératif
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Consommation de données
- Appels API
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesAustralie - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Fiches de paie - Paquet ML
- Passeports - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Limitations du trafic
- Configuration OCR
- Pipelines
- Services OCR
- Langues prises en charge
- Apprentissage profond
- Licences
Guide de l'utilisateur de Document Understanding
Rechercher des documents
Trois capacités de recherche sont disponibles au total, deux sont présentes dans la barre de gestion à partir du haut de la page, et une utilise le en bas à gauche de la page.
La fonctionnalité de recherche de la barre de gestion comprend les éléments suivants :
- Rechercher à l'aide des filtres intégrés : filtre les documents en fonction des options de lot/catégorie disponibles dans le menu déroulant.
Attention :
La sélection de plus d'options rend la recherche plus restrictive. Par exemple, sélectionner Batch import1 et Supprimé (Deleted) affiche uniquement les documents importés dans Batch import1 qui sont supprimés.
Prenez note des combinaisons qui renverront toujours une liste vide : la sélection de Batch import1 et Batch import2 ne renverra jamais un document, car la sélection est restrictive et aucun document ne peut faire partie de deux lots à la fois.
- Rechercher dans tous les documents de l'ensemble de données à l'aide de mots-clés : cette entrée de recherche filtre les informations en fonction de l'entrée de texte. Vous devez saisir le ou les mots clés sous forme de texte libre dans le champ de recherche. La recherche porte sur le ou les mots-clés dans le contenu d’un document ou le nom du document. La recherche par mots multiples renvoie des résultats lorsque les mots sont adjacents, en excluant toute ponctuation entre eux.
- Rechercher dans le document actuellement affiché : vous permet de rechercher des instances de texte uniquement dans votre document actuel. La barre de recherche, , se trouve en bas à gauche de l'écran.
Chaque filtre affiche entre parenthèses le nombre de documents qui répondent aux critères.
Il existe sept mots-clés prédéfinis, à savoir :
- Ensemble d'entraînement et de validation
- Ensemble de formation
- Ensemble d'évaluation
- Ensemble de validation
- Supprimé
- labellisé
- non labellisé
Veuillez noter que pour Forms AI, seuls les filtres intégrés suivants sont disponibles : Supprimé (Deleted), Labellisé (Labelled), Non labellisé (Unlabelled).
Outre ces mots clés prédéfinis, vous pouvez également filtrer en fonction des lots nommés en fonction du nombre de lots que vous avez importés dans Document Manager :
- Lot <batch_name_1>
- Lot <batch_name_2>
- Lot <batch_name_3>
- Etc.
Vous devez saisir le ou les mots clés sous forme de texte libre dans le champ Rechercher (Search). La recherche porte sur le ou les mots-clés dans le contenu d’un document ou le nom du document.
Vous pouvez effectuer une recherche en indiquant plus d'un mot de texte : seuls les documents contenant ces mots spécifiques, l'un après l'autre, sont affichés.
La recherche est insensible à la casse.
Vous pouvez filtrer à l'aide d'un mot-clé : par exemple, si vous sélectionnez Labellisé (Labelled), seuls les documents labellisés seront affichés
Vous pouvez filtrer à l'aide de plusieurs mots-clés : par exemple, si vous sélectionnez Labellisé (Labelled) et Ensemble de formation (Training set), seuls les documents labellisés marqués comme entraînés sont affichés. L'ordre dans lequel les mots-clés apparaissent n'a pas d'importance.
Lancez une recherche dans le document actuel en cliquant sur le bouton en bas à gauche de l'écran, en tapant le texte que vous souhaitez rechercher et en appuyant sur Entrée.
Toutes les instances de text correspondant à la recherche sont surlignées en jaune et le visualiseur de documents défile automatiquement jusqu'à la première position. Pour naviguer d'une instance de texte à une autre, appuyez sur Entrée ou sur Page précédente et Page suivante.
L'option Rechercher (Search) possède un menu déroulant qui, lorsqu'il est ouvert, affiche les filtres suivants :
- Ensemble de formation (Training set) : indique le nombre de documents à utiliser pour entraîner le modèle. Action automatisée.
- Ensemble de validation (Validation set) : indique le nombre de documents à utiliser pour valider le modèle une fois son apprentissage terminé. La répartition entre le train et l'ensemble de validation devrait être comprise entre 80 et 20 %. Action automatisée.
- Ensemble d'entraînement et de validation (Training and validation set) : indique le nombre de documents trouvés dans les filtres train-set et validate-set. Action automatisée.
- Ensemble d'évaluations (Evaluation set) : indique le nombre de documents pour lesquels la case Ensemble d'évaluations (evaluation set) a été cochée lors de l'importation et qui sont destinés à être utilisés pour évaluer le modèle dans l'étape du pipeline d'entraînement. Vous trouverez plus d'informations ici. Action manuelle.
- supprimé : spécifie le nombre de documents supprimés. Vous trouverez plus d’informations ici.
- non labellisé : spécifie le nombre de documents qui n’ont pas de libellé. Un libellé est défini par au moins un champ balisé/modifié manuellement par document.
- non labellisé : spécifie le nombre de documents qui n’ont pas de libellé.
- Nom du lot (Batch name) : spécifie les documents qui ont été inclus dans la même action d'importation.
L’affectation d’un document aux ensembles d’entraînement ou de validation est effectuée par l’application au moment de l’importation.
Les documents importés se retrouvent dans l'ensemble d'évaluation si la case Ensemble d’évaluation (Evaluation set) est cochée lors de l'importation.