- Démarrage
- Composants de l'infrastructure
- Vue d’ensemble de l’extraction des données
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- FlexiCapture Extractor
- Activités liées à l'extraction de données
- Document Understanding dans AI Center
- Pipelines
- Paquets ML
- Data Manager
- Services OCR
- Licences
- Référence (Reference)
Guide de l'utilisateur de Document Understanding
Exporter des documents
Une image labellisée est une image avec au moins un champ labellisé, quel qu'il soit. Vous pouvez voir combien d'images sont visibles en haut à gauche de la page. Le bouton Exporter (Export) vous permet d'exporter facilement des données pour l'entraînement de modèles ML.
L'exportation d'un document de labellisation prend en compte le filtre actif.
- Si aucun filtre n'est appliqué, toutes les images labellisées visibles dans la vue actuelle, à l'exception des images d'ensemble de test, sont exportées.
- Si vous avez appliqué un filtre, toutes les images labellisées dans la vue, y compris les images des ensembles de test, sont exportées.
- Si vous souhaitez exporter toutes les images de l'ensemble de tests, sélectionnez l'option test-set dans la liste déroulante des filtres.
Important :
L'exportation d'un ensemble de données nécessite que les conditions suivantes soient remplies :
- chaque champ régulier ou de colonne est labellisé sur au moins 10 images différentes
- chaque classe d'un champ de classification apparaît au moins une fois
Une fois qu'un ensemble de données est exporté, il est exporté sous forme de fichier compressé et de fichier journal. Avant de pouvoir l'utiliser dans AI Fabric, vous devez décompresser le fichier. Le dossier extrait peut ensuite être téléchargé en tant que nouvel ensemble de données ou en tant que sous-dossier pour un ensemble de données existant, comme décrit ici.