Intelligente Datenextraktion und Verarbeitung (IXP) – Modelle über Document Understanding-API nutzen

ixp

latest

false

Benutzerhandbuch für Unstrukturierte und komplexe Dokumente

Überblick
Modellerstellung
Modellvalidierung
Modellbereitstellung
Verbrauchen von Modellen
- Modelle über einen Workflow verbrauchen
- Modelle über Document Understanding-API verbrauchen
API
- API-Prüfungsereignisse
Häufig gestellte Fragen
- Häufig gestellte Fragen

Wichtig :

Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

Modelle über Document Understanding-API verbrauchen

Greifen Sie über die API des Document Understanding-Frameworks auf IXP-Projekte für unstrukturierte und komplexe Dokumente zu, indem Sie tagbasierte oder ExtractorId-basierte Extraktionsendpunkte verwenden.

Intelligente Datenextraktion und Verarbeitung (IXP) Projekte für unstrukturierte und komplexe Dokumente sind über dieselbe Document Understanding-Framework-API zugänglich. Intelligente Datenextraktion und Verarbeitung (IXP)-Projekte erscheinen als ProjectType: "IXP" in Discovery und unterstützen sowohl tag-basierte Endpunkte als auch extractorId-basierte Endpunkte für die Extraktion.

Zugehörige Dokumentation:

Voraussetzungen

Bevor Sie eine Document Understanding- oder Intelligente Datenextraktion und Verarbeitung (IXP)-API aufrufen, benötigen Sie eine externe Anwendung, die in der Automation Cloud registriert ist. Dies stellt AppID und AppSecret für die OAuth-Authentifizierung bereit.

Erstellen einer externen Anwendung

Navigieren Sie auf Mandantenebene zu Orchestrator.
Wählen Sie Zugriff verwalten und dann Konten und Gruppen verwalten aus.
Wählen Sie im Header der UiPath-Verwaltung die Option Externe Anwendungen aus.
Wählen Sie Anwendung hinzufügen aus.
Geben Sie Anwendungsname ein, z. B. DU API Client.
Wählen Sie Vertrauliche Anwendung aus, was erforderlich ist, um ein App-Secret zu erhalten.
Wählen Sie unter Ressourcen die Option Scopes hinzufügen aus:

Wählen Sie in der Dropdownliste Ressource die Option Document Understanding aus.
Wechseln Sie zur Registerkarte Anwendungs-Scope(s).
Aktivieren Sie die benötigten Scopes:
- Du.Digitization.Api – Dokumente digitalisieren
- Du.Classification.Api – Dokumente klassifizieren
- Du.Extraction.Api – Daten extrahieren
- Du.Validation.Api – Validierungsaufgaben erstellen
- Du.DataDeletion.Api – Dokumentdaten löschen
Wählen Sie Speichern.

Klicken Sie auf Hinzufügen , um die Registrierung zu erstellen.

Hinweis:

Das Pop-up App-Secret sofort kopieren wird nur einmal angezeigt und kann nicht wiederhergestellt werden. Sie können später über den Bearbeitungsbildschirm eine neue Version generieren.

Die Anwendungs-ID ist jederzeit auf der Seite Externe Anwendungen sichtbar.

Abrufen eines Zugriffstokens

Verwenden Sie die App-ID und das App Secret, um ein OAuth-Token über den Client Credentials Flow anzufordern:

curl -X POST 'https://cloud.uipath.com/identity_/connect/token' \
  -d 'grant_type=client_credentials' \
  -d 'client_id=<APP_ID>' \
  -d 'client_secret=<APP_SECRET>' \
  -d 'scope=Du.Digitization.Api Du.Extraction.Api'
curl -X POST 'https://cloud.uipath.com/identity_/connect/token' \
  -d 'grant_type=client_credentials' \
  -d 'client_id=<APP_ID>' \
  -d 'client_secret=<APP_SECRET>' \
  -d 'scope=Du.Digitization.Api Du.Extraction.Api'

Antwort:

{
  "access_token": "eyJh...CRaKrg",
  "expires_in": 3600,
  "token_type": "Bearer",
  "scope": "Du.Digitization.Api Du.Extraction.Api"
}
{
  "access_token": "eyJh...CRaKrg",
  "expires_in": 3600,
  "token_type": "Bearer",
  "scope": "Du.Digitization.Api Du.Extraction.Api"
}

Das Token läuft nach 1 Stunde ab. Verwenden Sie es als Authorization: Bearer <token> bei allen nachfolgenden API-Aufrufen.

Hinweis:

Wenn Sie das App-Secret verlieren, wechseln Sie zu Admin, dann zu Externe Anwendungen, bearbeiten Sie die App und wählen Sie unter App-Secret Neu generieren aus.Aktualisieren Sie alle Integrationen mit dem neuen Secret.

Hauptunterschiede

Die folgende Tabelle zeigt die wichtigsten Unterschiede zwischen Document Understanding-Projekten und IXP-Projekten:

	Document Understanding (Klassisch oder Modern)	IXP
Projekttyp	`Classic` oder `Modern`	`IXP`
Klassifizierung	Ja	Nein (nur Extraktion)
Extraktionsrouting	Mit `tag` + `documentTypeId` (empfohlen) oder `extractorId`	Durch `tag` + `documentTypeId` oder durch `extractorId` (`gpt_ixp_[version]`)
Versionierung	Extraktoren/Klassifizierer	Tags (Staging, Produktion)
Extraktionsmodell	Spezialisiert oder Generativ	Nur generativ (GPT-4o, Gemini)
Schemadefinition	Im Projekt oder über Prompts	Definiert in der Intelligente Datenextraktion und Verarbeitung (IXP)-Benutzeroberfläche (Taxonomie)

Der Intelligente Datenextraktion und Verarbeitung (IXP)-Workflow

Projekt und Tags ermitteln
Digitalisieren und extrahieren (parallel).
Validieren (optional).

Hinweis:

Es gibt keinen Klassifizierungsschritt, da Intelligente Datenextraktion und Verarbeitung (IXP) nur Extraktionen verarbeitet.

Parallele Digitalisierung und Extraktion (nur IXP)

Bei Projekten der Intelligenten Datenextraktion und Verarbeitung (IXP) können Sie die Abfrage nach dem Digitalisierungsergebnis überspringen und sofort nach dem Absenden der Digitalisierung mit der Extraktion beginnen.Das Backend führt beide Vorgänge parallel aus. Digitalisierung und Intelligente Datenextraktion und Verarbeitung (IXP) laufen parallel ab, und das System gibt das endgültige Extraktionsergebnis erst nach Abschluss beider Vorgänge zurück.

Dies ist eine IXP-spezifische Optimierung, die nicht mit Document Understanding Classic- oder Modern-Projekten funktioniert, bei denen Sie warten müssen, bis die Digitalisierung fertiggestellt ist, bevor Sie die Extraktion aufrufen.

Der optimierte Ablauf:

# 1. Start digitization (fire and forget — do not poll for result).
POST /projects/{projectId}/digitization/start
# → returns { "documentId": "..." }
# 2. Immediately start extraction with the documentId (no need to wait).
POST /projects/{projectId}/{tag}/document-types/{documentTypeId}/extraction/start
# → returns { "operationId": "..." }
# 3. Poll extraction result only — it waits for both digitization and extraction.
GET /projects/{projectId}/{tag}/document-types/{documentTypeId}/extraction/result/{operationId}
# 1. Start digitization (fire and forget — do not poll for result).
POST /projects/{projectId}/digitization/start
# → returns { "documentId": "..." }
# 2. Immediately start extraction with the documentId (no need to wait).
POST /projects/{projectId}/{tag}/document-types/{documentTypeId}/extraction/start
# → returns { "operationId": "..." }
# 3. Poll extraction result only — it waits for both digitization and extraction.
GET /projects/{projectId}/{tag}/document-types/{documentTypeId}/extraction/result/{operationId}

Dieser Ablauf eliminiert die Leerlaufzeit zwischen Digitalisierung und Extraktion und reduziert so die Gesamtlatenz.

Schritt 1: Das IXP-Projekt ermitteln

# List all projects — filter for type "IXP"
curl -X GET \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>'
# List all projects — filter for type "IXP"
curl -X GET \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>'

Notieren Sie aus der Antwort die id des IXP-Projekts.

Tags abrufen (veröffentlichte Versionen)

Tags entsprechen veröffentlichten Modellversionen, die in der Benutzeroberfläche von Intelligente Datenextraktion und Verarbeitung (IXP) als Staging oder Produktion gekennzeichnet sind.Jedes Tag enthält die zugehörigen Extraktoren und Dokumenttypen. Um Tags zu erhalten, führen Sie Folgendes aus:

curl -X GET \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects/<ProjectID>/tags?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>'
curl -X GET \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects/<ProjectID>/tags?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>'

Dokumenttypen abrufen

Um Dokumenttypen zu erhalten, führen Sie Folgendes aus:

curl -X GET \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects/<ProjectID>/document-types?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>'
curl -X GET \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects/<ProjectID>/document-types?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>'

Schritt 2: Das Dokument digitalisieren

Ähnlich wie bei Document Understanding laden Sie die Datei hoch, um documentId zu erhalten:

curl -X POST \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects/<ProjectID>/digitization/start?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>' \
  -H 'Content-Type: multipart/form-data' \
  -F 'file=@document.pdf;type=application/pdf'
curl -X POST \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects/<ProjectID>/digitization/start?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>' \
  -H 'Content-Type: multipart/form-data' \
  -F 'file=@document.pdf;type=application/pdf'

Gibt { "documentId": "..." } zurück.

Schritt 3: Extrahieren

Die IXP-Extraktion unterstützt die folgenden Routing-Ansätze:

Tag-basiert – Routen nach tag und documentTypeId. Dies wird für Produktions- oder Staging-Workflows empfohlen.
ExtractorId-basiert – Route über extractorId mit dem Format: gpt_ixp_[version]. Zum Beispiel gpt_ixp_67, wie für Document Understanding Classic- oder Modern-Projekte.

Tag-basierte Extraktion

Verwendet den tagbasierten Pfad mit documentTypeId von Discovery.

Synchron (bis zu 5 Seiten)

curl -X POST \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects/<ProjectID>/<Tag>/document-types/<DocumentTypeId>/extraction?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>' \
  -H 'Content-Type: application/json' \
  -d '{ "documentId": "<documentId>" }'
curl -X POST \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects/<ProjectID>/<Tag>/document-types/<DocumentTypeId>/extraction?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>' \
  -H 'Content-Type: application/json' \
  -d '{ "documentId": "<documentId>" }'

Asynchron (mehrseitig)

Start:

curl -X POST \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects/<ProjectID>/<Tag>/document-types/<DocumentTypeId>/extraction/start?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>' \
  -H 'Content-Type: application/json' \
  -d '{ "documentId": "<documentId>" }'
curl -X POST \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects/<ProjectID>/<Tag>/document-types/<DocumentTypeId>/extraction/start?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>' \
  -H 'Content-Type: application/json' \
  -d '{ "documentId": "<documentId>" }'

Gibt { "operationId": "..." } zurück. Nach Ergebnis abfragen:

curl -X GET \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects/<ProjectID>/<Tag>/document-types/<DocumentTypeId>/extraction/result/<operationId>?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>'
curl -X GET \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects/<ProjectID>/<Tag>/document-types/<DocumentTypeId>/extraction/result/<operationId>?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>'

Abfragen, bis status ist Succeeded oder Failed.

ExtractorId-basierte Extraktion

Es werden dieselben extraktorbasierten Endpunkte wie in Document Understanding Classic oder Modern verwendet.Die ExtractorId für Intelligente Datenextraktion und Verarbeitung (IXP) folgt dem Format gpt_ixp_[version], das Sie in der Erkennungsantwort sehen. Synchron (bis zu 5 Seiten):

curl -X POST \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects/<ProjectID>/extractors/<ExtractorId>/extraction?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>' \
  -H 'Content-Type: application/json' \
  -d '{ "documentId": "<documentId>" }'
curl -X POST \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects/<ProjectID>/extractors/<ExtractorId>/extraction?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>' \
  -H 'Content-Type: application/json' \
  -d '{ "documentId": "<documentId>" }'

Asynchron (mehrseitig):

curl -X POST \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects/<ProjectID>/extractors/<ExtractorId>/extraction/start?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>' \
  -H 'Content-Type: application/json' \
  -d '{ "documentId": "<documentId>" }'
curl -X POST \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects/<ProjectID>/extractors/<ExtractorId>/extraction/start?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>' \
  -H 'Content-Type: application/json' \
  -d '{ "documentId": "<documentId>" }'

Schritt 4: Validieren (optional)

curl -X POST \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects/<ProjectID>/<Tag>/document-types/<DocumentTypeId>/validation/start?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>' \
  -H 'Content-Type: application/json' \
  -d '{
    "documentId": "<documentId>",
    "actionTitle": "Review IXP extraction",
    "actionPriority": "Medium",
    "actionCatalog": "default_du_actions",
    "actionFolder": "Shared",
    "storageBucketName": "du_storage_bucket",
    "storageBucketDirectoryPath": "du_storage_bucket",
    "extractionResult": { }
  }'
curl -X POST \
  'https://cloud.uipath.com/<Org>/<Tenant>/du_/api/framework/projects/<ProjectID>/<Tag>/document-types/<DocumentTypeId>/validation/start?api-version=1' \
  -H 'Authorization: Bearer <TOKEN>' \
  -H 'Content-Type: application/json' \
  -d '{
    "documentId": "<documentId>",
    "actionTitle": "Review IXP extraction",
    "actionPriority": "Medium",
    "actionCatalog": "default_du_actions",
    "actionFolder": "Shared",
    "storageBucketName": "du_storage_bucket",
    "storageBucketDirectoryPath": "du_storage_bucket",
    "extractionResult": { }
  }'

Extraktionsantwortstruktur der Intelligenten Datenextraktion und Verarbeitung (IXP)

API v1 oder v1.1

In v1 und v1.1 werden Feldgruppen der Intelligenten Datenextraktion und Verarbeitung (IXP) FieldType: "Table" in der Antwort zugeordnet, wobei einzelne Felder als Tabellenspalten dienen. Alle Werte werden als Text (string) dargestellt, unabhängig von ihrem ursprünglichen IXP-Datentyp:

{
  "extractionResult": {
    "DocumentId": "...",
    "ResultsDocument": {
      "DocumentTypeId": "00000000-0000-0000-0000-000000000000",
      "DocumentTypeName": "Default",
      "Fields": [
        {
          "FieldId": "Fleet member transaction details",
          "FieldName": "Fleet member transaction details",
          "FieldType": "Table",
          "Values": []
        }
      ],
      "Tables": [
        {
          "FieldId": "Fleet member transaction details",
          "FieldName": "Fleet member transaction details",
          "Values": [
            {
              "Cells": [
                { "FieldId": "Fleet Code", "Value": "FL-7892", "Confidence": 0.95 },
                { "FieldId": "Fuel type", "Value": "Diesel", "Confidence": 0.97 }
              ]
            }
          ]
        }
      ]
    }
  }
}
{
  "extractionResult": {
    "DocumentId": "...",
    "ResultsDocument": {
      "DocumentTypeId": "00000000-0000-0000-0000-000000000000",
      "DocumentTypeName": "Default",
      "Fields": [
        {
          "FieldId": "Fleet member transaction details",
          "FieldName": "Fleet member transaction details",
          "FieldType": "Table",
          "Values": []
        }
      ],
      "Tables": [
        {
          "FieldId": "Fleet member transaction details",
          "FieldName": "Fleet member transaction details",
          "Values": [
            {
              "Cells": [
                { "FieldId": "Fleet Code", "Value": "FL-7892", "Confidence": 0.95 },
                { "FieldId": "Fuel type", "Value": "Diesel", "Confidence": 0.97 }
              ]
            }
          ]
        }
      ]
    }
  }
}

Wichtige strukturelle Unterschiede zu Document Understanding (v1 oder v1.1):

Alle Felder gehören zu Feldgruppen, die als Table-Typ in der Antwort erscheinen.
Selbst Einzelwertfelder werden in eine Tabellenzeilenstruktur eingeschlossen.
Das Tables-Array enthält die tatsächlichen Zellenwerte.

API v2

In v2 werden IXP-Feldgruppen zu FieldType: "FieldGroup" anstelle zu Table gemappt. Dies ist eine exakte Zuordnung des IXP-Feldgruppenkonzepts. Jedes Feld behält seinen tatsächlichen IXP-Datentyp bei, wie Text, Zahl, Datum, Währungsbetrag, anstatt alles als Zeichenfolgen darzustellen.

Weitere Informationen finden Sie unter Migration von API v1 zu v2.

{
  "extractionResult": {
    "ResultsDocument": {
      "Fields": [
        {
          "FieldId": "Default.Seller",
          "FieldName": "Seller",
          "FieldType": "FieldGroup",
          "IsMissing": false,
          "DataSource": "Automatic",
          "Values": [
            {
              "Components": [
                {
                  "FieldId": "Default.Seller.Name",
                  "FieldName": "Name",
                  "FieldType": "Text",
                  "Values": [
                    {
                      "Value": "John Doe",
                      "Confidence": 0.9999834
                    }
                  ]
                }
              ]
            }
          ]
        }
      ]
    }
  }
}
{
  "extractionResult": {
    "ResultsDocument": {
      "Fields": [
        {
          "FieldId": "Default.Seller",
          "FieldName": "Seller",
          "FieldType": "FieldGroup",
          "IsMissing": false,
          "DataSource": "Automatic",
          "Values": [
            {
              "Components": [
                {
                  "FieldId": "Default.Seller.Name",
                  "FieldName": "Name",
                  "FieldType": "Text",
                  "Values": [
                    {
                      "Value": "John Doe",
                      "Confidence": 0.9999834
                    }
                  ]
                }
              ]
            }
          ]
        }
      ]
    }
  }
}

Hauptunterschiede zu v1:

FieldType: "FieldGroup" ersetzt FieldType: "Table".
Das Tables-Array wurde entfernt. Feldgruppen werden direkt in Fields zurückgegeben.
Einzelne Felder behalten ihre IXP-Datentypen bei, anstatt alle vom Typ „string“ zu sein.
FieldIds verwenden die Punkt-Notation, z. B. Default.Seller.Name.

Struktur der IXP-Ermittlungsantwort

IXP-Projekte stellen die Versionsverwaltung über Tags und projectVersions bereit:

{
  "id": "044fedbc-40a6-8078-8f06-02a0d362ab44",
  "name": "Transcom Invoices - Andras",
  "type": "IXP",
  "properties": ["SupportsTags", "SupportsVersions"],
  "extractors": [
    {
      "id": "gpt_ixp_67",
      "documentTypeId": "00000000-0000-0000-0000-000000000000",
      "projectVersion": 67
    }
  ],
  "projectVersions": [
    { "version": 67, "tag": "live", "deployed": true }
  ],
  "classifiers": []
}
{
  "id": "044fedbc-40a6-8078-8f06-02a0d362ab44",
  "name": "Transcom Invoices - Andras",
  "type": "IXP",
  "properties": ["SupportsTags", "SupportsVersions"],
  "extractors": [
    {
      "id": "gpt_ixp_67",
      "documentTypeId": "00000000-0000-0000-0000-000000000000",
      "projectVersion": 67
    }
  ],
  "projectVersions": [
    { "version": 67, "tag": "live", "deployed": true }
  ],
  "classifiers": []
}

Der Tag-Name, zum Beispiel live, entspricht der Beschriftung „Produktion“ oder „Staging“ in der Benutzeroberfläche der IXP.

Berücksichtigen Sie Folgendes beim Aufrufen der Intelligente Datenextraktion und Verarbeitung (IXP)-Extraktionsendpunkte:

Keine Prompts erforderlich: Im Gegensatz zum generativen Extraktor oder Klassifizierer für Document Understanding ist das IXP-Extraktionsschema in der IXP-Projekt-Taxonomie vordefiniert. Sie übergeben prompts im API-Aufruf nicht.
Tag = Modellversion: Verwenden Sie das Tag, das der Produktions- oder Staging-Version entspricht, die Sie aufrufen möchten.
Dokumenttyp-ID: IXP-Projekte verwenden in der Regel einen einzigen Standarddokumenttyp (00000000-0000-0000-0000-000000000000).
Seitenlimits: GPT-4o bis zu 50 Seiten, Gemini bis zu 500 Seiten pro Aufruf.
Messen: Die Intelligente Datenextraktion und Verarbeitung (IXP)-Extraktion wird je nach Preisplan wie folgt abgerechnet:
- Flex-Plan: 1 AI Unit pro Seite oder 0,8 AI Units pro Seite, wenn die Seite bereits im Upstream klassifiziert ist, z. B. in einem modernen Document Understanding-Projekt.
- Unified Pricing: 0,2 Platform Units pro Seite. Fehlgeschlagene Anforderungen verbrauchen keine Einheiten.
Datenaufbewahrung: Digitalisierung 7 Tage, Extraktion 24 Stunden.

Hinweis:

Document Understanding- und IXP-Lizenzen können zusammen verwendet werden. Weitere Einzelheiten finden Sie unter Mess- und Abrechnungslogik (Flex-Plan) und Flex-Pricing-Plan für IXP.

War diese Seite hilfreich?

Vorherige (previous)Modelle über einen Workflow verbrauchen

WeiterAPI-Prüfungsereignisse

Voraussetzungen​

Erstellen einer externen Anwendung​

Abrufen eines Zugriffstokens​

Hauptunterschiede​

Der Intelligente Datenextraktion und Verarbeitung (IXP)-Workflow​

Parallele Digitalisierung und Extraktion (nur IXP)​

Schritt 1: Das IXP-Projekt ermitteln​

Tags abrufen (veröffentlichte Versionen)​

Dokumenttypen abrufen​

Schritt 2: Das Dokument digitalisieren​

Schritt 3: Extrahieren​

Tag-basierte Extraktion​

Synchron (bis zu 5 Seiten)​

Asynchron (mehrseitig)​

ExtractorId-basierte Extraktion​

Schritt 4: Validieren (optional)​

Extraktionsantwortstruktur der Intelligenten Datenextraktion und Verarbeitung (IXP)​

API v1 oder v1.1​

API v2​

Struktur der IXP-Ermittlungsantwort​

War diese Seite hilfreich?

Voraussetzungen

Erstellen einer externen Anwendung

Abrufen eines Zugriffstokens

Hauptunterschiede

Der Intelligente Datenextraktion und Verarbeitung (IXP)-Workflow

Parallele Digitalisierung und Extraktion (nur IXP)

Schritt 1: Das IXP-Projekt ermitteln

Tags abrufen (veröffentlichte Versionen)

Dokumenttypen abrufen

Schritt 2: Das Dokument digitalisieren

Schritt 3: Extrahieren

Tag-basierte Extraktion

Synchron (bis zu 5 Seiten)

Asynchron (mehrseitig)

ExtractorId-basierte Extraktion

Schritt 4: Validieren (optional)

Extraktionsantwortstruktur der Intelligenten Datenextraktion und Verarbeitung (IXP)

API v1 oder v1.1

API v2

Struktur der IXP-Ermittlungsantwort