- 概要
- Document Processing Contracts
- リリース ノート
- Document Processing Contracts について
- Box クラス
- IPersistedActivity インターフェイス
- PrettyBoxConverter クラス
- IClassifierActivity インターフェイス
- IClassifierCapabilitiesProvider インターフェイス
- ClassifierDocumentType クラス
- ClassifierResult クラス
- ClassifierCodeActivity クラス
- ClassifierNativeActivity クラス
- ClassifierAsyncCodeActivity クラス
- ClassifierDocumentTypeCapability クラス
- ContentValidationData クラス
- EvaluatedBusinessRulesForFieldValue クラス
- EvaluatedBusinessRuleDetails クラス
- ExtractorAsyncCodeActivity クラス
- ExtractorCodeActivity クラス
- ExtractorDocumentType クラス
- ExtractorDocumentTypeCapabilities クラス
- ExtractorFieldCapability クラス
- ExtractorNativeActivity クラス
- ExtractorResult クラス
- FieldValue クラス
- FieldValueResult クラス
- ICapabilitiesProvider インターフェイス
- IExtractorActivity インターフェイス
- ExtractorPayload クラス
- DocumentActionPriority 列挙型
- DocumentActionData クラス
- DocumentActionStatus 列挙型
- DocumentActionType 列挙型
- DocumentClassificationActionData クラス
- DocumentValidationActionData クラス
- UserData クラス
- Document クラス
- DocumentSplittingResult クラス
- DomExtensions クラス
- Page クラス
- PageSection クラス
- Polygon クラス
- PolygonConverter クラス
- Metadata クラス
- WordGroup クラス
- Word クラス
- ProcessingSource 列挙型
- ResultsTableCell クラス
- ResultsTableValue クラス
- ResultsTableColumnInfo クラス
- ResultsTable クラス
- Rotation 列挙型
- ルール クラス
- RuleResult クラス
- RuleSet クラス
- RuleSetResult クラス
- SectionType 列挙型
- WordGroupType 列挙型
- IDocumentTextProjection インターフェイス
- ClassificationResult クラス
- ExtractionResult クラス
- ResultsDocument クラス
- ResultsDocumentBounds クラス
- ResultsDataPoint クラス
- ResultsValue クラス
- ResultsContentReference クラス
- ResultsValueTokens クラス
- ResultsDerivedField クラス
- ResultsDataSource 列挙型
- ResultConstants クラス
- SimpleFieldValue クラス
- TableFieldValue クラス
- DocumentGroup クラス
- DocumentTaxonomy クラス
- DocumentType クラス
- Field クラス
- FieldType 列挙型
- FieldValueDetails クラス
- LanguageInfo クラス
- MetadataEntry クラス
- TextType 列挙型
- TypeField クラス
- ITrackingActivity インターフェイス
- ITrainableActivity インターフェイス
- ITrainableClassifierActivity インターフェイス
- ITrainableExtractorActivity インターフェイス
- TrainableClassifierAsyncCodeActivity クラス
- TrainableClassifierCodeActivity クラス
- TrainableClassifierNativeActivity クラス
- TrainableExtractorAsyncCodeActivity クラス
- TrainableExtractorCodeActivity クラス
- TrainableExtractorNativeActivity クラス
- Document Understanding ML
- Document Understanding OCR ローカル サーバー
- Document Understanding
- IntelligentOCR
- リリース ノート
- IntelligentOCR アクティビティ パッケージについて
- プロジェクトの対応 OS
- 認証を構成する
- タクソノミーを読み込み
- ドキュメントをデジタル化
- ドキュメント分類スコープ
- キーワード ベースの分類器
- Document Understanding プロジェクト分類器
- インテリジェント キーワード分類器
- ドキュメント分類アクションを作成
- ドキュメント検証成果物を作成
- ドキュメント検証成果物を取得
- ドキュメント分類アクション完了まで待機し再開
- 分類器トレーニング スコープ
- キーワード ベースの分類器トレーナー
- インテリジェント キーワード分類器トレーナー
- データ抽出スコープ
- Document Understanding プロジェクト抽出器
- Document Understanding プロジェクト抽出器トレーナー
- 正規表現ベースの抽出器
- フォーム抽出器
- インテリジェント フォーム抽出器
- ドキュメントを墨消し
- ドキュメント検証アクションを作成
- ドキュメント検証アクション完了まで待機し再開
- 抽出器トレーニング スコープ
- 抽出結果をエクスポート
- ML サービス
- OCR
- OCR Contracts
- リリース ノート
- OCR コントラクトについて
- プロジェクトの対応 OS
- IOCRActivity インターフェイス
- OCRAsyncCodeActivity クラス
- OCRCodeActivity クラス
- OCRNativeActivity クラス
- Character クラス
- OCRResult クラス
- Word クラス
- FontStyles 列挙型
- OCRRotation 列挙型
- OCRCapabilities クラス
- OCRScrapeBase クラス
- OCRScrapeFactory クラス
- ScrapeControlBase クラス
- ScrapeEngineUsages 列挙型
- ScrapeEngineBase
- ScrapeEngineFactory クラス
- ScrapeEngineProvider クラス
- OmniPage
- PDF
- [リストから削除済] ABBYY
- [リストから削除済] ABBYY Embedded

Document Understanding アクティビティ
公開日: 2025 年 9 月 11 日
バグ修正
Action Center の一部のアクションが無効になる問題を修正しました。この問題は、[ドキュメント データを抽出] アクティビティに生成 AI 抽出器または外部アプリケーションが設定されている場合にのみ発生していました。
公開日: 2025 年 9 月 11 日
バグ修正
外部アプリケーションの設定を使用して Document Understanding モダン プロジェクトのアクティビティを設定すると、Studio でテナント関連のエラーが表示される問題を修正しました。
既知の問題
[ドキュメント データを抽出] アクティビティに生成 AI 抽出器または外部アプリケーションが設定されている場合、Action Center のアクションが無効になります。この問題はバージョン 2.16.1 で修正されています。
公開日: 2025 年 4 月 16 日
分類されたドキュメントの種類によるドキュメント データの抽出: 分類操作の結果に基づく抽出器の使用
DocumentData.DataType
で指定した種類のドキュメントを処理可能な抽出器を識別して、処理に適した抽出器を自動的に選択できます。抽出器のリストで、提案された抽出器に対して [分類結果を使用] を選択します。分類結果を使用して抽出器を選択する方法について詳しくは、「ドキュメント データを抽出」をご覧ください。
更新内容
新しい抽出器を使用した抽出機能の強化
ドキュメントのカテゴリに合った抽出機能を提供するために、Generative Predefined という専用のモダン プロジェクトの種類を使用できるようになりました。このプロジェクトの種類では次の抽出器が提供されます。
- Long Documents Simple Layout – 既存の生成 AI 抽出器です。
- Long Documents Complex Layout (プレビュー) – 画像、手書き文字、フォーム要素、またはその他の複雑なレイアウト (フローティング吹き出しボックスなど) を含む長文のドキュメントに最適化されています。この抽出器に適したドキュメントの例として、保険証券や、複雑なレイアウトを持つ同様の長文のドキュメントがあります。
- Short Document Complex Layout (プレビュー) – 画像、手書き文字、フォーム要素、またはその他の複雑なレイアウト (フローティング吹き出しボックスなど) を含む短いドキュメントに最適化されています。たとえば、ID カードや、複雑なレイアウトを持つ医療の問診票に適しています。
詳しくは、「ドキュメント データを抽出」をご覧ください。
タグとバージョンを使用した Document Understanding モダン プロジェクトの参照
モデルのスナップショットを使用するために、アクティビティと API で、分類および抽出時にプロジェクトの特定のバージョンを使用できるようになりました。[タグ] プロパティと [バージョン] プロパティを使用して、パブリッシュ済みモデルの特定のバージョンの使用をきめ細かく制御できます。DocumentUnderstanding.Activities でバージョンを使用する方法について詳しくは、「ドキュメントを分類」および「ドキュメント データを抽出」をご覧ください。プロジェクトでのバージョンの公開については、「ドキュメントの詳細」をご覧ください。タグとバージョンを使用するために新たに利用可能になった API について詳しくは、「Discovery API を使用する」および「Digitization API を使用する」をご覧ください。
オンプレミス設定からのアクティビティのサポート
ロボットがローカルの Orchestrator に接続されている場合でも、[ドキュメントを分類] アクティビティと [ドキュメント データを抽出] アクティビティを使用できるようになりました。設計時には、さまざまな組織やテナントの Document Understanding リソースを使用できます。同様に実行時には、Studio でローカルの Orchestrator に接続したまま、これらのアクティビティを実行できます。
新しい [設計時の外部接続] プロパティと [実行時の外部接続] プロパティを使用すると、設計時または実行時に、外部アプリケーションの資格情報または Orchestrator に保存されている資格情報を直接使用して Document Understanding のリソースにアクセスできます。
改良点
- Generative Predefined プロジェクトで、既存の生成 AI 抽出器の名称が Long Document Simple Layout Extractor に変更されました。
- 生成 AI プロジェクトの種類で抽出器を選択する際に、[ドキュメントを分類] アクティビティと [ドキュメント データを抽出] アクティビティに含まれていた以前の[プロンプト] コレクションの名称を [ドキュメントの種類の詳細] に変更し、コレクションの目的がより正確にわかるようにしました。
- 更新された [ドキュメントの種類の詳細] コレクション内で、以前の [生成 AI のプロンプト] 列が [指示] になりました。[指示] フィールドは、特定のフィールド名に対して抽出する必要のある情報ついて提供する指示を表します。
更新内容について詳しくは、[ドキュメントを分類] アクティビティおよび [ドキュメント データを抽出] アクティビティをご覧ください。
- ドキュメント処理ワークフローのデジタル化の部分で、丸印、下線、または取り消し線が付いた値を含むドキュメントのデータを認識して返すことができるようになりました。
公開日: 2024 年 11 月 19 日
バグ修正
既定のタイムアウトが原因で、実行に長時間を要する分類と抽出のプロセスが失敗していました。現在は、アクティビティに設定されたすべてのタイムアウトの合計を、それらのアクティビティで動作しているすべての操作に対するグローバル タイムアウトと見なしています。また、エラー メッセージを改良し、この特定の状況におけるエラーの原因が明確にわかるようにしました。
公開日: 2024 年 10 月 21 日
バグ修正
このバージョンでは、データの欠落が原因で発生していた [AI ユニットの消費数の概要] ダッシュボードの [不明] セクションが解決されました。
公開日: 2024 年 10 月 14 日
バグ修正
このバージョンでは、データの欠落が原因で発生していた [AI ユニットの消費数の概要] ダッシュボードの [不明] セクションが解決されました。
公開日: 2024 年 10 月 3 日
更新内容
ドキュメント データのオンデマンド生成を無効化して、高度な実装の柔軟性を向上
IDocumentData<ExtractorType>
から IDocumentData<DictionaryData>
に変わります。[データ型を生成] を [False] に設定すると、フィールド値の取得と変更が簡素化され、検証ステーションでドキュメントの種類を変更できるようになります。
「ドキュメント データを抽出」および「ドキュメント データ」ページで、[データ型を生成] プロパティの使用方法と、抽出結果の確認方法を確認してください。
改良点
[分類の検証タスクを作成] アクティビティと [分類の検証タスクを作成して待機] アクティビティの [追加オプション] から、使用する Orchestrator のストレージ バケットを設定できるようになりました。特定のストレージ バケットが作成されていない場合は、既定のストレージ バケットを使用できます。
バグ修正
- Mac のロボットで Studio Web のワークフローを実行すると、「ファイルまたはアセンブリ 'UiPath.DocumentUnderstanding.Common.SDK' を読み込むことができませんでした。」という例外が発生して失敗していました。
- ドキュメント内の特定の数値や日付を手動で修正すると、Action Center のタスクを作成するアクティビティがクラッシュしていました。
- ワークフローの再開時に Studio Web で発生していたエラーを修正しました。以前は、このエラーが、Microsoft OneDrive から取得したファイルの Action Center での検証を伴う、ドキュメント分類の 1 回目の検証後に発生していました。
公開日: 2024 年 7 月 31 日
バグ修正
エンティティに添付されたドキュメントの読み込みを UiPath® Apps で試みるときに、[ドキュメント データを抽出] アクティビティを使用する Studio Web のワークフローで「System.InvalidOperationException」エラーが発生しなくなりました。公開日: 2024 年 6 月 20 日
バグ修正
ドキュメント内の特定の数値や日付を手動で修正すると、Action Center のタスクを作成するアクティビティがクラッシュしていました。
公開日: 2024 年 5 月 27 日
改良点
- プロンプトのサイズを質問あたり 500 文字から 1000 文字に増やし、指示を明確に入力できるようにしました。また、質問あたり 1000 文字のプロンプトのサイズ制限に達すると、「制限を超えました」というエラーが表示されます。
- [ドキュメント データを抽出] アクティビティのエラー メッセージを改良して分かりやすくし、デバッグを容易に行えるようにしました。
バグ修正
- [生成 AI 抽出器] アクティビティと [生成 AI 分類器] アクティビティを使用した後、またはドキュメントの種類を手動で割り当てた後に、ドキュメントの種類が検証ステーションで [不明] のままになっていました。
公開日: 2024 年 4 月 29 日
このリリース ノートには、2023 年 11 月から 2024 年 3 月の間に行われたすべての更新内容が記載されています。
UiPath.DocumentUnderstanding.Activities package.
新着情報
[ドキュメント データを抽出] の抽出結果の信頼度の向上
[ドキュメント データを抽出] アクティビティを改良し、スコアの精度を向上させ、検証時間を短縮しました。これにより、[自動検証] プロパティと [信頼度のしきい値] プロパティが強化され、特定のモデルからの抽出結果を生成モデルに対して相互検証できるようになりました。
抽出結果の信頼度レベルを向上させる方法について詳しくは、「ドキュメント データを抽出」をご覧ください。
分類の検証タスク
以下のアクティビティが利用可能になりました。
- 分類の検証タスクを作成: Action Center で検証タスクを作成できます。
- 分類の検証タスクを作成して待機: Action Center で検証タスクを作成し、タスクが完了するまでワークフローを一時停止できます。
- 分類の検証タスク完了まで待機し再開: 指定されたドキュメント検証アクションが完了するまで、現在のワークフローの実行を一時停止できます。
改良点
- [検証タスクを作成して待機] アクティビティと [検証タスクを作成] アクティビティの [追加オプション] から、使用する Orchestrator のストレージ バケットを設定できるようになりました。特定のストレージ バケットが作成されていない場合は、既定のストレージ バケットを使用できます。
- [ドキュメント データを抽出] アクティビティと [ドキュメントを分類] アクティビティで、オプションの [タイムアウト] プロパティが利用可能になりました。このパラメーターを使用して、アクティビティのタイムアウトを設定します。
- [ドキュメント データを抽出] アクティビティで選択した抽出器が、ドキュメントの種類を上書きするようになりました。生成 AI モデルには適用されません。
- 複数値フィールドの場合、すべての値が [ドキュメント データを抽出] アクティビティの Document Data で返されます。値は
DocumentData.Data.FieldName.MultiValues[]
で使用できます。 - 今回のリリースでは、Document Data オブジェクトに以下の更新を加えました。
- [ドキュメントの種類] 属性の [名前] プロパティが次のように置き換わります。
- カスタム モデルの場合は [表示名]
- すぐに使えるモデルの場合は ID
- Document Understanding フレームワークの結果から設定される 2 つの新しいプロパティが追加されました。
- ID
- 表示名
- [ドキュメントの種類] 属性の [名前] プロパティが次のように置き換わります。
既知の制限事項
現在プレビューの段階である Document Understanding の既存の Insights ダッシュボードに、クロスプラットフォームの DocumentUnderstanding.Activities パッケージのデータが表示されなくなりました。現在は IntelligentOCR.Activities ワークフローのデータのみがレポートされます。
クロスプラットフォームの DocumentUnderstanding.Activities のデータは、新しい別個の Insights ダッシュボードでレポートされるようになりました。
バグ修正
- [分類の検証タスクを作成] アクティビティの [分類結果] 出力プロパティの名称が [ドキュメント データ] に変更されました。
注意:現在のワークフロー内に
CreatedClassificationValidationTask.ClassificationResults
プロパティがある場合、アップグレード後はこのプロパティは利用できなくなります。 - [検証タスクを作成] アクティビティの出力プロパティ [抽出結果] の名称が [ドキュメント データ] に変更されました。
注意:ワークフローで
CreatedDocumentValidationTask.ExtractionResults
プロパティが使用されている場合、アップグレード後はこのプロパティは利用できなくなります。 - [検証タスク完了まで待機し再開] アクティビティで
3.1342,7
という形式の数値が認識されず、「入力データの形式が正しくありませんでした」というエラーが発生する問題を修正しました。すべての数値の形式が完全にサポートされるようになりました。
公開日: 2023 年 11 月 1 日
生成 AI 機能の一般提供 (GA) 開始
- [ドキュメントを分類] アクティビティ
- [ドキュメント データを抽出] アクティビティ
新機能と改良点
UiPath.DocumentUnderstanding.Activities パッケージが macOS システムでサポートされるようになりました。
- 検証タスクを作成して待機
- ドキュメント検証タスク完了まで待機し再開
公開日: 2023 年 10 月 11 日
Document Understanding アクティビティの一般提供 (GA) 開始
公開日: 2023 年 9 月 28 日
新機能と改良点
UiPath.DocumentUnderstanding.Activities パッケージが macOS システムでサポートされるようになりました。
公開日: 2023 年 5 月 11 日
バグ修正
- テンプレートを使用すると [ドキュメント データを抽出] アクティビティの読み込みが停止する問題を修正しました。
- [ドキュメント検証アクションを作成]、[検証タスクを作成して待機] アクティビティで、
ActionCatalog
フィールドが機能しない問題を修正しました。 - ワークフローで [ドキュメントを分類] アクティビティを使用するとエラーが発生する問題を修正しました。
公開日: 2023 年 5 月 11 日
バグ修正
[ドキュメント データを抽出] アクティビティで抽出したフィールドの値を使用しようとしたときに、その値が存在せず、エラーとなった問題を修正しました。
既知の問題
UiPath.DocumentUnderstanding.Activities パッケージは、macOS システムではサポートされていません。
公開日: 2023 年 5 月 5 日
新機能と改良点
パッケージの最も新しい追加機能は [PDF のテキストを抽出] アクティビティです。指定した PDF ファイルからすべての文字を抽出して String 型変数に格納できます。[OCR を適用] オプションが有効化されている場合は、OCR を使用して情報が抽出され、無効化するとネイティブ コンテンツが抽出されます。
2 つのアクティビティの名前が更新され、1 つのアクティビティのフィールドが更新されました。
- [ドキュメント検証タスクを作成] は [検証タスクを作成] になりました。
- [ドキュメント検証タスク完了まで待機し再開] は [検証タスク完了まで待機し再開] になりました。
- [PDF のパスワードを設定] に、次のような、より詳細なフィールド名が表示されるようになりました。
- 新しい管理パスワード
- 新しい文書を開くパスワード
- 現在の管理パスワード
- 現在の文書を開くパスワード
- 2.16.1
- バグ修正
- 2.16.0
- バグ修正
- 既知の問題
- v2.14.0
- 分類されたドキュメントの種類別でのドキュメント データの抽出: 分類操作の結果に基づく抽出器の使用
- 更新内容
- 新しい抽出器を使用した抽出機能の強化
- タグとバージョンを使用した Document Understanding モダン プロジェクトの参照
- オンプレミス設定からのアクティビティのサポート
- 改良点
- v2.12.1
- バグ修正
- v2.4.5
- バグ修正
- v2.9.6
- バグ修正
- v2.12.0
- 更新内容
- ドキュメント データの生成のオンデマンドでの無効化による高度な実装の柔軟性向上
- 改良点
- バグ修正
- v2.2.6
- v2.9.5
- バグ修正
- v2.9.4
- バグ修正
- v2.9.3
- バグ修正
- v2.4.3
- v2.9.2
- v2.9.1
- 改良点
- バグ修正
- v2.9.0
- 新着情報
- 改良点
- 既知の制限事項
- バグ修正
- v2.4.2
- バグ修正
- v2.4.1
- 生成 AI 機能の一般提供 (GA) 開始
- 新機能と改良点
- v2.4.0
- Document Understanding アクティビティの一般提供 (GA) 開始
- v2.2.4
- 新機能と改良点
- v2.2.3
- バグ修正
- v2.2.2
- バグ修正
- 既知の問題
- v2.2.1
- 新機能と改良点