Document Understanding - 既知の制限事項

document-understanding

latest

false

Document Understanding ガイド

重要 :

このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。新しいコンテンツの翻訳は、およそ 1 ～ 2 週間で公開されます。

既知の制限事項

Document Understanding モダンプロジェクトの現在の仕様と既知の制限事項 (データセットのサイズの上限やインポートの制約など)

このページでは、Document Understanding^TM モダンプロジェクトの現在の仕様と、プロジェクトを最適に利用するためのパラメーターの概要について説明します。

プロジェクトベースの制限事項

説明	上限量
サポートされるファイル形式	PNG JPG/JPEG PDF TIF/TIFF
画像サイズの制限	最小: 50 x 50 ピクセル最大: 10,000 x 10,000 ピクセル
ドキュメントの種類あたりの最大ページ数	5000 特定の時点を過ぎると、データを追加してもモデルのパフォーマンスは向上しません。この制限により、必要以上のドキュメントのアノテーションを行うことがなくなります。
ドキュメントあたりの最大ページ数	前世代モデルでは上限は 500、Helix Extractor モデルでは 100 です。
プロジェクトあたりの最大ページ数	30,000
プロジェクトあたりのドキュメントの種類の最大数	150
事前ラベル付けできる、ドキュメントあたりの最大ページ数	20 ドキュメントが 20 ページを超える場合は、最初の 20 ページでのみ事前アノテーションが行われます。
フィールドの最大数	300
並列処理される要求の最大数	10
すぐに使えるモデルで処理できる最大ページ数	20
デジタル化できる最大ファイルサイズ	160 MB
デジタル化できる、ドキュメントあたりの最大ページ数	500 ページ
分類名の文字数	最小値: 1 最大値: 50
分類の説明の文字数	最小値: 0 最大値: 2000
分類するドキュメント内の文字数	最小値: 0 最大値: 1e10 (事実上無制限)
プロジェクトごとのドキュメントの種類	最小値: 1 最大値: 150
実行時に UiPath Helix Extractor モデルが処理する最大ページ数	100 ページ

アクティビティまたは API ベースの制限事項

説明	上限量
サポートされるファイル形式	PNG JPG/JPEG PDF TIF/TIFF
画像サイズの制限	最小: 50 x 50 ピクセル最大: 10,000 x 10,000 ピクセル
デジタル化できる最大ファイルサイズ	160 MB
並列処理される要求の最大数 (モダンプロジェクトにデプロイされたプロジェクトのバージョン)	10
アクティビティでの生成 AI による抽出	ドキュメントの最小文字数: 10 ドキュメントの長さ: 500 ページフィールド: 150 プロンプトの長さ: 1000 文字
アクティビティでの生成 AI による分類	ドキュメントの長さ: 500 ページプロンプトの長さ: 1000 文字
すぐに使えるモデルで処理できる最大ページ数	20 ページ

既存のクラシックプロジェクトを移行する際の現在の制限事項

現在、5,000 ページを超えるデータセットのインポートはサポートされていません。最初の 5,000 ページのみが正常にインポートされ、それ以降のページはインポートに失敗します。たとえば、データセットが 4,999 ページで構成されている場合に、4 ページのドキュメントをインポートしようとすると、このプロセスは成功しません。
バッチ名および対応するバッチ結果は、現在は利用できません。データがバッチに編成されている場合、バッチ結果の情報はまだ表示されません。ただし、情報は保存されています。
AI Center からのエクスポートはサポートされていません。Document Manager からのエクスポートのみがサポートされています。

その他の制限事項

プロジェクトのパフォーマンスダッシュボードには、API または DocumentUnderstanding.Activities パッケージに含まれるアクティビティのいずれかを通じて、各プロジェクトを使用することにより処理されたドキュメントが表示されます。
英国とインドでは、Insights のダッシュボードが利用できないため、[プロジェクトのパフォーマンス] ダッシュボードにアクセスできません。
モダンプロジェクトでバージョン 24.4 または 24.10 でカスタムモデルをトレーニングする場合、モデルが単一のドキュメントテンプレートでトレーニングされていると、データ抽出に失敗することがあります。これは、モデルが 1 つのレイアウトに過剰に適合し、視覚的に類似したドキュメントであっても抽出エラーが発生するためです。より多様なデータセットを使用してモデルをトレーニングすることで、精度を向上できます。
[Document Understanding プロジェクト抽出器] アクティビティを使用する場合、プロジェクト名には、Document Understanding プロジェクトで元々定義されていた名前とまったく同じ文字種を使用する必要があります。
[ドキュメントの種類] 分類器は、ヘブライ語、中国語、日本語など、アルファベット以外の文字で記述されたドキュメントをサポートしていません。このようなドキュメントにドキュメントの種類による分類を使用すると、パイプラインが失敗したり、エンコード関連のエラーなどの予期しない結果が生成されたりする可能性があります。分類を使用しないのであれば、ドキュメントの抽出はアルファベット以外の言語でも動作可能です。

プロジェクトベースの制限事項
アクティビティまたは API ベースの制限事項
既存のクラシックプロジェクトを移行する際の現在の制限事項
その他の制限事項

このページは役に立ちましたか?

前へインフラストラクチャ

次へDocument Understanding™ のオートメーション

プロジェクトベースの制限事項​

アクティビティまたは API ベースの制限事項​

既存のクラシック プロジェクトを移行する際の現在の制限事項​

その他の制限事項​

このページは役に立ちましたか?

プロジェクトベースの制限事項

アクティビティまたは API ベースの制限事項

既存のクラシックプロジェクトを移行する際の現在の制限事項

その他の制限事項