Communications Mining
最新
ソースに CSV ファイルをアップロードする - Automation Cloud 最新
Banner background image
ロゴ
Communications Mining ガイド
最終更新日 2024年2月8日

CSV ファイルをソースにアップロードする

必要なユーザー権限:「ソース管理者」と「逐語的に編集」。

メモ: この記事では、CSV ファイルから既存のデータ ソースにデータをアップロードする方法について説明します。 最初にGUIを使用してデータソースを作成する方法については、 こちらをご覧ください
主なステップ
メモ: ソース内の既存のコメントを更新する場合、コメントのプロパティを変更する(例: コメント テキスト sent_at(タイムスタンプと 'To' または 'From') がユーザー プロパティ以外の場合、関連付けられたデータセットのエンティティ注釈は失われます。 その前に、関連付けられているデータセットに最新のモデル バージョンをピン留めすることを強くお勧めします。

CSV ファイルからデータソースにデータをアップロードするには、[ソース] ページ(管理コンソールから、ページの右上にある歯車からアクセス)に移動し、データのアップロード先のソースを見つけます。

データソースカードの右上隅にあるアップロードアイコンをクリックします(以下を参照)。

データソースカード

次に、[ファイルの選択]をクリックして、アップロードするCSVファイルを選択します。

選択したファイルは、次の条件を満たしている必要があります。

  • ファイルの最初の行にヘッダーを含め、コンマまたはタブで区切る必要があります
  • コメント テキストの内容 (メッセージ)、タイムスタンプ、コメントを識別する一意の ID の 3 つの列が必要です
  • CSV ファイル内のすべてのテキスト フィールドは、二重引用符で囲む必要があります
  • ファイルは、UTF-8、UTF-16、または UTF-32 のいずれかでエンコードされている必要があります (プラットフォームがどれを自動的に検出するか)
  • CSV ファイルは 64 MiB 以下にする必要があります。 ファイルが大きい場合でも、それぞれ 64 MiB 未満の複数のファイルに分割してアップロードできます
CSV アップロード ページ - 手順 1

ファイルが上記の条件を満たしている場合は、次の手順でコメントを構成してアップロードできます。

CSV アップロード ページ - 手順 2

CSV ファイル内で検出された列ヘッダーを含む各ドロップダウン リストから必要な列を選択します。

  • ID 列:
    • これは、コメントを識別できる一意の ID を含む列である必要があります
    • コメント ID には、ASCII 英数字 (A から Z、a から z 0 から 9) と句読点 (/ を除く) のみを含めることができます。
    • メモ: ソース内に同じ ID の既存のコメントがある場合は、新しいファイルの内容と一致するように更新されます
  • メッセージ列:
    • これは、プラットフォームで分析するメッセージテキストを含む列です
  • タイムスタンプ列:
    • これは、コメントが記録された日時を含む列です
    • タイムスタンプ形式は柔軟性があり、プラットフォームによって自動的に推測されます

件名、スレッド、または参加者を含むデータがある場合 (通常はケースまたはメールスレッドに表示されます)、CSV ファイル内に次の追加の列をアップロードすることもできます。

  • 件名列
    • コメントを含む列を選択する 件名
  • 送信者列
    • 送信者を含む列を選択する
  • 宛先列
    • 受信者を含む列を選択します。 複数の受信者はセミコロンで区切る必要があります。
  • CC 列
    • CC受信者を含む列を選択します。 複数の受信者はセミコロンで区切る必要があります
  • スレッド ID 列
    • コメントスレッド ID を含む列を選択します
    • スレッド ID は、異なるメッセージを同じスレッドに結び付けるものです

送信者/宛先/CC 形式:

  • sender/to/cc フィールドに次の条件があると、エラーが発生します。
    • 受信者の最大数を超えています (スレッドあたり最大 2048 人の受信者)
    • 送信者または受信者が最大文字数制限を超えている (受信者あたり最大 512 文字)
    • 2 つ以上のセミコロンが連続して見つかった場合 (例: john@email.com ; beth@email.com の形式が正しくありません)。
  • プラットフォームは受信者の前後の空白を削除しますが、追加のデータクレンジングは行いません。
    • データが必要な形式の例(完全なリストではありません):
      • 例 1 - ロバート ボグ <rob.bog@gmail.com>; ジョン・スミス<john.smith@gmail.com>
      • 例 2 - rob.bog@gmail.com ;john.smith@gmail.com
      • 例 3 - rob.bog@gmail.com ;john.smith@gmail.com
  • プラットフォームでは、さまざまな受信者がセミコロン (;)
  • データをアップロードする前に、メールが適切な形式でフォーマットされていることを確認してください
  • 典型的なスレッド化されたユースケース(例:電子メール)では、各「送信者」セルに1人の送信者しかいないことに注意してください

タイムスタンプ形式:

  • 選択したタイムスタンプ形式が日/月/年の順にあいまいな場合(例: 01/02/03 10:10)、正しい解釈を提案できます。
    • 2003年1月2日 - なし
    • 2003年2月1日 - 初日
    • 2001年2月3日 - 最初の年
    • 2001年3月2日 - 初日 + 初年度
  • あいまいさを避けるために、可能であれば RFC 3339 形式でタイムスタンプを指定することをお勧めします (例: UTCまたはタイムゾーンの場合、2020-01-31T12:34:56Z:2020-08-031T11:20:60-08:00)

次に、コメントとともにアップロードする追加のユーザー プロパティを選択します。 ユーザー プロパティは、プラットフォームでフィルター処理可能な各逐語的に関連付けられたコンテキスト メタデータです。 これらは、プラットフォーム内の機械学習モデルによっても使用される可能性があります。 文字列と数値の 2 種類があります。

  • 文字列のユーザー プロパティはカテゴリ メタデータです (一般的な例としては、ID、国、カウンター パーティなどがあります)。
  • 数値のユーザー プロパティは数値メタデータです (一般的な例には、NPS、電子メール統計、金額などがあります)。
注:

ファイルにユーザー プロパティとして NPS スコアが含まれている場合、ネイティブ NPS グラフをプラットフォームに読み込むには、これを数値プロパティとして含め、"NPS" のみという名前を付ける必要があります。

すべてのユーザープロパティを選択したら、[アップロード]をクリックします。

次に、データのアップロード先のソースを含むデータセット内のアップロードされたコメントを調べるように求められます。 ソースがまだどのデータセットにも関連付けられていない場合は、新しいデータセットを作成して、アップロードが期待どおりであることを確認できます。

注:

ユーザープロパティの選択を間違えた場合は、同じファイルを再アップロードでき、プラットフォームは列IDを識別子として使用して既存のコメントとプロパティを上書きします(これは既存のコメントに適用されたラベルには影響しません)。

トラブルシューティング

アップロードがスムーズに実行されることを願っていますが、アップロードプロセス中に問題が発生し、エラーメッセージが表示される可能性があります。 以下に、それらのいくつかとそれらが発生する理由の概要を説明し、それらを解決または回避するのに役立ちます。

以下のエラー メッセージでは、{something} は、エラーが発生した場所に関するコンテキスト情報にマップされます。 さらに、ファイル内の位置を参照する方法は、次のように標準化されています。

文字列展開先:
{位置}レコード {行番号} 行 {行番号} 列 {列番号} (バイト {バイト番号})
次に示すように、エラー メッセージのタイトルが説明と共に表示されます。


CSV ファイルをアップロードするときに発生する可能性のあるエラーメッセージを次に示します。

エラーの種類エラー メッセージ説明
列が不足していますCSVファイルには{number-columns}列のみが含まれていますが、少なくとも3つ(テキスト、タイムスタンプ、ID)が必要です。アップロードされた CSV に 3 つ以上の列が含まれていないか、プラットフォームでファイルのエンコードが正しく検出されていません。
無効なエンコードファイルに無効な文字が含まれています (エンコードが {検出エンコード} として検出されました)ファイルがUTF-8 / UTF-16 / UTF-32として正しくエンコードされていません(プラットフォームがファイルの形式を自動的に検出します)
無効なヘッダーstring:ti:er' does not match'(^delimiter|id|message|timestamp |timestamp_default_utc_offset |timestamp_day_first|timestamp_year_first\\Z)|(^(?P<property_type>number|string):(?P<name>\\w(?:[\\w]{0,30}\\w)?)\\Z)'列ヘッダーがユーザー プロパティの無効な名前である場合、プラットフォームは要求のスキーマが無効な場合の既定のメッセージを返します。 各列ヘッダーが、その目的に対して有効な形式であることを確認します。 列ヘッダーの最大長は 32 文字の英数字です
行の長さが等しくないCSV に含まれる行の長さが等しくありません。 コメント {位置} には {番号} フィールドがありますが、前のレコードには {番号} フィールドがあります。CSV に、セル数が異なる行、またはヘッダー数と一致しない行が含まれています。
ID の形式{レコード} のコメント ID が無効です。 ID は、ASCII 英数字と句読点 (「/」を除く) のみで構成できます。 セル値: {セル値} このエラーは、エラー メッセージで説明されているように、Id フィールドが無効な文字で構成されている場合に発生します。
ID の長さidがコメント{レコード}には長すぎます。 {number}バイトがあり、最大で1024と予想されていますこのエラーは、id フィールドが最大許容長 (1024 文字) よりも長い場合に発生します
タイムスタンプ形式コメント {位置}: {タイムスタンプエラーメッセージ}のタイムスタンプの形式が正しくありません。 セル値: {セル値}このエラーは、タイムスタンプ フィールドを解析できなかった場合に発生します。
メッセージ長メッセージがコメント {position} には長すぎます。 {number} バイトがあり、最大で 65536 と予想されますこのエラーは、メッセージ フィールドが最大許容長 (65536 文字) よりも長い場合に発生します。
数値プロパティの形式コメント {位置} の番号の形式が正しくありません: {番号エラーメッセージ}。 セル値: {セル値}このエラーは、数値ユーザー プロパティ フィールドを解析できなかった場合に発生します。 プラットフォームでは、数値として合理的にデコードできる任意の形式を許可する必要があります。
プロパティの長さプロパティがコメント {position} には長すぎます。 {number}バイトがあり、最大で4096と予想されていますこのエラーは、ユーザー プロパティ フィールドが最大許容長 (4096 文字) を超えている場合に発生します。
不明なエラー不明な CSV エラー: {基になるエラー メッセージ}上記のリストはすべてを網羅しているわけではなく、不明なエラーが発生した場合は、アップロードをリトライしてください。
Support and Services icon
サポートを受ける
UiPath Academy icon
RPA について学ぶ - オートメーション コース
UiPath Forum icon
UiPath コミュニティ フォーラム
UiPath ロゴ (白)
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.