データ プロファイリング ツールは、主要な統計情報やディストリビューションなどのクエリ データを直感的にクリーンアップ、変換、理解する方法を提供します。 さらに、[行の カウント] コマンドを使用して、すべてのクエリ データの行数を取得することもできます。
既定では、Power Query は最初の 1,000 行のデータをプロファイルします。 データセット全体で動作するプロファイルを変更するには、エディターの左下隅で、データ セット全体に基づいて 1,000 行に基づく列プロファイリングまたは列プロファイリングを選択 します。
-
クエリを開く場合は、Power Query Editor から以前に読み込まれたクエリを探し、データ内のセルを選択し、[クエリ] を選択して 、[編集]>します。 詳細については、「クエリの作成、読み込み、または編集」を参照Excel。
-
[表示] を選択します。
-
[データ プレビュー] グループ で、表示する要素を 1 つ以上選択します。
使用可能な統計情報と、実行できる追加の手順の詳細を次に示します。
クイック コマンド
プロファイルを表示するときにデータをさらにクリーンアップするには、[その他 (...)] をクリックすると、次のコマンドを使用できます。 さまざまなダイアログ ボックスの右下にある [重複の保持]、エラーの保持、重複の削除、空の削除、エラーの削除、およびエラーの置換を行います。 詳細については、「重複する行を 保持または削除する」、 エラーのある行を削除または保持する、および値を置き換えるに関する ページを参照してください。
列の品質
各列の有効 (緑)、エラー (赤)、空 (濃い灰色) の 3 つのカテゴリの棒グラフで、主要なパーセンテージを示すデータ プロファイルを表示します。
表示にマウス ポインターを合わせると、概要の拡大が表示されます。 追加の コマンドを 実行するには、[詳細 ](...)を選択します。
ヒント リボンの [データ プレビュー] グループでオプションをまだ設定していない場合は、薄い濃い灰色のバーを右クリックし、[品質列のピーク値を表示する] を選択すると、列品質プロファイル データをすばやく表示できます。 データ値をすばやくコピーすることもできます。
列の分散
各列の頻度と分布を視覚化し、最も高い頻度の値の降順で並べ替えた値を表示します。
箇条書き項目の上にマウス ポインターを置くと、概要の拡大が表示されます。 追加の コマンドを 実行するには、[詳細 ](...)を選択します。
列プロファイル: 列の統計情報と値の分布
各列のより詳細なビューと、関連付けられている統計情報が表示されます。
ヒント: 最も右にある [詳細](...)を選択してデータをコピーします。
さらに、次の操作を行います。
-
グラフ内の各バーにマウス ポインターを合わせると、詳細が表示されます。 そのバーをフィルター処理するには、[等しい] または [ 等しくない ] を選択します。 その他のコマンドについては、[ 詳細 ](...)を選択するか、バーを右クリックします。
-
一方、右側で [詳細(...])を選択し、[グループ化] を選択し、データ型によって異なる追加のコマンドを選択します。
グラフ内の個々の値を引き続き操作できます。
多くの場合、データを取得した後に返される行の数を確認する必要があります。 [ 行数] コマンドは、データの実際の行数を返します。列プロファイル設定の 影響を受 け取る必要があります。
-
クエリを開く場合は、Power Query Editor から以前に読み込まれたクエリを探し、データ内のセルを選択し、[クエリ] を選択して 、[編集]>します。 詳細については、「クエリを作成、編集、読み込む 」を参照Excel (Power Query) を参照してください。
-
[Transform >Count Rows ]を選択します。
-
必要に応じて、[数値ツール]の [変換] タブを選択し、[テーブルに変換] または [リストに変換] を選択して、ワークシートに結果を読み込む必要があります。
-
必要に応じて、[変換] グループのさまざまな数値コマンド を使用 します。 詳細については、「データ型 に基づいて列を追加する」を参照してください。