データ構造を単純化する

完了

複数のソースから Power BI Desktop にデータをインポートすると、その定義済みのテーブルと列の名前がデータに保持されます。 これらの名前の一部を変更して、一貫した形式にし、操作をしやすくし、ユーザーによりわかりやすくすることができます。  Power BI Desktop の Power Query エディターを使用して、これらの名前を変更したり、データ構造を単純化したりすることができます。

モデルの初期データを成形した前のシナリオを続行するには、さらにアクションを実行して、売上データの構造を単純化し、Sales チーム用にレポートを作成できるように準備する必要があります。  列の名前は既に変更していますが、ここでクエリ (テーブル) の名前を調べ、さらに改善できるかどうかを確認する必要があります。 また、列の内容を確認し、修正が必要なすべての値を置き換える必要があります。

クエリの名前を変更する

一般的ではない、または役に立たないクエリ名を、より明確な、あるいはユーザーにより馴染みのある名前に変更することをお勧めします。 たとえば、Power BI Desktop に製品ファクト テーブルをインポートするときに、クエリ名がFactProductTable と表示されている場合は、Products など、ユーザーによりわかりやすい名前に変更することができます。 同様に、ビューをインポートする場合、そのビューに、vProduct など、v のプレフィックスを含む名前が付けられることがあります。 この名前は不明確で混乱を招く場合があるため、プレフィックスを削除することができます。

この例では、TargetSales クエリの名前を調べ、この名前が役に立たないことがわかりました。それは、クエリに毎年この名前が付けられるためです。  混乱を避けるため、クエリ名に年を追加する必要があります。

Power Query エディターのデータの左側にある[クエリ] ペインで、名前を変更するクエリを選択します。 コードを右クリックし [名前の変更] を選択します。 現在の名前を編集するか、新しい名前を入力してから、Enter キーを押します。

値を置き換える

Power Query エディターの値の置換機能を使用して、選択された列の値を別の値に置き換えることができます。

この例では、Attribute 列の December の月のスペルが間違っていることがわかります。  このスペル ミスを修正する必要があります。 置き換える値が含まれている列 (この場合は Attribute) を選択し、[変換] タブで [値の置換] を選びます。

[検索する値] ボックスに、置き換える値の名前を入力し、[置換後の文字列] ボックスに、正しい値の名前を入力してから [OK] を選択します。  Power Query では、Excel の場合のように、1 つのセルを選択して 1 つの値を変更することはできません。

データを再構築して修正するために行った手順の一覧は、[クエリの設定] ペインで確認することができます。 必要な手順をすべて完了したら、[閉じて適用] を選択し、Power Query エディターを閉じて、変更内容をデータ モデルに適用することができます。  しかし、さらにアクションを実行し、データを消去および変換することができます。

null 値を置き換える

場合によっては、データ ソースに null 値が含まれていることがあります。 たとえば、販売注文の配送料が 0 と同義の場合、null 値が含まれることがあります。 値が null のままでは、平均は正しく計算されません。  解決策の 1 つは、null 値を 0 に変更することです。これにより、配送料の平均がより正確なものになります。 この例では、前に従ったのと同じ手順を使用すれば、null 値を 0 に置き換えるのに役立ちます。

重複を削除する

列から重複を削除して、選択された列内の一意の名前のみを保持することもできます。そのためには、Power Query の重複の削除機能を使用します。

この例では、Category Name 列に各カテゴリの重複が含まれていることに注目してください。 そのため、一意のカテゴリを持つテーブルを作成し、それをセマンティック モデルで使用する必要があります。 このアクションは、列を選択し、その列のヘッダーを右クリックしてから、[重複の削除] オプションを選択して行うことができます。

重複を削除する前に、テーブルをコピーすることを検討してください。 [コピー] オプションは、次のスクリーンショットに示されているように、コンテキスト メニューの上部にあります。 重複を削除する前にテーブルをコピーすると、テーブルを比較し、必要に応じて両方のテーブルを使用できるようになります。

テーブル、列、値の名前付けに関するベスト プラクティス

テーブル、列、値の名前付け規則には固定のルールはありません。しかし、組織内で一般的に使用され、全員が同意し、共通の用語と見なす言語と省略形を使用することをお勧めします。

ベスト プラクティスは、テーブル、列、メジャーに説明的なビジネス用語で名前を付け、アンダースコア ("_") をスペースに置き換えることです。 略語、プレフィックス、および "番号" や "ID" などの単語と一致させてください。過度に短い略語は、組織内で一般的に使用されていない場合、混乱を引き起こす可能性があります。

また、テーブル名で使用する可能性のあるプレフィックスやサフィックスを削除し、代わりにシンプルな形式で名前を付ければ、混乱を避けるのに役立ちます。

値を置き換えるときに、これらの値がレポートにどのように表示されるかを想像してみてください。 値が長すぎると、読みにくくなり、ビジュアルに収めにくくなる場合があります。 値が短すぎると、解釈しにくくなる場合があります。 テキストがビジュアルに収まるようであれば、値に頭字語を使用しないこともお勧めします。