Behandeln von Erfassungsfehlern oder beschädigten Daten

Hinweis

Am 1. September 2023 haben wir Dynamics 365 Marketing und Dynamics 365 Customer Insights zusammengeführt und umbenannt. Dynamics 365 Marketing heißt jetzt Dynamics 365 Customer Insights – Journeys. Dynamics 365 Customer Insights heißt jetzt Dynamics 365 Customer Insights – Data. Weitere Informationen finden Sie unter Häufig gestellte Fragen zu Dynamics 365 Customer Insights.

In diesem Artikel werden häufige Gründe für Datenerfassungsfehler oder beschädigte Daten bei der Verwendung von Azure Data Lake Storage oder Power Query in Microsoft Dynamics 365 Customer Insights – Data vorgestellt.

Erfassungsfehler oder beschädigte Daten mit Azure Data Lake Storage

Während der Datenerfassung sind einige der häufigsten Gründe, warum ein Datensatz als beschädigt betrachtet werden kann:

Schema- oder Datentypkonflikt

Wenn die Daten nicht dem Schema entsprechen, wird der Erfassungsprozess mit Fehlern abgeschlossen.

Um dieses Problem zu beheben, korrigieren Sie entweder die Quelldaten oder das Schema, und erfassen Sie die Daten erneut.

Partitionsdateien fehlen

  • Wenn der Erfassungsprozess ohne beschädigte Datensätze erfolgreich ist, Sie aber keine Daten sehen können, bearbeiten Sie Ihre model.json oder manifest.json Datei, um sicherzustellen, dass Partitionen angegeben sind. Aktualisieren Sie dann die Datenquelle.

  • Wenn die Datenerfassung zur gleichen Zeit erfolgt, zu der Datenquellen während einer automatischen Zeitplanaktualisierung aktualisiert werden, sind die Partitionsdateien möglicherweise leer oder für den Systemprozess nicht verfügbar. Um den Upstreamaktualisierungszeitplan anzupassen, ändern Sie den Systemaktualisierungszeitplan oder den Aktualisierungszeitplan für die Datenquelle. Richten Sie die Zeitsteuerung so aus, dass nicht alle Aktualisierungen gleichzeitig erfolgen.

Datetime-Felder weisen das falsche Format auf.

Die datetime Felder in der Tabelle weisen nicht das Iso 8601- oder en-US -Format auf. Das Standardformat datetime in Dynamics 365 Customer Insights – Data ist en-US. datetime Alle Felder in einer Tabelle sollten das gleiche Format aufweisen. Customer Insights unterstützt andere Formate, sofern Anmerkungen oder Merkmale auf Quell- oder Tabellenebene im Modell oder manifest.json vorgenommen werden. Beispiel:

Model.json

  "annotations": [
    {
      "name": "ci:CustomTimestampFormat",
      "value": "yyyy-MM-dd'T'HH:mm:ss:SSS"
    },
    {
      "name": "ci:CustomDateFormat",
      "value": "yyyy-MM-dd"
    }
  ]   

In einer manifest.json-Datei kann das datetime Format auf Tabellen- oder Attributebene angegeben werden. Verwenden Sie "exhibitsTraits" auf Tabellenebene in der Tabelle in *.manifest.cdm.json , um das datetime Format zu definieren. Verwenden Sie "appliedTraits" auf Attributebene im -Attribut in tablename.cdm.json.

Manifest.json auf Tabellenebene

"exhibitsTraits": [
    {
        "traitReference": "is.formatted.dateTime",
        "arguments": [
            {
                "name": "format",
                "value": "yyyy-MM-dd'T'HH:mm:ss"
            }
        ]
    },
    {
        "traitReference": "is.formatted.date",
        "arguments": [
            {
                "name": "format",
                "value": "yyyy-MM-dd"
            }
        ]
    }
]

table.json auf Attributebene

   {
      "name": "PurchasedOn",
      "appliedTraits": [
        {
          "traitReference": "is.formatted.date",
          "arguments" : [
            {
              "name": "format",
              "value": "yyyy-MM-dd"
            }
          ]
        },
        {
          "traitReference": "is.formatted.dateTime",
          "arguments" : [
            {
              "name": "format",
              "value": "yyyy-MM-ddTHH:mm:ss"
            }
          ]
        }
      ],
      "attributeContext": "POSPurchases/attributeContext/POSPurchases/PurchasedOn",
      "dataFormat": "DateTime"
    }

Erfassungsfehler oder beschädigte Daten mit Power Query

Datetime-Werte werden falsch analysiert, oder es tritt ein Analysefehler auf.

Der häufigste Datentypkonflikt tritt auf, wenn ein Datumsfeld nicht auf das richtige Datumsformat festgelegt ist. Dieser Konflikt kann durch falsch formatierte Quelldaten oder ein falsches Gebietsschema verursacht werden.

Symptome des Problems mit dem falschen Gebietsschema:

  • Wenn die Quelldaten nicht durch das verwendete Gebietsschema analysiert werden können, tritt ein Erfassungsfehler auf. Wenn z. B. "29/08/2023" mit "MM/TT/JJJJ" analysiert wird, schlägt die Erfassung fehl, da monat 29 nicht analysiert werden kann.

  • Wenn die Quelldaten erfolgreich mit einem falschen Gebietsschema analysiert werden, sind die datetime-Werte falsch. Die Quelldaten sind beispielsweise als "MM/TT/JJJJ" formatiert, während das Standardgebietsschema, das zum Analysieren der Daten während der Erfassung verwendet wird, "TT/MM/JJJJ" verwendet. Daher wird "8. Dezember 2023" als "12. August 2023" erfasst.

    Screenshot: Das datetime-Format ist nach der Erfassung falsch.

Lösung

  • Um ein falsches Format zu beheben, aktualisieren Sie die Quelldaten, und erfassen Sie sie erneut.

  • Um ein falsches Gebietsschema zu beheben, ändern Sie den Typ aller datetime-Felder, um das richtige Gebietsschema zu verwenden, indem Sie in den Power Query-Transformationen Typ>mithilfe des Gebietsschemas ändern. Beispiel:

    Screenshot: Ändern des Datentyps mit Gebietsschema in Power Query

    Weitere Informationen finden Sie unter Gebietsschema für Dokumente oder Projekte.

Weitere Informationen