Préparer la recherche des données modifiées
S’applique à : SQL Server SSIS Integration Runtime dans Azure Data Factory
Dans le flux de contrôle d’un package Integration Services qui effectue un chargement incrémentiel des données modifiées, la troisième et dernière tâche consiste à préparer la recherche des données modifiées et à ajouter une tâche Data Flow.
Notes
La deuxième tâche pour le flux de contrôle est de garantir que les données modifiées pour l'intervalle sélectionné sont prêtes. Pour plus d’informations, consultez Déterminer si les données modifiées sont prêtes. Pour obtenir une description du processus général de la conception du flux de contrôle, consultez Capture des changements de données (SSIS).
Remarques sur la conception
Pour récupérer les données modifiées, vous appellerez une fonction table Transact-SQL qui accepte les points de terminaison de l'intervalle comme paramètres d'entrée et qui retourne les données modifiées pour l'intervalle spécifié. Un composant source dans le flux de données appelle cette fonction. Pour plus d’informations sur ce composant source, consultez Récupérer et comprendre les données modifiées.
Les composants sources Integration Services les plus fréquemment utilisés, notamment la source OLE DB, la source ADO et la source ADO NET, ne peuvent pas dériver d’informations sur les paramètres pour une Fonction table. Ainsi, la plupart des sources ne peuvent pas appeler directement une fonction paramétrable.
Deux options de conception s'offrent à vous pour passer les paramètres d'entrée à la fonction :
Assembler la requête paramétrable en tant que chaîne. Vous pouvez utiliser une tâche de script ou une tâche d'exécution SQL pour assembler une chaîne SQL dynamique avec les valeurs de paramètre codées en dur dans la chaîne. Vous pouvez ensuite stocker cette chaîne dans une variable de package et l'utiliser pour définir la propriété SqlCommand d'un composant source. Cette approche aboutit car le composant source n'a plus besoin des informations de paramètre.
Notes
Un script précompilé nécessite un temps de traitement inférieur à une tâche d'exécution SQL.
Utiliser un wrapper paramétrable. Vous pouvez également créer une procédure stockée paramétrable en tant que wrapper qui appelle la fonction table paramétrable. Cette approche part du principe qu'un composant source peut correctement dériver des informations de paramètre pour une procédure stockée.
Cette rubrique utilise la première option de conception et assemble une requête paramétrable en tant que chaîne.
Préparation de la requête
Avant de pouvoir concaténer les valeurs des paramètres d'entrée dans une chaîne de requête unique, vous devez installer les variables de package dont la requête a besoin.
Pour configurer des variables de package
Dans SQL Server Data Tools (SSDT), dans la fenêtre Variables, créez une variable du type de données String pour contenir la chaîne de requête retournée par la tâche d’exécution SQL.
Cet exemple utilise le nom de variable SqlDataQuery.
Une fois la variable de package créée, vous pouvez utiliser une tâche de script ou une tâche d'exécution SQL pour concaténer les valeurs des paramètres d'entrée. Les deux procédures suivantes décrivent comment configurer ces composants.
Pour utiliser une tâche de script pour concaténer la chaîne de requête
Sous l’onglet Flux de contrôle , ajoutez une tâche de script au package après le conteneur de boucles For et connectez ce dernier à la tâche.
Notes
Cette procédure suppose que le package effectue un chargement incrémentiel à partir d'une table unique. Si le package effectue le chargement à partir de plusieurs tables et qu'il possède un package parent avec plusieurs packages enfants, cette tâche est ajoutée en tant que premier composant à chaque package enfant. Pour plus d’informations, consultez Exécuter un chargement incrémentiel de plusieurs tables.
Dans l’Éditeur de tâche de script, dans la page Script , sélectionnez les options suivantes :
Pour ReadOnlyVariables, sélectionnez User::DataReady, User::ExtractStartTimeet User::ExtractEndTime dans la liste.
Pour ReadWriteVariables, sélectionnez User::SqlDataQuery dans la liste.
Dans l’Éditeur de tâche de script, dans la page Script , cliquez sur Modifier le script pour ouvrir l’environnement de développement de script.
Dans la procédure Main, entrez l'un des segments de code suivants :
Si vous programmez en C#, entrez les lignes de code suivantes :
int dataReady; System.DateTime extractStartTime; System.DateTime extractEndTime; string sqlDataQuery; dataReady = (int)Dts.Variables["DataReady"].Value; extractStartTime = (System.DateTime)Dts.Variables["ExtractStartTime"].Value; extractEndTime = (System.DateTime)Dts.Variables["ExtractEndTime"].Value; if (dataReady == 2) { sqlDataQuery = "SELECT * FROM CDCSample.uf_Customer('" + string.Format("{0:yyyy-MM-dd hh:mm:ss}", extractStartTime) + "', '" + string.Format("{0:yyyy-MM-dd hh:mm:ss}", extractEndTime) + "')"; } else { sqlDataQuery = "SELECT * FROM CDCSample.uf_Customer(null" + ", '" + string.Format("{0:yyyy-MM-dd hh:mm:ss}", extractEndTime) + "')"; } Dts.Variables["SqlDataQuery"].Value = sqlDataQuery;
- ou -
Si vous programmez en Visual Basic, entrez les lignes de code suivantes :
Dim dataReady As Integer Dim extractStartTime As Date Dim extractEndTime As Date Dim sqlDataQuery As String dataReady = CType(Dts.Variables("DataReady").Value, Integer) extractStartTime = CType(Dts.Variables("ExtractStartTime").Value, Date) extractEndTime = CType(Dts.Variables("ExtractEndTime").Value, Date) If dataReady = 2 Then sqlDataQuery = "SELECT * FROM CDCSample.uf_Customer('" & _ String.Format("{0:yyyy-MM-dd hh:mm:ss}", extractStartTime) & _ "', '" & _ String.Format("{0:yyyy-MM-dd hh:mm:ss}", extractEndTime) & _ "')" Else sqlDataQuery = "SELECT * FROM CDCSample.uf_Customer(null" & _ ", '" & _ String.Format("{0:yyyy-MM-dd hh:mm:ss}", extractEndTime) & _ "')" End If Dts.Variables("SqlDataQuery").Value = sqlDataQuery
Laissez la ligne de code par défaut qui retourne DtsExecResult.Success suite à l’exécution du script.
Fermez l’environnement de développement de script et l’Éditeur de tâche de script.
Pour utiliser une tâche d'exécution SQL pour concaténer la chaîne de requête
Sous l’onglet Flux de contrôle , ajoutez une tâche d’exécution SQL au package après le conteneur de boucles For et connectez ce dernier à cette tâche.
Notes
Cette procédure suppose que le package effectue un chargement incrémentiel à partir d'une table unique. Si le package effectue le chargement à partir de plusieurs tables et qu'il possède un package parent avec plusieurs packages enfants, cette tâche est ajoutée en tant que premier composant à chaque package enfant. Pour plus d’informations, consultez Exécuter un chargement incrémentiel de plusieurs tables.
Dans l’Éditeur de tâche d’exécution de requêtes SQL, dans la page Général , sélectionnez les options suivantes :
Pour ResultSet, sélectionnez Ligne unique.
Configurez une connexion valide à la base de données source.
Pour SQLSourceType, sélectionnez Entrée directe.
Pour SQLStatement, entrez l’instruction SQL suivante :
declare @ExtractStartTime datetime, @ExtractEndTime datetime, @DataReady int select @DataReady = ?, @ExtractStartTime = ?, @ExtractEndTime = ? if @DataReady = 2 select N'select * from CDCSample.uf_Customer' + N'('''+ convert(nvarchar(30),@ExtractStartTime,120) + ''', ''' + convert(nvarchar(30),@ExtractEndTime,120) + ''') ' as SqlDataQuery else select N'select * from CDCSample.uf_Customer' + N'(null, ''' + convert(nvarchar(30),@ExtractEndTime,120) + ''') ' as SqlDataQuery
Notes
La clause else dans cet exemple génère une requête pour le chargement initial des données modifiées en passant une valeur Null pour la date et l’heure de début. Cet exemple ne s'applique pas au scénario selon lequel des modifications qui ont été apportées avant l'activation de la capture de données modifiées doivent aussi être téléchargées dans l'entrepôt de données.
Dans la page Mappage de paramètre de l’Éditeur de tâche d’exécution de requêtes SQL, effectuez le mappage suivant :
Mappez la variable DataReady au paramètre 0.
Mappez la variable ExtractStartTime au paramètre 1.
Mappez la variable ExtractEndTime au paramètre 2.
Dans la page Ensemble de résultats de l’Éditeur de tâche d’exécution de requêtes SQL, mappez le Nom de résultat à la variable SqlDataQuery.
Le Nom de résultat est le nom de la colonne unique retournée, SqlDataQuery.
Les procédures précédentes configurent une tâche qui prépare une chaîne de requête avec des valeurs de chaîne codées en dur pour les paramètres d'entrée. Le code suivant est un exemple d'une telle chaîne de requête :
select * from CDCSample. uf_Customer('2007-06-11 14:21:58', '2007-06-12 14:21:58')
Ajout d’une tâche de flux de données
La dernière étape de la conception du flux de contrôle pour le package consiste à ajouter une tâche de flux de données.
Pour ajouter une tâche de flux de données et terminer le flux de contrôle
- Sous l’onglet Flux de contrôle , ajoutez une tâche de flux et connectez la tâche ayant concaténé la chaîne de requête.
étape suivante
Une fois que vous avez préparé la chaîne de requête et configuré la tâche de flux de données, l'étape suivante consiste à créer la fonction table qui récupèrera les données modifiées de la base de données.
Rubrique suivante : Créer la fonction de récupération des données modifiées