Démocratiser les données avec l’invention numérique

Le charbon, le pétrole et le potentiel humain ont été les trois principaux atouts de la révolution industrielle. Ces ressources ont permis de bâtir des entreprises, de déplacer des marchés et, en définitive, de changer des nations. L’économie numérique compte trois ressources d’égale importance pour l’innovation : les données, les appareils et le potentiel humain. Ces ressources recèlent un grand potentiel d’innovation. Dans tout effort d'innovation de l'ère moderne, les données représentent le nouveau pétrole.

Chaque entreprise possède des données qui peuvent être exploitées pour identifier les besoins des clients et y répondre. Malheureusement, le processus d’exploration de ces données pour favoriser l’innovation peut s’avérer coûteux et chronophage, ce qui constitue un frein à la découverte des besoins et à la création de solutions. La démocratisation des données peut apporter une réponse à ce problème.

Présentation de la démocratisation des données Le processus de démocratisation des données consiste à mettre les données entre les bonnes mains pour favoriser l’innovation. Ce processus peut prendre différentes formes, qui comprennent généralement toutes des solutions pour l’ingestion ou l’intégration de données brutes ainsi que pour la centralisation, le partage et la sécurisation des données. Les experts de l’entreprise peuvent ensuite utiliser les données qui ont été démocratisées pour formuler et tester des hypothèses. Très souvent, les équipes d’adoption du cloud peuvent développer avec empathie envers les clients en utilisant uniquement des données, ceci afin de répondre rapidement aux besoins des clients.

Méthodes de démocratisation des données

Il existe différentes façons de démocratiser les données, mais la plupart incluent des méthodes pour collecter, centraliser, gouverner et partager les données. Les sections suivantes décrivent certaines de ces méthodes. Quand vous créez une solution pour une hypothèse client, vous devez déterminer s’il y a lieu de démocratiser les données, dans quelle mesure et de quelle façon.

Processus de démocratisation des données illustrant ces processus : gouverner, centraliser, collecter et partager des données.

Partager des données

Lorsque vous développez en faisant preuve d’empathie envers le client, les besoins du client doivent guider votre choix de solution. Si le client a besoin de données, la solution doit lui permettre d’interroger les données, de les analyser et d’en créer des rapports directement, sans l’aide du personnel informatique.

De nombreuses innovations réussies ont démarré sous la forme d’un produit minimum viable (MVP) qui fournissait des données au client. Un MVP est une version du produit qui comporte juste assez de fonctionnalités pour être utilisable par le client. Il est conçu pour montrer au client le potentiel du produit et recueillir les commentaires du client. Dans ce modèle de conciergerie, un employé est le consommateur de données. Cet employé utilise les données pour aider le client. Chaque fois que le client a recours au support manuel, une hypothèse peut être testée et validée. Cette approche est souvent un moyen rentable de tester une hypothèse centrée sur le client avant d'investir massivement dans des solutions intégrées.

Les principaux outils permettant de partager des données directement avec les consommateurs de données sont les rapports en libre-service ou les données intégrées dans d'autres expériences à l'aide d'outils tels que Power BI.

Remarque

Avant de partager des données, lisez les sections suivantes. Le partage de données peut nécessiter une gouvernance pour assurer la protection des données. En outre, si les données sont réparties sur plusieurs clouds, une centralisation est parfois nécessaire. Si les données se trouvent dans des applications, vous devez les collecter en vue de leur partage.

Régir les données

Le partage de données permet de produire rapidement un produit minimum viable, utilisable dans le cadre des conversations avec les clients. Toutefois, pour transformer ces données partagées en connaissances utiles et actionnables, cela n’est généralement pas suffisant.

Une fois qu'une hypothèse a été validée par le partage des données, la phase suivante du développement est généralement la gouvernance des données.

La gouvernance des données est un vaste sujet qui peut nécessiter son propre framework dédié et qui sort du cadre du Cloud Adoption Framework.

Plusieurs aspects de la gouvernance des données doivent être pris en compte dès que vous avez validé l’hypothèse du client. Par exemple :

  • Les données partagées sont-elles sensibles ? Les données doivent être classifiées avant d’être partagées publiquement afin de protéger les intérêts des clients et de l’entreprise.
  • Si les données sont sensibles, ont-elles été sécurisées ? La protection des données sensibles est indispensable pour les données démocratisées. L’exemple de charge de travail expliqué dans Sécurisation des solutions de données fournit des informations de référence relatives à la sécurisation des données.
  • Les données sont-elles cataloguées ? L’identification de la nature des données partagées facilite la gestion des données à long terme. Les outils permettant de documenter les données, comme Azure Data Catalog, peuvent rendre ce processus beaucoup plus facile dans le cloud. L’aide sur l’annotation des données et la documentation des sources de données contribue à accélérer le processus.

Lorsque la démocratisation des données est importante pour une hypothèse centrée sur le client, assurez-vous que la gouvernance des données partagées fait partie du plan de mise en production. Cela protège les clients, les consommateurs des données et l’entreprise.

Centraliser des données

La centralisation des données permet d’obtenir des rapports plus pertinents, de garantir la disponibilité des mêmes données dans l’ensemble de l’organisation et d’augmenter votre retour sur investissement. Quand les données sont dispersées au sein d’un environnement informatique, les possibilités d’innovation peuvent être extrêmement limitées, coûteuses et chronophages. Le cloud offre de nouvelles opportunités pour centraliser les données. Lorsque la centralisation de plusieurs sources de données est requise pour développer en faisant preuve d'empathie vis-à-vis du client, le cloud peut accélérer le test des hypothèses.

Attention

Quel que soit le processus d'innovation, la centralisation des données constitue toujours un risque. Lorsque la centralisation des données représente un défi technique, et pas une source de valeur pour le client, nous vous conseillons de reporter la centralisation jusqu'à ce que les hypothèses du client aient été confirmées.

Si vous choisissez de centraliser les données, vous avez besoin d’un magasin de données approprié pour y stocker les données centralisées. L'approche recommandée consiste à établir un entrepôt de données dans le cloud. Cette option évolutive fournira un emplacement central pour toutes vos données. Ce type de solution est disponible dans les options de traitement analytique en ligne (OLAP) ou de Big Data.

Les architectures de référence des solutions OLAP et Big Data peuvent vous aider à choisir la solution de centralisation la plus adaptée dans Azure. Si une solution hybride est requise, l'architecture de référence de l'extension des données locales peut également contribuer à accélérer le développement de la solution.

Important

En fonction des besoins des clients et des solutions proposées, une approche simple peut suffire. L’architecte du cloud doit inciter l’équipe à envisager des solutions à moindre coût qui permettent de valider l’hypothèse du client, en particulier au début du développement. Cette section sur la collecte des données présente des scénarios qui peuvent vous inspirer une autre solution en fonction de votre situation.

Collecter les données

Il existe deux principales formes de collecte de données : l’intégration et l’ingestion.

Intégration : Les données qui résident dans un magasin de données existant peuvent être intégrées au magasin de données centralisé en utilisant des techniques traditionnelles de déplacement des données. Cela est particulièrement courant pour les scénarios qui impliquent un stockage de données multicloud. Ces techniques consistent à extraire les données du magasin de données existant, puis à les charger dans le magasin de données central. À un moment donné de ce processus, les données sont généralement transformées pour être plus utiles et pertinentes dans le magasin central.

Les outils cloud ont transformé ces techniques en outils de paiement à l'utilisation, réduisant ainsi les obstacles à l'entrée pour la collecte et la centralisation des données. Azure Database Migration Service et Azure Data Factory sont des exemples d’outils de ce type. L’architecture de référence de Data Factory avec magasin de données OLAP est un exemple de solution de ce type.

Ingestion : Certaines données ne figurent dans aucun magasin de données existant. Lorsque ces données temporaires constituent une source principale d'innovation, vous devez envisager d'autres approches. Les données temporaires figurent dans différents types de sources existantes, comme les applications, les API, les flux de données, les appareils IoT, les blockchains, le cache des applications, le contenu multimédia ou même les fichiers plats.

Vous pouvez intégrer ces différentes formes de données dans un magasin de données central sur une solution OLAP ou Big Data. Toutefois, dans les premières itérations du cycle développer-mesurer-apprendre, une solution de traitement transactionnel en ligne (OLTP) peut suffire pour valider une hypothèse client. Les solutions OLTP ne sont pas les meilleures pour les scénarios de création de rapports. Mais lorsque vous développez en faisant preuve d'empathie vis-à-vis des clients, il est plus important de vous concentrer sur les besoins du client que sur les décisions techniques relatives aux outils. Une fois l'hypothèse du client confirmée à grande échelle, une plateforme plus appropriée peut s'avérer nécessaire. L'architecture de référence des magasins de données OLTP peut vous aider à déterminer le magasin de données le plus approprié pour votre solution.

Virtualisation : L’intégration et l’ingestion de données peuvent parfois ralentir l’innovation. Lorsqu'une solution de virtualisation des données est déjà disponible, cette approche peut s'avérer plus raisonnable. L'ingestion et l'intégration peuvent à la fois dupliquer les exigences relatives au stockage et au développement, ajouter une latence des données, augmenter la surface d'attaque, générer des problèmes de qualité et accroître les efforts de gouvernance. La virtualisation des données est une alternative plus contemporaine qui laisse les données d'origine dans un emplacement unique et crée des requêtes directes ou mises en cache des données sources.

SQL Server 2017 et Azure SQL Data Warehouse prennent en charge PolyBase, qui est l’approche de la virtualisation des données la plus couramment utilisée dans Azure.

Étapes suivantes

Après la mise en place d’une stratégie de démocratisation des données, l’étape suivante est l’évaluation des approches du développement d’applications.