UNdictionnaire de donnéesest une collection de noms, de définitions et d'attributs pour les éléments de données et les modèles. Les données dans undictionnaire de donnéessont les métadonnées sur la base de données. Ces éléments sont ensuite utilisés dans le cadre d’une base de données, d’un projet de recherche ou d’un système d’information. Ce sont quelques-uns des éléments les plus couramment utilisés dans undictionnaire de données, bien qu'il y ait des variations :
- Nom d'attribut
- Type d'attribut
- Relation d'entité
- Donnée de référence
- Règles de validation, de schéma ou de qualité des données
- Propriétés détaillées des éléments de données
- Informations physiques sur l'endroit où les données sont stockées
Il existe deux types dedictionnaires de données: actif et passif. Un actifdictionnaire de donnéesest lié à une base de données spécifique, ce qui rend le transfert de données difficile, mais il se met à jour automatiquement avec le système de gestion des données. Un passifdictionnaire de donnéesn'est pas lié à une base de données ou à un serveur particulier, mais il doit également être géré manuellement pour éviter que les métadonnées ne soient désynchronisées.
PourquoiDictionnaires de donnéesSont importants
La principale raison pour laquelle les entreprises utilisentdictionnaires de donnéesest de documenter et de partager des structures de données et d'autres informations pour toutes les personnes impliquées dans un projet ou une base de données. L'utilisation d'un dictionnaire partagé garantit la même qualité, la même signification et la même pertinence pour tous les éléments de données pour tous les membres de l'équipe. Ledictionnaire de donnéesdéfinira les conventions pour le projet et la cohérence dans l'ensemble de l'ensemble de données. Sans undictionnaire de données, le risque de perdre des informations cruciales lors de la traduction et de la transition est plus élevé. Utilisant undictionnaire de donnéesaide également les équipes à analyser les données plus facilement plus tard.
Comment créer un dictionnaire de données
De nombreuses entreprises s'appuient sur des systèmes de gestion de bases de données (SGBD), et ces systèmes disposent le plus souvent de systèmes actifs intégrés.dictionnaires de données. La documentation peut être générée avec SQL, Server, Oracle ou MySQL. Pour créer un passifdictionnaire de données, les analystes devront en créer un séparément d'un SGBD puisque les dictionnaires passifs ne sont pas gérés par un système de gestion. SQL, Server et Oracle peuvent être utilisés pour créer un dictionnaire, et il existe même un modèle dans Excel. Le moyen le plus simple d’intégrer un dictionnaire est de l’utiliser dans le cadre d’un SGBD.
Des défis avecDictionnaires de données
UNdictionnaire de donnéesprofite aux analystes en rendant une base de données cohérente et en simplifiant le processus d’analyse des données. Mais undictionnaire de donnéesà lui seul, il n’apporte jusqu’à présent que cohérence et normalisation. Sans préparation des données,dictionnaires de donnéespeut prendre du temps pour créer ou standardiser seulement une partie d’une base de données ou d’un projet. Ainsi, même si les éléments de données sont cohérents avec ceux d’un dictionnaire, cela ne représente qu’une partie de la préparation des données pour le processus d’analyse proprement dit. Et la préparation des données à grande échelle, y compris dans le cadre d'undictionnaire de données— peut prendre beaucoup de temps, laissant de nombreuses entreprises dans une situation difficile en matière de données.
Préparation des données avec unDictionnaire de données
L'avenir dudictionnaire de donnéesest de le combiner avec la préparation des données pour économiser du temps et des ressources aux équipes et pour rendre un projet cohérent à tous les niveaux. Quanddictionnaires de donnéessont intégrés dans un système de préparation de données, les deux travaillent ensemble pour rendre la cohérence efficace et plus simple pour les analystes de données.
Designer Cloud fournit une préparation de données efficace et efficiente qui est facilement accessible aux personnes de divers secteurs. Inscrivez-vous à unessai gratuit de 30 joursaujourd'hui.