La gestion intelligence des données : un élément clé du cycle de vie de l’information

CloudData-stockageEntrepriseStockage

Tribune : l’IDM (Gestion Intelligente des Données) aide les entreprises à établir leur stratégie de gestion des données, de leur création à leur suppression du système, explique Denis Montillet, Enterprise Marketing Manager, Division PME/PMI Dell France.

Ces volumes toujours plus importants de données inactives influent sur les performances des applications, limitent l’accès aux données et affectent l’infrastructure de stockage. Cela donne lieu à des difficultés croissantes dans les environnements informatiques essentiels à l’activité et représente également une préoccupation croissante pour les entreprises. C’est là que le concept de plus en plus connu d’Intelligent Data Management (IDM) entre en jeu.

L’IDM aide les entreprises à établir de quelle manière gérer les données le long de leur cycle de vie – du moment où elles sont générées/conservées au moment où elles sont supprimées du système.

La valeur des informations continue de changer avec le temps, les processus, les activités et les besoins réglementaires. Cela affecte au fur et à mesure l’utilisation même des données. La réutilisation et la déduplication des données sont des indicateurs clés de l’IDM, permettant le stockage de données à différents niveaux pour optimiser l’infrastructure de stockage et améliorer les performances. Une stratégie IDM bien planifiée permettra à l’entreprise de conserver tous les reportings et d’obtenir les mêmes capacités que si les données se trouvaient sur le même serveur.

Les analystes se sont basés sur différentes expériences afin de mettre au point les meilleures pratiques pour guider les entreprises à travers les évolutions de l’IDM. Les expériences de plusieurs entreprises mettent clairement en avant ces meilleures pratiques.

Classer les données

L’importance des politiques de rétention des données est clé. La valeur des données, également appelée classification des données, représente le fondement d’une gestion des données réussie et efficace. Les politiques de rétention des données nécessitent l’implication de toutes les entités qui créent ou utilisent ces données. La classification des données aide à organiser les données sur différents niveaux et est probablement l’étape la plus importante de l’IDM.

La déduplication des données

La déduplication est une technologie d’optimisation des données qui permet de réduire l’empreinte des données en éliminant les copies multiples de données redondantes et en stockant seulement les données uniques. Les copies de données redondantes sont remplacées par des références aux données d’origine, parfois appelées « pointeur ».

La déduplication de données redondantes peut avoir lieu au niveau du fichier, du sous-fichier ou du bloc. Au niveau du sous-fichier ou du bloc, les données sont généralement divisées en segments plus petits. Celles-ci peuvent alors être analysées plus facilement que les données au niveau des fichiers, permettant de découvrir de possibles redondances, et elles peuvent également être stockées plus facilement. De plus, la déduplication des données permet également de réduire les fenêtres des sauvegardes.

La déduplication peut se produite au niveau du stockage primaire, comme avec les outils de partage de fichiers (NAS). Cependant, le secteur se concentre aujourd’hui principalement sur le stockage secondaire (comme les données de sauvegarde) qui comprend de nombreuses données redondantes, avec des applications comme backup to disk (B2D). B2D est particulièrement intéressant en raison de la nature des données de sauvegarde. Généralement, le volume des données au sein d’une entreprise ne change pas particulièrement d’une sauvegarde à l’autre. Ainsi stocker une copie après la suivante du même fichier ou de la même donnée peut consommer inutilement des ressources, en termes de capacité de stockage, de puissance, de coût opérationnel et de gestion.

Lire aussi :