Développez l'apprentissage automatique prédictif avec Flink | Atelier du 18 déc. | S'inscrire

White Paper

Guide de la qualité des données de streaming

Obtenez le livre blanc

Découvrez les bonnes pratiques de Stream Governance pour protéger les systèmes et applications en aval contre les données de mauvaise qualité grâce à notre guide.

La qualité des données a toujours été un enjeu important, mais avec l’essor du tandem IA/ML, elle est aujourd'hui plus essentielle que jamais. Une mauvaise qualité des données conduit à des résultats erronés, avec un impact désastreux en aval : pannes coûteuses, défaillances de système, rapports inexacts, mauvaises décisions...

L’utilisation d’Apache Kafka® et d’autres technologies de streaming de données peut amplifier les problèmes de qualité, car les mauvaises données peuvent se propager plus rapidement et de façon plus globale. Avec les systèmes axés sur les événements, de mauvaises données peuvent facilement provoquer la rupture d’un écosystème entier d’applications et de services. Alors, comment votre organisation peut-elle tirer parti des avantages des architectures de streaming tout en offrant aux équipes chargées des données un moyen durable et évolutif de maintenir une qualité élevée ?

Ce guide présente les bonnes pratiques en matière de streaming de données dans une optique de gouvernance. Vous y découvrirez les catégories courantes de mauvaises données à surveiller et comment mettre en place des mesures préventives. Le guide propose des mesures concrètes à adopter pour garantir la qualité des données, et couvre des sujets tels que l’établissement de contrats de données, la création de produits de données et l’adoption d’une approche décentralisée de la responsabilité et de la gestion des données à l'échelle de l’organisation. Que vous soyez novice ou expert en matière de streaming de données, nous vous montrerons comment fluidifier et simplifier la mise en œuvre de ces stratégies grâce à Stream Governance de Confluent.

Téléchargez le guide maintenant pour découvrir comment :

  • Identifier les problèmes de schéma courants et les causes des valeurs non valides
  • Définir et partager des contrats de données avec Schema Registry
  • Découvrir, comprendre et vous fier à vos flux de données dans le cadre d'un modèle décentralisé