[Webinar] Master Apache Kafka Fundamentals with Confluent | Register Here

CAS D'USAGE| PIPELINES CDC

Création de pipelines CDC avec Apache Flink®

La capture des modifications de données (CDC) est utilisée pour copier des données dans des bases de données relationnelles, permettant ainsi des opérations de back-end essentielles telles que la synchronisation des données, la migration et la reprise après sinistre. Et maintenant, grâce à Stream Processing, vous pouvez créer des pipelines CDC qui alimentent des applications axées sur les événements et des produits de données fiables, avec des données actualisées, intégrées à travers des systèmes distribués, anciens et modernes.

Découvrez comment Confluent réunit Apache Kafka® et Apache Flink® pour que vous puissiez créer des pipelines CDC en continu et alimenter l'analyse en aval avec des données opérationnelles de haute qualité.

Passer de décisions prises sur des données obsolètes à des réactions en temps réel

Réduisez vos coûts de traitement de 30 %

Fournissez des données fiables et propres sans intervention manuelle de dépannage

3 défis clés
avec les architectures CDC traditionnelles

La plupart des organisations utilisent déjà le CDC basé sur les journaux pour transformer les modifications de la base de données en événements.

  • Latence significative des données lors du traitement par lots. Au lieu des flux d'événements, la plupart des organisations s'appuient sur le traitement par lots pour matérialiser les données de logs en aval. Cela signifie que les systèmes de données restent désynchronisés pendant les heures ou les jours nécessaires pour que le processus de traitement par lots suivant s'exécute.
  • Coûts du traitement redondant. Les coûts supplémentaires proviennent à la fois de la nécessité de construire et de maintenir des intégrations point à point, ainsi que du traitement redondant qui s'effectue à travers ces pipelines.
  • Perte de confiance due à des cycles de correction manuels constants. Le maintien de l'exactitude de tous ces pipelines est chronophage et sujet à des erreurs humaines. Et cette approche contraint les équipes à réagir en résolvant les problèmes détectés uniquement lorsqu'ils affectent un autre consumer en aval.
Operational estate and analytical state
Une architecture simple pour obtenir des données fraîches et fiables
CDC pipeline architecture

La création de pipelines CDC avec Kafka et Flink vous permet d'unifier vos charges de travail CDC et vos analyses par lots, et d'éliminer les silos de traitement. Au lieu de dépendre du traitement par lots, d’assumer les coûts de traitements redondants ou de s’appuyer sur des pipelines peu robustes, cette architecture vous permet de :

  • Capturer des données CDC sous forme de flux d'événements
  • Utiliser Flink pour traiter ces flux en temps réel
  • Matérialiser instantanément les flux CDC sur l'ensemble de vos environnements opérationnels et analytiques.

Maximisez la valeur de vos données à une fraction du coût

Avec serverless Apache Flink® sur la plateforme de streaming de données Confluent , vous pouvez déplacer le traitement en amont — avant l'ingestion des données — pour améliorer la latence, la portabilité des données et la rentabilité.

  • Enrichissement des données : Améliorez les données avec un contexte supplémentaire pour une précision accrue.
  • Réutilisabilité des données : Partagez des flux de données cohérents entre les applications.
  • En temps réel disponible partout : Activez des applications à faible latence pour qu'elles réagissent instantanément aux événements.
  • Réduction des coûts : Optimisez l'utilisation des ressources et réduisez les traitements redondants.

Les équipes AppDev peuvent construire des pipelines de données qui permettent des actions en temps opportun

Qu’il s’agisse d’ingestion shift-left vers l'entrepôt de données et le lac de données pour l’analytique, de la création d’index de recherche en temps réel, de pipelines ML ou de l’optimisation des SIEM.

Découvrir l’analyse Shift Left

Les équipes d'analyse peuvent préparer et structurer des données pour alimenter des applications axées sur les événements en déclenchant des calculs, des mises à jour d'état ou des actions externes

Cela inclut des applications développées pour les solutions GenAI, la détection de fraude, les alertes et notifications en temps réel, la personnalisation du marketing, et plus encore.

Découvrez Streaming Agents

3 étapes pour créer des pipelines CDC avec Confluent Stream Processing

Avec Confluent, vous pouvez traiter vos flux CDC avant de les matérialiser dans votre environnement analytique. Filtrez, fusionnez et enrichissez simplement les données CDC capturées dans vos topics Kafka avec Flink SQ. Ensuite, matérialisez les flux de données au sein de votre domaine opérationnel et analytique.

Modernize your tech stack image

Étape 1. Capturez et intégrez facilement les données de changement grâce aux connecteurs CDC entièrement gérés

Confluent propose des connecteurs CDC entièrement gérés pour des sources telles qu'Oracle, SQL Server, MySQL, Salesforce et Debezium. Ces connecteurs vous permettent de capturer un historique ordonné de toutes les insertions, mises à jour et suppressions—permettant une intégration en temps réel et fine des données de changement—sans avoir à écrire, tester, maintenir ou gérer vous-même les connecteurs.

Créez des tableaux qui se mettent à jour en continu et qui reflètent les changements en temps réel des flux de données sous-jacents, permettant ainsi d'obtenir des résultats en direct et interrogeables. Et vous pouvez même interpréter automatiquement les flux CDC de Debezium pour simplifier la conversion des modifications brutes de la base de données en tables mises à jour en continu.

CDC diagram

Étape 2. Enrichissez, transformez et optimisez en continu les données de changement en streaming avec Flink.

Quelle que soit l'origine de vos données de changement, utilisez Confluent Cloud pour Apache Flink® pour effectuer un traitement en mémoire, qu'il soit sans état ou avec état, à l'aide d'une syntaxe SQL simple. Ses capacités de traitement des flux à faible latence et à haut débit vous permettent, ainsi qu'aux équipes en aval, d'enrichir et de transformer les charges de travail CDC en temps réel grâce au filtrage, à la déduplication, à l'agrégation, à la jonction et à la dénormalisation.

Expose CDC streams

Étape 3. Exposez instantanément les flux CDC

Les pipelines ETL sont un moyen fragile et coûteux de livrer des charges de travail opérationnelles à votre infrastructure analytique. Cela devient encore plus difficile lorsque les données propres et enrichies doivent être mises à disposition dans votre domaine opérationnel. L'ajout d'étapes supplémentaires et le traitement par lots planifié pourraient avoir un impact significatif sur la capacité à offrir des expériences en temps réel et axées sur les événements.

Avec Confluent, vous pouvez facilement intégrer ces systèmes, traiter les charges de travail de capture des changements de données (CDC) en temps réel et les matérialiser instantanément dans les applications analytiques et opérationnelles. La riche gamme de connecteurs de Confluent permet une intégration transparente, tandis que Tableflow matérialise vos données de streaming dans des formats de table ouverts en temps réel.

Démonstrations et études de cas CDC en streaming

Les clients de Confluent utilisent Flink pour améliorer les cas d'usage existants de la capture de données de changement (CDC), tels que la synchronisation des données et la reprise après sinistre, et pour débloquer de nouvelles capacités en temps réel.

Explorez le dépôt GitHub pour apprendre à implémenter l’analytique en temps réel pour les cas d’usage Customer 360, l’analyse des ventes de produits ou l’analyse des tendances de vente.

Vous aurez 2 laboratoires parmi lesquels choisir :

Laboratoire d'agrégation des ventes de produits et de Customer360

Nettoyez et agrégez les données de vente des produits, ingérez les données enrichies dans Snowflake ou Redshift, puis créez un produit de données destiné aux bases de données opérationnelles.

Se lancer maintenant

Laboratoire des tendances de ventes quotidiennes

Validez les paiements, analysez les modèles de vente pour identifier les tendances quotidiennes, puis matérialisez le topic Kafka sous forme de table Iceberg dans Amazon Athena pour obtenir des informations plus approfondies.

Se lancer maintenant
CDC data flow diagram
Comment se lancer avec le CDC en streaming sur Confluent

Êtes-vous prêt à commencer à traiter les données CDC en temps réel avec Flink ? Commencez à utiliser Confluent et implémentez une architecture de traitement des flux adaptée à tous les environnements.

Essayez Confluent Cloud pour Apache Flink®—disponible sur AWS, Google Cloud, Microsoft Azure—pour créer des applications exploitant Kafka + Flink avec une efficacité et une simplicité de coût sans serveur et cloud-native.

Et avec Confluent Platform pour Apache Flink®, vous pouvez transférer vos charges de travail Flink existantes vers une plateforme de streaming de données self-managed, prête à être déployée sur site ou dans votre Cloud privé.

Confluent Cloud

Un service cloud native entièrement géré basé sur Apache Kafka®

Pour bénéficier d'une assistance technique personnalisée de la part d'un expert Confluent, veuillez saisir une adresse e-mail professionnelle.
Pays
  • Pays
  • Afghanistan
  • Afrique du Sud
  • Åland
  • Albanie
  • Algérie
  • Allemagne
  • Andorre
  • Angola
  • Anguilla
  • Antarctique
  • Antigua et Barbuda
  • Arabie Saoudite
  • Argentine
  • Arménie
  • Aruba
  • Australie
  • Autriche
  • Azerbaïdjan
  • Bahamas
  • Bahrein
  • Bangladesh
  • Barbade
  • Belgique
  • Belize
  • Bénin
  • Bermudes
  • Bhoutan
  • Bielorussie
  • Bolivie
  • Bonaire, Saint-Eustache et Saba
  • Bosnie-Herzégovine
  • Botswana
  • Brésil
  • Brunei Darussalam
  • Bulgarie
  • Burkina Faso
  • Burundi
  • Caïmanes
  • Cambodge
  • Cameroun
  • Canada
  • Cap-Vert
  • Centrafricaine, République
  • Chili
  • Chine
  • Chypre
  • Cocos
  • Colombie
  • Comores
  • Congo, République démocratique
  • Corée du Nord, République populaire démocratique
  • Corée du Sud, République
  • Costa Rica
  • Côte-d'Ivoire
  • Croatie
  • Cuba
  • Curaçao
  • Danemark
  • Djibouti
  • Dominique
  • Égypte
  • El Salvador
  • Émirats Arabes Unis
  • Équateur
  • Érythrée
  • Espagne
  • Estonie
  • États-Unis d'Amérique
  • Éthiopie
  • Fidji
  • Finlande
  • France
  • Gabon
  • Gambie
  • Géorgie
  • Géorgie du Sud-et-les Îles Sandwich du Sud
  • Ghana
  • Gibraltar
  • Grèce
  • Grenada
  • Groenland
  • Guadeloupe
  • Guam
  • Guatemala
  • Guernesey
  • Guinée
  • Guinée équatoriale
  • Guinée-Bissau
  • Guyana
  • Guyane française
  • Haïti
  • Honduras
  • Hong Kong
  • Hongrie
  • Île Bouvet
  • Île Christmas
  • Île de Man
  • Île Norfolk
  • Îles Cook
  • Îles Féroé
  • Îles Heard-et-MacDonald
  • Îles Malouines
  • Îles Marshall
  • Îles mineures éloignées des États-Unis
  • Îles Turques-et-Caïques
  • Îles vierges américaines
  • Îles vierges britanniques
  • Inde
  • Indonésie
  • Irak
  • Iran
  • Irlande
  • Islande
  • Israël
  • Italie
  • Jamaïque
  • Japon
  • Jersey
  • Jordanie
  • Kazakhstan
  • Kenya
  • Kirghistan
  • Kiribati
  • Koweit
  • Laos
  • Lesotho
  • Lettonie
  • Liban
  • Libéria
  • Libye
  • Liechtenstein
  • Lituanie
  • Luxembourg
  • Macao
  • Macédoine du Nord
  • Madagascar
  • Malaisie
  • Malawi
  • Maldives
  • Mali
  • Malte
  • Mariannes du Nord
  • Maroc
  • Martinique
  • Maurice
  • Mauritanie
  • Mayotte
  • Mexique
  • Micronésie
  • Moldavie
  • Monaco
  • Mongolie
  • Monténégro
  • Montserrat
  • Mozambique
  • Myanmar
  • Namibie
  • Nauru
  • Népal
  • Ngwane, Royaume d'Eswatini
  • Nicaragua
  • Niger
  • Nigéria
  • Niué
  • Norvège
  • Nouvelle-Calédonie
  • Nouvelle-Zélande
  • Océan Indien Britannique
  • Oman
  • Ouganda
  • Ouzbékistan
  • Pakistan
  • Palau
  • Palestine
  • Panama
  • Papouasie-Nouvelle-Guinée
  • Paraguay
  • Pays-Bas
  • Pérou
  • Philippines
  • Pitcairn
  • Pologne
  • Polynésie française
  • Porto Rico
  • Portugal
  • Qatar
  • République Dominicaine
  • République du Congo
  • République Tchèque
  • Réunion
  • Roumanie
  • Royaume-Uni
  • Russie
  • Rwanda
  • Sahara occidental
  • Saint Pierre and Miquelon
  • Saint-Barthélemy
  • Saint-Christophe-et-Niévès
  • Saint-Marin
  • Saint-Martin (partie française)
  • Saint-Martin (partie néerlandaise)
  • Saint-Siège
  • Saint-Vincent et les Grenadines
  • Sainte-Hélène
  • Sainte-Lucie
  • Salomon
  • Samoa
  • Samoa américaine
  • São Tomé et Principe
  • Sénégal
  • Serbie
  • Seychelles
  • Sierra Leone
  • Singapour
  • Slovaquie
  • Slovénie
  • Somalie
  • Soudan
  • Sri Lanka
  • Sud-Soudan
  • Suède
  • Suisse
  • Suriname
  • Svalbard et Île Jan Mayen
  • Syrie
  • Tadjikistan
  • Taïwan
  • Tanzanie, République unie
  • Tchad
  • Terres australes françaises
  • Thaïlande
  • Timor Leste
  • Togo
  • Tokelau
  • Tonga
  • Trinidad et Tobago
  • Tunisie
  • Turkménistan
  • Turquie
  • Tuvalu
  • Ukraine
  • Uruguay
  • Vanuatu
  • Venezuela
  • Vietnam
  • Wallis et Futuna
  • Yémen
  • Zambie
  • Zimbabwe

J'ai déjà un compte. Connexion

En cliquant sur « JE M'INSCRIS GRATUITEMENT », vous acceptez les conditions d'utilisation et la politique de confidentialité.

Pour bénéficier d'une assistance technique personnalisée de la part d'un expert Confluent, veuillez saisir une adresse e-mail professionnelle.
Pays
  • Pays
  • Afghanistan
  • Afrique du Sud
  • Åland
  • Albanie
  • Algérie
  • Allemagne
  • Andorre
  • Angola
  • Anguilla
  • Antarctique
  • Antigua et Barbuda
  • Arabie Saoudite
  • Argentine
  • Arménie
  • Aruba
  • Australie
  • Autriche
  • Azerbaïdjan
  • Bahamas
  • Bahrein
  • Bangladesh
  • Barbade
  • Belgique
  • Belize
  • Bénin
  • Bermudes
  • Bhoutan
  • Bielorussie
  • Bolivie
  • Bonaire, Saint-Eustache et Saba
  • Bosnie-Herzégovine
  • Botswana
  • Brésil
  • Brunei Darussalam
  • Bulgarie
  • Burkina Faso
  • Burundi
  • Caïmanes
  • Cambodge
  • Cameroun
  • Canada
  • Cap-Vert
  • Centrafricaine, République
  • Chili
  • Chine
  • Chypre
  • Cocos
  • Colombie
  • Comores
  • Congo, République démocratique
  • Corée du Nord, République populaire démocratique
  • Corée du Sud, République
  • Costa Rica
  • Côte-d'Ivoire
  • Croatie
  • Cuba
  • Curaçao
  • Danemark
  • Djibouti
  • Dominique
  • Égypte
  • El Salvador
  • Émirats Arabes Unis
  • Équateur
  • Érythrée
  • Espagne
  • Estonie
  • États-Unis d'Amérique
  • Éthiopie
  • Fidji
  • Finlande
  • France
  • Gabon
  • Gambie
  • Géorgie
  • Géorgie du Sud-et-les Îles Sandwich du Sud
  • Ghana
  • Gibraltar
  • Grèce
  • Grenada
  • Groenland
  • Guadeloupe
  • Guam
  • Guatemala
  • Guernesey
  • Guinée
  • Guinée équatoriale
  • Guinée-Bissau
  • Guyana
  • Guyane française
  • Haïti
  • Honduras
  • Hong Kong
  • Hongrie
  • Île Bouvet
  • Île Christmas
  • Île de Man
  • Île Norfolk
  • Îles Cook
  • Îles Féroé
  • Îles Heard-et-MacDonald
  • Îles Malouines
  • Îles Marshall
  • Îles mineures éloignées des États-Unis
  • Îles Turques-et-Caïques
  • Îles vierges américaines
  • Îles vierges britanniques
  • Inde
  • Indonésie
  • Irak
  • Iran
  • Irlande
  • Islande
  • Israël
  • Italie
  • Jamaïque
  • Japon
  • Jersey
  • Jordanie
  • Kazakhstan
  • Kenya
  • Kirghistan
  • Kiribati
  • Koweit
  • Laos
  • Lesotho
  • Lettonie
  • Liban
  • Libéria
  • Libye
  • Liechtenstein
  • Lituanie
  • Luxembourg
  • Macao
  • Macédoine du Nord
  • Madagascar
  • Malaisie
  • Malawi
  • Maldives
  • Mali
  • Malte
  • Mariannes du Nord
  • Maroc
  • Martinique
  • Maurice
  • Mauritanie
  • Mayotte
  • Mexique
  • Micronésie
  • Moldavie
  • Monaco
  • Mongolie
  • Monténégro
  • Montserrat
  • Mozambique
  • Myanmar
  • Namibie
  • Nauru
  • Népal
  • Ngwane, Royaume d'Eswatini
  • Nicaragua
  • Niger
  • Nigéria
  • Niué
  • Norvège
  • Nouvelle-Calédonie
  • Nouvelle-Zélande
  • Océan Indien Britannique
  • Oman
  • Ouganda
  • Ouzbékistan
  • Pakistan
  • Palau
  • Palestine
  • Panama
  • Papouasie-Nouvelle-Guinée
  • Paraguay
  • Pays-Bas
  • Pérou
  • Philippines
  • Pitcairn
  • Pologne
  • Polynésie française
  • Porto Rico
  • Portugal
  • Qatar
  • République Dominicaine
  • République du Congo
  • République Tchèque
  • Réunion
  • Roumanie
  • Royaume-Uni
  • Russie
  • Rwanda
  • Sahara occidental
  • Saint Pierre and Miquelon
  • Saint-Barthélemy
  • Saint-Christophe-et-Niévès
  • Saint-Marin
  • Saint-Martin (partie française)
  • Saint-Martin (partie néerlandaise)
  • Saint-Siège
  • Saint-Vincent et les Grenadines
  • Sainte-Hélène
  • Sainte-Lucie
  • Salomon
  • Samoa
  • Samoa américaine
  • São Tomé et Principe
  • Sénégal
  • Serbie
  • Seychelles
  • Sierra Leone
  • Singapour
  • Slovaquie
  • Slovénie
  • Somalie
  • Soudan
  • Sri Lanka
  • Sud-Soudan
  • Suède
  • Suisse
  • Suriname
  • Svalbard et Île Jan Mayen
  • Syrie
  • Tadjikistan
  • Taïwan
  • Tanzanie, République unie
  • Tchad
  • Terres australes françaises
  • Thaïlande
  • Timor Leste
  • Togo
  • Tokelau
  • Tonga
  • Trinidad et Tobago
  • Tunisie
  • Turkménistan
  • Turquie
  • Tuvalu
  • Ukraine
  • Uruguay
  • Vanuatu
  • Venezuela
  • Vietnam
  • Wallis et Futuna
  • Yémen
  • Zambie
  • Zimbabwe

J'ai déjà un compte. Connexion

En cliquant sur « JE M'INSCRIS GRATUITEMENT », vous acceptez les conditions d'utilisation et la politique de confidentialité.

Streaming CDC With Flink | FAQs

How does a streaming approach improve on batch ELT/ETL pipelines?

A streaming approach allows you to "shift left," processing and governing data closer to the source. Instead of running separate, costly ELT jobs in multiple downstream systems, you process the data once in-stream with Flink to create a single, reusable, high-quality data product. This improves data quality, reduces overall processing costs and risks, and gets trustworthy data to your teams faster.

Why use Apache Flink® for processing real-time CDC Data?

Apache Flink® is the de facto standard for stateful stream processing, designed for high-performance, low-latency workloads—making it ideal for CDC. Its ability to handle stateful computations allows it to accurately interpret streams of inserts, updates, and deletes to maintain a correct, materialized view of data over time. Confluent offers a fully managed, serverless Flink service that removes the operational burden of self-management.

How do you handle data consistency and quality in real-time CDC pipeline?

Data consistency is maintained by processing CDC events in-flight to filter duplicates, join streams for enrichment, and aggregate data correctly before it reaches any downstream system. Confluent's platform integrates Flink with Stream Governance, including Schema Registry, to define and enforce universal data standards, ensuring data compatibility, quality, and lineage tracking across your organization.

How does Confluent Cloud handle changes to the source database schema?

When your CDC pipeline is integrated with Confluent Schema Registry, it can automatically and safely handle schema evolution. This ensures that changes to the source table structure—like adding or removing columns—do not break downstream applications or data integrity. The platform manages schema compatibility, allowing your data streams to evolve seamlessly.

What are the main benefits of using a Fully managed service for Apache Flink® like Confluent Cloud?

A fully managed service eliminates the significant operational complexity, steep learning curve, and high in-house support costs associated with self-managing Apache Flink®. With Confluent, you get a serverless experience with elastic scalability, automated updates, and pay-as-you-go pricing, allowing your developers to focus on building applications rather than managing infrastructure. In addition, native integration between Apache Kafka® and Apache Flink® and pre-built connectors allow teams to build and scale fast.

How does Confluent Cloud simplify processing Debezium CDC events?

Confluent Cloud provides first-class support for Debezium, an open source distributed platform for change data capture. Pre-built connectors can automatically interpret the complex structure of Debezium CDC event streams, simplifying the process of integrating with Kafka and Flink.