Lors d’une récente soirée de juillet, des professionnels des données se sont réunis à Mindspace Munich pour la rencontre « Data Sips and Bites » des Data Natives en collaboration avec Double nuageOrganisé dans l’un des espaces de coworking de Mindspace, l’événement était une convergence de discussions perspicaces et de réseautage professionnel. Espace mentalun fournisseur mondial de coworking et de bureaux flexibles avec plus de 45 sites dans le monde, dont 13 en Allemagne, a offert un environnement propice à cet événement de partage de connaissances.
Conférences et réflexions
Mikhail Epikhin : Naviguer dans le paysage des processeurs pour Apache Kafka
Mikhail Epikhin a débuté la session en partageant les recherches de son équipe sur l’optimisation du service géré pour Apache Kafka. Sa présentation s’est concentrée sur les performances et l’efficacité de différents types d’instances et architectures de processeurs. Mikhail a comparé diverses implémentations JVM, notamment OpenJDK et Amazon Corretto, ainsi que différentes générations de processeurs Intel, AMD et ARM. Les résultats ont fourni des informations pratiques que les participants pourraient appliquer pour améliorer leurs propres plateformes, au-delà d’Apache Kafka.
Ed Posinitskii : Simplifier les flux de données avec DBT et Managed Airflow
Après Mikhail, Ed Posinitskii a discuté de la simplification des flux de données à l’aide de DBT et de Managed Airflow. Ed a expliqué les différences entre les processus ETL (Extract, Transform, Load) et ELT (Extract, Load, Transform), en soulignant les avantages de l’approche ELT dans les environnements de données modernes. Il a présenté Airflow comme un outil robuste pour l’orchestration des pipelines de données et DBT pour la transformation des données au sein des entrepôts de données. L’intégration de ces outils, a noté Ed, améliore le contrôle des pipelines, l’observabilité et les pratiques d’intégration et de livraison continues (CI/CD).
Mikhail Anukhin : Intégration de DataTransfer de DoubleCloud avec ClickHouse
La dernière conférence de Mikhail Anukhin portait sur l’intégration de l’outil ELT DataTransfer de DoubleCloud avec ClickHouse. Mikhail a évoqué la construction de pipelines de données pour des scénarios analytiques courants, tels que le streaming en temps réel et l’entreposage de données. Il a abordé les défis de la réplication des données et proposé des solutions pour optimiser ces processus. La présentation de Mikhail a fourni aux participants des informations exploitables pour améliorer leurs flux de données.
Réseautage et échanges professionnels
L’événement s’est terminé par une session de réseautage, qui a permis aux participants de participer à des discussions et d’échanger des idées. Cette session a offert aux professionnels des données une occasion précieuse de se connecter et d’échanger des idées, renforçant ainsi l’importance de la communauté et de la collaboration dans le domaine des données.
Dans l’ensemble, la rencontre « Data Sips and Bites » organisée à Mindspace a permis une soirée de développement professionnel et de réseautage. L’événement a souligné l’importance du partage des connaissances et de la communauté entre les professionnels des données, en offrant aux participants des informations pratiques à appliquer dans leur propre travail.