> Formations > Introduction to Data Engineering on Google Cloud

Formation : Introduction to Data Engineering on Google Cloud

Cours officiel, préparation aux examens de certification Google Cloud

Introduction to Data Engineering on Google Cloud

Cours officiel, préparation aux examens de certification Google Cloud


Nouvelle formation

Avec cette formation, vous pourrez acquérir les connaissances et compétences fondamentales en ingénierie des données sur Google Cloud Platform (GCP) afin de comprendre, concevoir et mettre en œuvre des pipelines de données efficaces. Vous apprendrez à utiliser les principaux services de GCP pour l’ingestion, le stockage, la transformation et l’analyse des données, tout en adoptant les bonnes pratiques de performance, de sécurité et de gouvernance des données.


INTRA
SUR MESURE

Formation dans vos locaux, chez nous ou à distance

Réf. GDE
  1j - 7h00
Vous souhaitez transposer cette formation, sans modification, pour votre entreprise ? En français ou dans une autre langue ?

Télécharger le programme

Partager cette formation




Avec cette formation, vous pourrez acquérir les connaissances et compétences fondamentales en ingénierie des données sur Google Cloud Platform (GCP) afin de comprendre, concevoir et mettre en œuvre des pipelines de données efficaces. Vous apprendrez à utiliser les principaux services de GCP pour l’ingestion, le stockage, la transformation et l’analyse des données, tout en adoptant les bonnes pratiques de performance, de sécurité et de gouvernance des données.


Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
Comprendre le rôle d’un ingénieur de données
Identifier les tâches d’ingénierie des données et les principaux composants utilisés sur Google Cloud
Comprendre comment créer et déployer des pipelines de données de différents modèles sur Google Cloud
Identifier et utiliser diverses techniques d’automatisation sur Google Cloud

Public concerné
Ingénieurs de données, administrateurs de bases de données, administrateurs système.

Prérequis
Connaissance de base de l'environnement Google Cloud. Maîtrise de base d’un langage de requête courant. Expérience en modélisation de données et activités ETL et en développement d'applications.
Vous recevrez par mail des informations permettant de vérifier vos prérequis avant la formation.

Certification
Nous vous recommandons de suivre cette formation si vous souhaitez préparer la certification "Google Cloud Professional Data Engineer".

Méthodes et moyens pédagogiques
Méthodes pédagogiques
Animation de la formation en français. Support de cours officiel au format numérique et en anglais. Bonne compréhension de l'anglais à l'écrit.

Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Programme de la formation

1
Tâches et composants de l’ingénierie des données

  • Comprendre le rôle d’un ingénieur de données.
  • Comprendre les différences entre une source de données et un puits de données.
  • Découvrir les différents types de formats de données.
  • Expliquez les options de solution de stockage sur Google Cloud.
  • Découvrir les options de gestion des métadonnées sur Google Cloud.
  • Découvrir comment partager facilement des ensembles de données à l’aide d’Analytics Hub.
  • Découvrir comment charger des données dans BigQuery à l’aide de la console Google Cloud ou de la gcloud CLI.
Travaux pratiques
Lab : chargement de données dans BigQuery.

2
Réplication et migration des données

  • Découvrir l’architecture de base de réplication et de migration des données de Google Cloud.
  • Comprendre les options et les cas d’utilisation de l’outil de ligne de commande gcloud.
  • Découvrir les fonctionnalités et les cas d’utilisation de Storage Transfer Service.
  • Découvrir les fonctionnalités et les cas d’utilisation de Transfer Appliance.
  • Découvrir les fonctionnalités et le déploiement de Datastream.
Travaux pratiques
Lab : Réplication PostgreSQL vers BigQuery.

3
Le modèle de pipeline Extract and Load

  • Extraire et charger l’architecture.
  • Comprendre les options de l’outil de ligne de commande bq.
  • Découvrir les fonctionnalités et les cas d’utilisation du service de transfert de données BigQuery.
  • Découvrir les fonctionnalités et les cas d’utilisation de BigLake en tant que modèle de chargement sans extraction.
Travaux pratiques
Lab : Introduction à BigLake.

4
Le modèle de pipeline Extract, Load and Transform

  • Expliquer le diagramme de base d’architecture d’extraction, de chargement et de transformation.
  • Comprendre un pipeline ELT courant sur Google Cloud.
  • Découvrir les fonctionnalités de programmation et de script SQL de BigQuery.
  • Expliquer les fonctionnalités et les cas d’utilisation de Dataform.
Travaux pratiques
Lab : Créer et exécuter un workflow SQL dans Dataform.

5
Modèle de pipeline Extract, Transform and Load

  • Découvrir le diagramme d’architecture d’extraction, de transformation et de chargement de base.
  • Découvrir les outils d’interface utilisateur graphique sur Google Cloud utilisés pour les pipelines de données ETL.
  • Expliquer le traitement de données par lots à l’aide de Dataproc.
  • Utiliser Dataproc Serverless pour Spark pour ETL..
  • Explorer les options de traitement de données en streaming.
  • Comprendre le rôle que joue Bigtable dans les pipelines de données.
Travaux pratiques
Lab : Utiliser Dataproc Serverless pour Spark pour charger BigQuery. Lab : Créer un pipeline de données en continu pour un tableau de bord en temps réel avec Dataflow.

6
Techniques d’automatisation

  • Découvrir les modèles et options d’automatisation disponibles pour les pipelines.
  • Découvrir Cloud Scheduler et Workflows.
  • Découvrir Cloud Composer.
  • Découvrir les fonctions de Cloud Run.
  • Découvrir les cas d’utilisation des fonctionnalités et de l’automatisation pour Eventarc.
Travaux pratiques
Lab : Utiliser les fonctions Cloud Run pour charger BigQuery.


Solutions de financement
Plusieurs solutions existent pour financer votre formation et dépendent de votre situation professionnelle.
Découvrez-les sur notre page Comment financer sa formation ou contactez votre conseiller formation.

Horaires
les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45. Les pauses et déjeuners sont offerts.
Pour les stages pratiques de 4 ou 5 jours, quelle que soit la modalité, les sessions se terminent à 16h le dernier jour.