Accueil > Big Data, IA > Big Data : concevoir et piloter un projet
Formation #BSI02

Formation Big Data : concevoir et piloter un projet

Durée : 3 jours

Code : BSI02


Prochaines dates programmées :

Du 01 au 03 Mai 2024

Du 03 au 05 Juil. 2024

Du 04 au 06 Sept. 2024

Du 20 au 22 Nov. 2024

Fin d'Inscription :
Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.
Si vous avez un besoin URGENT et que vous souhaitez une date de formation plus proche que les sessions programmées (minimum 15 à 20 jours ouvrés à date de votre demande)

Objectifs

  • Comprendre les spécificités propres aux projets Big Data
  • Comprendre les risques et le cadre juridique d’un projet Big Data
  • Savoir constituer et piloter une équipe d’un projet Big Data
  • Disposer des compétences nécessaires pour gérer un projet Big Data de A à Z
  • Être en mesure de budgéter un projet
  • Savoir piloter le cycle de vie des données
  • Comprendre comment traiter les problématiques de gouvernance
  • Comprendre comment traiter la sécurité des projets Big Data
Programme
1/ Présentation du Big Data
  • Les origines du Big Data
  • Un déluge de données
  • Données internes et externes
  • Les dimensions en V du Big Data : les 3V (Vélocité, Variété et Volume)
  • Les technologies essentielles
  • Les grands acteurs (éditeurs, intégrateurs) et l’Opensource
2/ Enjeux du Big Data
  • Les données au cœur des enjeux
  • Les nouveaux Métiers
  • Big Data versus Business Intelligence
  • Liens entre Big Data et internet des objets (IoT)
  • CNIL et règlementations (GDPR)
  • Sécurité IT (tokenisation, anonymisation)
  • Concept de Datalake
  • Datamanagement, traçabilité des données
  • Qualité des données
3/ Architectures Big Data
  • Les technologies classiques et nouvelles (Nifi, atlas,…)
  • FastData et Lambda architecture
  • Les moteurs de recherche
  • Bases de données NOSQL
  • Dataviz
  • Les technologies Sécurité
  • Les upgrades
4/ Le Big Data dans l’organisation des entreprises
  • Entreprises Data-centriques
  • L’organisation des équipes : une équipe restreinte d’experts techniques (pizza team)
  • Les profils au sein des équipes Big Data
  • Les méthodologies agiles
  • Quand ne pas les appliquer
5/ Contexte spécifique des projets Big Data
  • Comparaison entre un projet classique et un projet Big Data
  • L’importance des environnements techniques et leurs dimensionnements
  • Explosion du nombre de données
  • Problématique des données structurées, semi-structurées, non structurées dans un projet Big Data
  • Définition d’un système Big Data
  • Architecture générale et fonctionnement
  • Les différentes offres du marché
  • Analyse des caractéristiques
  • Processus d'exploration de données et l'apport de la recherche
  • Démarche d'organisation projets Big Data
  • Cycle de vie des données, des données de référence
  • L’importancede la gouvernance
  • Différences entre les projets Data Warehouse et Big Data
  • Choisir les bons outils de stockage des données
  • Évaluer et anticiper la croissance du volume de données
  • Évaluer et anticiper les besoins d’évolutions des architectures réseaux
  • Aspects légaux et éthiques : que peut-on collecter, stocker, analyser
  • Projets éligibles, les facteurs d’éligibilité, les risques
6/ Cadrage des projets Big Data
  • Hadoop dans le SI : Processus d’adoption
  • Constitution de l’équipe projet
  • Définir les rôles et responsabilités de chacun
  • Cadrage métiers
  • Identification de nouvelles sources de données
  • Cartographie des différentes entités impliquées dans la collecte
  • Définition des besoins technologiques
  • Estimation budgétaire et planification pour le Big Data
  • Comment élaborer un Datalab ?
7/ Management de projet Big Data
  • Phase des projets Big Data
  • Approche Agile pour le Big Data : Agile Data Management
  • Livrables des projets Big Data
  • Mesure de la performance : benchmark, surperformance
  • Délimitation du périmètre
  • L’importance des POC et Pilotes
  • Inventorier les données à disposition et définir le mode de collecte
  • Dimensionner l’infrastructure technique
  • Assurer la cohérence du traitement des données
  • Mettre à disposition les résultats
  • Définir les livrables
  • Réaliser une estimation budgétaire
  • Gouvernance des Données et « Culture Données »
  • Définir une véritable stratégie Données
  • Investir sur des initiatives ciblées et porteuses de valeur pour les métiers
  • Rompre avec les visions en silos
  • Promouvoir une « Culture Données »
  • Savoir communiquer (marketing digital)
8/ Processus et composantes du projet
  • Identification des composantes de la solution finale du projet
  • Qualification du poids de chacune des composantes du projet
  • Risques d'incohérences du choix technique
9/ La collecte et le stockage des données
  • Quelles données ?
  • Quelles sources ?
  • L’importance de la qualité des données (data quality)
  • Exemple de traitement avec un ETL dédié Big Data
  • Résumé : les différentes phases de la collecte dans un projet
10/ L’exploitation des données
  • Données structurées, semi structurées et non structurées
  • La réconciliation avec le référenciel interne
  • La question du Master Data Management
  • Big Data ou Smart Data ?
11/ L’analyse des données
  • Définition de l’analyse statistique
  • La Datascience
  • La place du Data scientist dans un projet Big Data
  • Datamining
  • L’implémentation d’indicateurs à destination du décisionnel
  • Différentes phases et formes de l’analyse dans un projet
12/ La visualisation des données (DATAVIZ)
  • Ce que les statistiques ne disent pas
  • Les objectifs de la visualisation
  • Quels graphes pour quels usages ?
  • Représentation de données complexes (encodage visuel, visualisation interactive)
  • Savoir communiquer sur les analyses de données (Data Storytelling)
13/ Piloter et maîtriser les risques des projets Big Data
  • Risques métiers liés au cadrage du scope
  • Risques stratégiques et manque de sponsoring
  • Les KPI : Time To Market vs Time To Live vs Return On Investment
  • La maturité des solutions du marché
  • La jungle des produits et l'immaturité des solutions
  • Jeunes talents vs maturité projets
  • Différentes méthodes pour piloter un datalab :
  • Business Driven
  • Lean
  • Scrum
14/ Compétences et organisation des projets Big Data
  • Les compétences de l'équipe projet
  • Collaboration entre experts métiers, statisticiens et informaticiens
  • Outils du manager de projets Big Data
  • Déploiement et mise en production des résultats de "test and learn"
15/ Mise en situation
Approche Pédagogique

Approche Pédagogique

  • Pédagogie très opérationnelle fondée sur l'alternance entre théorie et pratique
  • Cas pratiques
  • Remise d’outils
  • Echanges d’expériences
Public cible

Public cible

  • Chefs de projets
  • Directeurs de projets
  • DSI
  • Scrum Master
  • Architectes fonctionnels ou techniques
Dates

Dates

  • Du 01 au 03 Mai 2024
  • Du 03 au 05 Juil. 2024
  • Du 04 au 06 Sept. 2024
  • Du 20 au 22 Nov. 2024
  • Fin d'Inscription :
    Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.