Data Science et Machine Learning pas à pas

Autres informations

Formation proposée par

Pédagogie

  • Exposé
  • Cas pratiques
  • Echange d'expériences

Pré-requis

Prérequis : Aucun (rappels théoriques pendant la formation)

Objectifs

Permettre à un parfait débutant de mettre des mots concrets sur l’Intelligence Artificielle, d’identifier les acteurs du marché (data analysts/scientists) et de comprendre les outils à disposition pour faire « parler » les données, tout en les utilisant pour anticiper des tendances futures.

Contenu

Introduction - Posons les bases : définitions, rappels de fondamentaux

Objectifs : Comprendre le contexte et les enjeux de la data et son lien avec l’Intelligence Artificielle ; comprendre les concepts statistiques utiles dans le travail des données ; utiliser un langage de programmation.

A - Remise en perspective historique : la data dans le nouvel échiquier politico-économique.

B - Motivations de la formation : clarification des opportunités et défis de la data pour les professions financières, d'audit et d'expertise comptable.

Cas 0 : configuration de l’outil de programmation utilisé pendant la formation

C - Un bref rappel de notions statistiques

  • La synthèse des données : moyenne, variance, quantiles,...
  • Les distributions de probabilité et leur utilité
  • Notions d'inférence statistique et de modélisation

Partie 1 – L'approche historique : analyse des données, intelligence des affaires

Objectifs : S’approprier le « jargon » de la data analyse, connaître les sources de données exploitables, comprendre le fonctionnement des algorithmes de data mining, appliquer les notions dans un cas d’usage comptable.

A - L'analyse des données : son rôle, ses outils.

  • Le workflow de la data analyse : collecter, intégrer, mesurer, visualiser
  • Quelques notions de "dataviz" et les bonnes pratiques
    • Retour sur les visualisations statistiques et les outils de l'écosystème
    • Le paradoxe de Simpson et autres erreurs classiques

Cas 1 : illustration de la data analyse avec l’outil Power BI

B - Intégrer, enrichir et faire parler la donnée : quelques leviers actionnables

  • Structures de données et introduction au langage SQL
  • Les sources d'enrichissement de la donnée et comment les exploiter : open data, requêtes API, scraping

Cas 2 : utiliser l'API d'OpenStreetMap pour extraire les données caractérisant l'environnement d'un commerce (concurrents, marché potentiel...)

  • Exemple d'application de l'analyse des données

Cas 3 : détecter une fraude comptable et financière à partir de réconciliations de données et d'outils statistiques (comptabilité judiciaire)

Partie 2 – Prédire avec les data : comprendre,  utiliser et contrôler les modèles prédictifs

Objectifs : Comprendre la formalisation d'un problème de data science, connaître le fonctionnement d'un algorithme de machine learning, s'approprier les axes d'audit pour challenger un modèle statistique.

A - Petit crash-course de modélisation

  • Définitions préliminaires : modèle, apprentissage, biais/variances, machine learning...
  • La régression et la classification et leurs applications
    • Définitions
    • Contrôler la performance des modèles
    • Cas d'usage : scoring, anticipation d'attrition

Cas 4 : chiffrer l'effet de la présence géographique d'un commerce sur ses performances commerciales grâce à une régression

  • Une ouverture (philosophique) sur les réseaux de neuronnes

B - Auditer un modèle prédictif

  • Panorama de l'organisation industrielle autour des données et des modèles quantitatifs
  • Points de contrôle et pistes d'audit d'un modèle
    • Pour un grand compte
    • Pour une startup ou PME

C - Exemple d'application de la modélisation

Cas 5 : le cas Enron - comment détecter les opérations frauduleuses grâce au machnie learning ? Etude guidée, explications théoriques

Questions/répones

Réf. : 19LAB503

Durée : 1.0 j. (7h00)

Profils participants

  • Collaborateur
  • Expert-comptable
  • Commissaire aux comptes

Formation en Inter

20 déc. 2019 à PARIS (#35663)

Attention, dernières places disponibles !
Inscription limite : 17/12/2019
Animateur : HENRI QIU
Tarif : 410,00€ HT (492,00€ TTC) Connectez-vous pour vous inscrire