Module Machine Learning

DATE LIMITE
DE CANDIDATURE
15 / 11
2021
event Début : 22/11/2021
hourglass_empty inférieur à 10 jours
location_on Grand Ouest
school Sortie : optionnel

Présentation Présentation

Le module “Machine Learning” est un module intense pour rentrer dans le monde de la data science. Il couvre les bases de l’analyse des données en python, les statistiques essentielles à la datascience et l’utilisation de modèles simples et assez performants de machine learning.

La Fabrique de Simplon Nantes propose 2 sessions de 5 jours.

Du 22 au 26 novembre 2021 et du  24 au 28 janvier 2022.

Format : présentiel

Compétences Compétences visées

Acquérir des données, les combiner et les structurer en données propres en vue de leur intégration dans la structure de la base de données

Interpréter les données grâce à des outils de visualisation de données en vue d’expliquer les caractéristiques du jeu de données

Constituer un jeu de données exploitable de manière à entraîner un modèle d'apprentissage en utilisant la méthodologie et/ou l'outil approprié en fonction des standards de l'écosystème

Exploiter un modèle d’apprentissage supervisé ou non supervisé permettant la classification ou la prédiction d’une variable en fonction des données disponibles et des outils sélectionnés

Améliorer les performances d’un modèle d’apprentissage à l’aide d’une évaluation de la qualité des données et de la technique de modélisation afinde réduire les biais et les anomalies de résultats

 

Programme Programme

- Recensement des données à utiliser, leurs formats, leurs sources, leurs structures ainsi que leurs détenteurs
- Collecte des données par API
- Introduction au web scraping
- Nettoyage des données à importer, à l’aide de scripts ou de modules spécifiques appropriés
- Manipulation des données sous divers formats de fichier plats (XML, JSON, CSV, TXT)

- Choix des représentations visuelles des données en adéquation avec les contraintes techniques, réglementaires, la demande du commanditaire et leur utilisation
- Réalisation des représentations des données en utilisant des outils spécifiques de visualisation

- Détection des valeurs anormales dans le jeu de données / Validation des données par la détection de valeurs anormales
- Constitution d’un jeu de donnée au format de donnée préalablement identifié/sélectionné pour la mise en place d'un modèle de Machine Learning

- Identification du modèle d'apprentissage optimal en fonction du problème à résoudre, des données disponibles et de l'infrastructure à disposition
- Entraînement et exploitation d’un modèle d'apprentissage supervisé (classification et régression)
- Utilisation de l'apprentissage non supervisé pour créer des catégories
- Initiation aux méthode d'analyse du langage naturel, séries temporelles, vision par ordinateur

- Evaluation de la performance d’un modèle d’apprentissage avec les métriques standards
- Identification des hyper-paramètres du modèle
- Amélioration de données d’apprentissage d’après une analyse des métriques de performance(feature engineering)
- Combinaison de plusieurs modèles en un modèle plus performant

 

Cas pratiques en groupes : sur chaque thématique abordée
- Quizzs : sur chaque thématique abordée
- Mini-projet : formalisation d’un besoin client et d’un jeu de donnée.
Préparation de données pour réaliser un modèle aux objectifs et aux critères de performance exprimés dans le besoin.

Evaluation

portfolio.svg

Un portfolio comprenant la réalisation d'au moins 9 projets tout au long de la formation

project.svg

La réalisation d'un chef d'œuvre : projet de l'apprenant, attestant de la maîtrise de l'ensemble des compétences visées

jury.svg

Une soutenance devant un jury de professionnels

Admission Admission

Pré- requis : 

- Bases de python
- Bac+5 en sciences

 

Prix Prix

Formation Machine Learning 5 jours - 1 715€ HT

Retourner en haut