Les outils et environnements informatiques
Environnement :
|
Linux
|
Langage de développement :
|
Python 3.X
|
Plateforme Big Data :
|
Cloudera / Hortonworks
|
PlateformePython :
|
Anaconda
|
Machine Learning :
|
scikit-learn: pandas, NumPy, SciPy, and matplotlib..
|
Deep Learning :
|
Keras, TensorFlow
|
Jour 1: Data Science et Machine Learning
Introduction au Big Data
Qu’est-ce-que le Big Data ?
L’écosystème technologique du Big Data : Apache Hadoop
Travaux Pratiques : Manipulation d’un environnement Apache Hadoop avec Cloudera.
Introduction à la Data Science, le métier de Data Scientist
-
Le vocabulaire d’un problème de Data Science
-
De l’analyse statistique au machine learning
-
Overview des possibilités du machine learning
-
Les bases de Machine Learning
-
Le besoin de machine Learning
-
Comprendre machine Learning
-
Méthodes de Machine Learning
-
La boîte à outil du Data Scientist
-
Introduction aux outils : Anaconda, Jupyter Notebooks
-
Introduction au langage Python
-
Travaux pratiques :
-
Configurer l'environnement Anaconda Python
-
-
Jour 2: Data Science et Machine Learning
Les algorithmes de Machine Learning
-
Analyse supervisée
-
Analyse non supervisée
-
Classification / régression
-
La régression linéaire
-
Quelques rappels : fonction hypothèse, fonction convexe, optimisation
La construction de la fonction de coût
Méthode de minimisation : la descente de gradient
-
La régression logistique
-
Frontière de décision
-
Modélisation des variables quantitatives
-
La construction d’une fonction de coût convexe pour la classification
-
Naive Bayes
-
Le théorème de Bayes et la notion d’indépendance
-
Le modèle Naive Bayes par l’exemple
-
Machine Learning : Construction, réglage et déploiement de modèles
-
Qu’est-ce qu’un bon modèle ?
-
Cross-validation
-
Les métriques d’évaluation : precision, recall, ROC, MAPE, etc
-
Les pièges du machine learning
-
Overfitting ou sur-apprentissage
-
Biais vs variance
-
La régularisation : régression Ridge et Lasso
-
Jour 3:Pipeline de Machine Learning
Machine Learning avec Python, Pandas et Scikit-learn
-
Présentation de l’Ecosystème Python Machine Learning
-
NumPy et SciPy : manipuler des matrices ou tableaux multidimensionnels ainsi que des fonctions mathématiques opérant sur ces tableaux
-
Pandas : structures de données et opérations de manipulation de tableaux numériques et de séries temporelles
-
Matplotlib : librairie pour afficher les histogrammes des valeurs numériques :
-
Scikit-learn :librairie de Machine Learning en Python
-
Travaux pratiques :
-
Prise en main de NumPy et SciPy viaJupyter Notebooks
-
Prise en main de Pandas et Matplotlib via Jupyter Notebooks
-
Premier pas en Machine Learning avec Scikit-learnvia Jupyter Notebooks
-
Machine Learning: Data Preparation and Cleaning
-
Les types de données : catégorielles, continues, ordonnées, temporelles
-
Détection des outliers statistiques, des valeurs aberrantes
-
Stratégie pour les valeurs manquantes
-
Travaux Pratiques : Comment traiter les valeurs manquantes avec Python ?
-
Data Preparation and Cleaning avec avecScikit-learn (sklearn.preprocessing)
-
Machine Learning :Feature Engineering
-
Stratégies pour les variables non continues
-
Détecter et créer des variables discriminantes
-
Travaux Pratiques :
-
Identification et création des bonnes variables et réalisation d’un premier modèleavec Scikit-learn(sklearn.feature_extraction)
-
Machine Learning : Data Visualization
-
La visualisation pour comprendre les données : histogramme, scatter plot, etc
-
La visualisation pour comprendre les algorithmes : train / test loss, feature importance, etc
-
Travaux Pratiques :
-
Visualiser des données Machine Learning en Python avec Pandaset Matplotlib
-
Jour 4 : Machine Learningpar la Pratique
Naive Bayes Classification par la Pratique
-
-
GaussianNaive Bayes
-
Multinomial Naive Bayes
-
Travaux Pratiques :
-
Naive Bayes avec Python-Scikit-learn : “ Naive Bayes on the Titanic dataset”
-
LinearRegressionpar la Pratique
-
Simple LinearRegression
-
Basis Fonction basiques de la Régression
-
fonctions Polynomiales
-
fonctions Gaussiennes
-
Régularisation
-
Travaux Pratiques :
-
Création d’un modèle basé sur LinearRegressionavec Python pour la prédiction du prix du logement
-
Support Vector Machinespar la Pratique
-
Présentation de Support Vector Machines : Trouver des patterns fortement non linéaires.
-
Maximisation de la marge entre la frontière de décision
-
Choix d’un hyperplan séparateur dans un nouvel espace de combinaisonsnon linéaires entre les variables
-
Travaux Pratiques :
-
Prédiction du prix du logement à l'aide Support Vector Machines avec Python
-
Jour 5 : Machine Learning par la Pratique
Introduction aux méthodes ensemblistes
-
Le modèle de base : l’arbre de décision, ses avantages et ses limites
-
Présentation des différentes stratégies ensemblistes : bagging, boosting, etc
-
Travaux Pratiques "Retour sur le Titanic" :
-
Prédiction du prix du logement à l'aide del’arbre de décisionavec Python
-
Prédiction du prix du logement à l'aide de Random Forest avec Python
-
Apprentissage semi-supervisé
-
Les grandes classes d’algorithmes non supervisées :
-
Clustering(K-Means ,Hierarchical clustering ..ect)
-
Principal Component Analysis, etc
-
Travaux Pratiques
-
Clustering K-Means des stocks par corrélation des prix.
-
Neural Network and DeepLearning
-
Bases de l'apprentissage en profondeur et des réseaux de neurones
-
Optimisation d'un réseau neuronal avec propagation vers l'arrière
-
Construire des modèles d'apprentissage en profondeur avec Keras
-
Travaux Pratiques
-
Installation Keras avec Anaconda
-
Deep Learning House Price Prediction avec Keras.
-
Clustering K-Means des stocks par corrélation des prix.
Neural Network and DeepLearning
-
Bases de l'apprentissage en profondeur et des réseaux de neurones
-
Optimisation d'un réseau neuronal avec propagation vers l'arrière
-
Construire des modèles d'apprentissage en profondeur avec Keras
-
Travaux Pratiques
-
Installation Keras avec Anaconda
-
Deep Learning House Price Prediction avec Keras.
Nous contacter sur le 27 862 155 , 54 828 018, 71 866 142
Durée :
5 jours
Cours du jours :
De 9h à 14h
Cours du soir & weekend :
De 18:30 à 21h , Samedi matin,dimanche matin ,de 9h à 13h
Parrainez une seul personne et recevez une réduction de 30 %
Parrainez une deuxième personne et recevez une réduction immédiate de 100 %
Vous êtes une entreprise :
Nous sommes à votre entière disposition pour vous fournir les documents nécessaires au vu de la déduction des frais de formation sur la TFP(Taxe à la Formation Professionnelle).