Formation Python for Datascience Tunisie

Les outils et environnements informatiques

Environnement :

 Linux

Langage de développement :

Python 3.X/R

Plateforme Python :

Anaconda/R Studio

Machine Learning :

scikit-learn: pandas, NumPy, SciPy, and matplotlib..

Langage R

Deep Learning :

Keras, TensorFlow

 

Jour 1: Data Science et Machine Learning
Introduction à la Data Science, le métier de Data Scientist

  • Le vocabulaire d’un problème de Data Science

  • De l’analyse statistique à la machine Learning

  • Aperçu des possibilités de la machine Learning

Les bases de Machine Learning

  • Le besoin de machine Learning

  • Comprendre machine Learning

  • Méthodes de Machine Learning

La boîte à outil du Data Scientist

  • Introduction aux outils : Anaconda, Jupyter Notebooks

  • Introduction au langage Python

  • Travaux pratiques :

Jour 2: Data Science et Machine Learning

Les algorithmes de Machine Learning

  • Analyse supervisée

  • Analyse non supervisée

  • Classification / régression

La régression linéaire

  • Quelques rappels : fonction hypothèse, fonction convexe, optimisation
    La construction de la fonction de coût
    Méthode de minimisation : la descente de gradient

La régression logistique

  • Frontière de décision

  • Modélisation des variables quantitatives

  • La construction d’une fonction de coût convexe pour la classification

Naive Bayes 

  • Le théorème de Bayes et la notion d’indépendance

  • Le modèle Naive Bayes par l’exemple

Machine Learning : Construction, réglage et déploiement de modèles

  • Qu’est-ce qu’un bon modèle ?

    • Cross-validation

    • Les métriques d’évaluation : precision, recall, ROC,   AUC (aire sous la courbe ROC)., MAPE, etc

  • Les pièges du machine learning

    • Overfitting ou sur-apprentissage

    • Biais vs variance

    • La régularisation : régression Ridge et Lasso

Jour 3: Pipeline de Machine Learning

Machine Learning avec Python, Pandas et Scikit-learn

  • Présentation de l’Ecosystème Python Machine Learning

    • NumPy et SciPy : manipuler des matrices ou tableaux multidimensionnels ainsi que des fonctions mathématiques opérant sur ces tableaux  

    • Pandas : structures de données et opérations de manipulation de tableaux numériques et de séries temporelles

    • Matplotlib : librairie pour afficher les histogrammes des valeurs numériques :

    • Scikit-learn : librairie de Machine Learning en Python

  • Travaux pratiques :

    • Prise en main de NumPy et SciPy  via Jupyter Notebooks

    • Prise en main de Pandas et Matplotlib via Jupyter Notebooks

    • Premier pas en Machine Learning avec Scikit-learn via Jupyter Notebooks

Machine Learning: Data Preparation and Cleaning

  • Les types de données : catégorielles, continues, ordonnées, temporelles

  • Détection des outliers statistiques, des valeurs aberrantes

  • Stratégie pour les valeurs manquantes

  • Travaux Pratiques : Comment traiter les valeurs manquantes avec Python ?

    • Data Preparation and Cleaning avec avec Scikit-learn (sklearn.preprocessing)

Machine Learning : Feature Engineering

  • Stratégies pour les variables non continues

  • Détecter et créer des variables discriminantes

  • Travaux Pratiques :

    •  Identification et création des bonnes variables et réalisation d’un premier modèle avec Scikit-learn (sklearn.feature_extraction)

Machine Learning : Data Visualization

  • La visualisation pour comprendre les données : histogramme, scatter plot, etc

  • La visualisation pour comprendre les algorithmes : train / test loss, feature importance, etc

  • Travaux Pratiques :

    • Visualiser des données Machine Learning en Python avec Pandas et  Matplotlib

 

Jour 4 : Machine Learning par la Pratique

Naive Bayes Classification par la Pratique

  • Classification naïve bayésienne 

  • Gaussian Naive Bayes

  • Multinomial Naive Bayes

  • Travaux Pratiques :

    •  Naive Bayes avec Python-Scikit-learn : “ Classification avec Naïve Bayes on the Call Record Details dataset” 

 

Linear Regression par la Pratique

  • Simple Linear Regression

  • Basis Fonction basiques de la Régression

    • fonctions Polynomiales

    • fonctions Gaussiennes

  • Régularisation

  • Travaux Pratiques : 

    •  Création d’un modèle basé sur Linear Regression avec Python pour la prédiction du prix du logement

Support Vector Machines par la Pratique

  • Présentation de Support Vector Machines : Trouver des patterns fortement non linéaires.

  • Maximisation de la marge entre la frontière de décision

  • Choix d’un hyperplan séparateur dans un nouvel espace de combinaisons non linéaires entre les variables

  • Travaux Pratiques : 

    • Segmentation des clients avec Support Vector Machines avec Python 

Jour 5 : Machine Learning par la Pratique

Introduction aux méthodes ensemblistes

  • Le modèle de base : l’arbre de décision, ses avantages et ses limites

  • Présentation des différentes stratégies ensemblistes : bagging, boosting, etc

  • Travaux Pratiques "Customer Churn" :

    • Prédiction du Customer Churn à l'aide de l’arbre de décision avec Python

    • Prédiction du Customer Churn à l'aide de Random Forest avec Python 

Apprentissage semi-supervisé

  • Les grandes classes d’algorithmes non supervisées :

    •  Clustering (K-Means ,  Hierarchical clustering ..ect)

    • Principal Component Analysis, etc

  • Travaux Pratiques

    • Segmentation des clients en utilisant Clustering K-Means.

Neural Network and DeepLearning

  • Bases de l'apprentissage en profondeur et des réseaux de neurones

  • Optimisation d'un réseau neuronal avec propagation vers l'arrière

  • Construire des modèles d'apprentissage en profondeur avec Keras

  • Travaux Pratiques

    • Installation Keras avec Anaconda

    • Deep Learning SIM Fraud Prediction avec Keras.

 


 Mokhtar Sellami

I am Mokhtar Sallami, certified in IBM Big Data Specialist with IBM BigInsights V2.1. I m a Technologist Lecturer in computer science at the High Institute of Technological Studies of KEF, Tunisia. I’m a CEO founder of Enodis Web start-up ( 2008-2012). I’ve worked as web Freelancer for Enode (https://www.linkedin.com/company/499839?trk=prof-exp-company-name). I am Big Data Trainer (IBM BigInsights, Cloudera) at the UIT, EPI, ISET Kef. I’ve participated as Cloudera Trainer at First International Spring school of Big Data and Cloud Computing (http://www.i2sbd2c.tn/index.html )


Nous contacter sur le 27 862 155 , 54 828 018, 71 866 142


Durée : 5 jours

5 jours


Python for Datascience

 1007  vue Vues


Prochaine sessions:

Nous consulter


Durée:

5 jours


Confirmation de la session:

Une semaine avant la date prévue

Agile Scrum par la pratique

Angular mode projet

Bootcamp Java Spring Angular

Bootcamp Java Spring Angular

DevOps

ISTQB version 2018

Java 8 1Z0-808

Java 8 mode projet

Reconversion : Devenir développeur J2ee Angular de Zéro

Confirmation de la session:

Une semaine avant la date prévue


Recommandé pour:

Développeur , chef de projet ,entrepreneur


A propos du lieu de la formation

Nous pouvons aussi nous déplacer dans vos locaux (formation intra-entreprise).

N'hésitez pas également à proposer d'autres dates ou lieux, si ceux proposés ne vous conviennent pas.


A la fin de la formation:

Vous aurez un certificat de formation agréé par l'état