Formation Data science mode projet Tunisie

 

Les outils et environnements informatiques

Environnement :

 Linux

Langage de développement :

Python 3.X

Plateforme Big Data :

Cloudera / Hortonworks

PlateformePython :

Anaconda

Machine Learning :

scikit-learn: pandas, NumPy, SciPy, and matplotlib..

Deep Learning :

Keras, TensorFlow

 

Jour 1: Data Science et Machine Learning
Introduction au Big Data

Qu’est-ce-que le Big Data ?
L’écosystème technologique du Big Data : Apache Hadoop

Travaux Pratiques : Manipulation d’un environnement Apache Hadoop avec Cloudera.

Introduction à la Data Science, le métier de Data Scientist

  • Le vocabulaire d’un problème de Data Science

  • De l’analyse statistique au machine learning

  • Overview des possibilités du machine learning

  • Les bases de Machine Learning

  • Le besoin de machine Learning

  • Comprendre machine Learning

  • Méthodes de Machine Learning

  • La boîte à outil du Data Scientist

  • Introduction aux outils : Anaconda, Jupyter Notebooks

  • Introduction au langage Python

  • Travaux pratiques :

  • Jour 2: Data Science et Machine Learning

    Les algorithmes de Machine Learning

  • Analyse supervisée

  • Analyse non supervisée

  • Classification / régression

  • La régression linéaire

  • Quelques rappels : fonction hypothèse, fonction convexe, optimisation
    La construction de la fonction de coût
    Méthode de minimisation : la descente de gradient

  • La régression logistique

  • Frontière de décision

  • Modélisation des variables quantitatives

  • La construction d’une fonction de coût convexe pour la classification

  • Naive Bayes 

  • Le théorème de Bayes et la notion d’indépendance

  • Le modèle Naive Bayes par l’exemple

  • Machine Learning : Construction, réglage et déploiement de modèles

  • Qu’est-ce qu’un bon modèle ?

    • Cross-validation

    • Les métriques d’évaluation : precision, recall, ROC, MAPE, etc

  • Les pièges du machine learning

    • Overfitting ou sur-apprentissage

    • Biais vs variance

    • La régularisation : régression Ridge et Lasso

  • Jour 3:Pipeline de Machine Learning

    Machine Learning avec Python, Pandas et Scikit-learn

  • Présentation de l’Ecosystème Python Machine Learning

    • NumPy et SciPy : manipuler des matrices ou tableaux multidimensionnels ainsi que des fonctions mathématiques opérant sur ces tableaux 

    • Pandas : structures de données et opérations de manipulation de tableaux numériques et de séries temporelles

    • Matplotlib : librairie pour afficher les histogrammes des valeurs numériques :

    • Scikit-learn :librairie de Machine Learning en Python

  • Travaux pratiques :

    • Prise en main de NumPy et SciPy viaJupyter Notebooks

    • Prise en main de Pandas et Matplotlib via Jupyter Notebooks

    • Premier pas en Machine Learning avec Scikit-learnvia Jupyter Notebooks

  • Machine Learning: Data Preparation and Cleaning

  • Les types de données : catégorielles, continues, ordonnées, temporelles

  • Détection des outliers statistiques, des valeurs aberrantes

  • Stratégie pour les valeurs manquantes

  • Travaux Pratiques : Comment traiter les valeurs manquantes avec Python ?

    • Data Preparation and Cleaning avec avecScikit-learn (sklearn.preprocessing)

  • Machine Learning :Feature Engineering

  • Stratégies pour les variables non continues

  • Détecter et créer des variables discriminantes

  • Travaux Pratiques :

    • Identification et création des bonnes variables et réalisation d’un premier modèleavec Scikit-learn(sklearn.feature_extraction)

  • Machine Learning : Data Visualization

  • La visualisation pour comprendre les données : histogramme, scatter plot, etc

  • La visualisation pour comprendre les algorithmes : train / test loss, feature importance, etc

  • Travaux Pratiques :

    • Visualiser des données Machine Learning en Python avec Pandaset  Matplotlib

  • Jour 4 : Machine Learningpar la Pratique

    Naive Bayes Classification par la Pratique

  • Classification naïve bayésienne 

  • GaussianNaive Bayes

  • Multinomial Naive Bayes

  • Travaux Pratiques :

    • Naive Bayes avec Python-Scikit-learn : “ Naive Bayes on the Titanic dataset” 

  • LinearRegressionpar la Pratique

  • Simple LinearRegression

  • Basis Fonction basiques de la Régression

    • fonctions Polynomiales

    • fonctions Gaussiennes

  • Régularisation

  • Travaux Pratiques : 

    • Création d’un modèle basé sur LinearRegressionavec Python pour la prédiction du prix du logement

  • Support Vector Machinespar la Pratique

  • Présentation de Support Vector Machines : Trouver des patterns fortement non linéaires.

  • Maximisation de la marge entre la frontière de décision

  • Choix d’un hyperplan séparateur dans un nouvel espace de combinaisonsnon linéaires entre les variables

  • Travaux Pratiques : 

    • Prédiction du prix du logement à l'aide Support Vector Machines avec Python 

  • Jour 5 : Machine Learning par la Pratique

    Introduction aux méthodes ensemblistes

  • Le modèle de base : l’arbre de décision, ses avantages et ses limites

  • Présentation des différentes stratégies ensemblistes : bagging, boosting, etc

  • Travaux Pratiques "Retour sur le Titanic" :

    • Prédiction du prix du logement à l'aide del’arbre de décisionavec Python

    • Prédiction du prix du logement à l'aide de Random Forest avec Python 

  • Apprentissage semi-supervisé

  • Les grandes classes d’algorithmes non supervisées :

    •  Clustering(K-Means ,Hierarchical clustering ..ect)

    • Principal Component Analysis, etc

  • Travaux Pratiques

    • Clustering K-Means des stocks par corrélation des prix.

  • Neural Network and DeepLearning

  • Bases de l'apprentissage en profondeur et des réseaux de neurones

  • Optimisation d'un réseau neuronal avec propagation vers l'arrière

  • Construire des modèles d'apprentissage en profondeur avec Keras

  • Travaux Pratiques

    • Installation Keras avec Anaconda

    • Deep Learning House Price Prediction avec Keras.

      • Clustering K-Means des stocks par corrélation des prix.

Neural Network and DeepLearning

  • Bases de l'apprentissage en profondeur et des réseaux de neurones

  • Optimisation d'un réseau neuronal avec propagation vers l'arrière

  • Construire des modèles d'apprentissage en profondeur avec Keras

  • Travaux Pratiques

    • Installation Keras avec Anaconda

    • Deep Learning House Price Prediction avec Keras.


 Mokhtar Sellami

I am Mokhtar Sallami, certified in IBM Big Data Specialist with IBM BigInsights V2.1. I m a Technologist Lecturer in computer science at the High Institute of Technological Studies of KEF, Tunisia. I’m a CEO founder of Enodis Web start-up ( 2008-2012). I’ve worked as web Freelancer for Enode (https://www.linkedin.com/company/499839?trk=prof-exp-company-name). I am Big Data Trainer (IBM BigInsights, Cloudera) at the UIT, EPI, ISET Kef. I’ve participated as Cloudera Trainer at First International Spring school of Big Data and Cloud Computing (http://www.i2sbd2c.tn/index.html )


Nous contacter sur le 27 862 155 , 54 828 018, 71 866 142


Durée : 5 jours

Cours du jours : 

De 9h à 14h

Cours du soir & weekend : 

De 18:30 à 21h , Samedi matin,dimanche matin ,de 9h à 13h

Parrainez une seul personne et recevez une réduction de 30 % 
Parrainez une deuxième personne et recevez une réduction immédiate de 100 %

Vous êtes une entreprise : 
Nous sommes à votre entière disposition pour vous fournir les documents nécessaires au vu de la déduction des frais de formation sur la TFP(Taxe à la Formation Professionnelle).


Data science

 1758  vue Vues


Prochaine sessions:

Nous consulter


Durée:

5 jours


Confirmation de la session:

Une semaine avant la date prévue

Agile Scrum par la pratique

Angular mode projet

Big data par la pratique

Bootcamp Java Spring Angular

Bootcamp Java Spring Angular

DevOps

DevOps Tools Engineer par la pratique

ISTQB version 2018

Java 8 1Z0-808

Java 8 mode projet

Reconversion : Devenir développeur J2ee Angular de Zéro

Selenium par la pratique

Confirmation de la session:

Une semaine avant la date prévue


Recommandé pour:

Développeur , Administrateur , responsable IT, chef de projet ,entrepreneur


A propos du lieu de la formation

Nous pouvons aussi nous déplacer dans vos locaux (formation intra-entreprise).

N'hésitez pas également à proposer d'autres dates ou lieux, si ceux proposés ne vous conviennent pas.


A la fin de la formation:

Vous aurez un certificat de formation agréé par l'état