Formation
                
            
        Big Data : récolte et analyse de données volumineuses module Machine Learning
- Tout public
 
                                            • Acquérir les bases du Machine Learning 
• Apprendre à créer les modèles et les mettre en production
• Comprendre les possibilités du Machine Learning
• Formaliser son problème de Machine Learning
• Apprendre à Manipuler les données
• Apprendre à construire des modèles prédictifs
• Apprendre à utiliser ces modèles en production
• Apprendre à évaluer les performances
                                    • Apprendre à créer les modèles et les mettre en production
• Comprendre les possibilités du Machine Learning
• Formaliser son problème de Machine Learning
• Apprendre à Manipuler les données
• Apprendre à construire des modèles prédictifs
• Apprendre à utiliser ces modèles en production
• Apprendre à évaluer les performances
                                            Jour 1 
Faire de l’apprentissage automatique via des outils Open Source
 
Présentation du Machine Learning et de ses possibilités:
• Les fondamentaux
• Apprendre à formaliser les problématiques
• Exemple du Data Science en entreprise
 
Créer un premier Problème Prédictif:
• Techniques d’apprentissage(les plus proches voisins, modèles Linéaire, arbre de décision, …)
• Révision des bases de la programmation
• Apprentissage d’un modèle avec librairie Open Source
 
Préparation des données afin de les utiliser dans un système d’apprentissage:
• Présentation du feature Engineering et les limites
• Technique d’exploration de données
• Procédure de Prétraitement et de nettoyage
 
Jour 2
Apprendre à évaluer et déployer des modèles prédictifs
 
Apprendre à évaluer des modèles prédictifs :
• Création des jeux d’apprentissage, mise en place de leur validation et test.
• Tester la représentativité des données
• Mesure de performance des modèles prédictifs
• Apprendre à faire une matrice de confusion et de coût
 
Apprendre à Sélectionner les modèles
• Déterminer l’exactitude des prédictions avec les ensembles de modèles
• Apprendre à créer des arbres de décisions
 
Apprendre à déployer :
• Déterminer l’importance des APIs en production.
• Vue d’ensemble des solutions Open Source
• Apprendre à créer des APIs
• Apprendre à Gérer l’authentification
• Savoir utiliser Amazon Machine Learning et BigML
 
Utilisation du ML sur du texte:
• Conseils de prétraitement des données textuelles
• Mise en pratique avec la librairie open source NLTK
 
Jour 3
Aller plus loin avec le Machine Learning
 
Techniques avancées:
• Principe du Gradient Boosting et utilisation de la librairie open source XGBoost
• Pipelines de Machine learning: enrichissement et sélection de features, modélisation
• Techniques d'optimisation des paramètres de pipelines de Machine learning: grid search, random search et utilisation de la librairie open source hyperopt
• Autres problèmes d'apprentissage:
• Réseaux de neurones et Deep Learning:
• Développer son propre cas d’usage:
                                        
                                    Faire de l’apprentissage automatique via des outils Open Source
Présentation du Machine Learning et de ses possibilités:
• Les fondamentaux
• Apprendre à formaliser les problématiques
• Exemple du Data Science en entreprise
Créer un premier Problème Prédictif:
• Techniques d’apprentissage(les plus proches voisins, modèles Linéaire, arbre de décision, …)
• Révision des bases de la programmation
• Apprentissage d’un modèle avec librairie Open Source
Préparation des données afin de les utiliser dans un système d’apprentissage:
• Présentation du feature Engineering et les limites
• Technique d’exploration de données
• Procédure de Prétraitement et de nettoyage
Jour 2
Apprendre à évaluer et déployer des modèles prédictifs
Apprendre à évaluer des modèles prédictifs :
• Création des jeux d’apprentissage, mise en place de leur validation et test.
• Tester la représentativité des données
• Mesure de performance des modèles prédictifs
• Apprendre à faire une matrice de confusion et de coût
Apprendre à Sélectionner les modèles
• Déterminer l’exactitude des prédictions avec les ensembles de modèles
• Apprendre à créer des arbres de décisions
Apprendre à déployer :
• Déterminer l’importance des APIs en production.
• Vue d’ensemble des solutions Open Source
• Apprendre à créer des APIs
• Apprendre à Gérer l’authentification
• Savoir utiliser Amazon Machine Learning et BigML
Utilisation du ML sur du texte:
• Conseils de prétraitement des données textuelles
• Mise en pratique avec la librairie open source NLTK
Jour 3
Aller plus loin avec le Machine Learning
Techniques avancées:
• Principe du Gradient Boosting et utilisation de la librairie open source XGBoost
• Pipelines de Machine learning: enrichissement et sélection de features, modélisation
• Techniques d'optimisation des paramètres de pipelines de Machine learning: grid search, random search et utilisation de la librairie open source hyperopt
• Autres problèmes d'apprentissage:
• Réseaux de neurones et Deep Learning:
• Développer son propre cas d’usage:
                                            Non communiquée
                                        
                                    
                                            
3 jours                                        
                                    
                                                Formacode (Domaines de formation) : 
                                                
                                    - 31036 Administration base de données
 
- M1801 Administration de systèmes d'information
 
- 326 Informatique, traitement de l'information, réseaux de transmission des données
 
            CertifInfo 93835
                            
        - RS2234, Date fin d'enregistrement : 31/12/2021
 
Entrées/sorties permanentes
Formation 100% à distance
Niveau de sortie : Sans niveau spécifique
Organisme formateur :
Cegefos
                                                                                    Cegefos
 04 42 16 60 70