Passionné(e) de lecture ? Inscrivez-vous gratuitement ou connectez-vous pour rejoindre la communauté et bénéficier de toutes les fonctionnalités du site !  

Machine Learning : implémentation en Python avec Scikit-learn

Couverture du livre « Machine Learning : implémentation en Python avec Scikit-learn » de Virginie Mathivet aux éditions Eni
  • Date de parution :
  • Editeur : Eni
  • EAN : 9782409032516
  • Série : (-)
  • Support : Papier
Résumé:

Ce livre présente à des personnes non Data Scientists, et sans connaissances particulières en mathématiques, la méthodologie du Machine Learning, ses concepts et l'implémentation de ceux-ci en Python.

Il commence par une présentation du Machine Learning puis de la méthode CRISP où chaque... Voir plus

Ce livre présente à des personnes non Data Scientists, et sans connaissances particulières en mathématiques, la méthodologie du Machine Learning, ses concepts et l'implémentation de ceux-ci en Python.

Il commence par une présentation du Machine Learning puis de la méthode CRISP où chaque phase est détaillée avec les différentes étapes.

Les premiers chapitres s'intéressent donc aux phases de Data Understanding (ou compréhension des données) et de Data Preparation (préparation des données). Dans le premier sont présentés des analyses statistiques de datasets, que cela soit sous forme numérique ou graphique. Dans le deuxième sont vues les principales techniques utilisées pour la préparation des données, avec leur rôle et des conseils sur leur utilisation.

Ensuite, plusieurs chapitres sont dédiés chacun à une tâche de Machine Learning : ·
La classification ; ·
La régression, avec le cas particulier de la prédiction ; ·
Le clustering et plus globalement l'apprentissage non supervisé.

Pour chaque tâche qui est présentée sont successivement détaillés les critères d'évaluation, les concepts derrière les principaux algorithmes puis leur implémentation avec Scikit-Learn.

Pour illustrer les différents chapitres, les techniques et algorithmes présentés sont appliqués sur des datasets souvent utilisés : Iris (classification de fleurs), Boston (prévision de prix de vente d'appartements) et Titanic (prévision de la chance de survie des passagers du bateau).

Le code Python est commenté et disponible en téléchargement (sous la forme de notebooks Jupyter) sur le site www.editions-eni.fr.

Donner votre avis