Les meilleurs cours gratuits de science des données pendant le verrouillage

Si vous êtes enfermé à cause de la pandémie du COVID-19, vous aurez peut-être du temps supplémentaire. Binging Netflix est bien beau, mais peut-être que vous en avez assez et que vous aimeriez apprendre quelque chose de nouveau.

L'un des domaines les plus lucratifs à s'ouvrir au cours des deux dernières années est la science des données. Les ressources que j'énumère ci-dessous aideront ceux qui sont suffisamment techniques pour comprendre les mathématiques au niveau des statistiques et du calcul différentiel pour intégrer l'apprentissage automatique dans leurs compétences. Ils pourraient même vous aider à démarrer une nouvelle carrière en tant que data scientist. 

Si vous pouvez déjà programmer en Python ou R, cette compétence vous donnera une longueur d'avance sur la science des données appliquée. D'un autre côté, la programmation n'est pas la partie la plus difficile pour la plupart des gens - ce sont les méthodes numériques.

Coursera propose plusieurs des cours suivants. Vous pouvez les auditer gratuitement, mais si vous voulez du crédit, vous devez les payer.

Je recommande de commencer par le livre Les éléments de l'apprentissage statistique afin que vous puissiez apprendre les mathématiques et les concepts avant de commencer à écrire du code.

Je dois également noter qu'il existe plusieurs bons cours à Udemy, bien qu'ils ne soient pas gratuits. Ils coûtent généralement environ 200 $ chacun pour un accès à vie, mais j'ai vu beaucoup d'entre eux être réduits à moins de 20 $ ces derniers jours.

Jeff Prosise de Wintellectnow me dit qu'il prévoit de rendre quelques autres cours gratuits, alors restez à l'écoute.

Les éléments de l'apprentissage statistique, deuxième édition

Par Trevor Hastie, Robert Tibshirani et Jerome Friedman, Springer

//web.stanford.edu/~hastie/Papers/ESLII.pdf

Cet ebook gratuit de 764 pages est l'un des livres les plus recommandés pour les débutants en science des données. Il explique les principes fondamentaux de l'apprentissage automatique et comment tout fonctionne dans les coulisses, mais ne contient aucun code. Si vous préférez une version du livre avec des applications en R, vous pouvez l'acheter ou le louer via Amazon.

Science des données appliquée avec spécialisation Python

Par Christopher Brooks, Kevyn Collins-Thompson, VG Vinod Vydiswaran et Daniel Romero, Université du Michigan / Coursera

//www.coursera.org/specializations/data-science-python

Les cinq cours (89 heures) de cette spécialisation de l'Université du Michigan vous initient à la science des données via le langage de programmation Python. Cette spécialisation est destinée aux apprenants qui ont une formation de base en Python ou en programmation, et qui souhaitent appliquer des techniques statistiques, d'apprentissage automatique, de visualisation d'informations, d'analyse de texte et d'analyse de réseaux sociaux via des boîtes à outils Python populaires telles que Pandas, Matplotlib, Scikit-learn, NLTK et NetworkX pour obtenir un aperçu de leurs données.

Science des données: fondations utilisant la spécialisation R

Par Jeff Leek, Brian Caffo et Roger Peng, Johns Hopkins / Coursera

//www.coursera.org/specializations/data-science-foundations-r

Cette spécialisation de 68 heures (cinq cours) couvre les outils et techniques de base de la science des données, y compris l'obtention, le nettoyage et l'exploration de données, la programmation en R et la réalisation de recherches reproductibles.

L'apprentissage en profondeur

Par Andrew Ng, Kian Katanforoosh et Younes Bensouda Mourri, Stanford / deeplearning.ai / Coursera

//www.coursera.org/specializations/deep-learning

En 77 heures (cinq cours), cette série enseigne les bases de l'apprentissage profond, comment créer des réseaux de neurones et comment mener des projets d'apprentissage automatique réussis. Vous en apprendrez davantage sur les réseaux convolutifs (CNN), les réseaux de neurones récurrents (RNN), les réseaux de mémoire à long terme (LSTM), Adam, Dropout, BatchNorm, l'initialisation Xavier / He, etc. Vous travaillerez sur des études de cas dans les domaines de la santé, de la conduite autonome, de la lecture en langue des signes, de la génération de musique et du traitement du langage naturel. En plus de la théorie, vous apprendrez comment elle est appliquée dans l'industrie en utilisant Python et TensorFlow, qu'ils enseignent également.

Principes de base de l'apprentissage automatique

Par Jeff Prosise, Wintellectnow

//www.wintellectnow.com/Videos/Watch?videoId=fundamentals-of-machine-learning

Dans ce cours vidéo d'introduction gratuit de deux heures, Prosise vous présente la régression, la classification, les machines vectorielles de support, l'analyse des composants principaux, etc., à l'aide de Scikit-learn, la bibliothèque Python populaire pour l'apprentissage automatique. 

Apprentissage automatique

Par Andrew Ng, Stanford / Coursera

//www.coursera.org/learn/machine-learning

Ce cours vidéo de 56 heures offre une large introduction à l'apprentissage automatique, à l'exploration de données et à la reconnaissance statistique de formes. Les sujets incluent l'apprentissage supervisé (algorithmes paramétriques / non paramétriques, machines vectorielles de support, noyaux, réseaux de neurones), l'apprentissage non supervisé (clustering, réduction de dimensionnalité, systèmes de recommandation, apprentissage en profondeur) et les meilleures pratiques en apprentissage automatique et en IA (théorie des biais / variance et processus d'innovation). Vous apprendrez également à appliquer des algorithmes d'apprentissage à la création de robots intelligents, à la recherche sur le Web, à l'anti-spam, à la vision par ordinateur, à l'informatique médicale, à l'audio, à l'exploration de bases de données et à d'autres domaines.

Apprentissage automatique

Par Carlos Guestrin et Emily Fox, Université de Washington / Coursera

//www.coursera.org/specializations/machine-learning

Cette spécialisation de 143 heures (quatre cours) dispensée par d'éminents chercheurs de l'Université de Washington vous présente le domaine passionnant et très demandé de l'apprentissage automatique. Grâce à une série d'études de cas pratiques, vous acquerrez une expérience appliquée dans les principaux domaines de l'apprentissage automatique, notamment la prédiction, la classification, le clustering et la recherche d'informations. Vous apprendrez à analyser des ensembles de données volumineux et complexes, à créer des systèmes qui s'adaptent et s'améliorent au fil du temps, et à créer des applications intelligentes capables de faire des prédictions à partir de données.