2022-09-03 02:33 Temps de lecture : 19 min

Top 11 des ressources pour la science des données et l'apprentissage automatique

L'essor des données et de l'apprentissage automatique

Les données sont considérées comme le nouveau pétrole, et l'apprentissage automatique en est le moteur. Celui qui maîtrise ces deux éléments aura une influence considérable sur le monde.

Il ne s'agit pas d'une formule sortie d'un roman dystopique, mais d'une réalité contemporaine.

Nous assistons à l'émergence d'un nouvel ordre mondial où la collecte massive de données pertinentes et leur transformation en informations exploitables sont devenues cruciales. Cette capacité, autrefois hors de portée de l'humanité, donne à certains pays un avantage significatif, voire une possibilité de domination.

Par conséquent, cette discipline est prise très au sérieux par les nations les plus avancées.

Une carrière prometteuse

Au-delà des enjeux géopolitiques, la science des données et l'apprentissage automatique représentent un secteur en pleine expansion, offrant des perspectives professionnelles exceptionnelles. La demande de spécialistes est phénoménale, et l'offre ne parvient pas à suivre, même pour les profils les moins expérimentés.

C'est comme si nous avions découvert de nombreuses nouvelles planètes habitables sans avoir suffisamment de personnes pour les explorer. Cette métaphore illustre bien la situation. Voici une infographie qui confirme cette tendance :

Source : insidebigdata.com

Les salaires débutent à 50 000 $ et peuvent dépasser les 250 000 $ pour les postes de direction.

De plus, chaque individu génère en moyenne 1,7 Mo de données par seconde. Au cours d'une vie, cela représente plus de 3 500 To, une quantité de données que nous peinons à gérer et à analyser actuellement. Le potentiel de ce secteur est donc immense et nous réserve des avancées spectaculaires.

Difficulté de la science des données et de l'apprentissage automatique

C'est une question pertinente !

D'après mon expérience, la réponse est à la fois oui et non.

Si vous souhaitez vous consacrer à la recherche fondamentale et repousser les limites de l'intelligence artificielle (et par extension, de l'apprentissage automatique), cela représente un défi colossal. Même un doctorat en informatique et en mathématiques ne suffit pas toujours. Cependant, la plupart des gens n'ont ni l'ambition ni le temps pour une telle quête.

D'un autre côté, il y a ce que j'appellerais la science des données appliquée et l'apprentissage automatique.

Il s'agit d'utiliser les outils, les techniques et les algorithmes existants pour résoudre des problèmes concrets. Cette approche demande de l'engagement, de la perspicacité et de la créativité (ainsi que la compréhension de quelques notions mathématiques simples), mais elle est beaucoup plus accessible que le travail d'un ingénieur logiciel en termes de connaissances techniques.

En d'autres termes, ce n'est pas une tâche facile, mais le rapport bénéfice/effort est extrêmement favorable.

Maintenant que vous êtes motivé à devenir un spécialiste des données et de l'apprentissage automatique, explorons les meilleures options de formation.

Apprentissage automatique (Google)

Peu le savent, mais Google propose un cours gratuit et très pratique sur l'apprentissage automatique. Selon l'entreprise, il s'inscrit dans sa volonté de promouvoir les technologies d'IA/ML et de rendre le savoir accessible.

Ce cours ne requiert aucun prérequis, mais préparez-vous à consacrer du temps à l'étude des concepts statistiques.

Ce n'est pas obligatoire, mais sans connaissances en statistiques avancées, les explications du cours pourraient être insuffisantes. De plus, ce cours présente l'apprentissage automatique via TensorFlow, un outil développé par Google. Ainsi, Google met en avant ses propres API d'apprentissage automatique, mais compte tenu de la qualité du contenu, cela ne doit pas être un frein.

Au contraire, TensorFlow est l'un des outils les plus simples pour démarrer avec le ML et jouit d'une grande popularité (pour une comparaison des outils d'IA, voir cet article).

Science des données

Le nom d'Harvard est synonyme d'excellence, et ce cours ne fait pas exception.

Il ne s'agit pas d'un cours rapide qui vous initie à l'apprentissage automatique en quelques exercices. Il s'agit d'un véritable défi qui exige un travail acharné et un investissement de temps considérable.

Le cours propose des vidéos gratuites, du code (hébergé sur GitHub) et des solutions aux exercices pratiques. Autrement dit, rien ne vous empêche de le suivre si vous le souhaitez.

Quel est le public idéal ?

Vous ! Je ne plaisante pas.

Ce cours s'adresse aux professionnels ayant de solides bases en mathématiques, même s'ils ne les pratiquent plus régulièrement. Les capacités de raisonnement et de démonstration sont indispensables. Mais attention, ce cours vous donnera du fil à retordre, les exercices sont suffisamment difficiles pour vous faire transpirer, mais c'est peut-être justement ce que vous recherchez !

Apprentissage automatique

Si vous entrez dans un bar rempli de scientifiques des données et que vous demandez qui est Andrew Ng, vous risquez de vous faire houspiller.

Andrew Ng est une figure emblématique dans le domaine de la science des données et de l'apprentissage automatique, notamment grâce à son cours exceptionnel sur Coursera : Apprentissage automatique.

Pour vous donner une idée de ses références, voici un aperçu :

Ce cours est payant, car il est intégré dans l'offre de Coursera. Cependant, l'investissement financier n'est pas le seul prérequis. Ce cours est un long cheminement, car Andrew Ng approfondit les aspects mathématiques et décortique les algorithmes courants. Heureusement, c'est un parcours complet qui vous guidera à travers les méandres de l'apprentissage automatique.

Je vous le recommande vivement, d'autant plus que l'obtention du certificat de réussite est aujourd'hui un véritable atout !

Science des données appliquées

Les spécialisations sur Coursera consistent en une série de cours qui vous font progresser d'un niveau débutant à une maîtrise d'un concept spécifique. Si vous recherchez un cours complet, sérieux et convivial sur la science des données et l'apprentissage automatique avec Python, je ne peux que vous recommander cette spécialisation.

Vous obtiendrez un certificat à la fin de cette formation.

DataCamp

DataCamp propose de nombreux cours sur la science des données, couvrant différentes compétences et orientations professionnelles. De la manipulation de données à l'apprentissage automatique, vous développerez vos compétences de scientifique des données en Python et en R pour réussir dans ce domaine.

Grâce aux modules concis de DataCamp, vous pouvez apprendre à votre rythme. Ces cours vous proposent une expérience pratique qui vous permet de progresser dans vos compétences.

Vous pouvez commencer avec la version gratuite pour évaluer le contenu du cours en suivant le premier chapitre.

edX

Bénéficiez de l'enseignement de MITx, Harvardx, IBM, RICEx, UCSanDiegox et GTx sur la plateforme edX.

Chacun d'entre eux propose un programme complet pour développer vos compétences de scientifique des données. Ces programmes sont particulièrement adaptés aux personnes ayant une formation en statistiques ou en informatique.

Si vous ne recherchez pas un programme complet, vous pouvez choisir des cours à la carte. Sur edX, vous trouverez plus de 200 cours en lien avec la science des données, couvrant Python, R, Excel, les probabilités, les statistiques, l'apprentissage automatique, la visualisation de données, etc.

Codecademy

Codecademy est une autre plateforme de référence pour apprendre à coder. Leur approche privilégie l'apprentissage par la pratique, avec de nombreux projets et exercices sur leur plateforme.

Le cours de science des données proposé par Codecademy inclut SQL, Python 3, NumPy, Pandas, Matplotlib, Scikit-learn et de nombreuses autres bibliothèques.

L'ensemble du parcours de formation comprend 26 cours, largement suffisants pour vous aider à devenir un scientifique des données performant.

Ce cours sur les données :

  • Vous apporte une connaissance approfondie de la science des données.
  • Vous fournit une feuille de route simple à suivre.
  • Vous prépare à l'emploi en vous permettant d'acquérir une expérience pratique.

Udemy

Udemy n'a plus besoin d'être présenté.

Le Bootcamp Python pour la science des données et l'apprentissage automatique sur Udemy est l'un des cours les plus populaires, avec plus de 85 000 évaluations de 4,6 et plus de 370 000 étudiants dans le monde.

Voici les thèmes abordés dans ce cours :

Voici les caractéristiques du cours :

  • 25 heures de vidéos à la demande
  • Accès à vie complet
  • 13 articles et cinq ressources téléchargeables
  • Accès sur mobile et TV
  • Certificat d'achèvement
  • Garantie de remboursement de 30 jours

Si vous préférez un cours abordable, c'est une excellente option pour commencer.

IA Google

Seriez-vous intéressé par un apprentissage du machine learning avec des experts de Google ?

Dans ce cas, vous devez consulter les cours sur IA Google.

Cette plateforme propose des cours et du contenu sur l'apprentissage automatique et la science des données pour les étudiants, les ingénieurs logiciels, les scientifiques des données et même les chercheurs. Ces cours sont gratuits.

Pour commencer, le Cours intensif d'apprentissage automatique de Google AI est une excellente option. Il s'agit d'un cours rapide avec une introduction pratique à l'aide des API TensorFlow. Voici les détails du cours :

Cette plateforme propose également des cours spécifiques sur des sujets importants de l'apprentissage automatique tels que le regroupement, les systèmes de recommandation, les tests et débogages dans l'apprentissage automatique, et la préparation des données et l'ingénierie des fonctionnalités. Si vous connaissez déjà les bases de l'apprentissage automatique, ces cours seront très enrichissants.

Udacity

Udacity est également une plateforme d'apprentissage en ligne très populaire qui propose de nombreux cours sur les technologies émergentes. Plusieurs de ses programmes sont conçus et reconnus par les plus grandes entreprises du monde, comme AT&T, AWS, Google, et IBM.

Un des programmes d'Udacity concerne la science des données : L'école de la science des données. Ce programme vous aide à obtenir des postes d'analyste de données, de scientifique des données, d'ingénieur de données et d'analyste commercial. Le cours sur le métier de Data Scientist est essentiel dans ce programme car il couvre les concepts de l'apprentissage automatique, de l'apprentissage en profondeur et du génie logiciel. Des connaissances de base en apprentissage automatique sont nécessaires pour suivre ce cours.

Si vous connaissez la programmation Python mais que vous débutez dans l'apprentissage automatique, il existe un autre programme sur Udacity : l'école d'IA. Ce programme propose des cours qui commencent par les bases de l'apprentissage automatique.

L'apprentissage en profondeur

Ce cours est exceptionnel et je le recommande vivement, surtout si vous êtes un développeur.

Je le répète : si vous êtes un développeur.

En effet, ce cours ne s'attarde pas sur les bases de la programmation. La description du cours est très claire à ce sujet :

« Nous considérons que tous les participants à ce cours ont au moins une année d'expérience en programmation. Le cours utilise Python comme langage d'enseignement, donc si vous ne connaissez pas encore Python, nous considérons que vous prendrez le temps de l'apprendre. Un développeur expérimenté trouvera Python assez simple à maîtriser. »

Donc, si vous connaissez déjà Python (sinon apprenez-le ici), ou si vous pouvez vous familiariser rapidement, c'est le cours parfait pour les personnes pragmatiques qui souhaitent créer de vrais systèmes sans se préoccuper des fondements théoriques des algorithmes.

Je dirais même que c'est idéal pour les personnes impatientes (comme moi !) qui détestent les procédures formelles et la monotonie.

Et j'oubliais, il est 100 % gratuit et il bénéficie d'une communauté très active !

Conclusion

Ouf !

Cette liste a été difficile à établir. Non pas par manque de sources de qualité, mais parce qu'il y en a beaucoup trop !

L'apprentissage automatique est un domaine en plein essor qui résout des problèmes complexes avec une grande élégance. Il existe des centaines de cours en ligne, gratuits et payants, et la plupart sont excellents. Cela peut être déroutant, c'est pourquoi j'ai essayé de les résumer à onze en fonction du niveau d'expérience des différents apprenants.

J'espère que cela vous a été utile !

Auteur
France

Rédacteur tech, guides pratiques et astuces numériques.