Les 20 meilleurs sites Web pour accéder à des données gratuites pour la pratique
Où trouver des données gratuites pour vos analyses et recherches
Que vous soyez engagé dans des études de marché approfondies, que vous constituiez votre portfolio d'analyste ou que vous recherchiez des informations pour élargir votre présence sur le marché, l'accès à des données fiables et pertinentes est indispensable pour prendre des décisions éclairées.
Cependant, la recherche de données gratuites, fiables et facilement accessibles sur le web peut parfois s'avérer complexe. Cet article a pour objectif de simplifier votre démarche en vous présentant une sélection des meilleurs sites web où vous pouvez trouver des données de qualité sans frais.
Sites web incontournables pour vos données gratuites :
Google Trends est un outil gratuit proposé par Google, qui offre aux utilisateurs un aperçu des requêtes de recherche effectuées sur le moteur de recherche. Bien qu'il présente des données chronologiques depuis 2004, au niveau mondial ou local, il ne révèle aucune information personnelle sur les utilisateurs.
Vous pouvez également affiner les résultats en ciblant des catégories spécifiques, des langues, des entités ou encore des tendances de recherche sur Google. Parmi les données disponibles, vous trouverez les tendances de recherche quotidiennes et les tendances de recherche en temps réel, cette dernière proposant des données sur les sept derniers jours.
FiveThirtyEight est un site web spécialisé dans le journalisme de données. Il propose des données concernant l'analyse de sondages, le sport, la culture pop, la politique, les sciences et les événements économiques.
L'avantage de ce site est que vous pouvez télécharger les données directement depuis leur plateforme ou depuis leur dépôt GitHub officiel. Vous pourrez ainsi les utiliser avec vos outils de visualisation pour créer des graphiques et des infographies pertinentes. Vous trouverez par exemple des données sur les prédictions pour la coupe du monde ou sur les prédictions de la LNH pour la saison 2022-23.
BuzzFeed News est une plateforme américaine d'actualités et de reportages couvrant un large éventail de sujets : journalisme, technologie, divertissement, actualités des célébrités, culture, astuces de bricolage, santé et politique.
BuzzFeed News rend accessible et open source son ensemble de données, ses outils et ses analyses sur son compte GitHub. Vous pouvez par exemple consulter les données de vérification des antécédents d'armes à feu du FBI NICS.
Data.gov est le site officiel du gouvernement américain dédié aux données ouvertes. Il propose plus de 250 000 ensembles de données publiques provenant de diverses agences gouvernementales fédérales et internationales. L'objectif de cette initiative est de promouvoir un gouvernement ouvert et transparent.
Vous pouvez accéder aux données disponibles en fonction du sujet ou de l'agence qui les a produites. Des exemples de données incluent le système national de données sur les prêts étudiants et les données sur les véhicules électriques en circulation.
Kaggle, une plateforme d'analyse de données acquise par Google, propose une grande variété d'ensembles de données couvrant de nombreux sujets. C'est une véritable communauté où vous pouvez partager vos codes, apprendre, collaborer avec d'autres experts en données et perfectionner vos compétences. Kaggle organise également des concours de science des données, avec des prix à la clé.
Si vous débutez, vous trouverez sur Kaggle de nombreux guides pour vous familiariser avec le domaine de la science des données. Un exemple de jeu de données disponible est les statistiques mondiales de YouTube pour 2023.
EarthData est un projet de la NASA qui sert de référentiel de données terrestres depuis 1994. Vous pouvez y trouver des informations satellitaires sur l'atmosphère terrestre, l'océan et l'hydrosphère.
Vous pouvez explorer divers sujets et accéder à des données comme les données sur les vagues de chaleur. Pour des données non terrestres, il faudra consulter le système de données planétaires de la NASA.
IMDb fournit des informations sur les films, les séries TV, les vidéos personnelles, les podcasts, les jeux vidéo, les contenus en streaming et les célébrités. Un exemple de ressources disponibles sont les jeux de données IMDb non commerciaux.
AWS Public Dataset propose plus de 3000 ensembles de données publiques, mis à disposition via les services AWS. La plupart sont liés à des projets spécifiques, comme l' atlas du génome du cancer ou les ensembles de données Foldingathome COVID-19.
Inside Airbnb est un site de surveillance lancé par Murray Cox. Il propose des données publiques sur Airbnb, la plateforme qui permet de trouver des logements à prix abordables dans le monde entier. Les informations disponibles vous permettent de réaliser des analyses, comme par exemple des analyses de location à Montréal.
Google Dataset Search est un moteur de recherche de données développé par Google, qui référence plus de 20 millions d'ensembles de données. Comme le moteur de recherche classique de Google, vous pouvez y trouver des données sur presque tous les sujets. Un bon exemple est les données nationales canadiennes de surveillance à long terme de la qualité de l'eau.
Le dépôt d'apprentissage automatique de l'UC Irvine héberge 624 ensembles de données destinés à la communauté de l'apprentissage automatique. Ces données sont classées en fonction des tâches d'apprentissage auxquelles elles sont le mieux adaptées. Par exemple, vous pouvez trouver l' ensemble de données sur l'iris, très utilisé dans les modèles de classification et de clustering.
Datahub est une plateforme qui propose de nombreux ensembles de données couvrant des sujets variés, comme les rendements des obligations d'État américaines à 10 ans. En plus des données, vous trouverez des outils et des boîtes à outils utiles aux professionnels des données.
L'Observatoire mondial de la santé est un référentiel de données de santé exclusives. Il contient des statistiques pour plus de 1000 indicateurs, pour les 194 états membres de l'OMS. Ces données permettent de suivre les progrès de ces pays vers les objectifs de développement durable. Vous pouvez filtrer les informations par thème, catégorie, métadonnées et indicateur.
Ce site web est spécialisé dans les données de recherche et les informations sur le marché de l'industrie cinématographique britannique, comme les chiffres du box-office du week-end.
GitHub est bien plus qu'un simple hébergeur de projets collaboratifs et open source. La plateforme héberge également de nombreux référentiels dédiés à la conservation d'ensembles de données publiques et gratuites. Même BuzzFeedNews a un dépôt GitHub pour ses données.
Vous pouvez également trouver le dépôt Awesome Public Datasets ou l'ensemble de données "Do You Even Lift?". Vous pouvez également contribuer à ces projets open source.
Data.world est une plateforme collaborative et communautaire dédiée aux données. Elle héberge des projets et des ensembles de données. Bien que certains ensembles de données soient payants, la majorité est gratuite, comme les données de 2021 sur les passagers aériens mensuels en Amérique. Vous pouvez les télécharger localement ou les utiliser via leur API.
Les données ouvertes de la Banque Mondiale regroupent des données mondiales sur l'économie et le développement. Vous pouvez les explorer et les filtrer par indicateur ou par pays. Vous trouverez par exemple des statistiques mondiales sur le coût et l'accessibilité financière d'une alimentation saine.
Nasdaq Data Link est spécialisé dans les données financières, économiques et alternatives. Vous pouvez accéder à des données telles que les publications de la Réserve fédérale américaine, via une feuille de calcul ou une API.
La plateforme de données de la NYC Taxi and Limousine Commission contient des informations comme les enregistrements de trajets en taxis jaunes et verts dans la ville de New York. Vous y trouverez toutes les informations sur les prises en charge et déposes, les zones de taxis et les tarifs des trajets.
Academic Torrents est un catalogue de données de recherche regroupant plus de 127,15 To de données. Il a été créé par et pour des chercheurs.
Explorez et apprenez
Nous espérons que cette liste vous permettra de trouver les données qui vous seront utiles pour affiner vos stratégies commerciales, orienter vos études de marché, prendre un avantage concurrentiel ou encore pour créer votre propre portfolio de données. N'attendez plus, lancez-vous dans la recherche de données, votre quête sera désormais plus facile.