Les 20 meilleurs sites Web pour accéder à des données gratuites pour la pratique

Que vous meniez des études de marché, construisiez votre portefeuille en tant qu’analyste ou recherchiez des informations pour étendre votre portée sur le marché, des données précieuses et fiables sont essentielles pour une prise de décision éclairée.

Cependant, la recherche sur Internet de données gratuites, fiables et accessibles présente certains défis. Cet article rendra votre quête de données moins difficile en vous présentant certains des meilleurs sites Web pour accéder à des données gratuites.

Google Trends est un service gratuit développé par Google qui fournit aux utilisateurs des échantillons de données non filtrées des requêtes de recherche adressées à Google. Bien que ce service affiche des données de séries chronologiques de 2004 à aujourd’hui à l’échelle mondiale et à l’échelle de la ville, il n’affiche pas les détails personnels des utilisateurs des moteurs de recherche.

Vous pouvez également restreindre les données pour vous concentrer sur les catégories, les langues, les entités ou les recherches de tendances sur Google avec Google Trends. Exemples de données disponibles : tendances de recherche quotidiennes et tendances de recherche en temps réelqui affiche les données des sept derniers jours.

FiveThirtyEight est un site Web de journalisme de données qui contient des données sur l’analyse de sondages, les sports, la culture pop, la politique, la science et les événements économiques.

L’avantage du site Web est que vous pouvez télécharger les données depuis leur site Web ou leur dépôt officiel GitHub et utilisez vos outils de visualisation de données pour créer des visuels de journalisme de données captivants pour votre public. Quelques exemples de données intéressantes disponibles incluent pronostics coupe du monde et Données de prédictions de la LNH 2022-23.

BuzzFeed News est une plateforme américaine d’actualités de dernière minute et de reportage original qui rapporte tout, du journalisme, de la technologie, du divertissement, de l’actualité des célébrités, de la culture et des hacks de bricolage à la santé et à la politique.

Sur son GitHub, BuzzFeed News rend son ensemble de données, ses outils et ses analyses de la salle de rédaction de BuzzFeed open source, accessibles et disponibles. Un exemple inclut le Données de vérification des antécédents des armes à feu du FBI NICS.

Data.gov est le site Web de données ouvertes du gouvernement des États-Unis qui héberge plus de 250 000 ensembles de données bien documentés et accessibles au public provenant d’agences gouvernementales internationales et fédérales multiples. L’idée derrière cette initiative était de fournir un gouvernement ouvert et transparent.

Vous pouvez accéder aux données du site Web en fonction du sujet et de l’agence ou de l’organisation. Quelques exemples de données que vous pouvez trouver sur Data.gov sont les système national de données sur les prêts étudiants et données sur la population de véhicules électriques.

Kaggle est un terrain de jeu de données publiques acquis par Google qui propose un large éventail d’ensembles de données sur divers sujets. Cette plateforme communautaire vous permet de partager vos codes, d’apprendre, de collaborer avec d’autres professionnels des données et de perfectionner vos compétences. Kaggle organise également des concours de science des données où vous pouvez gagner divers prix.

Ce guide fournit un guide du débutant sur la façon de démarrer avec Kaggle pour la science des données. Un exemple est le Statistiques YouTube mondiales 2023.

EarthData est une initiative de données de la NASA servant de référentiel de données terrestres de 1994 à aujourd’hui. Vous pouvez obtenir des données liées aux informations satellitaires distantes aux données sur l’atmosphère terrestre, l’océan et l’hydrosphère terrestre.

Vous pouvez parcourir divers sujets et accéder à des données telles que données sur la chaleur extrême. Cependant, vous devrez explorer Le système de données planétaires de la NASA pour les données non terrestres.

IMDb fournit des données sur les films, les séries télévisées, les vidéos personnelles, les podcasts, les jeux vidéo, les informations en streaming et le contenu des célébrités. Un exemple est Ensembles de données IMDb non commerciaux.

AWS Public Dataset est un site Web qui héberge plus de 3 000 ensembles de données rendus publics via les services AWS. La plupart des ensembles de données ici sont basés sur des projets. Quelques-uns incluent le atlas du génome du cancer et Ensembles de données Foldingathome COVID-19.

Inside Airbnb est un site Web de surveillance lancé par Murray Cox. Ce site Web fournit des données accessibles au public sur Airbnb, une plate-forme qui propose aux utilisateurs des chambres économiques dans le monde entier. Vous pouvez utiliser les informations de ce site pour effectuer des analyses telles que analyses locatives de Montréal.

Google Dataset Search est un moteur de recherche d’ensembles de données créé par Google qui héberge plus de 20 millions d’ensembles de données. Comme leur moteur de recherche, vous pouvez obtenir des données sur presque tout. Un bon exemple est le Données nationales canadiennes de surveillance à long terme de la qualité de l’eau.

L’UC Irvine Machine Learning Repository héberge 624 ensembles de données destinés à la communauté mondiale de l’apprentissage automatique. Ce site Web jouit d’une solide réputation dans la communauté car les ensembles de données sont classés en fonction des tâches d’apprentissage automatique auxquelles ils sont adaptés. Un exemple est le Ensemble de données sur l’irisun célèbre ensemble de données de modèle de classification et de clustering.

Datahub, en tant que plateforme, possède de nombreux ensembles de données qui couvrent un large éventail de sujets tels que Rendement des obligations d’État américaines à 10 ans (taux d’intérêt à long terme). Outre les données, ils affichent également des outils de données et des boîtes à outils pouvant être utiles aux professionnels des données.

Il s’agit du premier site Web de notre liste de données de santé exclusives. L’Observatoire mondial de la santé sert de référentiel de données affichant des statistiques liées à la santé pour plus de 1 000 indicateurs pour les 194 États membres de l’OMS. Les données sont enregistrées pour suivre les progrès de ces États membres vers les objectifs des ODD. Vous pouvez obtenir des données en filtrant le thème, la catégorie, les métadonnées et l’indicateur des données.

Cette plateforme est vraiment basée sur une niche. Il affiche des données de recherche et des informations sur le marché comme le chiffres du box-office du week-end et des données connexes sur l’industrie cinématographique britannique.

GitHub est bien plus que le simple hébergeur de millions de projets collaboratifs et open source. La plateforme héberge également de nombreux référentiels visant à conserver des ensembles de données gratuits, publics et open source. Même BuzzFeedNews dispose d’un référentiel GitHub open source.

D’autres exemples sont le Super référentiel d’ensembles de données publics et est-ce que vous soulevez même l’ensemble de données. Vous pouvez également contribuer à ces projets open source sur GitHub.

Data.world est une communauté de données et une plateforme collaborative qui héberge des projets et des ensembles de données. Bien que quelques ensembles de données soient payants, la majorité des données présentes sur la plateforme, comme Makeover Monday’s 2021/W16 : passagers aériens mensuels en Amériquesont gratuits et peuvent être facilement téléchargés localement ou accessibles via leur API.

Les données ouvertes de la Banque mondiale sont un catalogue de données mondiales sur l’économie et le développement. Vous pouvez parcourir et filtrer les données, comme le statistiques mondiales sur le coût et l’accessibilité financière d’une alimentation saine par indicateur et par pays.

Nasdaq Data Link concerne toutes les données financières, économiques et alternatives. Vous pouvez accéder à des données comme Publications des données de la Réserve fédérale américaine via une feuille de calcul comme Excel ou une API.

La plateforme de données de la NYC Taxi and Limousine Commission enregistre et héberge des informations telles que records de trajets en taxi jaune et vert à travers la ville de New York. L’avantage de ce site Web est qu’il affiche des informations sur tout, de la prise en charge/dépose à la zone des taxis et aux tarifs du trajet.

Academic Torrents est un catalogue de données de plus de 127,15 To de données de recherche. Il a été construit, comme on dit, pour les chercheurs et par les chercheurs.

Explorer et apprendre

Espérons qu’avec cette liste, vous pourrez obtenir des données qui pourront façonner votre paysage commercial, piloter vos études de marché, acquérir un avantage concurrentiel et vous aider à créer gratuitement ce portefeuille de données unique. Alors saisissez les opportunités, explorez et lancez-vous dans une quête de recherche de données moins difficile.