Liste des bases de données en Open Data

  • Open­StreetMap: Base de don­nées géo­graphiques (inclu­ant cartes vec­to­rielles, rues, etc.) – Plusieurs for­mats nat­ifs dont XML (50Go)  – con­ver­sion dans plusieurs for­mats pos­si­bles. D’autres don­nées sur GeoN­ames.
  • Wikipedia: toute l’encyclopédie et ses images, sous la forme d’un Dump exploitable (20Go). De façon plus générales, issue du pro­jet Free­base, nous avons wiki­da­ta sur lequel repose wikipé­dia et qui con­tient une struc­ture séman­tique.
  • Open­Pro­duct­Da­ta: Tout ce qui con­tient un code barre (GTIN) est ici, Dump MySQL, avec ou sans pho­to (60Mo/2.6Go)
  • Open­Food­Facts: une base de don­nées de plus de 50Kproduits ali­men­taires en français au for­mat Mon­goDB ou CSV (220Mo)
  • Open­Li­brary: Plus d’un mil­lion de livres stock­és dans une base de don­nées, de quoi lire… lire… lire ! (7Go)
  • Data.gouv.fr: Des cen­taines de tables sur les codes postaux, des sta­tis­tiques, des codes… c’est assez inde­scriptible telle­ment il y a de don­nées sur la France… La ver­sion US c’est ici.
  • World­Fact­Book: des cartes stratégiques, la liste des mem­bres de chaque gou­verne­ment de chaque pays, etc. – tout cela con­tenu dans cette base de don­nées de la CIA. On peut même avoir les don­nées des années précé­dentes (jusqu’en 2000).
  • DMOZ: C’est l’Open Direc­to­ry Project – le plus grand annu­aire de sites web télécharge­able sous la forme d’une base de don­nées – un bon point de départ pour min­er automa­tique­ment de l’info sur le web. 4 Mil­lions de sites web, plus d’un mil­lion de caté­gories… 90 langues. Fer­mé le 14 mars 2017.
  • Stack­Ex­change: le plus grand réseau de sites anglo­phones de ques­tions et répons­es sur de nom­breux sujets: 320 bases de don­nées à télécharg­er.
  • IMDb: Le ciné­ma, les séries, les acteurs… Plusieurs tables à jour, toutes télécharge­ables (mais en anglais). Pour du français, vous pou­vez min­er Allocine.
  • MusicBrainz: la même chose qu’IMDb, mais pour la musique !
  • Ensem­bl: le génome humain et bien plus encore.
  • Ima­geNet: on en a par­lé ici, mais c’est la plus grande base de don­nées qui reli­er pho­tos d’objets et descrip­tion.

Fièrement propulsé par WordPress | Thème : Baskerville 2 par Anders Noren.

Retour en haut ↑

%d blogueurs aiment cette page :