Souvent sur le blog on aborde les différents logiciels d’IA, de deep learning, de big data, les algorithmes, etc. pour enseigner à un ordinateur (ou un robot) comment conduire, reconnaitre un objet, etc.
Aujourd’hui, on a va se pencher sur la question: comment l’alimenter ? Internet, c’est bien, mais c’est vaste et il faut “miner” — c’est long, faut filtrer l’information, etc. Il y a une approche “intermédiaire” qui permet déjà de donner un tas d’informations à traiter à votre petit monstre: les bases de données. Et la bonne nouvelle, c’est qu’on a accès à des tas de bases de données en plus ou moins “open data” et qu’il vous manque juste un gros disque dur et une bonne connexion à internet pour charger tout ça !
Edit au 06/10/2016: A l’époque de l’article, j’avais listé ici les bases de données en Open Data, mais comme c’est une liste en constante évolution que je compte alimenter au fur et à mesure de mes découvertes, vous les trouverez sur cette page. N’hésitez pas me soumettre de nouveaux liens et à bookmarker cette page.
Avec ça, vous avez déjà de quoi faire votre propre watson (en attendant, amusez vous avec Deep Dive et ses propres Dataset):
Laisser un commentaire