site:enseignement:master:bdle:tmes:dataset
Différences
Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
| site:enseignement:master:bdle:tmes:dataset [21/09/2018 15:23] – [YAGO] hubert | site:enseignement:master:bdle:tmes:dataset [12/10/2019 18:39] (Version actuelle) – [Jeux de données] hubert | ||
|---|---|---|---|
| Ligne 5: | Ligne 5: | ||
| Cette page liste les jeux de données utilisables pour les TME de BDLE. | Cette page liste les jeux de données utilisables pour les TME de BDLE. | ||
| + | Ils sont disponibles en ligne dans [[https:// | ||
| + | |||
| + | |||
| Préparation : créer un répertoire / | Préparation : créer un répertoire / | ||
| Ligne 63: | Ligne 66: | ||
| ==== YAGO ==== | ==== YAGO ==== | ||
| - | Des données issues de YAGO. Ce sont des triplets RDF. | + | Des données issues de YAGO. Ce sont des triplets RDF (sujet, propriété, |
| - | Le jeux de données complet contient plus de 100 millions de triplets. Pour faciliter les TME, on manipule un extrait contenant 5 millions de triplets : | + | Le jeux de données |
| - | * on considère seulement les faits : ce sont les triplets reliant deux ressources (aucun littéral). | + | * on considère seulement les faits : ce sont les triplets reliant deux ressources |
| + | * on ne garde que les faits concernant un sujet relié à au moins 5 objets (ie. il y a au moins 5 faits dans Yago3 pour ce sujet), et un objet relié à au moins 5 sujets. | ||
| Pour récupérer les triplets : | Pour récupérer les triplets : | ||
| Ligne 81: | Ligne 85: | ||
| </ | </ | ||
| - | ===== YAGO2 ===== | + | === YAGO2 === |
| - | La dataset YAGO2 créé en 2012 contient 4 millions de faits et les types des individus | + | La dataset YAGO2 créé en 2012 contient 4 millions de faits et les **types** des individus |
| <code bash> | <code bash> | ||
| tar zxvf / | tar zxvf / | ||
| Ligne 91: | Ligne 95: | ||
| Pour aller plus loin, vous avez la possibilité de télécharger les [[https:// | Pour aller plus loin, vous avez la possibilité de télécharger les [[https:// | ||
| - | [[http:// | + | [[http:// |
| Ligne 128: | Ligne 132: | ||
| + | |||
| + | Retour vers les [[site: | ||
site/enseignement/master/bdle/tmes/dataset.1537536213.txt.gz · Dernière modification : de hubert
