site:enseignement:master:bdle:tmes:tmejointure
Différences
Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
| site:enseignement:master:bdle:tmes:tmejointure [30/11/2018 16:03] – [Exercice 4 : Produit Cartésien] hubert | site:enseignement:master:bdle:tmes:tmejointure [14/12/2018 16:18] (Version actuelle) – [Exercice 6 : Chemin le plus long] hubert | ||
|---|---|---|---|
| Ligne 717: | Ligne 717: | ||
| - | ===== Exercice 5 : Questions diverses | + | ===== Exercice 5 : Traitement itératif par partition et par groupe d' |
| - | La methode zipWithIndex (numérotant les éléments d'une collection) existe pour un RDD mais pas pour un DataSet. | + | La methode zipWithIndex (numérotant les éléments d'une collection) existe pour un RDD mais pas pour un Dataset. |
| Ecrire la fonction '' | Ecrire la fonction '' | ||
| + | Rmq: une solution consiste à utiliser mapPartitionsWithIndex pour connaitre la taille des partitions et parcourir une partition pour affecter les numéros consécutifs à chaque élément. | ||
| + | |||
| + | |||
| + | |||
| + | ===== Exercice 6 : Chemin le plus long ===== | ||
| + | Pour les données de yago utilisées précédemment, | ||
| + | Un chemin doit être sans circuit (ou sans cycle : ne jamais repasser sur le même sujet). | ||
| + | Combien y a -t-il de chemin de longueur 2, 3 ,4 ? | ||
| + | Quelle est la longueur maximale ? | ||
| + | Montrer que votre solution est efficace. Expliquer ce que vous avez mis en oeuvre pour apporter plus d' | ||
site/enseignement/master/bdle/tmes/tmejointure.1543590222.txt.gz · Dernière modification : de hubert
