site:enseignement:master:bdle:tmes:tme3-prise-main-spark
Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
site:enseignement:master:bdle:tmes:tme3-prise-main-spark [11/10/2017 12:18] – [Interrogation des données] amine | site:enseignement:master:bdle:tmes:tme3-prise-main-spark [15/10/2018 09:09] (Version actuelle) – [Interrogation des données] amine | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | {{indexmenu_n> | + | {{indexmenu_n> |
- | ====== [TME II-2] | + | ====== [TME II-1] |
- | Pour l'aide sur l' | + | **Remarque générale :** Le cours ne peut être // |
+ | Pour l'aide sur l' | ||
===== Exercice 1 ===== | ===== Exercice 1 ===== | ||
- | //Cet exercice est la suite de l' | ||
+ | Copier le fichier | ||
+ | < | ||
Lancer le spark-shell en mode local ([[spark|voir Doc]]) en suivant les instructions fournies | Lancer le spark-shell en mode local ([[spark|voir Doc]]) en suivant les instructions fournies | ||
puis charger le fichier | puis charger le fichier | ||
Ligne 24: | Ligne 26: | ||
- Grouper les paires par ‘mot’ et additionner leur nombre nb. | - Grouper les paires par ‘mot’ et additionner leur nombre nb. | ||
- Reprendre les questions 3 et 4 en calculant ‘mot’ différemment : désormais, ‘mot’ doit correspondre au préfixe du premier sous-élément de chaque élément de list, çad, pour en.d, mot doit être en, pour fr.d, mot doit être fr, etc. Comparer les résultats avec ceux obtenus précédemment. | - Reprendre les questions 3 et 4 en calculant ‘mot’ différemment : désormais, ‘mot’ doit correspondre au préfixe du premier sous-élément de chaque élément de list, çad, pour en.d, mot doit être en, pour fr.d, mot doit être fr, etc. Comparer les résultats avec ceux obtenus précédemment. | ||
- | **Remarque** pour partitionner une chaîne de caractères en utilisant le point (.) comme délimiteur à l'aide de la méthode split(), il faut protéger le point avec \, i.e split(" | + | **Remarque** pour partitionner une chaîne de caractères en utilisant le point (.) comme délimiteur à l'aide de la méthode split(), il faut protéger le point avec \, i.e split(" |
Ligne 82: | Ligne 84: | ||
* films (MovieID, Title, Genres) | * films (MovieID, Title, Genres) | ||
- | === Structure de donnée : Dataset=== | + | |
- | Pour le TME sur les Dataset, récupérer le fichier suivant: | + | |
- | <code bash> | + | |
- | cp / | + | |
- | emacs tme-dataset-etudiant.scala & | + | |
- | </ | + | |
Ligne 134: | Ligne 131: | ||
</ | </ | ||
</ | </ | ||
+ | |||
+ | |||
+ | === Exercice Subsidiaire : reprendre les questions précédentes en utilisant l'API Dataset === | ||
+ | Pour utiliser les Dataset, récupérer le fichier suivant: | ||
+ | <code bash> | ||
+ | cp / | ||
+ | emacs tme-dataset-etudiant.scala & | ||
+ | </ | ||
+ | |||
+ |
site/enseignement/master/bdle/tmes/tme3-prise-main-spark.1507717139.txt.gz · Dernière modification : de amine