Différences

Ci-dessous, les différences entre deux révisions de la page.

--- site:enseignement:master:bdle:tmes:tme3-prise-main-spark [20/10/2017 12:13] – amine
+++ site:enseignement:master:bdle:tmes:tme3-prise-main-spark [15/10/2018 09:09] (Version actuelle) – [Interrogation des données] amine
@@ Ligne 1: / Ligne 1: @@
 {{indexmenu_n>30}}
-====== [TME II-2]  MapReduce en Spark   ======
+====== [TME II-1]  Introduction à Spark (Algèbre RDD)   ======
-Pour l'aide sur l'utilisation de Spark voir [[spark|ici]]
+**Remarque générale :** Le cours ne peut être //self-contained// --> consulter la documentation en ligne de [[https://spark.apache.org/docs/2.1.1/api/scala/index.html#package|Spark]].
+Pour l'aide sur l'utilisation de Spark voir [[spark|ici]]
 ===== Exercice 1 =====
-//Cet exercice est la suite de l'exercice 2 du TME précédent.//
+Copier le fichier
+<code> /Infos/bd/spark/bdle/2015/data/wordcount.txt.bz2</code> sur votre espace personnel.
 Lancer le spark-shell en mode local ([[spark|voir Doc]]) en suivant les instructions fournies
 puis charger le fichier
@@ Ligne 82: / Ligne 84: @@
   * films (MovieID, Title, Genres)
-=== Structure de donnée : Dataset===
-Pour le TME sur les Dataset, récupérer le fichier suivant:
-<code bash>
-cp /Infos/bd/spark/tme-dataset-etudiant.scala <votre repertoire de travail>
-emacs tme-dataset-etudiant.scala &
-</code>
@@ Ligne 134: / Ligne 131: @@
 </code>
 </showif>
+=== Exercice Subsidiaire :  reprendre les questions précédentes en utilisant l'API Dataset ===
+Pour utiliser les Dataset, récupérer le fichier suivant:
+<code bash>
+cp /Infos/bd/spark/tme-dataset-etudiant.scala <votre repertoire de travail>
+emacs tme-dataset-etudiant.scala &
+</code>