site:enseignement:master:bdle:supports-cours:spark
Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
site:enseignement:master:bdle:supports-cours:spark [15/11/2018 17:56] – amine | site:enseignement:master:bdle:supports-cours:spark [15/11/2018 18:12] (Version actuelle) – [Analyser du JSON en Spark SQL] amine | ||
---|---|---|---|
Ligne 88: | Ligne 88: | ||
===== Spark SQL ===== | ===== Spark SQL ===== | ||
+ | |||
+ | Le but ici est d' | ||
+ | |||
<code scala> | <code scala> | ||
+ | import spark.implicits._ | ||
+ | |||
+ | |||
val lineitem = spark.read.format(" | val lineitem = spark.read.format(" | ||
val part = spark.read.format(" | val part = spark.read.format(" | ||
+ | </ | ||
+ | Les instructions suivantes expriment les sous-expression de la requête | ||
+ | < | ||
+ | val inner = lineitem.groupBy(" | ||
+ | |||
+ | val outer = lineitem.join(part, | ||
+ | |||
+ | val q17_simp = inner.join(outer, | ||
+ | |||
+ | q17_simp.show() | ||
</ | </ | ||
+ | |||
+ | Pour examiner les plans logiques et physique utiliser le explain | ||
+ | <code scala> | ||
+ | q17_simp.explain(true) | ||
+ | </ | ||
+ | Il est aussi possible de visualizer le plan physique et les Stages de l' | ||
+ | ===== Analyser du JSON en Spark SQL ===== | ||
+ | Les extrait du cours sont dans <code bash>/ | ||
+ | Chaque fichier de l' | ||
+ | L' | ||
+ | |||
+ | <code scala> |
site/enseignement/master/bdle/supports-cours/spark.1542300970.txt.gz · Dernière modification : de amine