Bases de Données / Databases

Site Web de l'équipe BD du LIP6 / LIP6 DB Web Site

Outils pour utilisateurs

Outils du site


site:enseignement:master:bdle:tmes:databricks

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
site:enseignement:master:bdle:tmes:databricks [05/10/2020 12:39] – [Création notebook] aminesite:enseignement:master:bdle:tmes:databricks [27/09/2021 13:02] (Version actuelle) – [Divers] hubert
Ligne 12: Ligne 12:
 Apres création du compte, se connecter sur Databricks Community Edition. La fenetre principale est indiquée ci-dessous Apres création du compte, se connecter sur Databricks Community Edition. La fenetre principale est indiquée ci-dessous
  
-{{:site:enseignement:master:bdle:tmes:principale.jpg?400|principale}}+{{:site:enseignement:master:bdle:tmes:db.png?400|principale}}
  
 La barre latérale propose plusieurs fonctionnalités: La barre latérale propose plusieurs fonctionnalités:
   * "Workspace" permet de gérer les notebook et d'autres fichiers de configuration   * "Workspace" permet de gérer les notebook et d'autres fichiers de configuration
   * "Data" permet d'importer des données   * "Data" permet d'importer des données
-  * "Clusters" permet créer, démarrer ou arrêter un cluster+  * "Compute" permet créer, démarrer ou arrêter un cluster
   * "Jobs", réservé à la version payante, permet de visualiser des métriques sur l'exécution des programmes.   * "Jobs", réservé à la version payante, permet de visualiser des métriques sur l'exécution des programmes.
 +
 +===== Configuration =====
 +
 +Pour avoir la possibilité d'utiliser la ligne de commande et organiser vos fichier depuis l'interface graphique, il faudra activer deux paramètres en vous navigant depuis l'interface principale 
 +
 +**Settings -> Admin console
 +**
 +
 +Puis cliquer sur l'onglet **Workspace Settings**
 +
 +Enfin, basculer **Web Terminal** et **DBFS File Browser** vers Enabled, comme indiqué dans la capture ci-dessous
 +
 +{{:site:enseignement:master:bdle:tmes:enabled.jpg?400|Enabled}}
 +
  
 ===== Création Cluster ===== ===== Création Cluster =====
Ligne 26: Ligne 40:
 {{:site:enseignement:master:bdle:tmes:creation-cluster.jpg?400|creation cluster}} {{:site:enseignement:master:bdle:tmes:creation-cluster.jpg?400|creation cluster}}
  
-Après quelques secondes, le cluster est prêt à l'usage. Il sera tué au bout de 2 heures d'inaction.+Après quelques secondes (ou minutes...), le cluster est prêt à l'usage. Il sera tué au bout de 2 heures d'inaction.
 s'agit d'une machine avec 15 GO de RAM, 2 coeurs et 1 Database Unit. s'agit d'une machine avec 15 GO de RAM, 2 coeurs et 1 Database Unit.
 +Toutefois, la suppression du cluster ne supprime ni vos données ni vos notebook qui sont conservés dans votre espace databricks.
  
 ===== Chargement données ===== ===== Chargement données =====
Ligne 59: Ligne 74:
 Saisir les instructions dans les cellules et executer.  Saisir les instructions dans les cellules et executer. 
  
-Par exemple, pour charger test.csv saisir les instructions suivantes +Par exemple, pour charger et visualiser le contenu *test.csvsaisir les instructions suivantes  
 + 
 +<code python> 
 +path = "/FileStore/tables/BDLE/TME1/"  
 +test = spark.read.format("csv").option("header", "true")\ 
 +            .option("inferSchema", "true")\ 
 +            .load(path +"test.csv"
 +test.printSchema() 
 +test.show() 
 +</code> 
 + 
 +{{:site:enseignement:master:bdle:tmes:exec-notebook.jpg?400|exec-notebook}} 
 + 
 + 
 +===== Importer un notebook ===== 
 +Il est aussi possible d'importer un notebook existant et d'en exporter à la fin de la séance de TME. 
 +Menu déroulant sur le nom de l'utilisateur -> Import 
 + 
 +{{:site:enseignement:master:bdle:tmes:import1.png?200|}} 
 +puis saisir l'url du notebook à importer 
 +{{:site:enseignement:master:bdle:tmes:import2.png?200|}} 
 + 
 +===== Plan d'exécution ===== 
 +A faire 
  
  
 +=====Divers=====
 +Dans une cellule de code, possibilité de faire **Run All Above** pour traiter toutes les cellules précédentes.
 +{{:site:enseignement:master:bdle:tmes:databricks_run_all_above.png?200|}}
site/enseignement/master/bdle/tmes/databricks.1601894373.txt.gz · Dernière modification : de amine