Bases de Données / Databases

Site Web de l'équipe BD du LIP6 / LIP6 DB Web Site

Outils pour utilisateurs

Outils du site


site:enseignement:master:bdle:tmes:projet2018

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
site:enseignement:master:bdle:tmes:projet2018 [18/01/2019 15:00] hubertsite:enseignement:master:bdle:tmes:projet2018 [31/01/2019 21:25] (Version actuelle) – [Mini-projet 2018] hubert
Ligne 1: Ligne 1:
 ====== Mini-projet 2018 ====== ====== Mini-projet 2018 ======
  
-Consulter le [[https://nuage.lip6.fr/s/wNwjFKqAw9aGXHp| Dossier pour le projet]] contenant : +Commencer par consulter le [[https://nuage.lip6.fr/s/wNwjFKqAw9aGXHp| Dossier pour le projet]] contenant  
-le sujet et le document tuto_idea pour utiliser l'outil IDEA+le //sujet// et le document //tuto_idea// pour utiliser l'outil IDEA
  
  
  
-==Complément du mini projet (janvier 2019)==+ 
 +====Facultatif : Complément du mini projet : Calcul de composantes connexes==== 
 +Date: janvier 2019 
 + 
 Utiliser GraphX pour manipuler le graphe se trouvant dans  Utiliser GraphX pour manipuler le graphe se trouvant dans 
 le dossier /Infos/bd/spark/dataset/arxiv/graphe_similarite le dossier /Infos/bd/spark/dataset/arxiv/graphe_similarite
  
 <code bash> <code bash>
-cd /Infos/bd/spark/dataset/arxiv/graphe_similarite+cd /Infos/bd/spark/dataset/arxiv/graphe_similarite/40_topics_par_annee
 more similarite.json more similarite.json
-more topicAnnee.json+more topicDetail.json
 </code> </code>
  
Ligne 19: Ligne 22:
 Faire le calcul pour les 10 valeurs de s dans {0, 0.1, 0.2, ..., 0.9} Faire le calcul pour les 10 valeurs de s dans {0, 0.1, 0.2, ..., 0.9}
  
-Pour chaque Gs obtenu, calculer les composantes connexes.+Pour chaque Gs obtenu, calculer les **composantes connexes**.
 Quelles sont les 10 composantes les plus grandes en nombre de noeuds et contenant au moins 4 années? Quelles sont les 10 composantes les plus grandes en nombre de noeuds et contenant au moins 4 années?
 Proposer un critère d'importance pour une composante et calculer les 10 composantes les plus importantes. Proposer un critère d'importance pour une composante et calculer les 10 composantes les plus importantes.
Ligne 31: Ligne 34:
  
  
-===Divers===+====Divers====
 [[https://spark.apache.org/docs/latest/api/scala/index.html#org.apache.spark.package| Spark API]], les [[https://spark.apache.org/docs/latest/api/sql/index.html|fonctions]] pour transformer un élément d'un Dataframe. [[https://spark.apache.org/docs/latest/api/scala/index.html#org.apache.spark.package| Spark API]], les [[https://spark.apache.org/docs/latest/api/sql/index.html|fonctions]] pour transformer un élément d'un Dataframe.
  
 Retour vers l'UE [[site:enseignement:master:bdle:start]] Retour vers l'UE [[site:enseignement:master:bdle:start]]
site/enseignement/master/bdle/tmes/projet2018.1547820023.txt.gz · Dernière modification : de hubert