site:enseignement:master:bdle:tmes:projet2020
Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
site:enseignement:master:bdle:tmes:projet2020 [24/11/2020 18:17] – [Modalités] amine | site:enseignement:master:bdle:tmes:projet2020 [14/12/2020 09:47] (Version actuelle) – [Modalités] amine | ||
---|---|---|---|
Ligne 24: | Ligne 24: | ||
===== Projet 2 ===== | ===== Projet 2 ===== | ||
- | en construction ... | + | Le notebook des réponses devra contenir les informations suivantes : |
- | rajouter notebook | + | * Nom(s) |
+ | * Description des données utilisées | ||
+ | * Source : lien vers la source publique des données ou lien de téléchargement si pas de lien publique | ||
+ | * Taille : en MB et en nb_lignes | ||
+ | * Description breve des données, quelle est la variable à prédire | ||
+ | * L' | ||
+ | |||
==== Modalités ==== | ==== Modalités ==== | ||
- | Rendre | + | Rendre |
- | Date de remise : **10-12-2020** | + | - un document pdf avec lien vers un **notebook** Databricks contenant **code source** et **informations** décrites ci-haut |
+ | | ||
+ | Date de remise : à partir du **10-12-2020** jusqu' | ||
+ | [[https:// | ||
- | Le sujet traité est la réalisation d’un pipeline ML pour entrainer un arbre de décision pour la *régression* à l’aide de l'API Spark ML décrite en cours, | + | Le sujet traité est la réalisation d’un pipeline ML pour entrainer un arbre de décision pour la *régression* à l’aide de l'API Spark ML décrite en cours, |
L' | L' | ||
Vous être libre d' | Vous être libre d' | ||
Ligne 55: | Ligne 64: | ||
Préciser quelles variables donnent lieux à des " | Préciser quelles variables donnent lieux à des " | ||
- | Si besoin, transforer | + | A titre d' |
- | Construire une paire 30%-70%d de jeux de test et d' | + | Construire une paire 30%-70% de jeux de test et d' |
Lancer l' | Lancer l' | ||
Ligne 75: | Ligne 84: | ||
* sélectionner un sous-ensembles des données en suivant également des critères qui vous semblent pertinents (valeurs aberrantes, prediction trop imprecise) | * sélectionner un sous-ensembles des données en suivant également des critères qui vous semblent pertinents (valeurs aberrantes, prediction trop imprecise) | ||
- | * Imputation des valeurs manquantes (utiliser fonctions | + | * Imputation des valeurs manquantes |
* Toute autre astuce qui vous semble utile | * Toute autre astuce qui vous semble utile | ||
Ligne 82: | Ligne 91: | ||
=== Tache 4 === | === Tache 4 === | ||
- | Donner succinctement votre avis sur la libraire ML : difficultés rencontrées, | + | Donner succinctement votre avis sur la libraire ML : difficultés rencontrées, |
site/enseignement/master/bdle/tmes/projet2020.1606238235.txt.gz · Dernière modification : de amine