Merge pull request #10 from calculquebec/rev/h26/chap2

plstonge · web-flow · commit 5016db06cff1 · 2026-05-29T11:53:35.000-04:00
Révision du chapitre 2 selon le feedback H26
diff --git a/src/02-selection.ipynb b/src/02-selection.ipynb
@@ -250,70 +250,6 @@
     "surveys_df.loc[[0, 10], :]"
    ]
   },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "id": "2e2d84c1-c559-4302-94ff-ff1a31fcf43b",
-   "metadata": {
-    "lang": "fr",
-    "tags": [
-     "soln"
-    ]
-   },
-   "outputs": [],
-   "source": [
-    "# Erreur 1 - Qu'arrive-t-il si on exécute le code ci-dessous?\n",
-    "surveys_df.loc[[0, 10, 35548], :]"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "id": "384110f3-b095-48f5-85bc-646a8f7ea029",
-   "metadata": {
-    "lang": "fr",
-    "tags": [
-     "exer"
-    ]
-   },
-   "outputs": [],
-   "source": [
-    "# Erreur 1 - Qu'arrive-t-il si on exécute le code ci-dessous?\n",
-    "surveys_df.loc[[0, 10, 35549], :]"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "id": "20a4e3b6-56e1-4ba2-a177-9c273ff08e9b",
-   "metadata": {
-    "lang": "en",
-    "tags": [
-     "soln"
-    ]
-   },
-   "outputs": [],
-   "source": [
-    "# Error 1 - What happens when you type the code below?\n",
-    "surveys_df.loc[[0, 10, 35548], :]"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "id": "7643732e-f87e-4be8-90d7-6b40d139c32c",
-   "metadata": {
-    "lang": "en",
-    "tags": [
-     "exer"
-    ]
-   },
-   "outputs": [],
-   "source": [
-    "# Error 1 - What happens when you type the code below?\n",
-    "surveys_df.loc[[0, 10, 35549], :]"
-   ]
-  },
   {
    "cell_type": "code",
    "execution_count": null,
@@ -326,7 +262,7 @@
    },
    "outputs": [],
    "source": [
-    "# Erreur 2 - Qu'arrive-t-il si on exécute le code ci-dessous?\n",
+    "# Erreur - Qu'arrive-t-il si on exécute le code ci-dessous?\n",
     "surveys_df.loc[0:4, 'month':'plot_id']"
    ]
   },
@@ -342,7 +278,7 @@
    },
    "outputs": [],
    "source": [
-    "# Erreur 2 - Qu'arrive-t-il si on exécute le code ci-dessous?\n",
+    "# Erreur - Qu'arrive-t-il si on exécute le code ci-dessous?\n",
     "surveys_df.loc[0:4, 1:4]  # 'month':'plot_id'"
    ]
   },
@@ -358,7 +294,7 @@
    },
    "outputs": [],
    "source": [
-    "# Error 2 - What happens when you type the code below?\n",
+    "# Error - What happens when you type the code below?\n",
     "surveys_df.loc[0:4, 'month':'plot_id']"
    ]
   },
@@ -374,7 +310,7 @@
    },
    "outputs": [],
    "source": [
-    "# Error 2 - What happens when you type the code below?\n",
+    "# Error - What happens when you type the code below?\n",
     "surveys_df.loc[0:4, 1:4]  # 'month':'plot_id'"
    ]
   },
@@ -387,10 +323,10 @@
    "source": [
     "### Exercice - Une sélection de données\n",
     "Obtenez la moyenne des **longueurs d'arrière-pieds** et\n",
-    "des **poids** de chaque **espèce** de `'NL'` à `'PB'` :\n",
+    "des **poids** pour les **espèces** `'NL'` et `'PB'` :\n",
     "\n",
     "1. Commencez par sélectionner uniquement les colonnes requises.\n",
-    "2. À la fin, sélectionnez les lignes de `'NL'` à `'PB'`.\n",
+    "2. À la fin, sélectionnez les lignes `'NL'` et `'PB'`.\n",
     "\n",
     "(3 min.)"
    ]
@@ -404,10 +340,10 @@
    "source": [
     "### Exercise - Selecting data\n",
     "Get the average **hindfoot lengths** and\n",
-    "**weights** of each **species** from `'NL'` to `'PB'`:\n",
+    "**weights** for the **species** `'NL'` and `'PB'`:\n",
     "\n",
     "1. Start by selecting only the required columns.\n",
-    "2. At the end, select the rows from `'NL'` to `'PB'`.\n",
+    "2. At the end, select the rows for `'NL'` and `'PB'`.\n",
     "\n",
     "(3 min.)"
    ]
@@ -425,7 +361,7 @@
    "outputs": [],
    "source": [
     "colonnes = ['species_id', 'hindfoot_length', 'weight']\n",
-    "surveys_df[colonnes].groupby('species_id').mean().loc['NL':'PB', :]"
+    "surveys_df[colonnes].groupby('species_id').mean().loc[['NL', 'PB'], :]"
    ]
   },
   {
@@ -457,7 +393,7 @@
    "outputs": [],
    "source": [
     "columns = ['species_id', 'hindfoot_length', 'weight']\n",
-    "surveys_df[columns].groupby('species_id').mean().loc['NL':'PB', :]"
+    "surveys_df[columns].groupby('species_id').mean().loc[['NL', 'PB'], :]"
    ]
   },
   {
@@ -658,7 +594,7 @@
     "    (surveys_df['year'] == 1991) |\n",
     "    (surveys_df['year'] == 1996) |\n",
     "    (surveys_df['year'] == 2001)\n",
-    "].shape"
+    "]"
    ]
   },
   {
@@ -675,7 +611,7 @@
     "    (surveys_df['year'] == 1991) |\n",
     "    (surveys_df['year'] == 1996) |\n",
     "    (surveys_df['year'] == 2001)\n",
-    "].shape"
+    "]"
    ]
   },
   {
@@ -690,7 +626,7 @@
     "# Sélection de trois années avec isin()\n",
     "surveys_df[\n",
     "    surveys_df['year'].isin([1991, 1996, 2001])\n",
-    "].shape"
+    "]"
    ]
   },
   {
@@ -705,7 +641,7 @@
     "# Selection of three years with isin()\n",
     "surveys_df[\n",
     "    surveys_df['year'].isin([1991, 1996, 2001])\n",
-    "].shape"
+    "]"
    ]
   },
   {
@@ -870,11 +806,11 @@
    },
    "source": [
     "`2`. Calculez la moyenne des poids\n",
-    "selon le site (`plot_id`) et le sexe :\n",
+    "selon l'espèce (`species_id`) et le sexe :\n",
     "* Créez une sélection contenant seulement :\n",
     "  * Les observations ayant une valeur de sexe `F` ou `M`\n",
     "    et ayant un poids supérieur à `0`;\n",
-    "  * Les colonnes de poids, de site et de sexe.\n",
+    "  * Les colonnes de poids, d'espèce et de sexe.\n",
     "* Groupez les données et calculez les moyennes de poids.\n",
     "\n",
     "(5 min.)"
@@ -887,11 +823,11 @@
     "lang": "en"
    },
    "source": [
-    "`2`. Get the average weight by site (`plot_id`) and sex:\n",
+    "`2`. Get the average weight by species (`species_id`) and sex:\n",
     "* Create a selection that contains only:\n",
     "  * The observations that are of sex `F` or `M`\n",
     "    and where weight values are greater than `0`;\n",
-    "  * The weight, the site and the sex columns.\n",
+    "  * The weight, the species and the sex columns.\n",
     "* Group the data and compute the average weights.\n",
     "\n",
     "(5 min.)"
@@ -912,7 +848,7 @@
     "# Sélection des enregistrements et des colonnes nécessaires\n",
     "cond_sexe = surveys_df['sex'].isin(['F', 'M'])\n",
     "cond_poids = surveys_df['weight'] > 0\n",
-    "colonnes = ['weight', 'plot_id', 'sex']\n",
+    "colonnes = ['weight', 'species_id', 'sex']\n",
     "\n",
     "selection = surveys_df.loc[cond_sexe & cond_poids, colonnes]\n",
     "selection.tail()"
@@ -933,7 +869,7 @@
     "# Sélection des enregistrements et des colonnes nécessaires\n",
     "cond_sexe = surveys_df['sex'].isin(['F', 'M'])\n",
     "cond_poids = surveys_df['weight'] ###\n",
-    "colonnes = ['weight', 'plot_id', 'sex']\n",
+    "colonnes = ['weight', 'species_id', 'sex']\n",
     "\n",
     "selection = surveys_df###\n",
     "selection.tail()"
@@ -954,7 +890,7 @@
     "# Selection of the data with isin()\n",
     "sex_mask = surveys_df['sex'].isin(['F', 'M'])\n",
     "weight_mask = surveys_df['weight'] > 0\n",
-    "columns = ['weight', 'plot_id', 'sex']\n",
+    "columns = ['weight', 'species_id', 'sex']\n",
     "\n",
     "selection = surveys_df.loc[sex_mask & weight_mask, columns]\n",
     "selection.tail()"
@@ -975,7 +911,7 @@
     "# Selection of the data with isin()\n",
     "sex_mask = surveys_df['sex'].isin(['F', 'M'])\n",
     "weight_mask = surveys_df['weight'] ###\n",
-    "columns = ['weight', 'plot_id', 'sex']\n",
+    "columns = ['weight', 'species_id', 'sex']\n",
     "\n",
     "selection = surveys_df###\n",
     "selection.tail()"
@@ -993,9 +929,9 @@
    },
    "outputs": [],
    "source": [
-    "# Grouper selon les sites et les sexes, calculer les moyennes\n",
-    "moy_par_site_sexe = selection.groupby(['plot_id', 'sex']).mean()\n",
-    "moy_par_site_sexe.tail()"
+    "# Grouper selon les espèces et les sexes, calculer les moyennes\n",
+    "moy_par_espece_sexe = selection.groupby(['species_id', 'sex']).mean()\n",
+    "moy_par_espece_sexe.tail()"
    ]
   },
   {
@@ -1010,9 +946,9 @@
    },
    "outputs": [],
    "source": [
-    "# Grouper selon les sites et les sexes, calculer les moyennes\n",
-    "moy_par_site_sexe = selection###\n",
-    "moy_par_site_sexe.tail()"
+    "# Grouper selon les espèces et les sexes, calculer les moyennes\n",
+    "moy_par_espece_sexe = ###.groupby(['species_id', 'sex']).mean()\n",
+    "moy_par_espece_sexe.tail()"
    ]
   },
   {
@@ -1027,9 +963,9 @@
    },
    "outputs": [],
    "source": [
-    "# Calculate the mean weight for each plot_id and sex combination: \n",
-    "avg_by_site_sex = selection.groupby(['plot_id', 'sex']).mean()\n",
-    "avg_by_site_sex.tail()"
+    "# Calculate the mean weight for each species_id and sex combination\n",
+    "avg_by_species_sex = selection.groupby(['species_id', 'sex']).mean()\n",
+    "avg_by_species_sex.tail()"
    ]
   },
   {
@@ -1044,9 +980,9 @@
    },
    "outputs": [],
    "source": [
-    "# Calculate the mean weight for each plot_id and sex combination: \n",
-    "avg_by_site_sex = selection###\n",
-    "avg_by_site_sex.tail()"
+    "# Calculate the mean weight for each species_id and sex combination\n",
+    "avg_by_species_sex = ###.groupby(['species_id', 'sex']).mean()\n",
+    "avg_by_species_sex.tail()"
    ]
   },
   {