Skip to content

Commit ef3ce74

Browse files
authored
Merge pull request #41 from corrections-a25
Corrections A25
2 parents a75ab8e + 1bb150f commit ef3ce74

15 files changed

Lines changed: 3816 additions & 77 deletions

File tree

doc/en/conf.py

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -54,7 +54,7 @@
5454
html_theme = 'sphinx_book_theme'
5555
html_theme_options = {
5656
'logo': {
57-
'text': 'Running jobs: resources and monitoring (CIP201)',
57+
'text': 'Job monitoring and resource estimation (CIP201)',
5858
'image_light': '../images/logo.png'
5959
}
6060
}

doc/en/index.rst

Lines changed: 4 additions & 4 deletions
Original file line numberDiff line numberDiff line change
@@ -1,10 +1,10 @@
1-
Running jobs: resources and monitoring
1+
Job monitoring and resource estimation
22
======================================
33

44
`Français <../fr/index.html>`_
55

66
This intermediate-level workshop (CIP201) is the continuation of *First steps on
7-
compute clusters* (CIP101); we explore in details certain key aspects of
7+
supercomputers* (CIP101); we explore in details certain key aspects of
88
high-performance computing.
99

1010
The workshop begins with a review of the **job scheduler**. :doc:`What is it
@@ -18,8 +18,8 @@ The next section introduces the two **types of compute jobs**. :doc:`Serial jobs
1818
<task-types/serial>` are the simplest. :doc:`Parallel jobs
1919
<task-types/parallel>` deserve a more in-depth presentation, including the
2020
differences between multi-threaded and MPI programs. Data parallelism is briefly
21-
discussed and is the topic of a subsequent workshop, `Data parallelism on the
22-
clusters <https://calculquebec.github.io/cq-formation-cip202/en/index.html>`__
21+
discussed and is the topic of a subsequent workshop, `Managing large batches of
22+
jobs <https://calculquebec.github.io/cq-formation-cip202/en/index.html>`__
2323
(CIP202).
2424

2525
**Estimating the resources required** for a compute job can be challenging! This

doc/en/monitoring/interactive-sessions.rst

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -6,7 +6,7 @@ Interactive sessions
66
We have already presented several tools to analyse compute jobs. Scheduler
77
commands ``seff`` and ``sacct`` show information about completed jobs. To
88
monitor running jobs, we have seen how to connect to a compute node with
9-
``ssh``, and there use the ``top`` task manager.
9+
``srun`` or ``ssh``, and there use the ``top`` task manager.
1010

1111
Interactive sessions are yet another tool, which is especially well-suited for
1212
series of short tests. For instance, when analysing a program’s scalability, you

doc/en/task-types/parallel.rst

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -320,7 +320,7 @@ Exercise
320320
#. Compile the ``pi`` program with the ``make`` command.
321321
#. Start an interactive job with ``salloc [...] --time=00:10:00``.
322322
Replace ``[...]`` by the parallelism options necessary for an MPI program
323-
and ask for 2 CPU cores.
323+
and ask for 1 node and 2 CPU cores.
324324
#. Run the program in the background with ``mpirun ./pi &``.
325325
#. While ``pi`` runs, check its CPU usage with ``top -u $USER`` and ``top -u
326326
$USER -H``.

doc/fr/conf.py

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -54,7 +54,7 @@
5454
html_theme = 'sphinx_book_theme'
5555
html_theme_options = {
5656
'logo': {
57-
'text': 'Tâches de calcul : Ressources et suivi (CIP201)',
57+
'text': 'Suivi des tâches de calcul et estimation des ressources (CIP201)',
5858
'image_light': '../images/logo.png'
5959
}
6060
}

doc/fr/index.rst

Lines changed: 7 additions & 7 deletions
Original file line numberDiff line numberDiff line change
@@ -1,10 +1,10 @@
1-
Tâches de calcul : ressources et suivi
2-
======================================
1+
Suivi des tâches de calcul et estimation des ressources
2+
=======================================================
33

44
`English <../en/index.html>`_
55

66
Cet atelier de niveau intermédiaire (CIP201) est la suite de *Premiers pas sur
7-
les grappes de calcul* (CIP101). Nous y explorons plus en profondeur certains
7+
les superordinateurs* (CIP101). Nous y explorons plus en profondeur certains
88
aspects clés du calcul informatique de pointe.
99

1010
L’atelier débute par un rappel sur **l’ordonnanceur de tâches**. :doc:`À quoi
@@ -16,13 +16,13 @@ cours de l’atelier précédent, cette section vous servira de référence pend
1616
les exercices.
1717

1818
La section suivante présente les deux **types de tâches de calcul**. Les
19-
:doc:`tâches sérielles <task-types/serial>` sont les plus simples. Les
19+
:doc:`tâches séquentielles <task-types/serial>` sont les plus simples. Les
2020
:doc:`tâches parallèles <task-types/parallel>`, pour leur part, méritent une
2121
discussion plus approfondie, incluant la différence entre les programmes
2222
parallèles multi-fils et MPI. Le parallélisme de données est mentionné
23-
brièvement et fait l’objet d’un atelier subséquent, `Parallélisme de données sur
24-
les grappes
25-
<https://calculquebec.github.io/cq-formation-cip202/fr/index.html>`__ (CIP202).
23+
brièvement et fait l’objet d’un atelier subséquent, `Gestion de grands lots de
24+
tâches <https://calculquebec.github.io/cq-formation-cip202/fr/index.html>`__
25+
(CIP202).
2626

2727
**Estimer les ressources requises** pour une tâche de calcul peut être un défi !
2828
Cette section discute du :doc:`temps <resources/time>` de calcul, de la

doc/fr/monitoring/interactive-sessions.rst

Lines changed: 6 additions & 6 deletions
Original file line numberDiff line numberDiff line change
@@ -6,8 +6,8 @@ Sessions interactives
66
Nous avons présenté plusieurs outils pour analyser les tâches de calcul. Les
77
commandes de l’ordonnanceur ``seff`` et ``sacct`` affichent de l’information sur
88
les tâches complétées. Pour le suivi des tâches actives, nous avons vu comment
9-
se connecter à un nœud de calcul avec ``ssh`` et y utiliser le gestionnaire de
10-
tâches ``top``.
9+
se connecter à un nœud de calcul avec ``srun`` ou ``ssh`` et y utiliser le
10+
gestionnaire de tâches ``top``.
1111

1212
Les sessions interactives sont un autre outil, particulièrement approprié pour
1313
des séries de courts tests. Par exemple, si vous analysez la scalabilité d’un
@@ -50,8 +50,8 @@ Démonstration
5050
- L’option ``--mem=0`` demande toute la mémoire du nœud et ne devrait être
5151
utilisée que lorsque l’on demande un nœud complet.
5252

53-
2. Tester le programme en mode sériel
54-
'''''''''''''''''''''''''''''''''''''
53+
2. Tester le programme en mode séquentiel
54+
'''''''''''''''''''''''''''''''''''''''''
5555

5656
.. code-block:: console
5757
:emphasize-lines: 1,4,10
@@ -83,7 +83,7 @@ Démonstration
8383

8484
Précédemment, nous avons vu que la commande ``srun`` est nécessaire pour
8585
lancer des programmes MPI. ``srun`` peut aussi être utilisée avec n’importe
86-
quel autre programme, sériel ou parallèle, multi-fils ou MPI.
86+
quel autre programme, séquentiel ou parallèle, multi-fils ou MPI.
8787

8888
3. Tester différents nombres de cœurs CPU
8989
'''''''''''''''''''''''''''''''''''''''''
@@ -147,7 +147,7 @@ Démonstration
147147
- Nombre de cœurs CPU : :math:`n`
148148
- Temps : :math:`t`
149149
- Performance : :math:`P_n = \text{points} / t`
150-
- Accélération : :math:`S_n = t_\text{sériel} / t_n`
150+
- Accélération : :math:`S_n = t_\text{séquentiel} / t_n`
151151
- Efficacité : :math:`E_n = S_n / n`
152152

153153
Remarques

doc/fr/resources/cpu.rst

Lines changed: 7 additions & 6 deletions
Original file line numberDiff line numberDiff line change
@@ -5,8 +5,8 @@ Cœurs CPU
55

66
Les cœurs CPU sont une ressource analysée diféremment du temps ou de la mémoire.
77
Pour les tâches parallèles, il faut bien sûr choisir un nombre de cœurs.
8-
Toutefois, aussi bien pour les tâches sérielles que parallèles, il importe de
9-
vérifier que le CPU est bien utilisé.
8+
Toutefois, aussi bien pour les tâches séquentielles que parallèles, il importe
9+
de vérifier que le CPU est bien utilisé.
1010

1111
Pourquoi vérifier l’utilisation du CPU ?
1212
----------------------------------------
@@ -129,11 +129,12 @@ paramètres tels que la taille des données d’entrée.
129129

130130
On quantifie la scalabilité avec deux grandeurs : l’accélération et
131131
l’efficacité. Pour :math:`n` cœurs CPU, l’accélération (*speedup*, :math:`S`)
132-
est le ratio du temps d’exécution sériel sur le temps d’exécution parallèle :
132+
est le ratio du temps d’exécution séquentiel sur le temps d’exécution
133+
parallèle :
133134

134135
.. math::
135136
136-
S_n = \frac{t_\text{sériel}}{t_n}
137+
S_n = \frac{t_\text{séquentiel}}{t_n}
137138
138139
Par exemple, si un calcul requiert 10 minutes avec 1 cœur CPU et 6 minutes avec
139140
2, l’accélaration est de 1,67. C’est donc une mesure de « combien de fois plus
@@ -167,7 +168,7 @@ peut être calculée à partir de la performance plutôt que du temps de calcul
167168

168169
.. math::
169170
170-
S_n = \frac{P_{n}}{P_\text{sérielle}}
171+
S_n = \frac{P_{n}}{P_\text{séquentielle}}
171172
172173
.. _scalability-exercise:
173174

@@ -227,7 +228,7 @@ Pourquoi l’efficacité n’est-elle pas linéaire ?
227228
La scalabilité est limitée par la fraction du programme qui calcule en parallèle
228229
(voir figure ci-dessous). C’est ce qu’on appelle la `loi d’Amdahl
229230
<https://fr.wikipedia.org/wiki/Loi_d%27Amdahl>`__. Un programme parallèle peut
230-
avoir une fraction sérielle pour une variété de raisons :
231+
avoir une fraction séquentielle pour une variété de raisons :
231232

232233
- Lecture non parallèle d’un fichier d’entrée ou mise à jour d’un fichier de
233234
sortie.

doc/fr/resources/memory.rst

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -69,7 +69,7 @@ JobID,JobName,NTasks,AveRSS,MaxRSS``.
6969
- ``MaxRSS`` : le pic d’utilisation mémoire du processus qui en a utilisé
7070
le plus.
7171

72-
Pour les tâches sérielles et multi-fils, ``AveRSS`` et ``MaxRSS`` sont
72+
Pour les tâches séquentielles et multi-fils, ``AveRSS`` et ``MaxRSS`` sont
7373
identiques et correspondent au pic d’utilisation mémoire mesuré.
7474

7575
Pour les tâches MPI, le pic d’utilisation mémoire peut être estimé par

doc/fr/task-types/parallel.rst

Lines changed: 4 additions & 4 deletions
Original file line numberDiff line numberDiff line change
@@ -337,7 +337,7 @@ Exercice
337337
#. Compilez le programme ``pi`` avec la commande ``make``.
338338
#. Démarrez une tâche interactive avec ``salloc [...] --time=00:10:00``.
339339
Remplacez ``[...]`` par les options de parallélisme nécessaires pour une
340-
tâche MPI et demandez 2 cœurs CPU.
340+
tâche MPI et demandez 1 nœud et 2 cœurs CPU.
341341
#. Exécutez le programme en arrière-plan avec ``mpirun ./pi &``.
342342
#. Pendant que ``pi`` s’exécute, observez sa consommation CPU avec ``top -u
343343
$USER`` et ``top -u $USER -H``.
@@ -465,9 +465,9 @@ parallélisme.
465465
Autres types de parallélisme
466466
----------------------------
467467

468-
Le parallélisme de données consiste à répéter une tâche sérielle ou parallèle
469-
avec différentes données d’entrées, par exemple des images, molécules ou
470-
séquences d’ADN. Alors que l’objectif du parallélisme dans une tâche est de
468+
Le parallélisme de données consiste à répéter une tâche séquentielle ou
469+
parallèle avec différentes données d’entrées, par exemple des images, molécules
470+
ou séquences d’ADN. Alors que l’objectif du parallélisme dans une tâche est de
471471
réduire le temps de calcul nécessaire à cette tâche, le parallélisme de données
472472
vise à augmenter le débit de calcul en exécutant de multiples tâches
473473
simultanément. Nous convrirons ce sujet en détails dans l’atelier *Parallélisme

0 commit comments

Comments
 (0)