Ressourcen

Konfiguration der Batchjobs für unterschiedliche Hardware

Standardmäßig werden Jobs auf dem gesamten Cluster und somit auf allen Arten von Knoten aller Phasen (Ausbaustufen) ausgeführt.

Damit Ihr Job auf einer bestimmten oder speziellen Hardware (-Ausstattung) zur Ausführung kommt, müssen Sie spezielle Ressourcen anfordern – wir unterscheiden grundsätzlich nach Prozessor-Typ und nach Akzelerator-Typ, aber auch nach Sektionen, wie in der nachfolgenden Tabelle aufgeführt.

Alle anderen Eigenschaften Ihrer Jobs wie Laufzeit und Speicherverbrauch werden automatisch auf die verschiedenen Knoten-Typen bzw. Sektionen des Clusters umverteilt.

Prozessor-Typ
Ressource Sektion Knotennamen Details
avx512 MPI 3 mpsc MPI-Sektion, LB 2 Phase I
NVD 3 gvqc, gaqc ACC-Sektion, LB 2 Phase I
MEM 3 mpqc MEM-Sektion, LB 2 Phase I
 
Beschleuniger-Typ
(wird über „Generic Resources“ ausgewählt, nicht mehr per „constraint/feature“)
GRes Beschleuniger-Typ Knotennamen Details
--gres=gpu Nvidia (allgemein) gvqc,
gaqc
ACC-Sektionen (alle)
--gres=gpu:v100 Nvidia Volta 100 gvqc ACC-Sektion, LB 2 Phase I
--gres=gpu:a100 Nvidia Ampere 100 gaqc ACC-Sektion, LB 2 Phase I
 
Sektionen
Ressource Sektionsname Knotennamen Details
mpi MPI mpsc MPI Sektionen (alle)
mem1536g MEM mpqc MEM Sektion, LB 2Phase I

Ressourcen können mit der Option -C („constraint“) angefordert und ausgewählt werden. Verschiedene Ressourcen können über ein & (logisches UND) bzw. ein | (logisches ODER) verknüpft werden.

Beispiele:

-C avx512
Fordert Knoten mit AVX512-Architektur an.
-C "avx512&mem1536"
Fordert Knoten mit AVX512-Architektur UND 1.5 TByte RAM an.
-C avx512
--gres=gpu:v100:2
Fordert Knoten mit AVX512-Architektur und 2 GPUs vom Typ „Volta 100“ an.