SLURM Kommandos
Mit der aktuellen Cluster-Konfiguration müssen im Regelfall keine Partitionen (oder Queues) beim Abschicken* eines neuen Jobs angegeben werden – das erledigt Slurm weitestgehend automatisch anhand allgemeiner Job-Eigenschaften (z.B. max. Laufzeit und spezieller Ressourcen-Anforderung wie Akzeleratoren).
Nutzer mit mehreren Projekten müssen darauf achten, dass beim Abschicken neuer Rechenjobs die Projektzugehörigkeit korrekt spezifiziert wurde (z.B. mittels des Parameters -A <Projekt-Name>
).
sbatch <Job-Script>
Stellt einen neuen Job in eine Queue (Warteschlange) ein. Weitere wichtige Parameter des Kommandos und für die Job-Scripte findet man im obigen Reiter sbatch – Parameter.
Verschiedene ausführliche Beispiele für Job-Scripte findet man in den „Script“-Reitern oben.squeue
Zeigt den Stand und die Job-IDs aller wartenden und aktiven Jobs.sjobs <Job-ID>
Das ist ein spezielles TU Darmstadt Script und zeigt detaillierte Informationen über alle Jobs bzw. über den Job (Job-ID) an.scancel <Job-ID<
Löscht einen Job aus der Warteschlange oder beendet einen aktiven Job.scancel -u <TU-ID>
Löscht/beendet alle eigenen Jobs.
csreport
Das ist ein spezielles TU Darmstadt Script und zeigt für die vergangenen Monate und für alle ihre Projekte den Gesamtverbrauch (im Vergleich zu den beantragten Ressourcen) in Core*Stunden pro Monat an. Für den aktuellen Monat wird zusätzlich auch ihr eigener Nutzeranteil gezeigt (für Projekte mit mehreren Nutzern wichtig).sreport
Das ist das Slurm-Standardkommando zum Anzeigen des Ressourcen-Verbrauchs zu jedem ihrer Projekte.
Achtung: Die Angaben erfolgen hier in Core*Minuten.- Mit diesem Standardkommando kann man auch selektiv für einen bestimmten Zeitraum die Werte anzeigen.
Dazu müssen die Parametercluster Account
, sowie der Start- und Ende-Zeitpunkt angegeben werden. Nachfolgendes Beispiel zeigt die Core-Minuten für den Monat April 2016:sreport cluster Account Start=2016-04-01 End=2016-05-01
- Mit diesem Standardkommando kann man auch selektiv für einen bestimmten Zeitraum die Werte anzeigen.
csum
Das ist ein spezielles TU Darmstadt Script und zeigt für alle ihre Projekte den aktuellen Gesamtverbrauch (im Vergleich zu den genehmigten Ressourcen) an Core*Stunden an.
* außer Nutzer in Kursen oder Lehrveranstaltungen.