SLURM Kommandos

SLURM Kommandos

Mit der aktuellen Cluster-Konfiguration müssen im Regelfall keine Partitionen (oder Queues) beim Abschicken* eines neuen Jobs angegeben werden – das erledigt Slurm weitestgehend automatisch anhand allgemeiner Job-Eigenschaften (z.B. max. Laufzeit und spezieller Ressourcen-Anforderung wie Akzeleratoren).

Nutzer mit mehreren Projekten müssen darauf achten, dass beim Abschicken neuer Rechenjobs die Projektzugehörigkeit korrekt spezifiziert wurde (z.B. mittels des Parameters -A <Projekt-Name>).

  • sbatch <Job-Script>
    Stellt einen neuen Job in eine Queue (Warteschlange) ein. Weitere wichtige Parameter des Kommandos und für die Job-Scripte findet man im obigen Reiter sbatch – Parameter.
    Verschiedene ausführliche Beispiele für Job-Scripte findet man in den „Script“-Reitern oben.
  • squeue
    Zeigt den Stand und die Job-IDs aller wartenden und aktiven Jobs.
  • sjobs <Job-ID>
    Das ist ein spezielles TU Darmstadt Script und zeigt detaillierte Informationen über alle Jobs bzw. über den Job (Job-ID) an.
  • scancel <Job-ID<
    Löscht einen Job aus der Warteschlange oder beendet einen aktiven Job.
    • scancel -u <TU-ID>
      Löscht/beendet alle eigenen Jobs.
  • csreport
    Das ist ein spezielles TU Darmstadt Script und zeigt für die vergangenen Monate und für alle ihre Projekte den Gesamtverbrauch (im Vergleich zu den beantragten Ressourcen) in Core*Stunden pro Monat an. Für den aktuellen Monat wird zusätzlich auch ihr eigener Nutzeranteil gezeigt (für Projekte mit mehreren Nutzern wichtig).
    • sreport
      Das ist das Slurm-Standardkommando zum Anzeigen des Ressourcen-Verbrauchs zu jedem ihrer Projekte.
      Achtung: Die Angaben erfolgen hier in Core*Minuten.
      • Mit diesem Standardkommando kann man auch selektiv für einen bestimmten Zeitraum die Werte anzeigen.
        Dazu müssen die Parameter cluster Account, sowie der Start- und Ende-Zeitpunkt angegeben werden. Nachfolgendes Beispiel zeigt die Core-Minuten für den Monat April 2016:
        sreport cluster Account Start=2016-04-01 End=2016-05-01
  • csum
    Das ist ein spezielles TU Darmstadt Script und zeigt für alle ihre Projekte den Gesamtverbrauch (im Vergleich zu den beantragten Ressourcen) in Core*Stunden in Summe an.

* außer Nutzer in Kursen oder Lehrveranstaltungen.