Next: Benutzerkommandos Up: DQS - Ein Previous: DQS - Ein

Funktionsweise

Das DQS-System wird von einem zentralen Prozeß gesteuert, dem qmaster. Er nimmt alle Jobs entgegen und legt sie zunächst auf einer Platte ab. Dann untersucht er, ob die von einem Job angeforderten Resourcen zur Verfügung stehen. Ist dies der Fall, wird der Job zu einer Maschine oder - bei Paralleljobs - zu mehreren Maschinen weitergeleitet, ansonsten wird er vom qmaster in einer Queue gehalten. Das Verteilen von Jobs auf Rechner geschieht dabei entweder gemäß der Auslastung oder einfach der Reihe nach, je nach Konfiguration des DQS-Systems.

Auf jedem am DQS beteiligten Rechner läuft ein Prozeß namens dqs_execd. Er nimmt die Jobs für seine Maschine vom qmaster an, führt sie aus, sammelt Accounting-Informationen, räumt am Ende auf und schickt die Ergebnisse an den qmaster zurück. Alle 150 s meldet er außerdem die aktuelle Load an den qmaster. Bekommt dieser einige Male keine solche Meldung, nimmt er an, daß der Rechner (oder der dqs_execd) abgestürzt ist, entfernt ihn aus seiner Tabelle möglicher Maschinen und startet die Batchjobs neu, die dort liefen.