Next: Funktionsweise Up: Zentrale Systeme Previous: Convex/HP-Meta-Cluster

DQS - Ein Batchsystem für Workstation-Cluster

DQS - das Distributed Queueing System - wurde am Supercomputer Computations Research Institute der Florida State University entwickelt, um auf effektive Weise die möglichst gleichmäßige Verteilung von Batchjobs auf mehrere UNIX-Workstations zu erreichen. Außerdem ermöglicht es Besitzern von Workstations, ihre Maschinen in eine DQS-Konfiguration einzubinden oder wieder herauszunehmen. DQS wird inzwischen an vielen Rechenzentren auf ihren Workstation-Clustern eingesetzt; es ist über ftp erhältlich von mufus.rz.tu-harburg.de bzw. direkt von ftp.scri.fsu.edu. Die aktuelle Version ist 2.1.5.

Grundlegende Konzepte im DQS sind die Queue und die Gruppe. Eine Queue ist eine gewöhnliche Batchqueue. Jede Queue befindet sich auf einer bestimmten Maschine, kann aber von allen am DQS beteiligten Rechnern aus erreicht werden. Eine Gruppe ist eine Menge mehrerer Queues, die alle zu Maschinen der gleichen Architektur gehören. Ein Benutzer schickt seinen Job normalerweise an eine Gruppe, DQS sendet den Job dann an eine freie Queue aus dieser Gruppe weiter. Sind alle Queues einer Gruppe belegt, wird der Job zentral gehalten und erst dann einer (maschinenspezifischen) Queue zugeteilt, wenn sie frei ist. Auf diese Weise kann ein dynamisches Verteilen der Last auf einem Cluster realisiert werden.