Citation link: https://nbn-resolving.org/urn:nbn:de:hbz:467-4111
Files in This Item:
File Description SizeFormat
lorenz.pdf3.18 MBAdobe PDFThumbnail
View/Open
Dokument Type: Doctoral Thesis
metadata.dc.title: Modellierung des Online-Steerings von Gridjobs als Zugriffe auf verteilten gemeinsamen Speicher
Other Titles: Modeling online steering of Gridjobs as accesses to distributed shared memory
Authors: Lorenz, Daniel 
Institute: Fachgruppe Betriebssysteme und verteilte Systeme 
Free keywords: Online Steering, online steering
Dewey Decimal Classification: 004 Informatik
GHBS-Clases: TWPS
Issue Date: 2009
Publish Date: 2009
Abstract: 
Diese Arbeit beschäftigt sich mit dem Online-Steering von Gridjobs. Das Online-Steering wird in vier Teilaufgaben zerlegt: Die Kommunikation, die Datenkonsistenz, automatisierte Auswertungen und Optimierungen und der Datenzugriff.

Der Schwerpunkt dieser Arbeit liegt in der Teilaufgabe, die sich mit der Datenkonsistenz beschäftigt. Hierfür wird ein neues Konzept vorgestellt, das Online-Steering als Zugriffe auf Daten in einem virtuellen verteilten gemeinsamen Speicher betrachtet. Es werden die Intra-Prozess und die Inter-Prozess Bedingung identifiziert, die Regeln für den Datenaustausch definieren, die die Integrität der Daten sichern sollen. Je nach Anwendung müssen dafür beide Bedingungen erfüllt werden oder es reicht die Erfüllung der Intra-\Prozess Bedingung.

Ausgehend von den Integritätsbedingungen werden die Spezielle Schwache Konsistenz und die Verzögerte Schwache Konsistenz definiert, die die Intra-Prozess Bedingung erfüllen. Ferner wird, basierend auf einem CUMULVS-Algorithmus, die Zeitplan-Konsistenz definiert, die beide Bedingungen erfüllt. Zusätzlich kann es Daten geben, für die keine der beiden Bedingungen erfüllt sein muss. Bei der Speziellen Schwachen Konsistenz und der Verzögerten Schwachen Konsistenz müssen jeweils nur ein Steering-Prozess und ein Anwendungsprozess miteinander kommunizieren. Für beide Konsistenzmodelle wurde je ein Aktualisierungsprotokoll und ein Invalidierungsprotokoll entworfen und implementiert. Zusätzlich wurden auch ein Aktualisierungsprotokoll und ein Invalidierngsprotokoll für die PRAM-Konsistenz implementiert. Anhand dieser Implementierungen wurde das Laufzeitverhalten der Protokolle untersucht.

Bei der Evaluation wurde festgestellt, dass die Protokolle der Speziellen Schwachen Konsistenz, aufgrund der strengen Ordnung der Synchronisationspunkte, langsamer als die Protokolle der Verzögerten Schwachen Konsistenz sind. Dieser Unterschied verstärkt sich, wenn die Round-Trip-Zeit im Netzwerk wächst.

Um Online-Steering mit Gridjobs zu ermöglichen, muss mit dem Gridjob kommuniziert werden können. Es wurde in dieser Arbeit eine Kommunikationsschicht entwickelt, die eine sichere Kommunikation zum Gridjob aufbauen kann. Dabei sollte das Sicherheitskonzept der Site aufrecht erhalten werden können. Es wurden daher mehrere Szenarien entwickelt, die je nach Konfiguration der Site zum Einsatz kommen. Das zu verwendende Szenario kann dabei dynamisch ermittelt werden.

Der Durchsatz und die Round-Trip-Zeit der Kommunikationsschicht bei verschiedenen Szenarien und Sicherheitsstufen wird evaluiert.
Das Verhalten der Kommunikationsschicht kann mit einer Pipeline modelliert werden. Der Durchsatz wird von der Pipelinestufe mit dem geringsten Durchsatz bestimmt. Bei Netzwerken, wie sie zwischen den deutschen LCG-Sites bestehen, führt die Verwendung von Verschlüsselung zu einer Limitierung des Durchsatzes durch die Rechenzeit auf den sendenden und empfangenden Rechnern. Bei der Verwendung einer zweiten Sicherheitsschicht ohne Verschlüsselung, war bei eindirektionalem Datentransfer die Bandbreite limitierend. Wenn in beide Richtungen gleichzeitig gesendet wird, wird die Rechenzeit an den Endpunkten kritisch, da bei voll-duplex Netzwerken die Übermittlung von Daten mit maximaler Bandbreite in beiden Richtungen gleichzeitig erfolgen kann, während die Rechenzeit zum Ein- und Auspacken der Nachrichten sich addiert.

Zu der Round-Trip-Zeit fügt jede Komponente einen additiven Bestandteil bei. In Anbetracht der Round-Trip-Zeit zwischen zwei Sites sind die zusätzlichen Zeiten für einen Verbindungsdienst und die Sicherheitsschichten vernachlässigbar.

Die Optimierung und der Datenzugriff werden in wesentlich geringerem Umfang behandelt als die Datenkonsistenz und die Kommunikation. Die Optimierungsidee basierte auf der Annahme, dass die Netzwerkbandbreite den Durchsatz limitiert. Es soll zwischen dem Aktualisierungprotokoll und dem Invalidierungsprotokoll, dasjenige gewählt werden, dass die beste Perfromance bietet.

Bei dem Datenzugriff geht es darum, Datenzugriffe der Anwendung abzufangen und Methoden des Steering-Systems aufzurufen, so dass das Steering-System auf die Datenzugriffe reagieren kann. Hierbei werden zunächst einige Klassifizierungen vorgenommen, die sich darauf auswirken, wie das Steering-System auf diese Datenzugriffe reagieren kann oder soll.

Mit der Implementierung in RMOST können Jobs des ATLAS Experiments gesteuert werden.

In this work, four tasks for online steering are distinguished: Communication, data consistency, automated evaluation and optimization, and data access.

The focus of this work is on the data consistency task. For this task, a new model is presented, which views online steering as accesses to data in a virtual distributed shared memory. To ensure the consistency of the data, the intra-process condition and the inter-process condition are identified. Both define rules for the data exchange. Dependent on the requirements of the application, both conditions must be satisfied or only the intra-process condition must be satisfied.

Two consistency models are defined which satisfy the intra-process condition which are named special weak consistency and delayed weak consistency. Based on an algorithm from CUMULVS, the schedule consistency is defined which satisfies both conditions. Furthermore, data objects may exist for which none of the conditions must be fullfilled.

When using the special weak consistency or the delayed weak consistency, only pairs consisting of one application process and one steering process communicate. For both models, an update protocol and an invalidate protocol are developed and implemented. Additionally, an update protocol and an invalidate protocol for the PRAM consistency are implemented. With the implementations the behavior of the protocol was evaluated. Hereby, it was detected that the protocols of the special weak consistency were slower than the protocols of the delayed weak consistency. The performance difference increases if the round trip time in the network increases.

For online steering of Gridjobs, a possibility must exist to communicate with a Gridjob. In this work, a communication channel is developed which allow to establish a secure communication connection to a Gridjob without compromising the security of the site. Several scenarios are developed for establishing a communication channel, depending on the site's configuration. The appropriate scenario can be automatically detected.

The throughput and the round trip time of the communication channel are evaluated using different scenarios and security levels. The behavior of the communication channel can be modeled with a pipeline. The throughput is limited by the slowest pipeline stage. When using encryption, the throughput between German LCG-sites is limited by the computing time for encryption/decryption on the endpoints of the communication. When using two security levels without encryption, the bandwidth limits the throughput for one-directional data transfer. In the case of two-directional data transfer, the computing time at the endpoints can limit the throughput.

Every component adds a constant to the round trip time. Compared to the round trip time between sites, the additional contributions are negligible.

Optimization and data access are not discussed in the same level of detail than data consistency and communication. The presented optimization approaches are based on the assumption that the bandwidth are limiting the performance. The optimization selects the invalidate or update protocol based on predictions of their performance.

The goal of the data access task is, to intercept data accesses to steered date objects and call methods of the steering system in order to allow the steering system to react on data accesses. Hereby, classifications are made which discern the possibilities of the steering system to react on the data accesses.

With the implementation of the steering model in RMOST, jobs of the ATLAS experiment can be steered.
URN: urn:nbn:de:hbz:467-4111
URI: https://dspace.ub.uni-siegen.de/handle/ubsi/411
License: https://dspace.ub.uni-siegen.de/static/license.txt
Appears in Collections:Hochschulschriften

This item is protected by original copyright

Show full item record

Page view(s)

702
checked on Dec 27, 2024

Download(s)

142
checked on Dec 27, 2024

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.