Kategorie:OLAP

Aus Wikipalo

Share/Save/Bookmark(Weitergeleitet von MOLAP)
Wechseln zu: Navigation, Suche

OLAP ist die Abkürzung von "Online Analytical Processing". OLAP-Datenbanken sind also zunächst alle Datenbanken, die für Ad-hoc-Reports, Planung und Analyse verwendet werden. Pendse und Creeth stellten 1995 (Lit.: Pendse) unter dem Akronym FASMI fünf herstellerunabhängige Evaluierungsregeln auf, um damit das OLAP-Konzept zu beschreiben. FASMI steht für „Fast Analysis of Shared Multidimensional Information“ und besagt im Einzelnen:

  • Fast: Abfragen sollen durchschnittlich fünf Sekunden dauern dürfen. Dabei sollen einfache Abfragen nicht länger als eine Sekunde und nur wenige, komplexere Abfragen bis zu 20 Sekunden Verarbeitungszeit beanspruchen.
  • Analysis: Ein OLAP-System soll jegliche benötigte Logik bewältigen können. Dabei soll die Definition einer komplexeren Analyseabfrage durch den Anwender mit wenig Programmieraufwand zu realisieren sein.
  • Shared: Ein OLAP-System soll für den Mehrbenutzerbetrieb ausgelegt sein. Dies bedingt eine Verfügbarkeit geeigneter Zugriffsschutzmechanismen.
  • Multidimensional: Als Hauptkriterium fordern Pendse und Creeth eine mehrdimensionale Strukturierung der Daten mit voller Unterstützung der Dimensionshierarchien.
  • Information: Bei der Analyse sollen einem Anwender alle benötigten Daten transparent zur Verfügung stehen. Eine Analyse darf nicht durch Beschränkungen des OLAP-Systems beeinflusst werden.


Es gibt drei Arten von OLAP-Datenbanktechnologie:

  • ROLAP heißt "relationales OLAP". Die Daten liegen in einer relationalen Datenbank.
  • MOLAP heißt "multidemensionales OLAP". Wir kommen weiter unten genauer darauf zurück.
  • HOLAP ist eine Mischung aus beiden. Ziel ist es, die Vorteile von ROLAP und MOLAP zu verbinden.


MOLAP hat sich als das praxistauglichste Konzept erwiesen. Wenn von OLAP-Datenbanken die Rede ist, meint man daher in der Regel MOLAP. Auch Palo ist eine MOLAP-Datenbank.


Relationale Datenbanken werden vorwiegend verwendet für Produktivsysteme wie Buchhaltung, Logistik, Produktionsprozeßsteuerung oder Warenwirtschaftssysteme. Die Daten liegen in Datensätzen vor, welche zeilenorientiert in Tabellen zusammengefasst sind. OLAP-Systeme, die mit relationaler Technologie arbeiten, bereiten die Daten zwar in einer multidimensionalen Struktur auf, die Daten selbst bleiben aber datenbanktechnisch relational organisiert. Diese Technologie ist besonders geeignet, wenn es bei einem OLAP-System auf große Detailtiefe ankommt und Performance nicht ausschlaggebend ist.


Multidimensionale Datenbanken hingegen sind dann zu empfehlen, wenn Sie mit relativ wenigen, möglicherweise verdichteten Daten arbeiten und schnell auf Ergebnisse zugreifen möchten. Im Gegensatz zur zeilenorientierten Datenorganisation bei relationalen Systemen sind die Daten in einer MOLAP-Datenbank zellorientiert in Würfeln abgelegt. Die Bedeutung des Werts einer jeden Zelle ist definiert durch den Schnittpunkt der Ausprägungen aller Dimensionen, die bei der Konstruktion des Würfels einbezogen wurden, dessen Bestandteil die Zelle ist.


MOLAP-Datenbanken sind also in einer Struktur von Dimensionen, Elementen und Würfeln organisiert, wobei ein Würfel typischerweise aus vielen Millionen theoretisch möglichen Kombinationen von Dimensionsausprägungen besteht, die aber nur zu einem geringen Prozentsatz tatsächlich gefüllt sind. Dadurch wird eine sehr komprimierte Speicherung erreicht, die vergleichsweise wenig Speicher benötigt und in der die einzelnen Zellen außergewöhnlich schnell addressiert werden können. Der Inhalt von MOLAP-Datenbanken wird beim Start des Datenbankservers komplett in den Arbeitsspeicher geladen, wodurch sich ein zusätzlicher Perfomancegewinn ergibt.

Hier ein dreidimensionales Beispiel mit den Dimensionen Artikel, Region und Datenart:


Datei:OLAP_01.PNG


Hier ein zweidimensionales Beispiel mit Mehrfachbeziehungen zwischen Artikel und Regionen:

Artikel Nord Süd West Ost
Äpfel 50 60 100 90
Birnen 40 70 80 60
Orangen 90 120 140 50
Bananen 20 10 30 20


Die strukturellen Zusammenhänge zwischen Server, Datenbanken, Würfeln und Dimensionen lassen sich am Besten grafisch veranschaulichen:

Image:OLAP_02.PNG

  • Auf einem PALO-Server können mehrere Datenbanken angelegt werden.
  • Einer PALO-Datenbank sind in aller Regel mehrere Dimensionen und mindestens ein Würfel zugeordnet.
  • Die Würfel innerhalb einer Datenbank sind jeweils aus verschiedenen Kombination dieser Dimensionen konstruiert.
  • Die Dimensionen selbst beinhalten Basis- und Hierarchieelemente.


Hinweis

Das Verständnis für diese Zusammenhänge ist aus folgenden Gründen sehr wichtig.

  • Man muss sich beim Aufbau der Datenbanken zunächst überlegen, welchen Bereich diese Datenbank abdecken soll. In der Praxis werden die Datenbanken nach verschiedenen Gesichtspunkten aufgebaut, häufig nach Firmen oder Abteilungen.
  • Auch der Aufbau von Dimensionen muss gut überlegt werden, denn eine Dimension, die identisch sowohl in Datenbank A als auch in Datenbank B benötigt wird, muss auch doppelt gepflegt werden. D.h. wenn ein neues Element in dieser Dimension hinzukommt, dann muss es in beiden Datenbanken, also in A und B gepflegt werden.
  • Palo kann problemlos 256 Dimensionen pro Datenbank verwalten (diese Größe ist jedoch eher theoretischer Natur).
  • Bevor ein Würfel angelegt/erzeugt werden kann, müssen die zur Würfel-Bildung benötigten Dimensionen erstellt werden.

Persönliche Werkzeuge