Projekte Datenbanktechnologie
News
[22.10.2007]
Folien
Hier findet Ihr die Projekt-Folien zu "XML Datenbanken / BaseX".
Course Description
Im Wintersemester 2007/08 werden Aufgabenstellungen für Gruppen (2 bis max. 3 Studierende) oder Einzelpersonen als Bachelor- bzw. Master-Projekte aus den nachfolgend genannten Themenbereichen vergeben. Begleitend zu den Projekten findet ein Seminar statt, in dem regelmäßig über Aufgabenstellungen, Fortschritt, auftretende Probleme und Ergebnisse von laufenden Projektarbeiten berichtet wird. Zu Beginn eines jeden Semester werden von Lehrstuhlmitarbeitern Überblicke über die laufenden Forschungsaktivitäten und die sich daraus ergebenden Themen für Projektarbeiten gegeben (siehe Seminar-Beschreibung).
- BaseX:
BaseX ist eine XML Datenbank, die in unserer Arbeitsgruppe entwickelt wird.
BaseX implementiert kompakte Speicherstrukturen und verfügt über eine effiziente XPath und XQuery Auswertung. Neben dem Datenbank-Backend legen wir auch grossen Wert auf die Visualisierung der gespeicherten Dokumente und versuchen User Interfaces zu entwickeln, die einen intuitiven Zugang zu den Daten bieten (screenshot-1, screenshot-2). BaseX ist komplett in Java geschrieben und bindet über das Java Native Interface (JNI) auch nativen C code unter Linux und OS X ein.
Folgende betreute Arbeiten können derzeit als Bachelor-/Masterarbeiten vergeben werden. Weitere Arbeiten sind als HiWi-Jobs jederzeit zu vergeben).
- Implementierung eines XQuery Moduls zum Zugriff und zur Manipulation von Dateisystem XML Instanzen (bereits vergeben an Elmedin Dedovic).
- Anbindung von BaseX an den fsevents Server unter OS X bzw. den file alternation monitor unter Linux.
- Integration von Dateisystemoperationen in den Datenbank Kernel von BaseX (bereits vergeben an Hannes Schwarz).
Freude an Implementierungsarbeiten wird vorausgesetzt und kann hier vertieft werden...
Primäre Kontaktpersonen für diese Arbeiten sind Christian Grün und Alexander Holupirek
- DataCube Explorer:
Im Projekt "DataCube Explorer" werden innovative Methoden zur Analyse und Exploration multidimensionaler Datenwürfel entwickelt und in einem prototypischen OLAP-Tool implementiert. Die Herausforderungen liegen in den Berechen konzeptionelle Modellierung nicht-konventioneller Anwendungsszenarien, relationale Umsetzung neuartiger Konzepte, Ansätze zur visuellen Anfragestellung / Datennavigation und Visualisierungs- und Interkationstechniken für OLAP. Auf der Projektwebsite ist eine ausführlichere Projektbeschreibung zu finden (auf Englisch!). Interessenten für dieses Arbeitsgebiet sollten Kenntnisse oder mindestens Interessenschwerpunkte zu einem oder mehreren der folgenden Bereiche mitbringen:
- Data Warehousing
- OLAP-Datenwürfel und OLAP-Operationen
- Visualisierungstechniken
- Mensch-Computer-Schnittstellen
Die für dieses Projekt relevanten Technologien sind Java, JDBS, JSP, SQL, XML, HTML (Vorkenntnisse in Java und SQL sind erforderlich).
Primäre Kontaktperson für diese Arbeiten ist Svetlana Mansmann.
- Data Warehouse for Surgical Workflow Analysis:
In Kooperation mit ICCAS (Innovation Center Computer Assisted Surgery) der Universität Leipzig konzipieren wir ein Data Warehouse zur Verwaltung der Daten, die im Laufe der chirurgischen Operationen erhoben werden. Die akkumulierten Daten sollen in der Zukunft für anspruchsvolle Analyseaufgaben in Bereichen Chirurgie, Medical Engineering, medizinische Forschung und Bildung genutzt werden. Im Rahmen des Projekts werden verschiedene Data-Warehouse-Systenme und OLAP-Werkzeuge eingesetzt, getestet und ggf. erweitert und angepasst. Die aktuellen Aufgaben sind verschiedenartig, von der Datenmodellierung, Einbindung externer Datenquellen, Routinen zum Datenimport bis zur Entwicklung geeigneter Visualisierungs- und Interaktionstechniken für Endbenutzer. Interessenten für dieses Arbeitsgebiet sollten Kenntnisse oder mindestens Interessenschwerpunkte zu einem oder mehreren der folgenden Bereiche mitbringen:
- Data Warehousing und OLAP
- Business Intelligence
- Business Process Analysis
- Visuelle Datenexploration
- Knowledge Discovery
Die für dieses Projekt relevanten Technologien sind Java, JDBS, JSP, SQL, MDX, XML, HTML (Vorkenntnisse in Java und SQL sind erforderlich).
Folgende Systeme sind im Einsatz: DB2 Data Warehouse Edition, PostgreSQL, Pentaho Business Intelligence Platform, Mondrial OLAP Server.Primäre Kontaktperson für diese Arbeiten ist Svetlana Mansmann.
- Pathfinder XQuery Compiler + Full-Text:
In diesem Projekt wird der XQuery Compiler Pathfinder um Full-Text Fähigkeiten erweitert. Einfließen sollen die XQuery Full-Text Definition des W3C und Arbeiten über die Score Region Algebra.
Erstes Ziel (und konzeptionell fast abgeschlossen) ist das effiziente Erzeugen und Verarbeiten von Scores, ohne den Compiler allzu sehr zu verändern. Zum besseren Verständnis von Pathfinder wurde ein Prototyp in Haskell entwickelt —mit weniger als 800 Zeilen Code :-) — und schrittweise erweitert. In Zukunft sollen weitere Full-Text-spezifische Techniken einfließen.
Aktuell stehen folgende Aufgaben an:
- Der Pathfinder Compiler kann eine XML Repräsentation seiner Algebra ausgeben. Dafür soll ein Parser geschrieben werden, der solch einen Algebra Plan wieder in den Pathfinder einliest.
- Übertragen der Ideen aus dem Prototyp auf den original Pathfinder Compiler.
Interessenten sollten die Programmiersprache C verstehen, sich für den Pathfinder Compiler interessieren, und sich in den original Code einarbeiten können. Haskell lesen zu können ist nicht nötig.
Weitere Informationen gibt's bei Stefan Klinger.
- Weitere Themenbereiche:
Wir begrüßen weitere Themenvorschläge und Ideen im Bereich "Datenbanktechnologie". Kontaktieren Sie ein der Mitglieder unserer Arbeitsgruppe.
- Vertiefendes Seminar:
Es wird auch ein Forschungsseminar in diesem Kontext angeboten.
Schedule
One-time Events
- Project meeting: 16.10.2007, 12:00 to 14:00 in room D 210 (Presentation of possible projects and discussion)
- Project meeting: 23.10.2007, 12:00 to 14:00 in room D 210 (Presentation of possible projects and discussion)
Contacts
- Prof. Dr.Marc H. Scholl (lecturer), office: E 211
- Svetlana Mansmann (assistant), office: E 203
- Christian Grün (assistant), office: E 217
- Alexander Holupirek (assistant), office: E 217


