Query von Multiebenenannotierten XML-Dokumenten mit Prolog

نویسندگان

  • Daniela Goecke
  • Daniel Naber
  • Andreas Witt
چکیده

In dem Beitrag wird ein Ansatz vorgestellt, XML-Dokumente zu analysieren, die hinsichtlich mehrerer Ebenen annotiert sind. Die Arbeiten stehen in Zusammenhang mit einem Projekt, in dem sprachliche Funktionen (insbesondere Koreferenz) in Beziehung gesetzt werden zu den sprachlichen Ausdrucksmitteln der untersuchten typologisch unterschiedlichen Sprachen. Derartige Untersuchungen bilden für eine multilingual ausgerichtete Sprachtechnologie eine wichtige Grundlage. So ist es z.B. für maschinelle Übersetzungen unabdingbar, Kenntnisse über eine angemessene Versprachlichung einer in einer Quellsprache als Pronomen realisierten koreferenten Einheit zu besitzen. Als Beispiel für die Relevanz der Verknüpfung von verschiedenen Ebenen soll in dem vorliegenden Beitrag jedoch eine andere Anwendung der hier vorgestellten Query-Möglichkeiten beschrieben werden, die ebenfalls für Arbeiten im Bereich der maschinellen Übersetzung sehr relevant ist, nämlich die Kontrollierte Sprache (vgl. Lehrndorfer 1996). Bei der Analyse von XML-Dokumenten liegt unser Schwerpunkt auf dem Vergleich von Annotationsebenen, existierende Query-Sprachen (vgl. Bonifati & Lee, 2001) legen jedoch zumeist den Schwerpunkt auf die Analyse einer einzelnen Annotationsebene. In Sprachen wie XQuery 1.0 oder XPath 1.0 werden Anfragen in XMLSyntax formuliert. Das Datenmodell ist eine Baumstruktur, Inklusionsrelationen zwischen Elementen, die durch die hierarchische Struktur der Daten gegeben sind, können einfach erfragt werden. Die Query-Sprachen erlauben zwar die Verknüpfung von verteilten Annotationen, überlappende Elemente lassen sich jedoch nicht darstellen, da für deren Modellierung eine parallele Sicht auf die Primärdaten notwendig ist. Um eine parallele Sicht zu ermöglichen, wird das Datenmodell um zusätzliche Informationen erweitert, die eine Verknüpfung der verschiedenen Annotationsebenen erlauben. Für die Realisierung dieses Ansatzes wird der Inferenzmechanismus der Programmiersprache Prolog verwendet.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Grafische Darstellung von XML Schema Dokumenten - ein Beispiel für XML2SVG - XSLT Transformation zur Erzeugung von SVG aus XML

Zusammenfassung: Dieser Beitrag beschreibt eine XSLT Transformation um ein einfaches SVG Dokument aus einem XML Dokument zu erzeugen. Das Layout dieses SVG Dokument ist ähnlich wie ein Browser aufgebaut, wie es der Baumstruktur eines XML Dokuments auch entspricht. Durch die Vorgabe eines weiteren XML Dokuments als Grundlage einer grafischen Datenbank für die Darstellung der XML Tags als SVG Obj...

متن کامل

Die unerträgliche Leichtigkeit des Seins - Where Simplicity beats Power

Für viele Anwendungen war das Relationenmodell allerdings zu simpel. Seit etwa 1990 setzten sich in der Forschung objektorientierte, später als Kompromiss objektrelationale Datenbanksysteme durch. Mit Verbreitung des Webs wurden Markup-Sprachen zur Beschreibung von Dokumenten beliebt, die in Form von XML dann auch der nächsten Generation von Datenbanksystemen ein Pseudo-Datenbankmodell lieferte...

متن کامل

Navigation auf XML-Dokumenten

Die weite Verbreitung von mobilen Geräten und die Entwicklung von mobilen Kommunikationstechnologien ermöglichen den Einsatz solcher Geräte für Aufgaben, die über die reine Kommunikation hinaus gehen. In dieser Arbeit wird ein XML-basiertes Gesamtmodell vorgestellt, indem durch eine einheitliche Schnittstelle zu gemeinsamen Informationsräumen einen Zugang zu Informationen für Geräte mit untersc...

متن کامل

XML und Zope

Zope ist ein Open Source Middlewareprodukt, welches auf der Skriptsprache Python aufbaut. Zope ist als Applikationsserver sowohl ein Webserver mit einem webbasiertem Interface als auch eine objektorientierte Datenbank. Parsed XML ist ein auf dem Python Expat aufbauender XML Parser der als Produkt für Zope entwickelt wurde und die standardisierte DOM-Schnittstelle enthält. Zusammen mit Page Temp...

متن کامل

XML in der Oracle Datenbank "relational and beyond"

In Geschäftsund B2B-Anwendungen wird XML zunehmend als das Format für elektronisches Publizieren und den Austausch von Dokumenten eingesetzt. Richtiges Speichern von XML-Dokumenten ist dabei ein viel diskutiertes Thema. So werden beispielsweise beim nicht nativen Speichern Webinhalte und Applikationsdaten entweder in relationalen Tabellen, im Dateisystem oder in beidem gespeichert. Die besonder...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • LDV Forum

دوره 18  شماره 

صفحات  -

تاریخ انتشار 2003