Das neu geordnete Web

 

Prof. Dr. Sören Auer ist Leiter des Lehrstuhls Enterprise Information Systems an der Universität Bonn und Mitglied der Führung des Fraunhofer Instituts für Intelligente Analyse- und Informationssysteme (IAIS). Als Experte zu Themen des Linked Data und des Semantic Web arbeitet er an der Strukturierung und Verknüpfung von digitalen Informationen. Zudem ist er Jury-Mitglied des zweiten Foresight Filmfestival (30. Juni 2016, Steintor Varieté in Halle).

 

Science2public sprach mit Prof. Dr. Sören Auer über das Vokabular des semantischen Webs, multilineare Informationsaufbereitung für eine verbesserte Recherche und Forschung und den Einfluss digitaler Datenbanken auf die Mobilität des Menschen.

In Anbetracht des exponentiellen Zuwachses an Daten, wie lässt sich eine Ordnung der Daten über das semantische Web herstellen?

Prof. Dr. Sören Auer: Zur Strukturierung der Daten im Internet werden Vokabulare definiert, ähnlich wie im allgemeinen Sprachgebrauch. Vokabulare für das semantische Web sind aber mehr als nur Begriffslexika, sondern umfassen auch Konzepte und Verbindungen. Ein Konzept kann zum Beispiel eine Person sein. Das Konzept Person hat verschiedene Attribute wie Geburtsdaten und Beziehungen zu Verwandten. Nimmt man diese Informationen und Verknüpfungen zusammen, so erhält man ein Vokabular. Die Vokabulare können zudem miteinander in Beziehung stehen und eine Aufgabe besteht nun darin, weltweit eindeutige Identifikatoren für die Verknüpfungen zu entwerfen.

Wie werden Verknüpfungen im semantischen Web erstellt?

Auer: Zur Identifikation und Verknüpfung verwendet man das Prinzip der URL, also des Uniform Resource Locator, welcher im Internet bereits als Identifikationsadresse einer Webseite fungiert. Das Prinzip der URL dient im Semantic Web, um Vokabulare, deren Begriffe und Verknüpfungen, zu identifizieren. Die Systematik funktioniert dann ähnlich, wie wir es von Wikipedia kennen. Dort kann man beispielsweise in einem Artikel über die Stadt Bonn Informationen über die aktuelle Einwohnerzahl und das Bundesland einarbeiten und verlinken.

Ist das Semantic Web dann nur eine neue Form von Wikipedia?

Auer: Das semantische Web konzentriert sich auf die Strukturierung von fachinternen Informationen, die über den Informationsbedarf der Allgemeinheit hinausgehen. So bietet das semantische Web beispielsweise Informationen für Produktionsweisen und spezifische Attribute von Maschinen, die für Ingenieure in der Industrie relevant sind. Manchmal möchte man auch allgemeines Wissen und Fachwissen zusammen nutzen und verknüpfen, auch dies ist mit den Vokabularen möglich. Und so, wie ich mich von einer Webseite zur nächsten hangeln kann, kann ich dies mit Verknüpfungsknoten im semantischen Web.

Wie wird die Kommunikation zwischen dem User und den Datenbanken gestaltet sein?

Auer: Eine zukünftig dominierende Kommunikationsform wird das Question-Answering werden, indem der User per Spracherkennung mit der Software kommuniziert und die Software dann auf Basis der vorhandenen Daten Antworten formuliert. Dies gibt es heute schon durch Programme, wie Siri von Apple oder Google Now für das Mobiltelefon. Bisher können solche smarten Programme nur auf Fragen zum Allgemeinwissen antworten. Doch in Zukunft werden die Assistenzprogramme mit Spracherkennungssoftware immer lernfähiger, intelligenter und in professionellen Einsatzszenarien anwendbar.

Welchen Beitrag können moderne Datenbanken bei der universitären Wissensvermittlung leisten?

Auer: Die Strukturierung und Vernetzung von Daten lässt sich nutzen, um Bildung und das Erschließen von Wissen zu erleichtern. So arbeiten wir beispielsweise an dem Projekt slidewiki.org. Das ist eine Plattform, auf der man Lern- und Lehrmaterialien kollaborativ erstellen kann. Ich selbst nutze es für meine Vorlesungen und gebe damit den Studierenden die Möglichkeit, die Texte nach ihren Bedürfnissen zu editieren und sie in verschiedene Sprachen übersetzen zu lassen.

Wie wird sich die Arbeit von Forschenden durch das semantische Web verändern?

Auer: Im Kern hat sich die Wissensaneignung seit 400 Jahren wenig geändert. Wir lesen immer noch Papiere und schreiben in Textform. Für den Rezipienten können Informationen verloren gehen, weil er den Text erst entschlüsseln muss, um Wissen aufzubauen. Auch Forschende wenden noch viel Energie darauf, ihr Wissen und ihre Resultate in eine lineare Textform zu bringen und die Informationen dann wieder aus der linearen Form herauszubringen, um sie besser zu entschlüsseln. Das semantische Web unterstützt bei dieser Übersetzungsleistung durch Kontext bezogene Strukturierung der Daten. Dies verhilft zu einem besseren Überblick über Publikationen. Man erfährt schneller, wie sich der Fortschritt in einem Themengebiet gestaltet und kann Theorien, Forschungsansätze und Methodiken leichter vergleichen.

Welches Interesse hat die Wirtschaft im semantischen Web, bedenkt man die Brisanz von Patentrechten?

Auer: Zunächst einmal lässt sich auch das semantische Web in Formen des Intranets unterteilen, auf die nur die jeweiligen Mitglieder Zugriff haben. Die semantischen Intranets lassen sich dann auch mit Daten aus dem offenen Web verknüpfen, sodass Überlappungen entstehen. Das Interesse von Firmen am offenen semantischen Web liegt z.B. auch in der besseren Aufbereitung von Produktinformationen für Kunden oder der besseren Zusammenarbeit mit Partnern (ähnlich zu open-source Software-Entwicklung).

Sie konzentrieren sich in Ihrer Arbeit auf das offene semantische Web. Wo sehen Sie Vorteile?

Auer: Der Vorteil am offenen Web ist, dass es der Vernetzungscharakter ermöglicht, die Intelligenz einer großen Menge von kleinen Beiträgen effizienter zu nutzen, als es ein einzelnes Unternehmen könnte. So hat beispielsweise eine weltweite, doch relativ kleine Community Openstreetmaps entwickelt, die ähnlich wie Google Maps, die komplette Welt kartografiert. Bei Openstreetmaps ist nicht nur die Karte, sondern auch alle darunterliegenden Daten sind frei zugänglich. Zudem hat die Community es geschafft, eine Weltkarte mit einem Detailgrad zu erstellen, der den kommerzieller Angebote in vieler Hinsicht übersteigt. Denkt man nun weiter in die Zukunft und an das automatisierte Fahren, für das datenintensive Karten notwendig sind, dann stellt das semantische Web einen wichtigen Baustein für unsere zukünftige Mobilität dar.

Prof. Dr. Sören Auer, Leiter des Lehrstuhls Enterprise Information Systems an der Universität Bonn