[X] Semantic Desktop

estartu

Solange wir nicht zum Java Magazin mutieren ist das okay.

SideWinder

Würde so einen Artikel begrüßen, ich hoffe daraus wird etwas

MfG SideWinder

mosta

Semantic Desktop

1. Einleitung
2. Geschichte
3. Projekte
3.1 Gnowsis
3.2 Jena
3.3 MindRaider
3.4 Protege
3.5 Haystack
3.6 Aduna
4. Technologien/Standards
4.1 RDF
4.1.1 URI
4.2 OWL
4.3 IRIs
4.4 SPARQL
5. Aussichten

1. Einleitung

Auf das Thema Semantic Desktop bin ich gestoßen, als ich nach einer einfacheren und schnelleren Benutzeroberfläche gesucht habe. Den bei dem heutigem Interface, nervt es mich das ich soviel zeit damit verschwende mit dem Suchen und Ordnung halten, auf meiner Festplatte.

Die ersten Projekte, die ich zu dem Thema gefunden habe bezogen sich auf das Thema Semantic Web. Was eine neue Struktur des Internets darstellt. Es gibt auch mittlerweile den Begriff Web 2.0. Der diese Art von Diensten und Ideen zusammenzufassen versucht.
Der größte unterschied liegt darin das Informationen nicht einfach nur per Hyperlinks verbunden sind, sondern das die Internet Seiten auch nach ihrem Inhalt hin untersucht werden können. Was enorme Vorteile beim suchen von Internetseiten hat. Da man nicht nur Internetseiten nach gleichen Worten suchen kann, sondern nach ihrem Inhalt und nachdem inhaltlichen Zusammenhang. Also wenn ich nachdem Einbau eines neuen Autoradios Suche. Mir dann nicht versucht wird ein mp3-Player mit Radiofunktion angeboten wird.

Wobei Semantic Desktop, sich nicht nur auf das suchen nach Informationen und ihren Verwaltung beschäftigt. Es geht auch um das verwalten der verschiedenen Kommunikationsmittel und -Wege. Also eine effizientere Art mit ihrem E-Mail, Instant Messenger und IRC Diensten umzugehen. Wobei sich dabei die Interessantesten Anwendungen ergeben. Zum Beispiel die Verknüpfung dieser dienste mit ihrem Kalender und der auto-reply Funktion.
Folgendes Szenario, wenn einer ihrer Freunde ein Kino Abend plant und Sie nicht am Rechner sitzen oder mit dem Handy erreichbar sind. Kann ihr Instant Messenger sich nach freien Terminen erkundigen oder nachschauen, ob Sie zudem Zeitpunkt nichts vorhaben. Aufgrund der entsprechenden Information wird eine entsprechende Antwort generiert. Die Sie dann bestätigen können oder default mässig annehmen. Sie werden dann per SMS oder mittels einer MessageBox über den Termin rechtzeitig informiert. Wenn Sie aber nicht darauf reagieren. Weil Sie es nicht mitbekommen, kann ihrem Freund auch eine Meldung gesendet werden, dass Sie es doch nicht schaffen und der Termin gelöscht werden.

Sie erkennen also die Möglichkeiten solcher Anwendungen.

2. Geschichte

Die erste Beschreibung eines Systems das eine einheitliche Schnittstelle zur Verarbeitung von Informationen, sowie der Kommunikation mit anderen Teilnehmern ermöglicht, passierte 1945 durch Vannevar Bush in dem Artikel “As we may think”. Er beschrieb ein Gerät namens “Memex” das alle Bücher, Aufzeichnungen und Kommunikationsmittel vereint und dass sehr schnell und flexibel bewältigt. Das Gerät sollte aber völlig analog funktionieren und Mikrofilm als Speichermedium nutzen.
Weitere wurzeln findet man bei Ted Nelson. Der 1960 ein System beschrieb, das aus verknüpften Informationen bestand. Die in einer Informationsgesellschaft gehandelt wurden. Er nannte das System "Xanadu".
Der erste versuch solch ein System umzusetzen fand durch Tim Berners-Lee(Berguender des Internet) statt. Der sein Programm "Enquire-Within-Upon-Evrything" nannte und das ein Informations- management Tool war. Das in der Lage war Informationen über Personen, Projekte, Hardwareressourcen und wie Sie miteinander verknüpft waren zu bearbeiten.

Der Begriff Semantic Desktop wurde durch Stefan Decken beschrieben und von Leo Sauermann 2003 aufgegriffen um die verschiedenen Technologien und Ideen in einem Hauptbegriff zusammen zu fassen. Wobei Stefan Decker und Martin Frank das Bedürfnis eines Networked Semantic Desktop 2004 Formulierten. Was den Semantic Desktop um eine P2P Funktion erweitert in der die Informationen untereinander getauscht werden können.

3. Projekte

3.1 Gnowsis
Das erste Forschungs-Projekt das den Begriff Semantic Desktop benutzte, war das Gnowsis Projekt von Leo Sauermann. Das aus einer Diplomarbeit These hervor geht. Es wird heute als Open-Source Projekt weiter geführt.

3.2 Jena

3.3 MindRaider

3.4 Protege

3.5 Haystack

3.6 Aduna

4. Technologien/Standards:

4.1 RDF - Resource Description Framework
Das Resource Description Framework ist eine Sprache um Informationen über Ressourcen im Internet Darzustellen. Es geht aber hier um die Darstellung von Metadaten, also um Informationen über Informationen. Was im ersten Moment etwas Schizophren klingt. Es geht aber in diesem Fall um Informationen wie der Autor eines Textes oder die Art des Textes. Man kann das natürlich auch auf andere Informationen wie Musik, Video oder Dienste beziehen.
Dabei können die Informationen Variieren. Definiert wurde Sie aber um zusätzliche Informationen über Web Dokumente zu Definieren und sie maschinell verarbeiten zu können. RDF ist konzipiert um diese Art von Informationen zwischen Anwendungen auszutauschen ohne den Verlust der Bedeutung. Dabei werden Informationen mittels URI’s identifiziert und beschrieben.

4.1.1 URI - Uniform Resource Identifiers

Uniform – heißt soviel wie gleichförmig. Das bedeutet, dass wir Ressourcen auf die gleiche Art identifizieren können.

Resource – Eine Ressource kann, soviel wie alles sein. In unserem Fall eine Website, Datei oder Person bzw. Jedes Objekt oder Information die sich mit unserm Rechner erreichen läst.

Identifiers- sind Objekte, die eine Beziehung zu einer Ressource knüpfen die eine Identität haben.

URI’s sind wie folgt aufgebaut
IRIs - Internationalized Resource Identifiers

OWL - Web Ontology Language

SPARQL - Query Language for RDF

5. Aussichten:

mosta

Semantik Desktop

1. Einleitung
2. Geschichte
3. Projekte
3.1 Gnowsis
3.2 Jena
3.3 MindRaider
3.4 Protege
3.5 Haystack
3.6 Aduna
4. Technologien/Standards
4.1 RDF
4.1.1 URI
4.2 OWL
4.3 IRIs
4.4 SPARQL
5. Aussichten

1. Einleitung

Auf das Thema Semantic Desktop bin ich gestoßen, als ich nach einer einfacheren und schnelleren Benutzeroberfläche gesucht habe.
Vor allem im Bezug auf das Programmieren und dem Verwalten von Projekten. Den bei den heutigen Benutzerschnittstellen, verbringt man zuviel zeit damit mit dem Suchen und Ordnung halten, auf seinem System.

Die ersten Projekte, die ich zu dem Thema gefunden habe bezogen sich auf das Thema Semantic Web.

[add]
Das Semantic Web ist eine Erweiterung des Internets um maschinell verarbeitbare Daten. Die dazu genutzt werden um eine Semantische Verbindung zwischen Inhalten im Internet zu knüpfen. Im Klartext sollen Informationen nicht nur über Hyperlinks miteinander verbunden werden können, sondern über ihren Inhalt. Zur Beschreibung dieser Daten, soll das Ressource Description Framework(RDF) genutzt
werden. Das später genauer beschrieben wird. Dadurch wird das Internet inhaltsbezogen durchsuchbar.

Semantic Web fehlt auch in den Begriff Web 2.0, wobei hier auf soziale Netzwerke wie FOAF (Friend of a Friend)oder XFN (XHTML Friends Network) bezogen wird. Was beides soziale Netzwerke sind, also verknüpfungen zwischen Personen. Was so ähnlich wie in Buddylisten bei Instant Messenger Diensten läuft nur das hier die Verbindungen zwischen den Personen öffentlich einsehbar sind. Diese Systeme sind bei Bloggern beliebt. Denn so kann man die Webblogs Personifizieren und weiß wer diesen Webblog unterhält. Dazu kann man feststellen, ob man diese Person vielleicht sogar kennt.
[/add]

Was enorme Vorteile beim suchen von Internetseiten mit sich bringt. Da man nicht nur Internetseiten nach gleichen Wörtern hin suchen kann(Volltextsuche), sondern nach ihrem Inhalt und nachdem inhaltlichen Zusammenhang. Als Beispiel dient die Suche nachdem Einbau eines neuen Autoradios mit MP3-Player. Der Unterschied zeigt sich im Suchergebnis. Den es besteht nicht nur aus MP3-Playeren mit
Radiofunktion, sondern es wird in der Kategorie Auto, nach Anleitungen für den Einbau von Teilen gesucht und nachdem Link für Radioanlagen geschaut. Die Anleitungen werden dann nach Hersteller und Modell aufgelistet oder diese mit einer weiteren Frage in Erfahrung gebracht.

Wobei Semantic Desktop, sich nicht nur auf das suchen nach Informationen und ihrer Verwaltung begrenzt. Es geht auch um das verwalten der verschiedenen Kommunikationsmittel und -Wege. Also eine effizientere Art mit ihrem E-Mail, Instant Messenger
[add]
, IRC und anderen Diensten
[/add]
umzugehen. Wobei sich dabei die Interessantesten Anwendungen ergeben. Zum Beispiel die Verknüpfung dieser dienste mit ihrem Kalender und der auto-reply Funktion. Folgendes Szenario, wenn einer ihrer Freunde ein Kino Abend plant und Sie nicht am Rechner sitzen oder mit dem Handy erreichbar sind. Kann ihr Instant Messenger sich nach freien Terminen erkundigen oder nachschauen, ob Sie zudem Zeitpunkt nichts vorhaben. Aufgrund der entsprechenden Information wird eine entsprechende Antwort generiert. Die Sie dann bestätigen können oder default mäßig annehmen. Sie werden dann per SMS oder mittels einer MessageBox über den Termin rechtzeitig informiert. Wenn Sie aber nicht darauf reagieren. Weil Sie es nicht mitbekommen, kann ihrem Freund auch eine Meldung gesendet werden, dass Sie es doch nicht schaffen und der Termin gelöscht werden.

Sie erkennen also die Möglichkeiten solcher Anwendungen.

[add]
Wobei das sich nicht nur auf den Heimanwender begrenzt sondern auch im proffesionellen oder kommerziellen Bereichen auch seine Einsatzmöglichkeiten finden. Wie der Projektplannung und -verwaltung. So kann man auch Informationen für Projekte oder Gruppen so leichter die Übersichtlichkeit wahren.
[/add]

2. Geschichte

Die erste Beschreibung eines Systems der einen einheitlichen Schnittstelle zur Verarbeitung von Informationen, sowie der Kommunikation mit anderen Teilnehmern ermöglicht, passierte 1945 durch Vannevar Bush in dem Artikel “As we may think”. Er beschrieb ein Gerät namens “Memex” das alle Bücher, Aufzeichnungen und Kommunikationsmittel vereint und dass sehr schnell und flexibel bewältigt. Das
Gerät sollte aber völlig analog funktionieren und Mikrofilm als Speichermedium nutzen.
Weitere wurzeln findet man bei Ted Nelson. Der 1960 ein System beschrieb, das aus verknüpften Informationen bestand. Die in einer Informationsgesellschaft gehandelt wurden. Er nannte das System "Xanadu".
Der erste versuch solch ein System umzusetzen fand durch Tim Berners-Lee (Begründer des Internet) statt. Der sein Programm Enquire-Within-Upon-Everything" nannte und das ein Informations- management Tool war. Das in der Lage war Informationen über Personen, Projekte, Hardwareressourcen und wie Sie miteinander verknüpft waren zu bearbeiten.

Der Begriff Semantic Desktop wurde durch Stefan Decken beschrieben und von Leo Sauermann 2003 aufgegriffen um die verschiedenen Technologien und Ideen in einem Hauptbegriff zusammen zu fassen. Wobei Stefan Decker und Martin Frank das Bedürfnis eines Networked Semantic Desktop 2004 Formulierten. Was den Semantic Desktop um eine P2P Funktion erweitert in der die Informationen untereinander
getauscht werden können.

3. Projekte

3.2 Jena

Java Basieren
Basic Framework zur Erstellung von Semantic Applications
Grund Idee
Technologien
Konzept

3.1 Gnowsis
Gnowsis ist eine Art Semantic Web für den Desktop. Im Mittelpunkt steht ein RDF Server der die verschiedenen Informations-Quellen und –Dienste verknüpft. Es besitzt ein Daten Integrations Framework um ihre E-Mails und Dateien und andere RDF Daten Quellen zu verbinden.

[bild]bild1[/bild]
Quelle www.gnowsis.org

Gnowsis ist ein Webserver der die verschiedenen Technologien die aus der Semantic Web Diskussion hervorgingen benutzt und einen Dienst anbietet mit dem Semantische Informationen erstellt und verwaltet werden können. Dazu hat es eine Menge Schnittstellen. Zu anderen Programmen. Wie die gängigsten E-Mail Clients und Webbrowser um so Semantische Informationen zu erzeugen und den Usern mit
einem Web Frontend zu präsentieren.

Das Hauptaugenmerk liegt bei dem Server und der Erstellung von Semantisch verwertbaren Quellen im RDF-Format. Deswegen läßt die Benutzerfreundlichkeit und Übersichtlichkeit stark zu wünschen übrig.

Gnowsis soll eher ein Developer Framework sein um Semantische Tools zu entwickeln.

Es besitzt aber auch eine swing GUI die Enquire2 genannt wird und mit Gnowsis startet. Der Primäre Zweck scheint erstmal das testen der Server Funktion und eine erste Anwendung zu entwickeln. Das ganze befindet sich noch in der Developer Phase und ist deswegen noch Buggy.

GnowSis entstammt einer Diplomarbeit und sollte nur ein test der RDF-Fähigkeiten darstellen mittlerweile ist es ein Framework deren Anwendungen man die Herkunft als Proof-off Concept start anmerkt und deswegen zur Benutzung nicht gedacht sind.

Ontologie Manager
Central Hub
Repository
Weitere Dienste
Technologien
Konzept weiter ausarbeiten

Gnowsis ist ein Semantic Desktop System. Das aus verschiedenen Adaptern und einem Server besteht der einen Dienst zur Verwaltung der Meta Daten anbietet. Die Komponenten sind....

Features
Feature Overview of the gnowsis
Features
Gnowsis is a Semantic Web desktop System. It consists of a Local Server and a Browser. The adapters read data from different sources
and make your information available as RDF. Parts of the framework can be used seperately. You will like these parts.
Server Features
Local RDF Database (Jena Model based)
Data integration Hub. integrates different Data sources.
XML/RPC API
Java Client API
full text indexing (using Apache Lucene)
local webserver for experiments (using Jetty)
Adapters
Adapters take information from applications and convert them to RDF. This is done only when needed, on the fly. Data remains in the
applications and is only viewed as RDF. There are adaptors to access in RDF:
Filesystem adapter
MP3-ID3 tag adapter (using MP3 Library by Jens Vonderheide)
Microsoft Outlook adapter
Mozilla Thunderbird email adapter
Mozilla Firefox bookmarks adapter
Browser Features
Browse the local Semantic Desktop
shows related information for any resource
Manage your projects using ordinary File Folders
full text search
Link anything with drag-drop
annotate photos and persons
Framework features
Handy RDF utilities: org.gnowsis.util.*
Remote Models. Access your jena Models on remote servers like they are local, through the Jena model interface and XML-RPC magic.
See org.gnowsis.util.remotemodel
File backed models with convenience. Have your model save every X seconds to a file! See org.gnowsis.util.filemodel
Non-Features
Something is too much for gnowsis.
RDF data in Gnowsis is read only.
Stability and performance. This is a research prototype. Don't use it in commercial projects. This is alpha. Wait a few months and it
will be beta

3.3 MindRaider

Technologien
Konzept – Idee
Usability

3.4 Protege

3.5 Haystack
Java Basieren
Basic Framework zur Erstellung von Semantic Applications
Grund Idee
Technologien
Konzept
Projektstatus

3.6 Aduna
Java Basieren
Basic Framework zur Erstellung von Semantic Applications
Grund Idee
Technologien
Konzept

4. Technologien/Standards:

4.1 RDF - Ressource Description Framework
Das Ressource Description Framework ist eine Sprache um Informationen über Ressourcen im Internet Darzustellen. Es geht aber hier um die Darstellung von Metadaten, also um Informationen über Informationen. Was im ersten Moment etwas Schizophren klingt. Es geht aber in diesem Fall um Informationen wie der Autor eines Textes oder die Art des Textes. Man kann das natürlich auch auf andere
Informationen wie Musik, Video oder Dienste beziehen.
Dabei können die Informationen Variieren. Definiert wurde Sie aber um zusätzliche Informationen über Web Dokumente zu Definieren und sie maschinell verarbeiten zu können. RDF ist konzipiert um diese Art von Informationen zwischen Anwendungen auszutauschen ohne den Verlust der Bedeutung. Dabei werden Informationen mittels URI’s identifiziert und beschrieben.

4.1.1 URI - Uniform Ressource Identifiers

Uniform – heißt soviel wie gleichförmig. Das bedeutet, dass wir Ressourcen auf die gleiche Art identifizieren können.

Ressource – Eine Ressource kann, soviel wie alles sein. In unserem Fall eine Website, Datei oder Person bzw. Jedes Objekt oder
Information die sich mit unserm Rechner erreichen läst.

Identifiers- sind Objekte, die eine Beziehung zu einer Ressource knüpfen die eine Identität haben.

URI’s sind wie folgt aufgebaut
IRIs - Internationalized Ressource Identifiers

OWL - Web Ontology Language

SPARQL - Query Language for RDF

5. Aussichten:

------------------------------------------------------------------------------

Ich Poste mal ne neue Version um zu zeigen das ich noch an dem Artikel schreibe und auf Ideen und Anregungen von anderen hoffe.

Wobei ich es wahrscheinlich nicht schaffe, zu diesem release den artikel fertig zu schreiben aber ich werd es Versuchen.

gruss mosta

mosta

Semantik Desktop

1. Einleitung
2. Geschichte
3. Projekte
3.1 Gnowsis
3.2 Jena
3.3 MindRaider
3.4 Protege
3.5 Haystack
3.6 Aduna
4. Technologien/Standards
4.1 RDF
4.1.1 URI
4.2 OWL
4.4 SPARQL
5. Referencen

1. Einleitung

Semantic Desktop ist eine neue Art der Anwendung, die versucht bisherige Anwendungen miteinander zu verknüpfen. Wenn wir der reinen Wortbeschreibung folgen ist die Semantik die Bedeutungslehre und der Desktop ist die Schreibtischplatte. Wenn wir das zusammenfassen haben wir eine Schreibtischplatte die Verknüpfungen über die Bedeutung erstellt. Der große unterschied zum bisherigen Desktop liegt darin das Informationen miteinander zu Themengebieten zusammengefasst werden. Semantisch Desktop beschäftigt sich aber nicht nur mit den Suchen und verwalten von Dateien. Es geht um die Verbesserung der Kommunikation, der Anwendungen miteinander. Die Anwendungen sollen nicht nur Informationen erzeugen, sondern noch zusätzlich Aussagen über diese Angeben(Wie Autor, Titel, Datum, Themengruppe, Referencen, Glossar). Damit andere Anwendungen diese einlesen und verstehen können. Das bekannteste und eindrucksvollste Beispiel was hier zu nennen ist, ist das suchen von Informationen. Denn wenn bei der Suche nicht nur nach gleichen Wörtern verglichen wird, sondern nach Inhalten, kann sich das Suchergebnis enorm verbessern.

[edit]Der Rechner kann nun die vorhandene Ontologie/Struktur mit anderen vergleichen. Wie Internet Diensten oder anderen Rechnern die eine geeignete Schnittstelle anbieten.[/edit]Also wenn wir uns in neue Themengebiete einarbeiten wollen kann er Sie mit unseren bisherigen Daten/wissen vergleichen und daraus resultierende unterschiede aus vorherigem wissen ausarbeiten. Wie zum Beispiel auf tiefergehende oder verwandte Themengebiete hinzuweisen. Der größte Vorteil liegt, in der Suche und Verwaltung von Inhalten und Quellen von Inhalten. Wie RSS Feeds, Newsgroup und anderen Diensten. Wobei der Hauptaugenmerk bei den derzeitigen Tools auf der Erzeugung von Semantischen oder in diesem Kontext auch als Meta-Informationen bezeichneten Inhalten. Wie dem Erstellen von Dokumenten wie E-Mails. Dem ähnlich wie in dem Eintrag „Betreff“. Eine Kurze Information enthalten ist. Die der E-Mail einen oder mehreren Themen oder Gruppenfeldern zuordnen. Dieser Vorgang wird auch in Zusammenhang mit Bookmarks(del.ico.us)als Tagging Bezeichnet. Das Folgendermaßen Funktioniert es wird einer URL Adresse ein paar Stichworte als Eingliederung des Links in eine oder mehrere Themengebieten angegeben. Um so die URL’s Themenbezogen (Semantisch) zu durchsuchen. Tagging Projekte gibt es aber nicht nur für URL’s, sondern auch für Photos(Flickr.com), Videos(YouTube.com) und Musik(myspace.com). Wobei diese aber auch gleich eine Unterstützung für Soziale Netzwerke bieten.

Semantic Desktop ist der Versuch Techniken aus dem Semantik Web auf den Desktop zu Portieren.

Das Semantic Web ist eine Erweiterung des Internets um Internet Seiten maschinell lesbar zu machen.

Die dazu genutzt werden um eine Semantische Verbindung zwischen Inhalten im Internet zu knüpfen. Es werden Informationen nicht nur über Hyperlinks miteinander verbunden, sondern zusätzlich über ihren Inhalt. Zur Beschreibung dieser Daten, soll das Ressource Description Framework(RDF) genutzt werden. Das später genauer beschrieben wird. Dadurch wird das Internet inhaltsbezogen durchsuchbar. Also einer extremen Wissens Erweiterung unseres Semantic Desktop.

[zu viel?]
Semantic Web fehlt auch in das Buzzword "Web 2.0", wobei hier auf soziale Netzwerke wie FOAF (Friend of a Friend) oder XFN (XHTML Friends Network) verwiesen wird. Soziale Netzwerke sind Verknüpfungen zwischen Personen. Wobei sich das hier auf Communities bezieht die Inhalte produzieren wie die Wikipedianer oder Blogger. Als Beispiele zu nennen sind hier FOAF und XFN Sie funktionieren so ähnlich wie Buddylisten bei Instant Messenger Diensten. Nur das hier die Verbindungen öffentlich gemacht werden. Diese Systeme sind bei Bloggern beliebt. Denn so kann man die Webblogs Personifizieren und weiß wer dieses Webblog unterhält. Dazu kann man feststellen, ob man diese Person vielleicht sogar direkt kennt oder indirekt über einen gemeinsamen Freund.

Wobei es für die Wikipedianer ein eigenständiges Projekt noch gibt das sich Semantik Wikipedia nennt. Die eine Wiki über das Semantic Web ist aber auch gleichzeitig ein versuch ist die Wikipedia mit neuen Semantischen Technologien zu verbinden.

[/zu viel?]

2. Geschichte

Die erste Beschreibung eines Systems der einen einheitlichen Schnittstelle zur Verarbeitung von Informationen, sowie der Kommunikation mit anderen Teilnehmern ermöglicht, passierte 1945 durch Vannevar Bush in dem Artikel “As we may think”. Er beschrieb ein Gerät namens “Memex” das alle Bücher, Aufzeichnungen und Kommunikationsmittel vereint und dass sehr schnell und flexibel bewältigt. Das Gerät sollte aber völlig analog funktionieren und Mikrofilm als Speichermedium nutzen. Weitere wurzeln findet man bei Ted Nelson. Der 1960 ein System beschrieb, das aus verknüpften Informationen bestand. Die in einer Informationsgesellschaft gehandelt wurden. Er nannte das System "Xanadu". Der erste versuch solch ein System umzusetzen fand durch Tim Berners-Lee(Begründer des Internet) statt. Der sein Programm "Enquire-Within-Upon-Everything" nannte und das ein Informations- Management Tool war. Das in der Lage war Informationen über Personen, Projekte, Hardwareressourcen und wie Sie miteinander verknüpft waren zu bearbeiten.

Der Begriff Semantic Desktop wurde durch Stefan Decken beschrieben und von Leo Sauermann 2003 aufgegriffen um die verschiedenen Technologien und Ideen in einem Hauptbegriff zusammen zu fassen. Wobei Stefan Decker und Martin Frank das Bedürfnis eines Networked Semantic Desktop 2004 Formulierten. Was den Semantic Desktop um eine P2P Funktion erweitert in der die Ontologien untereinander getauscht werden können.

3. Projekte

Hier erfolgt ein Vorstellung von Projekten die eine Implementierung des Semantic Desktop vornehmen.

3.1 Gnowsis

Gnowsis ist ein Developer Framework zum erstellen und verwalten von Semantischen Informationen. Es besteht aus einen Server und einem Browser die als Web-Desktop System funktionieren.

Quelle www.gnowsis.org

Der Server besteht aus einem Data Integration Hub. Welches Adapter zum lesen von verschiedenen Quellen bietet und diese im RDF Format zugänglich macht.
Es stehen folgende Adapter zur Verfügung:

MS Outlook
MP3 ID3 Tag
Mozilla Thunderbird
Mozilla Firefox(Bookmarks)
File System

Im derzeitigen Projekt Status ist aber nur ein lese zugriff auf RDF Informationen verfügbar,

Der Browser bietet ein übersichtliches Interface. Er stellt semantische Informationen über einen Expand Tree ähnlich dem Explorer da. Es lassen sich so Semantische Links mit Drag und Drop erstellen.
TODO: genauer beschreiben
Also ein Download lohnt sich.

3.4 Protege

3.5 Haystack
Java Basieren
Basic Framework zur Erstellung von Semantic Applications
Grund Idee
Technologien
Konzept
Projektstatus

3.6 Aduna
Java Basieren
Basic Framework zur Erstellung von Semantic Applications
Grund Idee
Technologien
Konzept

4. Technologien/Standards:

4.1 RDF - Ressource Description Framework
Das Ressource Description Framework ist eine Sprache um Informationen über Ressourcen im Internet Darzustellen. Es geht aber hier um die Darstellung von Metadaten, also um Informationen über Informationen. Was im ersten Moment etwas Schizophren klingt. Es geht aber in diesem Fall um Informationen wie der Autor eines Textes oder die Art des Textes. Man kann das natürlich auch auf andere Informationen wie Musik, Video oder Dienste beziehen. Dabei können die Informationen Variieren. Definiert wurde Sie aber um zusätzliche Informationen über Web Dokumente zu Definieren und sie maschinell verarbeiten zu können. RDF ist konzipiert um diese Art von Informationen zwischen Anwendungen auszutauschen ohne den Verlust der Bedeutung. Dabei werden Informationen mittels URI’s identifiziert und beschrieben.

RDF ist wie folgt aufgebaut. Es besteht aus drei Objekttypen, den Ressourcen, Eigenschaftselementen und den Objekten. Die auch als Subjekt, Objekt und Prädikat beschrieben werden. Durch Kombination der drei Typen wird eine Aussage über eine Ressource formuliert. Um das ganze anschaulich zu machen beschreiben wir das Forum:

Das Objekt ist eine URL Adresse: http://www.c-plusplus.net/forum
Die Eigenschaft Ordnet der Information eine Bedeutung zu wir beschreiben erstmal was für eine Seite das ist also die Objekteigenschaft ist „type“.
Das Objekt ist Forum

Der Link würde also so aussehen http://www.c-plusplus.net#type. Als antwort auf eine solche anfrage bekämen wir „Forum“. Wenn diese Antwort jetzt ein Google Boot bekämm. Kann Google bei der nächsten Anfrage anzeigen, ob der Link in ein Forum zeigt. Dazu noch welches Thema das Forum hat und weitere Informationen die von der Internetseite angeboten werden.

4.1.1 URI - Uniform Ressource Identifiers

Uniform – heißt soviel wie gleichförmig. Das bedeutet, dass wir Ressourcen auf die gleiche Art identifizieren können.

Ressource – Eine Ressource kann, soviel wie alles sein. In unserem Fall eine Website, Datei oder Person bzw. Jedes Objekt oder Information die sich mit unserm Rechner erreichen läst.

Identifiers- sind Objekte, die eine Beziehung zu einer Ressource knüpfen die eine Identität haben.

URI’s sind wie folgt aufgebaut

Resource Description Framework (RDF, engl. (sinngemäß) „System zur Beschreibung von Ressourcen“) ist eine formale Sprache zur Bereitstellung von Metadaten im World Wide Web [1].

RDF wurde vom World Wide Web Consortium zusammen mit der Web Ontology Language als Grundstein für das Semantische Web entwickelt und ist frei verfügbar. Die Idee ist, Eigenschaften von Ressourcen im World Wide Web in einer maschinell verarbeitbaren Form zu beschreiben. Solche Beschreibungen können nach dem RDF-Modell als Graph oder nach der RDF-Syntax als XML-Hypertext vorliegen.

RDF wird erweitert durch das RDF-Schema, mit der komplexere Beziehungen zwischen Ressourcen beschrieben werden können.
[Bearbeiten]

Grundlagen von RDF

Mit RDF können Informationen über Web-Seiten im World Wide Web zugänglich gemacht werden, die nicht auf der eigentlichen Webseite enthalten sind. Die Metadaten können dabei Informationen wie beispielsweise Titel, Name oder Copyright, enthalten. RDF besteht sowohl aus einem grafischen Modell zur Repräsentation der erzeugten Metadaten, als auch aus einer XML-Syntax mit gleichem Ziel.
[Bearbeiten]

IRIs - Internationalized Ressource Identifiers

OWL - Web Ontology Language

SPARQL - Query Language for RDF

5. Referencen:
-------------------------------------------------
hier ist ne neue version
würd mich über feedbakc freuen besonders ob das ganze nachvollziehbar ist und ob die stelle die ich in der Einleitung mit "zu viel?" Kommentiert habe.

gruss mosta

GPC

Hallo,

geht's hier noch weiter? Lies sich bisher nämlich flüssig

MfG

GPC

mosta

Ja ich schreib noch dran nur mir läuft immer die zeit davon

GPC

mosta schrieb:

Ja ich schreib noch dran nur mir läuft immer die zeit davon

Okay, ich wollte nur mal kurz nachhaken

mosta

Semantic Desktop

1. Einleitung
2. Semantic Web
3. Was ist Semantic Desktop?
3. Geschichte
4. Technologien/Standards
4.1 RDF / RDF Scheme
4.2 OWL
4.5 SWRL
4.4 SPARQL
6. Referenzen

1. Einleitung

Durch das Internet hat sich die Art und Weise mit der wir Kommunizieren komplett geändert. Der Rechner mit einem Internet Anschluss gehören zur Grundausstattung. E-Mails, IM(Instant Messenger) und Webseiten gehören zu unserem Alltag und ein Leben ohne diese Dinge scheint immer schwerer vorstellbar. Doch die Handhabung all dieser Anwendungen wird aufgrund des steigenden Datenaufkommens immer aufwendiger. Um den entgegen zu wirken entstammt die Idee des Semantic Desktop.

Semantic Desktop ist eine neue Art der Anwendung, die versucht bisherige Anwendungen miteinander zu verknüpfen, um daraus einen mehr nutzen für den Anwender zu gewinnen. Das Wort Semantic kommt zustande, da alle Informationen auf dem Desktop Semantisch (über ihren Inhalt) verknüpft werden. Das heißt das der Computer nicht nur weiß, wo die Dateien liegen, wie groß sie sind und evtl. mit welchem Programm sie geöffnet werden können, sondern was für Inhalte, die Daten haben und sie daraufhin aufbereiten.
[stärker ausführen]

Dieser Ansatz wurde schon früher verfolgt. Doch war am Anfang der Computer Revolution nicht der Sinn erkennbar für solche Anwendungen.
Dies erfolgt durch eine stärkere Trennung von Inhalt und Layout. Denn nun können Datenbestände inhaltlich verglichen werden, also wenn wir uns in neue Themengebiete einarbeiten wollen. Können wir Quellen auf inhaltliche unterschiede hin untersuchen, um so die Qualität von Texten besser Unterscheiden zu können. Der weitere Unterschied zum derzeitigen Desktop liegt daran, dass Informationen nur von der Anwendung die Sie erstellt bzw. für die Sie erstellt wurden nutzbar sind.
[besseres Beispiel]
Als Beispiel nehmen wir das schreiben eines Artikels oder Hausaufgabe. Als erstes geben wir das Thema unseres Artikels an.
Aus dem Thema kann unsere Anwendung dann Recherchieren und uns Ansätze bzw. Hintergründe liefern und uns so dass Recherchieren ersparren.

Der Vorteil liegt aber nicht nur in der Suche und Verwaltung von Inhalten und Quellen von Inhalten. Wie RSS Feeds, Newsgroup und anderen Diensten. Wobei der Hauptaugenmerk bei den derzeitigen Tools auf der Erzeugung von Semantischen oder in diesem Kontext auch als Meta-Informationen bezeichneten Inhalten. Wie dem Erstellen von Dokumenten und E-Mails.
[sprung]
Dem ähnlich wie in dem Eintrag „Subject“. Eine Kurze Information enthalten ist. Die der E-Mail einem Thema oder Gruppenfeld zuordnet. Dieser Vorgang wird auch in Zusammenhang mit Bookmarks(del.ico.us)als Tagging Bezeichnet. Wobei URL Adressen ein paar Stichworte als Eingliederung des Links in eine oder mehrere Themengebieten genutzt wird um so die ULR’s Themenbezogen (Semantisch) zu durchsuchen. Tagging Projekte gibt es aber nicht nur für URL’s, sondern auch für Photos(Flickr.com), Videos(YouTube.com) und Musik(myspace.com). Wobei diese aber auch gleich eine eigene Plattform für Soziale Netzwerke bieten.

Sematic Desktop kommt aus dem Gedanken das Internet zu strukturieren, wobei es dabei nicht um die Hardware Struktur geht, sondern von Inhalten die im Internet angeboten werden.

Der Wandel ist daher nötig, da wir das WWW heute anders nutzen als in den Anfängen. Damals war es eher ein Tummelplatz für Technik Intressierte. Wohin es sich heute als fester bestandteil des Alltags ist und Mainstream geworden ist. Es ist also nicht mehr Intressant die buntesten und mit Effekten vollgestopftesten Seiten zu finden und zu benutzen, sondern die am Inhaltlich wertvollste. Durch die veränderte Anforderung müssen sich auch die Anwendungen anpassen.

Das Semantic Web ist eine Erweiterung des Internets um Internet Seiten maschinell lesbar zu machen.

Die dazu genutzt werden um eine Semantische Verbindung zwischen Inhalten im Internet zu knüpfen. Im Klartext sollen Informationen nicht nur über Hyperlinks miteinander verbunden werden können, sondern über ihren Inhalt. Zur Beschreibung dieser Daten, soll das Ressource Description Framework(RDF) genutzt werden. Das später genauer beschrieben wird. Dadurch wird das Internet inhaltsbezogen durchsuchbar.

Semantic Web fehlt auch in das Buzzword "Web 2.0", wobei hier auf soziale Netzwerke wie FOAF (Friend of a Friend) oder XFN (XHTML Friends Network) verwiesen wird. Soziale Netzwerke sind Verknüpfungen zwischen Personen. Wobei sich das hier auf Gemeinschaften bezieht die Inhalte produzieren wie die Wikipedianer oder Bloggern. Als Beispiele zu nennen sind hier FOAF und XFN Sie funktionieren so ähnlich wie Buddylisten bei Instant Messenger Diensten. Nur das hier die Verbindungen öffentlich gemacht werden. Diese Systeme sind bei Bloggern sehr beliebt. Denn so kann sich die Webblogs Szene Personifizieren und weiß wer dieses Webblog unterhält. Dies dient zur Stärkung der Beziehung in solchen Gemeinschaften.

Wobei es für die Wikipedianer ein eigenständiges Projekt noch gibt das sich Semantik Wikipedia nennt. Die eigentlich nur eine Wiki über das Semantic Web ist aber auch gleichzeitig ein versuch ist die Wikipedia mit neuen Semantischen Technologien zu verbinden.

2. Semantic Web

Doch wie soll das Funktionieren? Als erstes brauchen wir eine Sprache, um Informationen zu beschreiben. Dafür ist das schon oft angesprochene RDF(Ressource Description Format) angedacht. RDF beschreibt Aussagen über Informationen, in so genannten Triples. Diese bestehen aus 3 Teilen(Wie man sich denken kann ;-)), aus einem Subjekt, einem Prädikat und einem Objekt. Eine Sammlung von Triples ist ein RDF-Graph. Solch ein RDF basiertes Datenmodell wird meistens als Wissenspräsentation beschrieben. In Informatiker kreisen auch als Ontologie bekannt.
Weil anders als in Relationalen Datenbanken(wie MySQL, Access, etc.), die Verknüpfungen über den Inhalt gezogen werden und nicht über einen Schlüssel. Auf das RDF-Modell kann man leicht eine Ontologie Sprache aufsetzten, bzw. das ist so angedacht. Das W3C sieht dafür OWL oder SPARQL vor. Dadurch kann man Informationen aus einem RDF-Graphen abfragen, genauso wie mit SQL Relationale Datenbanken ausgekundschaftet werden können. In den meisten Projekten werden RDF-Graphen auch in relationalen Datenbanken gespeichert und SPARQL hat auch viel Ähnlichkeit mit SQL.

3. Geschichte

Bevor wie uns ins Technische begeben ist erst mal eine kleine Geschichtsstunde angesetzt. Den zum Verständnis ist es schon wichtig zu wissen, woher diese Ideen Stammen.
Die erste Beschreibung eines Systems der einen einheitlichen Schnittstelle zur Verarbeitung von Informationen, sowie der Kommunikation mit anderen Teilnehmern ermöglicht, passierte 1945 durch Vannevar Bush in dem Artikel “As we may think”. Man glaubt es kaum ein vorfahre von George W. Bush, war ein SciFi Autor. Er beschrieb ein Gerät namens “Memex” das alle Bücher, Aufzeichnungen und Kommunikationsmittel vereint und dass sehr schnell und flexibel bewältigt. Das Gerät sollte aber völlig analog funktionieren und Mikrofilm als Speichermedium nutzen. Weitere wurzeln findet man bei Ted Nelson. Der 1960 ein System beschrieb, das aus verknüpften Informationen bestand. Die in einer Informationsgesellschaft gehandelt wurden. Er nannte das System "Xanadu". Der erste versuch solch ein System umzusetzen fand durch Tim Berners-Lee(Begründer des Internet) statt. Der sein Programm "Enquire-Within-Upon-Everything" nannte. Wobei der Name alles sagt. Das in der Lage war Informationen über Personen, Projekte, Hardwareressourcen und wie Sie miteinander verknüpft waren, zu beschreiben. Es sollte die Dokumentationen die am CERN zu der Zeit geschrieben wurden Strukturieren und einfacher zugänglich machen.

Als nächstes ist das Semantic Web zu nennen. Das 1998 von Tim Berners Lee aufgeworfen wurde. Er fordert eine Stärkung der Nutzbarkeit der Daten und arbeitet auch an den entsprechenden Standards wie RDF, etc. mit.

Der Begriff Semantic Desktop wurde durch Stefan Decken beschrieben und von Leo Sauermann 2003 aufgegriffen um die verschiedenen Technologien und Ideen in einem Hauptbegriff zusammen zu fassen. Wobei Stefan Decker und Martin Frank das Bedürfnis eines Networked Semantic Desktop 2004 Formulierten. Was den Semantic Desktop um eine P2P Funktion erweitert in der die Ontologien untereinander getauscht werden können.

4. Technologien/Standards:

Hier werden die Techniken genauer beleuchtet, die in der Einleitung erwähnt wurden.

4.1 RDF - Resource Description Framework

Das Ressource Description Framework ist eine Sprache um Informationen über Ressourcen im Internet Darzustellen. Es geht aber hier um die Darstellung von Metadaten, also um Informationen über Informationen. Was im ersten Moment etwas Schizophren klingt. Es geht aber in diesem Fall um Informationen wie der Autor eines Textes oder die Art des Textes. Man kann das natürlich auch auf andere Informationen wie Musik, Video oder Dienste beziehen. Dabei können die Informationen Variieren. Definiert wurde Sie aber um zusätzliche Informationen über Web Dokumente zu Definieren und sie maschinell verarbeiten zu können. RDF ist konzipiert um diese Art von Informationen zwischen Anwendungen auszutauschen ohne den Verlust der Bedeutung. Dabei werden Informationen mittels URI’s identifiziert und beschrieben. URI's sind das gleiche wie URL's nur heißen sie nicht mehr Unified Resource Locator, sondern Identifier.

RDF ist wie folgt aufgebaut. Es besteht aus drei Objekttypen, den Ressourcen, Eigenschaftselementen und den Objekten. Die auch als Subjekt, Objekt und Prädikat beschrieben werden. Durch Kombination der drei Typen wird eine Aussage über eine Ressource formuliert. Um das ganze anschaulich zu machen beschreiben wir einen RDF Graph für diesen Artikel:

Das Objekt ist die URL des Artikels "http://www.c-plusplus.net/forum/viewtopic-var-t-is-136407.html"
Die Eigenschaft Ordnet der Information eine Bedeutung zu in unserem Fall "http://purl.org/dc/elements/1.1/Creator".

Um Eigenschaften zu definieren wird der Dienst PURL genutzt PURL steht für Persistent Uniform Ressource Locator. Das ist eine Verlinkung von einer URL auf eine URL. Dieser Dienst ist für URL's die in Büchern oder Zeitschriften veröffentlicht werden. Denn nach ein paar Jahren kann der Link nicht mehr gültig sein und man kann so den Link auf eine andere Seite oder auf die neue URL der Seite setzen und so bleibt die URL im Buch gültig.

Damit die Anwendungen unter den Eigenschaften immer das gleiche verstehen hat die DCMI (Dublin Core Metadata Initiative) ein paar Standard Terme mit PURL's verlinked. Näheres findet ihr unter http://dublincore.org.

Das Objekt ist der Autor "mosta"

. Da aber der Nick sehr nichts sagend ist verlinken wir auf den Artikel im Forum in dem ich mich beschreibe. Also tragen wir bei Objekt den folgenden Link ein " http://www.c-plusplus.net/forum/viewtopic-var-t-is-139119.html". Aber hier könnte auch ein Link auf einen XFN oder FOAF stehen.

Der RDF Graph dazu sieht so aus.

RDF Graphen werden mittels eines XML Syntax beschrieben. Als Beispiel nehmen wir den gerade beschriebenen RDF Graphen.

1. <?xml version="1.0"?>
2. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
3.             xmlns:exterms="http://purl.org/dc/elements/1.1/">
4.   <rdf:Description rdf:about="http://www.c-plusplus.net/forum/viewtopic-var-t-is-136407.html">
5.       <exterms:Creator> http://www.c-plusplus.net/forum/viewtopic-var-t-is-139119.html</exterms:Creator>
6.   </rdf:Description>
7. </rdf:RDF>

In der ersten Zeile wird nur definiert welche XML Version benutzt wird.
Die zweite Zeile definiert den RDF Namespace und alle tags die mit <rdf: beginnen sind Teil des RDF Syntax.
Die dritte Zeile ist auch eine Namespace Deklaration und sagt aus, dass wir die Eigenschaften des DCMI benutzen um unsere Graphen zu beschreiben.
Die vierte Zeile ist die Ressource die Beschrieben wird
Die fünfte Zeile beginnt dem tag exterms:Creator und ist die Eigenschaft. Der Term, der in dem tag eingeschlossen ist, ist das Objekt.
Die sechste Zeile schließt die Description
Die siebte Zeile beendet unseren RDF Graphen.

4.2 OWL

Die Web Ontology Language (kurz OWL) ist eine Spezifikation des W3C, um Ontologien anhand einer formalen Beschreibungssprache erstellen, publizieren und verteilen zu können. Es geht darum, Terme einer Domäne und deren Beziehungen formal so zu beschreiben, dass auch Software (Agenten) die Bedeutung verarbeiten ("verstehen") kann (können). OWL ist somit ein wesentlicher Bestandteil der Semantic Web-Initiative von Tim Berners-Lee. OWL basiert technisch auf der RDF-Syntax und historisch auf DAML+OIL, und geht dabei über die Ausdrucksmächtigkeit von RDF-Schema weit hinaus. Zusätzlich zu RDF und RDF-Schema werden weitere Sprachkonstrukte eingeführt, die es erlauben, Ausdrücke ähnlich der Prädikatenlogik zu formulieren.

Sprachebenen: Lite, DL und Full [Bearbeiten]

OWL kommt in drei verschiedenen Versionen daher. Dazu wurden die Sprachebenen OWL Lite, OWL DL und OWL Full definiert. Für den Einsatz von OWL Lite/DL wurden Einschränkungen definiert, welche die Entwicklung von Tools erleichtern bzw. vollständige Inferenz ermöglichen sollen.

OWL Lite [Bearbeiten]

Die "Light-Version" wurde mit dem Ziel geschaffen, eine einfach zu implementierende Untermenge der Sprache zu schaffen. Sie dient vor allem zum Erschaffen einfacher Taxonomien und leicht axiomatisierter Ontologien. Dabei fielen diverse Sprachkonstrukte aus OWL DL weg.

OWL DL [Bearbeiten]

Dies ist die Ebene, deren Semantik noch am ehesten an DAML+OIL heranreicht. DL steht für die Beschreibungslogik (description logic) \mathcal{SHOIN} (D), welche zu einer entscheidbaren Untermenge der Prädikatenlogik erster Stufe äquivalent ist. Um die Abbildbarkeit auf diese Logik zu gewährleisten, wurden diverse Einschränkungen für den Einsatz von RDFS-Konstrukten eingefügt, zum Beispiel darf eine Klasse nicht Instanz einer anderen Klasse sein.

OWL Full [Bearbeiten]

OWL Full besteht aus den selben Sprachkonstrukten wie OWL DL, verzichtet aber auf die dort vorhandenen Einschränkungen. Dadurch sind die Ontologien unentscheidbar, können dafür aber prädikatenlogische Ausdrücke höheren Grades ermöglichen.

Sprachkonstrukte [Bearbeiten]

Die Spezifikation erweitert die Bedeutung von RDF und RDF-Schema um weitere Konstrukte, um die Ausdrucksmächtigkeit zu steigern (oder teilweise auch einzuschränken, um Entscheidbarkeit zu erreichen).

OWL unterscheidet Klassen, Eigenschaften (properties) und Instanzen. Klassen stehen für Konzepte. Sie können Eigenschaften besitzen. Instanzen sind Individuen einer oder mehrerer Klassen.

Klassen betreffend [Bearbeiten]

* owl:class
* owl:oneOf
* owl:unionOf
* owl:intersectionOf
* ...

Properties betreffend [Bearbeiten]

* owl:Restriction
* owl:allValuesFrom
* owl:someValuesFrom
* ...

Instanzen betreffend [Bearbeiten]

Beispiel [Bearbeiten]

Das Beispiel beschreibt die Konzepte <Person>, <Gender> und <Woman>. Eine Frau ist definiert, als eine <Person> mit dem Wert <female> im Property <gender>, das der Klasse <Gender> angehören muss. Die Instanz <STilgner> ist somit als <Person> beschrieben eine Frau (<Woman>). Mittels Inferenz kann diese Zugehörigkeit ermittelt werden.

4.3 SPARQL

SPARQL ist ein rekursives Akronym und steht für "SPARQL Protocol and RDF Query Language".
SPARQL ist eine Sprache um Informationen aus einem RDF Graphen zu erhalten. Die Grundstruktur erinnert einen stark an SQL. Da ein ähnlicher bzw. der Syntax darauf gebaut wurde. Abfragen bestehen aus vier grund Bausteinen. einer PREFIX zeile in der Variablen definiert werden können. Eine SELECT Anweisung in der die Datenbestände angegeben werden können die dursucht werden sollen. Eine WHERE Zeile in der ausgewählt wurde welche Daten aus den vorher angegebenen Quellen extrahiert werden sollen.

Die RDF Data Access Working Group (DAWG) des World Wide Web Consortium treibt die Entwicklung und Standardisierung von SPARQL voran. Momentan (seit April 2006) ist SPARQL auf der Entwicklungsstufe Candidate Recommendation angelangt. SPARQL ist der Nachfolger mehrerer Abfragesprachen (z.B. RDF Query Language, RDQL), die ebenfalls auf RDF-Daten zugreifen.

ARQ ist eine Implementation, die SPARQL-Abfragen durchführen kann.

Ein Beispiel [Bearbeiten]

Das folgende Beispiel findet die Namen aller afrikanischen Hauptstädte.

PREFIX abc: http://example.com/exampleOntologie#
SELECT ?capital ?country
WHERE {
?x abc:cityname ?capital.
?y abc:countryname ?country.
?x abc:isCapitalOf ?y.
?y abc:isInContinent abc:africa.
}

Variabeln werden mit vorangestelltem „?“ gekennzeichnet (möglich ist auch „$“). Dabei werden alle Variablenbelegungen für ?capital und ?country zurückgegeben, die auf die Muster dieser vier RDF-Tripeln passen.

Weil das Ausschreiben der URIs die Leserlichkeit einer Abfrage mindert, können Präfixe verwendet werden. Hier steht ein „abc:“ für „http://example.com/exampleOntologie#“

mosta

der artikel scheint sich endlich dem ende zuzubewegen ;-). ich werd versuchen ihn zu diesem wochende fertig zu kriegen. ich hab aber erstmal die beispiel projekte rausgeschmießen vlt. kann man daraus einen 2. artikel machen. aber ich wollte mal zu nem Punkt kommen und nicht nochmal dreimonate damit verbringen mich intensive in die verschiedene frameworks einzuarbeiten.

was noch zu machen ist. es ist im geschichtsteil eine kurze passage über das semantic web einzufügen wo ... steht. dann die owl und sparql abschnitte zu schreiben.

was nett wäre wenn sich das jmd. durchlesen würde und mir ne kritik dazu geben könte. Ich werd den artikel auch noch öfters in der woche bearbeiten, also ruhig nochmal schauen ob sich was geändert hat . hab es zwar schon einigen leuten zum lesen gegeben aber konstruktive kritik schadet nie.

gruss mosta

GPC

Ändere bitte noch das Kürzel, [F] gibt's nicht mehr ( http://www.c-plusplus.net/forum/viewtopic-var-t-is-157919.html ). Danke

MfG

GPC

mosta

Ich werd wohl zum wochenende nicht fertig . Erstens gibt es auf der arbeit zuviel zu tun und ich hab jetzt im Netz einen Vortrag von Sir-Tim-Berners-Lee im Netz gefunden und wollte davon noch ein paar Sachen einbauen. Vorallem sind das bessere Beispiele.

Deswegen fallen auch die Beispiel Projekte raus. Den Index hab ich jetzt schonmal vorbereitet

--------------------------------------------------------------------------------

Semantic Desktop die nächste Evolution des Rechners?

1. Einleitung
2. Semantic Web
3. Was ist Semantic Desktop?
4. Geschichte
5. Technologien/Standards
5.1 RDF / RDF Schema
5.2 OWL
5.3 SWRL
5.4 SPARQL
6. Referenzen

1. Einleitung

Durch das Internet hat sich die Art und Weise mit der wir Kommunizieren komplett geändert. Der Rechner mit einem Internet Anschluss gehören zur Grundausstattung. E-Mails, Instant Messenger (IM) und Webseiten gehören zu unserem Alltag und ein Leben ohne diese Dinge scheint immer schwerer vorstellbar. Doch die Handhabung all dieser Anwendungen wird aufgrund der steigenden Informationsflut immer aufwendiger. Um dem entgegen zu wirken entstammt die Idee des Semantic Desktop.

Das Ziel des Semantic Desktop ist es den Umgang und das Erstellen von Inhalten zu erleichtern und beschleunigen. Dies geschieht durch das definieren von Informationen. Also eine einheitliche Beschreibung von Informationen. Das bezieht sich nicht auf die Inhalte, sondern das wir Sie für den Computer verständlich deklarieren. Dies geschieht so ähnlich wie MP3 Tags nur das das System nicht auf Audio Daten beschränkt ist.
Da der Semantic Desktop eine Implementierung von Semantic Web Technologien auf den Desktop ist. Beschreibe ich als erstes die Idee des Semantic Web und gehe dann auf den Semantic Desktop ein.

2. Semantic Web

Das Ziel des Semantic Web ist es das World Wide Web(WWW) für den Computer benutzbar zu machen. So dass eine globale verteilte Datenbank entsteht. Das Ziel ist es das Netz mit Suchanfragen auswerten zu können.

Dafür gliedert sich das Semantic Web in 4 Ebenen auf.

Die erste Ebene besteht aus Links auf Inhalte und Datenbank Einträgen

Das sind URI’s(Uniform Ressource Identifiers), der bekannteste Identifier ist die URL(Uniform Ressource Locater). Außerdem Datenbank Einträge. Diese Schicht ist die der Inhalte also das Web so wie wir es jetzt kennen.

Die zweite Ebene sind RDF Graphen

Hier beginnt eigentlich das Semantic Web. Denn hier beschreiben wir unsere Inhalte. Also ihnen wird eine Bedeutung(Semantic) zu geordnet. Dafür wird RDF benutzt das ich später beschreiben werde.

Die dritte Ebene sind RDF Schema

Hier wird ein einheitliches Vokabular festgelegt. Also wenn ein Begriff genutzt wird das auf einen Deklaration verwiesen werden kann und alle dann unter den Begriffen das selbe verstehen. Diese Schicht übernimmt die Aufgabe eines Duden, indem man nachschlagen kann was welches Wort meint. Nur dass das System nicht auf eine Sprache begrenzt ist, sondern es ein Abstrakter Link ist, der auch auf Definitionen in verschiedenen Sprachen weiterlinken kann.

Die vierte Ebene sind Ontologien

Das ist die Ebene in der die wirklichen Vorteile eines Semantic Web zu tragen kommen. Denn hier kann den Inhalten nun eine Bedeutung zugeordnet werden. Denn wir wissen nun wenn wir eine Datei übers Internet zugreifen welcher Art Sie ist, wer der Autor ist, Thema und jede weiter Information die über sie angegeben wurde.

3. Was ist Semantic Desktop?

4. Geschichte

Bevor wie uns ins Technische begeben ist erst mal eine kleine Geschichtsstunde angesetzt. Den zum Verständnis ist es schon wichtig zu wissen, woher diese Ideen Stammen.
Die erste Beschreibung eines Systems der einen einheitlichen Schnittstelle zur Verarbeitung von Informationen, sowie der Kommunikation mit anderen Teilnehmern ermöglicht, passierte 1945 durch Vannevar Bush in dem Artikel “As we may think”. Man glaubt es kaum ein vorfahre von George W. Bush, war ein SciFi Autor. Er beschrieb ein Gerät namens “Memex” das alle Bücher, Aufzeichnungen und Kommunikationsmittel vereint und dass sehr schnell und flexibel bewältigt. Das Gerät sollte aber völlig analog funktionieren und Mikrofilm als Speichermedium nutzen. Weitere wurzeln findet man bei Ted Nelson. Der 1960 ein System beschrieb, das aus verknüpften Informationen bestand. Die in einer Informationsgesellschaft gehandelt wurden. Er nannte das System "Xanadu". Der erste versuch solch ein System umzusetzen fand durch Tim Berners-Lee(Begründer des Internet) statt. Der sein Programm "Enquire-Within-Upon-Everything" nannte. Wobei der Name alles sagt. Das in der Lage war Informationen über Personen, Projekte, Hardwareressourcen und wie Sie miteinander verknüpft waren, zu beschreiben. Es sollte die Dokumentationen die am CERN zu der Zeit geschrieben wurden Strukturieren und einfacher zugänglich machen.

Als nächstes ist das Semantic Web zu nennen. Das 1998 von Tim Berners Lee aufgeworfen wurde. Er fordert eine Stärkung der Nutzbarkeit der Daten und arbeitet auch an den entsprechenden Standards wie RDF, etc. mit.

Der Begriff Semantic Desktop wurde durch Stefan Decken beschrieben und von Leo Sauermann 2003 aufgegriffen um die verschiedenen Technologien und Ideen in einem Hauptbegriff zusammen zu fassen. Wobei Stefan Decker und Martin Frank das Bedürfnis eines Networked Semantic Desktop 2004 Formulierten. Was den Semantic Desktop um eine P2P Funktion erweitert in der die Ontologien untereinander getauscht werden können.

5. Technologien/Standards:

Hier werden die Techniken genauer beleuchtet, die in der Einleitung erwähnt wurden.

5.1 RDF - Resource Description Framework

Das Ressource Description Framework ist eine Sprache um Informationen über Ressourcen im Internet Darzustellen. Streng genommen ist es keine eigene Sprache, sondern ein XML Dialekt. Es geht aber hier um die Darstellung von Metadaten, also um Informationen über Informationen. Was im ersten Moment etwas Schizophren klingt. Es geht aber in diesem Fall um Informationen wie der Autor eines Textes oder die Art des Textes. Man kann das natürlich auch auf andere Informationen wie Musik, Video oder jede andere Ressource beziehen. Dabei können die Informationen Variieren. Definiert wurde Sie aber um zusätzliche Informationen über Web Dokumente zu Definieren und sie maschinell verarbeiten zu können. RDF ist konzipiert um diese Art von Informationen zwischen Anwendungen auszutauschen ohne den Verlust der Bedeutung. Dabei werden Informationen mittels URI’s identifiziert und beschrieben.

RDF ist wie folgt aufgebaut. Es besteht aus drei Objekttypen, den Ressourcen, Eigenschaftselementen und den Objekten. Die auch als Subjekt, Objekt und Prädikat beschrieben werden. Durch Kombination der drei Typen wird eine Aussage über eine Ressource formuliert. Um das ganze anschaulich zu machen beschreiben wir einen RDF Graph für diesen Artikel:

Das Objekt ist die URL des Artikels "http://www.c-plusplus.net/forum/viewtopic-var-t-is-136407.html"
Die Eigenschaft Ordnet der Information eine Bedeutung zu in unserem Fall "http://purl.org/dc/elements/1.1/Creator".

Um Eigenschaften zu definieren wird der Dienst PURL genutzt PURL steht für Persistent Uniform Ressource Locator. Das ist eine Verlinkung von einer URL auf eine URL. Dieser Dienst ist für URL's die in Büchern oder Zeitschriften veröffentlicht werden. Denn nach ein paar Jahren kann der Link nicht mehr gültig sein und man kann so den Link auf eine andere Seite oder auf die neue URL der Seite setzen und so bleibt die URL im Buch gültig.

Damit die Anwendungen unter den Eigenschaften immer das gleiche verstehen hat die DCMI (Dublin Core Metadata Initiative) ein paar Standard Terme mit PURL's verlinked. Näheres findet ihr unter http://dublincore.org. Dies sind die vorher beschriebenen RDF Schema.

Das Objekt ist der Autor "mosta"

. Da aber der Nick sehr nichts sagend ist verlinken wir auf den Artikel im Forum in dem ich mich beschreibe. Also tragen wir bei Objekt den folgenden Link ein " http://www.c-plusplus.net/forum/viewtopic-var-t-is-139119.html". Aber hier könnte auch ein Link auf einen XFN(Xhtml Friends Network) oder FOAF(Friend-Of-A-Friend) Eintrag stehen.

Der RDF Graph dazu sieht so aus.

RDF Graphen werden mittels eines XML Syntax beschrieben. Als Beispiel nehmen wir den gerade beschriebenen RDF Graphen.

1. <?xml version="1.0"?>
2. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
3.             xmlns:exterms="http://purl.org/dc/elements/1.1/"> 
4.   <rdf:Description rdf:about="http://www.c-plusplus.net/forum/viewtopic-var-t-is-136407.html">
5.       <exterms:Creator> http://www.c-plusplus.net/forum/viewtopic-var-t-is-139119.html</exterms:Creator>
6.   </rdf:Description>
7. </rdf:RDF>

In der ersten Zeile wird nur definiert welche XML Version benutzt wird.
Die zweite Zeile definiert den RDF Namespace und alle tags die mit <rdf: beginnen sind Teil des RDF Syntax.
Die dritte Zeile ist auch eine Namespace Deklaration und sagt aus, dass wir die Eigenschaften des DCMI benutzen um unsere Graphen zu beschreiben.
Die vierte Zeile ist die Ressource die Beschrieben wird
Die fünfte Zeile beginnt dem tag exterms:Creator und ist die Eigenschaft. Der Term, der in dem tag eingeschlossen ist, ist das Objekt.
Die sechste Zeile schließt die Description
Die siebte Zeile beendet unseren RDF Graphen.

5.2 OWL

Die Web Ontology Language (kurz OWL) ist eine Spezifikation des W3C, um Ontologien anhand einer formalen Beschreibungssprache erstellen, publizieren und verteilen zu können. Es geht darum, Terme einer Domäne und deren Beziehungen formal so zu beschreiben, dass auch Software (Agenten) die Bedeutung verarbeiten ("verstehen") kann (können). OWL ist somit ein wesentlicher Bestandteil der Semantic Web-Initiative von Tim Berners-Lee. OWL basiert technisch auf der RDF-Syntax und historisch auf DAML+OIL, und geht dabei über die Ausdrucksmächtigkeit von RDF-Schema weit hinaus. Zusätzlich zu RDF und RDF-Schema werden weitere Sprachkonstrukte eingeführt, die es erlauben, Ausdrücke ähnlich der Prädikatenlogik zu formulieren.

Sprachebenen: Lite, DL und Full [Bearbeiten]

OWL kommt in drei verschiedenen Versionen daher. Dazu wurden die Sprachebenen OWL Lite, OWL DL und OWL Full definiert. Für den Einsatz von OWL Lite/DL wurden Einschränkungen definiert, welche die Entwicklung von Tools erleichtern bzw. vollständige Inferenz ermöglichen sollen.

OWL Lite [Bearbeiten]

Die "Light-Version" wurde mit dem Ziel geschaffen, eine einfach zu implementierende Untermenge der Sprache zu schaffen. Sie dient vor allem zum Erschaffen einfacher Taxonomien und leicht axiomatisierter Ontologien. Dabei fielen diverse Sprachkonstrukte aus OWL DL weg.

OWL DL [Bearbeiten]

Dies ist die Ebene, deren Semantik noch am ehesten an DAML+OIL heranreicht. DL steht für die Beschreibungslogik (description logic) \mathcal{SHOIN} (D), welche zu einer entscheidbaren Untermenge der Prädikatenlogik erster Stufe äquivalent ist. Um die Abbildbarkeit auf diese Logik zu gewährleisten, wurden diverse Einschränkungen für den Einsatz von RDFS-Konstrukten eingefügt, zum Beispiel darf eine Klasse nicht Instanz einer anderen Klasse sein.

OWL Full [Bearbeiten]

OWL Full besteht aus den selben Sprachkonstrukten wie OWL DL, verzichtet aber auf die dort vorhandenen Einschränkungen. Dadurch sind die Ontologien unentscheidbar, können dafür aber prädikatenlogische Ausdrücke höheren Grades ermöglichen.

Sprachkonstrukte [Bearbeiten]

Die Spezifikation erweitert die Bedeutung von RDF und RDF-Schema um weitere Konstrukte, um die Ausdrucksmächtigkeit zu steigern (oder teilweise auch einzuschränken, um Entscheidbarkeit zu erreichen).

OWL unterscheidet Klassen, Eigenschaften (properties) und Instanzen. Klassen stehen für Konzepte. Sie können Eigenschaften besitzen. Instanzen sind Individuen einer oder mehrerer Klassen.

Klassen betreffend [Bearbeiten]

* owl:class
* owl:oneOf
* owl:unionOf
* owl:intersectionOf
* ...

Properties betreffend [Bearbeiten]

* owl:Restriction
* owl:allValuesFrom
* owl:someValuesFrom
* ...

Instanzen betreffend [Bearbeiten]

Beispiel [Bearbeiten]

Das Beispiel beschreibt die Konzepte <Person>, <Gender> und <Woman>. Eine Frau ist definiert, als eine <Person> mit dem Wert <female> im Property <gender>, das der Klasse <Gender> angehören muss. Die Instanz <STilgner> ist somit als <Person> beschrieben eine Frau (<Woman>). Mittels Inferenz kann diese Zugehörigkeit ermittelt werden.

5.3 SWRL

5.4 SPARQL

SPARQL ist ein rekursives Akronym und steht für "SPARQL Protocol and RDF Query Language". Durch SPARQL wird die Aussage klar das aus dem WWW, eine Globale Datenbank zu erstellen.
SPARQL ist eine Sprache um Informationen aus einem RDF Graphen zu erhalten. Die Grundstruktur erinnert einen stark an SQL. Da ein ähnlicher bzw. der Syntax darauf gebaut wurde. Abfragen bestehen aus vier grund Bausteinen. einer PREFIX zeile in der Variablen definiert werden können. Eine SELECT Anweisung in der die Datenbestände angegeben werden können die dursucht werden sollen. Eine WHERE Zeile in der ausgewählt wurde welche Daten aus den vorher angegebenen Quellen extrahiert werden sollen.

Die RDF Data Access Working Group (DAWG) des World Wide Web Consortium treibt die Entwicklung und Standardisierung von SPARQL voran. Momentan (seit April 2006) ist SPARQL auf der Entwicklungsstufe Candidate Recommendation angelangt. SPARQL ist der Nachfolger mehrerer Abfragesprachen (z.B. RDF Query Language, RDQL), die ebenfalls auf RDF-Daten zugreifen.

ARQ ist eine Implementation, die SPARQL-Abfragen durchführen kann.

Ein Beispiel [Bearbeiten]

Das folgende Beispiel findet die Namen aller afrikanischen Hauptstädte.

PREFIX abc: http://example.com/exampleOntologie#
SELECT ?capital ?country
WHERE {
?x abc:cityname ?capital.
?y abc:countryname ?country.
?x abc:isCapitalOf ?y.
?y abc:isInContinent abc:africa.
}

Variabeln werden mit vorangestelltem „?“ gekennzeichnet (möglich ist auch „$“). Dabei werden alle Variablenbelegungen für ?capital und ?country zurückgegeben, die auf die Muster dieser vier RDF-Tripeln passen.

Weil das Ausschreiben der URIs die Leserlichkeit einer Abfrage mindert, können Präfixe verwendet werden. Hier steht ein „abc:“ für http://example.com/exampleOntologie#

6. Referenzen

mosta

Semantic Desktop die nächste Evolution des Rechners?

1. Einleitung
2. Semantic Web
3. Geschichte
4. Was ist ein Semantic Desktop?
5. Technologien/Standards
5.1 RDF / RDF Schema
5.2 OWL
5.3 SWRL
5.4 SPARQL
6. Fazit
7. Referenzen

1. Einleitung

Das Internet revolutionierte die Art und Weise mit der wir Kommunizieren. E-Mails, Instant Messenger(IM) und andere Dienste gehören zu unserem Alltag und dieser scheint immer schwerer zu bewältigen ohne diese Anwendungen. Doch das dadurch resultierende Informationsaufkommen lässt sich immer schwerer bändigen. Um dem entgegen zu wirken entstammt die Idee des Semantic Desktop.

Das Ziel des Semantic Desktop ist es den Umgang und das Erstellen von Inhalten zu erleichtern und zu beschleunigen. Dies soll durch das Deklarieren von Inhalten geschehen. Es soll eine einheitliche Beschreibung von Informationen entstehen. Dies bezieht sich nicht auf die Inhalte, sondern das wir Sie für den Computer verständlich beschreiben. Dies geschieht wie bei MP3 Tags nur das das System nicht auf Audio Daten beschränkt ist.
Da der Semantic Desktop eine Implementierung von Semantic Web Technologien auf den Desktop ist. Wird als erstes die Idee des Semantic Web beschrieben und es wird dann näher auf den Semantic Desktop eingegangen.

2. Semantic Web

Das Ziel des Semantic Web ist es das Web für den Computer benutzbar zu machen.

Zurzeit funktioniert das Web über Hyperlinks. Die Seiten werden mit Hyperlinks miteinander verbunden und man kann so durch das Web Navigieren. Diese Art des Vernetzens verteilt die Aufgabe der Verbindungen setzen auf den Anbieter bzw. Erzeuger von Informationen. Das birgt die Problematik das Informationen verschwinden bzw. nicht wieder gefunden werden können. Da man den Pfad kennen muss der zu der Information führt. Dieses Problem ist schon lange bekannt und die derzeitige Lösungsstrategie sind Suchmaschinen. Doch deren Funktion ist durch Spamer und der riesigen Informationsflut mittlerweile sehr eingeschränkt und mit immer steigendem Aufwand zu gebrauchen.
Die Strategie des Semantic Web ist es den Seiten selbst oder in Datenbanken Meta Information anzufügen. Die Aussagen über die Information beinhalten, Wie der Autor, Thema, Themengebiete und andere Angaben die zu der Website passen. Dies führt zu einer Art Weltwissen, einem System das eine Repräsentation des Menschlichen Wissens Darstellt und das in einer Ontologie Strukturiert wird.

Dafür gliedert sich das Semantic Web in 4 Ebenen auf.

1.Ebene korrekten Darstellung von Inhalten

Hier sind Standards definiert die ein Medienneutrale (uniformierte) Darstellung erlauben. Als Keycode liegt das Unicode Format vor.
Zur Speicherung wird das XML Format verwendet. Das eine Medien- und Sprachneutralität Darstellung ermöglicht.
Das Referenzieren von Ressourcen geschieht mittels URI’s (Der bekannteste Identifier ist der Locator [URL]). URI’s können wie folgt aussehen:

ftp://ftp.is.co.za/rfc/rfc1808.txt

   http://www.ietf.org/rfc/rfc2396.txt

   ldap://[2001:db8::7]/c=GB?objectClass?one

   mailto:John.Doe@example.com

   news:comp.infosystems.www.servers.unix

   tel:+1-816-555-1212

   telnet://192.0.2.16:80/

   urn:oasis:names:specification:docbook:dtd:xml:4.1.2

Es werden zwar einige dieser Protokolle nicht im Semantic Web benutzt aber es macht Sinn wenn man das in Verbindung mit dem Semantic Desktop bringt. Die erste Ebene ist damit die direkte Schnittstelle zum „alten“ Web.

2.Ebene RDF Graphen

Hier beginnt eigentlich das Semantic Web. Denn hier beschreiben wir unsere Inhalte. Also ihnen wird eine Bedeutung(Semantic) zu geordnet. Dafür wird RDF benutzt, das ich später beschreiben werde. [siehe RDF Kapitel]

3.Ebene RDF Schema

Das RDF Schema dient zum beschreiben von RDF-Triples. Das RDF-Klassen und Beziehungssystem ist ähnlich dem Typen System von Objekt-Orientierten Programmiersprachen. Es unterscheidet sich darin das die Definition einer Klasse im RDF Vokabular, nicht durch Attribute und deren Typen gestaltet wird, sondern durch die Terme auf die sich die Ressourcen beziehen.

Diese RDF-Triples definieren Regeln bzw. Aussagen wie:

Tür      -> subclass  -> Auto
Tür      -> Typ       -> Material
Material -> Typ       -> Metall

VW Käfer -> Typ       -> Auto

So können Beziehungen zwischen den Inhalten auf den Seiten gesetzt werden. Wobei die Beziehungen auch auf Teile der Seite oder Absätze bezogen werden können. Dadurch können Texte erstellt werden aus diesen Textbausteinen.

4.Ebene Ontologien

In dieser Ebene wird es richtig spannend. Denn in dieser Ebene können wir auf einheitliche beschriebene Inhalte mit gleichem Vokabular zugreifen. In dieser Ebene werden Ontologien erstellt. Also es werden die in der vorherigen Ebene definierten Regeln hierarchisch Organisiert. Wenn wir das auf unser Beispiel beziehen. Können wir folgende Frage beantworten und zwar "Aus was besteht die Tür eines VW Käfer?". Da wir wissen das der Käfer ein Auto ist und ein Auto eine Tür hat und eine Tür aus Material besteht und Metall ein Material ist können wir sagen das die Tür des Käfers aus Metall besteht. Um sich das zu vereinfachen kann man das als eine Relationale Datenbank ansehen, nur das hier noch ein Objekt Modell dazu gekommen ist. Mann kann also Tabellen als Typ angeben bei der Deklaration der Tabellenspalten.

Verifizieren
Zum Verifizieren von Daten werden Signaturen und Verschlüsselungsverfahren genutzt. Das die Echtheit der Daten gewährleistet.

3. Geschichte

Bevor wie uns ins Technische begeben ist erst mal eine kleine Geschichtsstunde angesetzt. Den es ist schon Interessant woher diese Ideen Stammen.
Die erste Beschreibung des Semantic Desktop, geschah 1945 durch Vannevar Bush in dem Artikel “As we may think”(Man glaubt es kaum ein vorfahre von George W. Bush). Er beschrieb ein Gerät namens “Memex” das alle Aufzeichnungen - Text, Bild und Ton - seines Benutzers speichern kann und alle Kommunikationsmittel vereint. Das bewältigt dieses Gerät sehr schnell und für den Benutzer sehr intuitive. Das Gerät sollte aber völlig analog funktionieren und Mikrofilm als Speichermedium nutzen. Weitere Wurzeln findet man bei Ted Nelson. Der 1960 ein System beschrieb, das aus verknüpften Informationen bestand. Die in einer Informationsgesellschaft gehandelt wurden. Er nannte das System "Xanadu". Der erste versuch solch ein System umzusetzen fand durch Tim Berners-Lee(Begründer des Internet) statt. Der sein Programm "Enquire-Within-Upon-Everything" nannte. Wobei der Name alles sagt. Das in der Lage war Informationen über Personen, Projekte, Hardwareressourcen und wie Sie miteinander verknüpft waren, zu beschreiben. Es sollte die Dokumentationen die am CERN zu der Zeit geschrieben wurden Strukturieren und einfacher zugänglich machen. Es fand aber keinen Anklang.

Als nächstes folgt das Semantic Web. Das 1998 von Tim Berners Lee eingeführt wurde. Er fordert eine Stärkung der Nutzbarkeit der Daten und arbeitet auch an den entsprechenden Standards wie RDF mit.

Der Begriff Semantic Desktop wurde durch Stefan Decken beschrieben und von Leo Sauermann 2003 aufgegriffen um die verschiedenen Technologien und Ideen in einem Hauptbegriff zusammen zu fassen. Wobei Stefan Decker und Martin Frank den Begriff Networked Semantic Desktop, 2004 formulierten. Was den Semantic Desktop um eine P2P Funktion erweitert in der die Ontologien untereinander getauscht werden können.

4. Was ist ein Semantic Desktop?

Die Definition des Semantik Desktop leitet sich aus den Beschreibungen von Vannevar Bush ab. Da er aber ein Analoges System beschrieb wurde die Definition nach ihrer technischen Realisierung angepasst.
auch ein schlachtplan ergibt sich ähnlich dem Semantic Web Paper von Tim-Berners-Lee.

Ein Semantic Desktop (SD) ist ein Gerät, das in der Lage ist alle digitalen Informationen seines Benutzers zu speichern. Diese werden als Semantic Web Ressourcen interpretiert und als RDF Graphen gespeichert. Ressourcen aus dem Web können gespeichert, bearbeitet und der Inhalt kann mit anderen Benutzern geteilt werden.
Ontologien repräsentieren das persönliche mentale Model seines Benutzers. Sie stellen damit den „Klebstoff“ zwischen Informationen und dem „System“ da. Anwendungen eines Semantic Desktop speichern, lesen und kommunizieren via Ontologien und Semantic Web Protokollen. Dadurch ist der Semantic Desktop eine Erweiterung des Gedächtnisses seines Benutzers.

Wenn man es grob zusammenfassen möchte, wäre ein Semantic Desktop ein lokales Semantic Web. Der unterschied ist aber das man hier nicht eine riesige "relationale" Datenbank anstrebt, sondern das Entwickeln von Anwendungen die diese Daten auswerten und aufbereiten können.
Es werden Programme nicht mehr ein Problem lösen, sondern eher in einem Verbund miteinander Kommunizieren. Es werden also intelligentere Anwendungen angestrebt, die sich mehr auf seinen Benutzer anpassen und ihm ständig wiederkehrende arbeiten wie das sortieren von Dateien abnehmen. Da sie nach ihrer Bedeutung strukturiert werden. Man spricht auch in diesem Zusammenhang auch von Software Agenten.

Die ersten Versuche solche Systeme laufen schon. Es gibt einmal das Smart Web Projekt des DFKI. Das eine Software für Mobile Endgeräte ist, die durch Sprach- und Tastatureingaben gesteuert werden kann. Es ist aber nur möglich Fragen zu stellen und auch nur zu bestimmten Themengebieten. Was aber trotzdem beeindruckend ist, weil es eine Aussicht ist auf weiterführende Projekte ist wie die nächsten.
Das DFKI hat noch ein zweites Projekt, und zwar gnowsis das eine Semantic Desktop System darstellt. Im Mittelpunkt steht ein Web-Server der die Handhabung der Ontologie übernimmt. Gnowsis bietet ein Framework an, zur Anbindung an bestehenden Software Lösungen. Es wird versucht die Inhalte aus diesen Anwendungen zu nutzen und in der Ontologie im Server abzubilden.
Als weiteres Projekt zu erwähnen ist haystack vom MIT. Das ein E-Mail Client, Adressbuch, Kalender und Dateisystem ist. Im Gegensatz zum gnowsis Projekt wird hier nicht ein Framework mit Pipelines zu Anwendungen realisiert, sondern ein einheitliches System.

5. Technologien/Standards:

Hier werden die Techniken genauer beleuchtet, die in der Einleitung erwähnt wurden.

5.1 RDF - Resource Description Framework

Das Ressource Description Framework ist eine Sprache um Informationen über Ressourcen im Internet Darzustellen. Streng genommen ist es keine eigene Sprache, sondern ein XML Dialekt. Es geht aber hier um die Darstellung von Metadaten, also um Informationen über Informationen. Was im ersten Moment etwas Schizophren klingt. Es geht aber in diesem Fall um Informationen wie der Autor eines Textes oder die Art des Textes. Man kann das natürlich auch auf andere Informationen wie Musik, Video oder jede andere Ressource beziehen. Dabei können die Informationen Variieren. Definiert wurde Sie aber um zusätzliche Informationen über Web Dokumente zu Definieren und sie maschinell verarbeiten zu können. RDF ist konzipiert um diese Art von Informationen zwischen Anwendungen auszutauschen ohne den Verlust der Bedeutung. Dabei werden Informationen mittels URI’s identifiziert und beschrieben.

RDF ist wie folgt aufgebaut. Es besteht aus drei Objekttypen, den Ressourcen, Eigenschaftselementen und den Objekten. Die auch als Subjekt, Objekt und Prädikat beschrieben werden. Durch Kombination der drei Typen wird eine Aussage über eine Ressource formuliert. Um das ganze anschaulich zu machen beschreiben wir einen RDF Graph für diesen Artikel:

Das Subjekt ist die URL des Artikels "http://www.c-plusplus.net/forum/viewtopic-var-t-is-136407.html"
Das Objekt Ordnet der Information eine Bedeutung zu in unserem Fall "http://purl.org/dc/elements/1.1/Creator".

Um Eigenschaften zu definieren wird der Dienst PURL genutzt PURL steht für Persistent Uniform Ressource Locator. Das ist eine Verlinkung von einer URL auf eine URL. Dieser Dienst ist für URL's die in Büchern oder Zeitschriften veröffentlicht wurden. Denn nach ein paar Jahren kann der Link nicht mehr gültig sein und man kann so den Link auf eine andere Seite oder auf die neue URL der Seite setzen und so bleibt die URL im Buch gültig.

Don't say "color" say <http://example.com/2002/std6#col>

Damit die Anwendungen unter den Eigenschaften immer das gleiche verstehen hat die DCMI (Dublin Core Metadata Initiative) ein paar Standard Terme mit PURL's verlinked. Näheres findet ihr unter http://dublincore.org. Dies sind die vorher beschriebenen RDF Schema.

Das Prädikat ist der Autor "mosta". Da aber der Nick sehr nichts sagend ist verlinken wir auf den Artikel im Forum in dem ich mich beschreibe. Also tragen wir bei Objekt den folgenden Link ein " http://www.c-plusplus.net/forum/viewtopic-var-t-is-139119.html". Aber hier könnte auch ein Link auf einen XFN(XHtml Friends Network) oder FOAF(Friend-Of-A-Friend) Eintrag stehen.

Der RDF Graph dazu sieht so aus.

RDF Graphen werden mittels eines XML Syntax beschrieben. Als Beispiel nehmen wir den gerade beschriebenen RDF Graphen.

1. <?xml version="1.0"?>
2. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
3.             xmlns:exterms="http://purl.org/dc/elements/1.1/"> 
4.   <rdf:Description rdf:about="http://www.c-plusplus.net/forum/viewtopic-var-t-is-136407.html">
5.       <exterms:Creator>http://www.c-plusplus.net/forum/viewtopic-var-t-is-139119.html</exterms:Creator>
6.   </rdf:Description>
7. </rdf:RDF>

In der ersten Zeile wird nur definiert welche XML Version benutzt wird.
Die zweite Zeile definiert den RDF Namespace und alle tags die mit <rdf: beginnen sind Teil des RDF Syntax.
Die dritte Zeile ist auch eine Namespace Deklaration und sagt aus, dass wir die Eigenschaften des DCMI benutzen um unsere Graphen zu beschreiben.
Die vierte Zeile ist die Ressource die Beschrieben wird
Die fünfte Zeile beginnt dem tag exterms:Creator und ist die Eigenschaft. Der Term, der in dem tag eingeschlossen ist, ist das Objekt.
Die sechste Zeile schließt die Description
Die siebte Zeile beendet unseren RDF Graphen.

5.2 OWL

Die Web Ontology Language(OWL) ist eine Sprache zum beschreiben von Ontologien, wobei sie sich in 3 Sprach Ebenen unterteilt. Mit OWL lassen sich Ausdrücke formulieren ähnlich der Prädikaten-Logik. Die verschiedenen Ebenen unterscheiden sich in der Ausdrucksfähigkeit. OWL basiert auf den RDF-Syntax und DAML+OIL.

OWL Lite

OWL Light dient zum Beschreiben einfacher Taxonomien. Es sind die Grundlegenden Funktionen zum definieren von Klassen und setzen von Abhängigkeiten.

OWL DL

DL steht für Description Logic(Beschreibungslogik) und ist gleichzusetzen mit der ersten Stufe der Prädikatenlogik.

OWL Full

OWL Full ermöglicht Ausdrücke aus Prädikatenlogiken höherer Stufe.

Hier ein Beispiel:

<owl:Class rdf:ID="WhiteWine">
  <owl:intersectionOf rdf:parseType="Collection">
    <owl:Class rdf:about="#Wine" />
    <owl:Restriction>
      <owl:onProperty rdf:resource="#hasColor" />
      <owl:hasValue rdf:resource="#White" />
    </owl:Restriction>
  </owl:intersectionOf>
</owl:Class>

Dies ist ein Beispiel für eine IntersectionOf Abfrage. Es ist wird die „Collection“ auf Weißweine überprüft.

5.3 SWRL

SWRL steht für Semantic Web Rule Language und ist eine Zusammenführung von OWL Lite und OWL DL, nur das hier die Lesbarkeit durch den Menschen im Vordergrund steht. Es lehnt sich dabei an EBNF(Extended-Backus-Nau-Form) in seiner Syntax an.

Der Syntax sieht so aus:

axiom ::= rule 

rule ::= 'Implies(' [ URIreference ] { annotation } antecedent consequent ')'
antecedent ::= 'Antecedent(' { atom } ')'
consequent ::= 'Consequent(' { atom } ')'

atom ::= description '(' i-object ')'
	 | dataRange '(' d-object ')'
	 | individualvaluedPropertyID '(' i-object i-object ')'
	 | datavaluedPropertyID '(' i-object d-object ')'
	 | sameAs '(' i-object i-object ')'
	 | differentFrom '(' i-object i-object ')'
	 | builtIn '(' builtinID { d-object } ')'
builtinID ::= URIreference

i-object ::= i-variable | individualID
d-object ::= d-variable | dataLiteral

i-variable ::= 'I-variable(' URIreference ')'
d-variable ::= 'D-variable(' URIreference ')'

Der konkrete XML Syntax sieht so aus.

<swrlx:Ontology
  swrlx:name = xsd:anyURI 
>
  Content: (owlx:VersionInfo | owlx:PriorVersion | owlx:BackwardCompatibleWith | 
            owlx:IncompatibleWith | owlx:Imports | owlx:Annotation | 
            owlx:Class[axiom] | owlx:EnumeratedClass(D,F) | 
            owlx:SubClassOf(D,F) | owlx:EquivalentClasses | owlx:DisjointClasses(D,F) | 
            owlx:DatatypeProperty | owlx:ObjectProperty | 
            owlx:SubPropertyOf | owlx:EquivalentProperties | 
            owlx:Individual[axiom] | owlx:SameIndividual | owlx:DifferentIndividuals |
            ruleml:imp[axiom] | ruleml:var[axiom])* 
</swrlx:Ontology>

5.4 SPARQL

SPARQL ist ein rekursives Akronym und steht für "SPARQL Protocol and RDF Query Language". Durch SPARQL wird die Aussage klar das aus dem WWW, eine Globale Datenbank zu erstellen.
SPARQL ist eine Sprache um Informationen aus einem RDF Graphen zu erhalten. Die Grundstruktur erinnert einen stark an SQL. Da ein ähnlicher bzw. der Syntax darauf gebaut wurde. Abfragen bestehen aus vier Grund Bausteinen. einer PREFIX Zeile in der Variablen definiert werden können. Eine SELECT Anweisung in der die Datenbestände angegeben werden können die durchsucht werden sollen. Eine WHERE Zeile in der ausgewählt wurde welche Daten aus den vorher angegebenen Quellen extrahiert werden sollen.

SPARQL ist eine Abfrage(query) Sprache und dient nur dem Abfragen von Inhalten, im Gegensatz zu den Ontologie Sprachen. Hier ein Beispiel, indem nach den Artikeln von „mosta“ gefragt wird:

PREFIX page: http://www.c-plusplus.net/forum/Artikel
SELECT  	?topic
WHERE{
		?x page:topic ?mosta
}

6. Fazit

Im groben und Ganzen ist es eine toll klingende Sache, wobei ich bisher die Nachteile wissentlich verschwiegen habe. Denn das Problem ist, dass man alle Inhalte selbst Editieren muss. Das heißt man muss selber die Ontologien bauen. Diese Problematik wird sich aber mit der Zeit legen. Wenn es nämlich schon fertige "default" Ontologien gibt, die für uns dann das grundlegende Einsortieren übernehmen können. Bei den jetzigen Systemen läuft das aber alles per Fuß. Was sich in etwa wie die ersten Spracherkennungssoftware verhält, nur mit einer längeren „Trainingsphase“.

7. Referenzen

Das RFC zum URI Standard
http://www.gbiv.com/protocols/uri/rfc/rfc3986.html
Das RDF-Schema Paper vom W3C
http://www.w3.org/TR/rdf-schema/
Der Artikel von Vannevar Bush
http://en.wikipedia.org/wiki/As_We_May_Think
Das SWRL Paper
http://www.w3.org/Submission/SWRL/

mosta

ha ich hab den Artikel doch noch dieses Jahr fertig bekommen;-p. Wär nett, wenn ich eine Einschätzung über den Artikel bekommen könnte bevor er rausgeht. Also ob Inhaltlich alles stimmig ist. Den ich hab den bestimmt 10 mal neu angefangen und immer wieder aus Textgruppen zusammengefühgt.

gruß und guten rutsch an die redaktion

GPC

Cool, aber für 'ne inhaltliche Prüfung muss er zuerst auf Status T, dann für die Rechtschreibprüfung auf R

mosta

da keiner bisher was zu meckern hat. Stell ich den Artikel auf Rechtschreibprüfung . Wenn jmd. etwas nicht schlüssig erscheint kann er es ja trotzdem sagen

GPC

hab ihn jetzt gelesen, mir ist nichts aufgefallen, außer:

Der unterschied ist aber das man hier eine riesige "relationale" Datenbank anstrebt, sondern das Entwickeln von Anwendungen die diese Daten auswerten und aufbereiten können.

Müsste es nicht "keine riesige "relationale" Datenbank" heißen?

MfG

GPC

mosta

korrigiert heißt jetzt so:

hier nicht eine riesige "relationale" Datenbank anstrebt

mosta

soll ich den Artikel auf fertig stellen? oder prüft denn noch wär anders auf rechtschreibfehler?

michba

Ich schau heute oder morgen noch drüber.

[X] Semantic Desktop

Semantic Desktop die nächste Evolution des Rechners?

1. Einleitung

2. Semantic Web

3. Geschichte

4. Was ist ein Semantic Desktop?

5. Technologien/Standards

5.1 RDF / RDF Schema

5.2 OWL

5.3 SWRL

5.4 SPARQL

6. Fazit

7. Referenzen

1. Einleitung

2. Semantic Web

3. Geschichte

4. Was ist ein Semantic Desktop?

5. Technologien/Standards:

5.1 RDF - Resource Description Framework

5.2 OWL

OWL Lite

OWL DL

OWL Full

5.3 SWRL

5.4 SPARQL

6. Fazit

7. Referenzen