Mit Schema.org starten die großen Suchmaschinenanbieter Google, Bing und Yahoo ein Projekt, dass es Webmastern ermöglicht ihre Seiteninhalte noch spezifischer zu beschreiben. Ziel der Suchmaschinen ist es, in Zukunft Informationen noch genauer gewinnen zu können und damit die Suchergebnisse weiter zu verbessern. Demnach ist das Thema auch für die Suchmaschinenoptimierung (SEO) interessant.
Im Rahmen meiner aktuellen SEO Studienarbeit wurde ich auf das Thema Schema.org hingewiesen. Ein Gemeinschaftsprojekt der Suchgiganten Google, Yahoo und Bing. Die Veröffentlichung eines gemeinsamen Projekts, welches besonders für Webmaster und SEOs interessant sein sollte, wurde Anfang Juni 2011 im WebmasterCentralBlog (Introducing schema.org: Search engines come together for a richer web) bekannt gegeben. Auch auf seo-united wurde vom Start des Projektes bereits einführend berichtet.
Was ist schema.org?
Schema.org ist ein Gemeinschaftsprojekt von Google, Bing und Yahoo um mit Hilfe von definierten Schemas Markup-Sprachen wie z.B. HTML zu erweitern. Ein konkretes Beispiel zur Veranschaulichung befindet sich weiter unten im Artikel.
„(…) a new initiative from Google, Bing and Yahoo!
to create and support a common set of schemas for structured data markup on web pages.“
Das Ziel von Schema.org
Die Fülle an Informationen, die wachsende Größe der Webseiten und deren Inhalt, sowie die steigende semantische Komplexität von Markup-Quellcode stellen die Suchmaschinen vor immer größere Herausforderungen bei der Indexierung von Inhalt. Die Algorithmen der Suchmaschinen tun sich schwer daran, komplexe Strukturen im HTML-Code zu erkennen und den notwendigen Inhalt auszulesen. Das Problem für die Crawler der Suchmaschinen: Wichtige Informationen gehen verloren.
Die neuen Möglichkeiten von schema.org sollen dem entgegenwirken. Die Grenzen der bisherigen Markup-Standards werden erweitert. Eine Definition und Auszeichnung von Inhalt lässt sich in Zukunft noch spezifischer einsetzen und ermöglicht es den Suchmaschinen Inhalte noch genauer indexieren und verteilen zu können.
Motivation für den Webmaster: Sauberer und fehlerfreier HTML-Code verbessert das Information Retrieval der Suchmaschinen. Im Rahmen einer Onpage Optimierung lassen sich Fehler identifizieren und ausbessern. Eine korrekte Auszeichnung und Platzierung der Keywords ermöglicht es so, im Ranking der Suchmaschinen besser platziert zu werden.
Motivation für die Suchmaschinenoptimierung (SEO)
Das die Idee von schema.org für SEO relevant wird, ist kaum anzuzweifeln. Im folgenden vier motivierende Punkte sich mit dem Thema einmal genauer auseinandersetzen sollen:
Semantisch korrekter Quellcode: Webseiten die es dem Crawler der Suchmaschinen ermöglichen die Inhalte einer Seite optimal zu indexieren, haben eine höhere Chance auf ein gutes Ranking. Dem entgegen stehen Webseiten mit schlecht strukturierten oder sogar falschem Quellcode. Da die Suchmaschinen selbst der Vorreiter in Sachen sauberes und vollständiges Markup sind, ist es ratsam ihnen hier einen Schritt entgegen zu kommen.
Detaillierte Beschreibung der Inhalte: Webseiten mit großen Mengen Inhalt wird es in Zukunft besser möglich sein, die Fülle an Informationen genauer zu definieren. Wo bisher hauptsächlich über die Keywords und den Seiteninhalt als Ganzes ein einheitliches Bild über den Inhalt der Seite erstellt werden musste, ist es nun möglich einzelne Teile einer Seite inhaltlich genau zu deklarieren und zu beschreiben.
Bessere Integration in Universal Search Dienste: Im Rahmen der laufenden Entwicklungen und Freischaltungen neuer Zusatzdienste seitens des Suchmaschinen-Primus Google (z.B. Produkte aus Universal Search) ist es wahrscheinlich, dass Google in Zukunft Seiten mit Verwendung von Schemas in den Anzeigen der Universal Search bevorzugt. Man stelle sich die Suche nach Filmen vor. Inhalte über FIlme, die semantsiche Korrekt und im Sinne von schema.org ausgezeichnet wurden, werden in einer innovativen und aktuell fiktivenGoogle-Filmsuche im Ranking besser platziert.
Möglichkeiten der Verknüpfung mit Social Media: Beim tieferen Einblick in das Vokabular von schema.org stellt man schnell die Reichweite der Neuerungen fest. Als Beispiel der Schema-Typ „Person“: Dieser fährt gleich mit einem ganzen Pool an sensiblen Daten auf wie: Adresse, Ausbildung, Kinder, Eltern und Kontaktmöglichkeit um nur einige zu nennen. Ebenfalls findet sich auch eine Eigenschaft namens: knows die ebenfalls vom Typ Person ist. Diese gibt Auskunft über die sozialen Beziehungen der deklarierten Person. Und eben diesen Personen lassen sich auch die knows-Eigenschaft hinzufügen. Für Google & co. wird es in Zukunft somit noch einfacher möglich soziale Zusammenhänge der Internetuser zu erkennen – abseits der eh schon gigantischen Möglichkeiten durch Facebook, Twitter, LinkedIn, Youtube, XING & co.
Probleme beim Einsatz von Schema.org
Die Idee von schema.org ist zweifelsohne gut und wegweisend. Dennoch wird es wie allzu oft vorerst nur für die großen Unternehmen möglich sein, das teilweise sehr komplexe Vokabular in die Semantik einzuarbeiten. Im folgenden zwei Probleme, die ich persönlich als besondere Herausforderung sehe:
Erheblicher Mehraufwand: Kleinere Webseiten und Blogs mit wenigen oder gar nur einem Betreiber haben zwei Möglichkeiten. Entweder sie schreiben weniger Texte und Inhalte. Konzentrieren sich dafür aber auf die semantisch korrekte Auszeichnung der Inhalte. Oder sie ignorieren vorerst die Fülle an Vokabular und beschränken sich auf die wesentlichen Neuerungen. Sicherlich ist Schritt 2, sobald es denn erste positive Ergebnisse über den Einfluss von Schema.org auf das SEO gibt, der empfehlenswerte Weg.
Fehlende Umsetzung in den CMS: Auch hier liegt der Vorteil bei großen Seitenbetreibern. Diese nutzen oftmals ihre eigenen Content-Management-Systeme. Dafür steht ein Inhouse-Entwicklerteam zur Verfügung oder eine Agentur im Sinne des Outsourcing. Neuerungen wie diese, lassen sich schneller in das CMS integrieren. Dem entgegen stehen Webmaster die auf Fremdsoftware angewiesen sind. Hier entscheiden die Entwickler von WordPress, Typo3 & co., wann eine Integration in die Content-Management-Systeme erfolgt.
Beispiel für den Einsatz von schema.org
Man stelle sich eine Seite vor die über Events berichtet. Das Event Weedbeat-Festival bei Hildesheim / Hannover ist auf der Seite folgendermaßen deklariert:
<div> <div>Weedbeat-Festival</div> <span>Festival für Leute die noch selber denken.</span> Datum: 15.07.2011 - 17.07.2011 </div
Die Schwierigkeiten für den Suchmaschinen-Crawler sind klar. Nur über das Keyword Datum besteht die Möglichkeit eine Info darüber zu bekommen, wann genau das Festival stattfindet. „Wann genau“ – sehr wage formuliert: Denn Auskunft über Anfang und Ende gibt in dem Sinne noch lange nicht. Auch über den Namen und die Beschreibung des Festivals können die Algorithmen der Suchmaschinen nur mutmaßen (auch wenn sie das schon sehr gut können).
Mit Hilfe des Vokabulars aus schema.org würde der HTML-Code semantsich verändert so aussehen:
<div itemscope itemtype="http://schema.org/Event"> <div itemprop="name">Weebeat-Festival</div> <span itemprop="description">3 Tage karibisches Open Air.</span> Event date: <time itemprop="startDate" datetime="2011-05-15">15.07.2011</time> <time itemprop="endDate" datetime="2011-07-17">17.07.2011</time>
Fazit – Machen wir das Web ein bisschen smarter
Die Idee ist gut. In Zukunft sollte man auf jeden Fall damit rechnen, dass die Suchmaschinen Wert auf den Einsatz der neuen, semantischen Möglichkeiten legen werden. Was das für die Suchmaschinenoptimierung und die Arbeit der Webmaster bedeutet ist selbsterklärend. Dennoch steht hier der Begriff Zukunft nicht ganz zufällig. Wann sich die Umsetzung durchsetzt ist abhängig davon, wann Google, Bing und Yahoo erstmalig Seiten mit der Integration der Typen von schema.org bevorzugt anzeigen und die Möglichkeiten auf ihre Informationsdarstellung in den Ergebnislisten dafür zu Nutze machen. Und auch bis dahin werden es die großen Seiten sein, die eine stückweise Umsetzung vorantreiben. Kleinere Webseiten, mit dem Einsatz von CMS-Systemen aus fremder Hand, müssen vorerst abwarten ab wann die Entwickler vereinfachte Möglichkeiten zur Umsetzung der neuen semantischen Beschreibungen in ihre Systeme integrieren.
Man darf gespannt sein, wo die Reise der semantischen Weiterentwicklung hingeht? Und was das für das Interne im allgemeinen zu bedeuten hat? Was ist eure Meinung?