Knowledge Base wird quelloffen Programmcode von Yago bei GitHub

Autor Stephan Augsten

In zehn Jahren ist die Wissensdatenbank Yago bei vielen Suchmaschinen zum beliebten Helfer avanciert. Von der Knowledge Base profitierte auch IBM Watson bei der Jeopardy!-Challenge 2011. Der Yago-Quellcode wurde nun von den hinter dem Projekt stehenden Forschern veröffentlicht.

Anbieter zum Thema

Yago stellt als Knowledge Base wichtige Verküpfungen zwischen verschiedenen Entitäten her, der Quellcode steht jetzt bei GitHub allen Entwicklern offen.
Yago stellt als Knowledge Base wichtige Verküpfungen zwischen verschiedenen Entitäten her, der Quellcode steht jetzt bei GitHub allen Entwicklern offen.
(Bild: Max-Planck-Institut für Informatik)

Seit Ende August steht der Quellcode der Wissensdatenbank Yago auf der Plattform GitHub unter der Open-Source-Lizenz GNU GPL v3 zur Verfügung. Diese Softwarelizenz stellt sicher, dass jeder den damit geschützten Programmcode ausführen, studieren, verändern und teilen darf.

„Mit Yago bekommt die Entwickler-Gemeinde eine Wissensbank von hoher Qualität“, erklärt Professor Fabian Suchanek, Gründer des Knowledge-Base-Projekts. „Von der Veröffentlichung erhoffen wir uns nicht nur weitere Anwendungen von Yago, sondern auch Beiträge von der Entwickler-Gemeinde”.

Yago wurde als eine der ersten ernstzunehmenden Wissensdatenbanken im Jahr 2007 von Wissenschaftlern am Max-Planck-Institut für Informatik in Saarbrücken und der Télécom ParisTech aus der Taufe gehoben. In Yago wird jeder Wikipedia-Artikel zu einer Entität der Wissensbank.

Die Knowledge Base durchstöbert aber nicht nur Datensätze wie Wikipedia-Einträge, sondern kann auch Beziehungen zwischen diesen herstellen. Diese „Relationen“ machen es möglich, bessere Suchergebnisse auszuspielen. Auf diese Weise schaffen es die Forscher, in Yago fast 17 Millionen Entitäten und 150 Millionen Beziehungen zwischen diesen abzuspeichern.

Erst dieses Hintergrundwissen macht Internet-Suchmaschinen wie Google erst so mächtig: Neben den Ergebnissen der Web-Suche nach einer Stadt können sie auch deren Koordinaten, Wetterdaten, Ortszeit, Reise- und Unterbringungsmöglichkeiten sowie Navigationsoptionen einblenden.

Anwendungen können mithilfe der Knowledge Base in mehreren Sprachen suchen oder Fakten sowohl räumlich als auch zeitlich einordnen. Dies erlaubt semantische Suchanfragen wie „Nenne mir alle Wissenschaftler, die im 20. Jahrhundert gelebt haben und mit einem Nobelpreis ausgezeichnet wurden, sowie im weiteren Umkreis von Stuttgart geboren wurden!“. Die potenziellen Ergebnisse werden also durch den Kontext eingegrenzt.

An der Wissensdatenbank ist im Übrigen auch die Max-Planck-Ausgründung Ambiverse beteiligt, die mithilfe von Yago die Panama Papers analysiert hat. Innerhalb weniger Stunden ließen sich so Informationen über die Inhaber der Panama-Konten gewinnen, die man manuell nur mit größtem Aufwand hätte finden können.

(ID:44868833)