Mittwoch, 14. August 2019
msg betreibt eine auf Open Source basierte Bibliothek mit dem Namen „Holmes“, die im offiziellen GitHub-Repository veröffentlicht wurde. Mithilfe von Holmes können Informationen aus englischen und deutschen Texten extrahiert und die semantischen Beziehungen zwischen den einzelnen Bestandteilen eines Satzes analysiert werden.
Mit Holmes lässt sich beispielsweise die Suchfunktion, etwa innerhalb von Dokumenten, auf ein völlig neues Level heben. Denn im Gegensatz zu den gängigen Suchmechanismen, in denen ein Dokument lediglich nach bestimmten Wörtern durchsucht werden kann, wird mit Holmes nach der Bedeutung ganzer Phrasen gefiltert. Um herauszufinden, inwieweit sich zwei Aussagen, die auf reiner Wortebene keine Übereinstimmung aufweisen, auf semantischer Ebene – also hinsichtlich ihrer Bedeutung – decken, setzt Holmes auf Prädikatenlogik. Denn Holmes transformiert die syntaktischen Informationen über jeden Satz in semantische Strukturen, sodass verschiedenen Aussagen auf Bedeutungsebene miteinander verglichen werden können.
Der Open-Source-Bibliothek liegt ein logisches, regelbasiertes System zugrunde, das beschreibt, wie syntaktische Strukturen in der jeweiligen Sprache semantische Beziehungen ausdrücken. Sprich: wie eine bestimmte inhaltliche Bedeutung sich im Satzbau widerspiegelt. Holmes baut auf der Open-Source-Software spaCy auf, die auf die Verarbeitung natürlicher Sprache spezialisiert ist. Die Holmes-Bibliothek kann ohne umfangreiche Anpassungen „Out of the Box“ für eine große Bandbreite an Anwendungsfällen wie Chatbots, Suchanfragen sowie Dokumentenklassifizierungen genutzt werden.
Hier geht’s zu Holmes auf GitHub und im spaCy Universe sowie zur Demoversion.