Wieviele Läufer kennt Otto?

Otto ist mein Bot. Er ist ja noch nicht wirklich intelligent. Er kann zwar, wie im letzten Artikel beschrieben, Satzarten auseinanderhalten und sinnvoll darauf antworten, aber er kann sich noch nichts merken und er kann vor allem nicht einschätzen, in welchem Kontext sich ein Gespräch bewegt.

Läufer

Ein schönes Beispiel ist der Läufer. Die drei wohl bekanntesten Bedeutungen von Läufer sind:

  • Ein Sportler
  • Ein länglicher Teppich
  • Eine Schachfigur

Woher soll eine künstliche Intelligenz nun also wissen, in welchem Kontext der Läufer gemeint ist? Denn zum Verstehen gehört ja zunächst einmal, dass man weiß, worum es geht. Dabei ist mir der Gedanke gekommen, dass man eine Annäherung schaffen könnte, indem man im Satz immer Kombinationen von Verb und Subjekt bzw. Objekt betrachtet. Dadurch lässt sich annähernd bzw. in vielen Bereichen eine Abgrenzung der Bedeutungen herstellen. Als Beispiel seien hier einmal Sätze angeführt, die uns Menschen auch ohne vorheriges Gespräch sofort erkennen lassen, um was es sich handelt:

  • Der Läufer gewinnt das Rennen - Sportler
  • Der Läufer wird ausgeschlagen - Teppich
  • Der Läufer wird geschlagen - Schachfigur

Das Ganze ist natürlich ein Hack bzw. wird es Substantive geben, auf die die gleichen Verben angewendet werden können. Andererseits kann ich so mit enorm wenig Aufwand eine größere Trefferquote der jeweils richtigen Bedeutung erreichen.

Hintenrum wird bei jedem Satz in eine Tabelle Lookup die Kombination aus Substantiv und Verb eingefügt.

Clarify

Natürlich muss Otto diese Unterschiede in den Bedeutungen erst beigebracht bekommen. Dafür gibt es im Webinterface jetzt einen Menüpunkt Klärung:

Klärung

Zunächst hat jede Kombination von Substantiv und Verb eine eindeutige ID. Wird im Webinterface nun bestätigt, dass es sich bei den Sätzen um die gleiche Bedeutung eines Substantives handelt, dann wird eine der beiden IDs gelöscht, sozusagen zusammengeschmissen.

Handelt es sich jedoch um unterschiedliche Bedeutungen, wird dies vermerkt, damit nicht jedes Mal wieder neu gefragt werden muss. Otto soll ja auch mal was behalten.

Syntax

Wichtig ist dabei, ob es sich beim Substantiv um ein Subjekt oder ein Objekt handelt - es ist schon ein Unterschied, ob der Läufer schlägt oder geschlagen wird.

Otto ist ein Hobby-Projekt für mich, weswegen ich auch immer nur mal dran arbeite, wenn ich Zeit habe. Inzwischen bin ich schon ein halber Linguist geworden. Ich sag’s Euch Leute, die deutsche Sprache hat es in sich. Also, soweit. Möge Otto eines Tages weise werden.