Die exakte Suche (= klassische Volltextsuche)
macht Information nur dann sichtbar, wenn die entsprechenden Suchbegriffe
bekannt sind. Wenn einem jedoch die Information nicht bekannt ist, ist
folglich auch der genaue Wortlaut unbekannt, und die Information bleibt
weiterhin verborgen.
Die Synonymsuche (= semantische Suche) findet Synonyme
zum eingegebenen Suchtext, in der Abfragesprache sowie auch in anderen
Sprachen. So findet beispielsweise die Suche nach "bicycle" auch "bike",
"push-bike", "Fahrrad", "Velo", "Drahtesel" etc.; eine entscheidende
Eigenschaft bei Dokumenten, die von Dritten geschrieben wurden (die
möglicherweise verschiedene Begriffe für ein und dieselbe Sache verwenden).
Zusammengesetzte Begriffe (Gruppen von Wörtern, die zusammengehören)
werden ebenfalls erkannt, zum Beispiel "United Nations Secretariat",
"common sense", "Europäische Union" oder "office fédérale de la statistique"
Die Ähnlichkeitssuche findet ähnliche Dokumente
zu einer Abfrage, die aus freiem Text in natürlicher Sprache besteht
(zum Beispiel ein erhaltenes E-Mail). Der Inhalt der Abfrage wird mit
den bestehenden Dokumenten verglichen; dabei ist keine wortgetreue Gleichheit
der Suchbegriffe erforderlich.
Die sprachübergreifende Ähnlichkeitssuche ist entscheidend
für die automatische Kategorisierung von Dokumenten und das Matching
von Dokumenten mit ähnlichem Inhalt. Sie funktioniert sogar, wenn die
Mehrheit der Ausdrücke unterschiedlich ist.
InfoCodex ist zurzeit das einzige System im Markt, das eine
echt sprachübergreifende semantische Suche und Ähnlichkeitssuche ohne
vorgängiges aufwendiges Trainieren bietet.