InfoCodex - Sprachübergreifende Textanalyse, Textmining, Linguistische Datenbank, Taxonomie, Ontologie

InfoCodex basiert auf einer fortschrittlichen neuen Technologie für Textanalyse und sprachübergreifende Inhaltserkennung (patentiert in Europa und den USA).

Im Text vorkommende Wörter oder Ausdrücke (Wortgruppen wie "Europäische Union", "Unternehmens-Suchmaschine" etc.) werden mit der linguistischen Datenbank von InfoCodex abgeglichen. Diese umfasst mehr als drei Millionen Wörter/Ausdrücke, die nach sprachübergreifenden Synonymgruppen klassiert sind. Die Synonymgruppen weisen auf einen Knotenpunkt in einer universellen Taxonomie (Ontologie), welche die Bedeutung der abgeglichenen Synonyme charakterisiert. Diese von der Sprache unabhängige Information wird daraufhin verwendet, um den Inhalt des Dokuments einzuordnen.

Sprachübergreifender universeller Wissensspeicher

Die zentrale mehrsprachige linguistische Datenbank (Wissensspeicher) resultiert aus dem Kombinieren und Harmonisieren von anerkannten linguistischen Werken wie dem WordNet (Princeton University), EuroVoc, AgriVoc, JuriVoc, DIN, der „International Classification for Standards“ (ICS), Finanztaxonomien und vielen anderen Quellen.

Inhaltserkennung und Kategorisierung

Inhalts-Ähnlichkeit

Semantische- und Ähnlichkeitssuche

Abstract-Generierung

Visualisierung

Datenschutz/Sicherheit

Semantic Web

Kundennutzen

Semantische Maschine

Verteilte Datenquellen

Sprachübergreifende Textanalyse