Text-Detektor, c't 4/97, S. 386, cp
====================================

FUZZSRCH.C ist ein kleines Demoprogramm in einfachem ANSI-C (ausprobiert mit
GNU-C unter Unix, Borland C 5.0 unter Windows 95 und Metrowerks C CW10 unter
MacOS), entwickelt von Dr. Reinhard Rapp. Es zeigt ein verblueffend einfaches
Verfahren zur "unscharfen" Suche in Textdateien.

Um das Programm mglichst kompakt zu halten, wird kein Index verwendet, sondern
eine sequentielle Suche im Text durchgefhrt. Die Treffer und die berechneten
hnlichkeitswerte werden unmittelbar ausgegeben. Vorteilhaft ist dabei, da auf
der Festplatte kein speicheraufwendiger Index angelegt zu werden braucht, und
da kein Indexierungslauf erforderlich ist. Dafr sind allerdings die Suchzeiten
erheblich lnger, was sich bei Texten ab einigen Megabyte Gre strend
bemerkbar macht. Das Programm bietet aber auch sonst noch einigen Raum zur
Optimierung, weil es im Interesse der Verstndlichkeit recht schematisch kodiert
ist.

Nach dem Starten des Programmes werden vom Benutzer der Name der zu
durchsuchenden Textdatei, der Suchstring sowie ein Schwellwert fr die
gewnschte bereinstimmung zwischen Suchstring und Textsegment eingegeben.
Das Programm durchsucht den Text absatzweise. Es knnen mehrere Suchbegriffe,
durch Leerzeichen separiert, eingegeben werden. Die Reihenfolge spielt keine
Rolle.

Eine ausfuehrliche Beschreibung wurde in c't 4/97 veroeffentlicht.

