MySQL Volltextsuche mit deutscher Stoppwortliste

Wer von Ihnen schon einmal versucht hat eine Volltextsuche in MySQL zu realisieren, dem ist bestimmt aufgefallen, dass es garnicht so einfach ist eine deutsche Stoppwortliste, die ein unnötiges Anschwillen des Volltext-Indizes verhindern soll, zu finden.
Ich habe vor einiger Zeit mal recherchiert und die gängisten deutschen Wörter in einer Wortliste zusammen gefasst.

Die Stoppwortliste (Dateiname: „stopwords_german“) muss dann nur noch auf den Server kopiert werden. Am besten unter „/etc/“ , wo sich auch die Datei „my.cnf“ (MySQL-Konfigurationsdatei) befindet.
In der Datei „my.cnf“ muss dann noch folgendes ergänzt werden:

[mysqld]
ft_min_word_len = 3
ft_stopword_file = /etc/stopwords_german

Danach müssen Sie MySQL neu starten (z.B.  „/etc/init.d/mysql restart“).

Um zu prüfen ob alle Einstellungen erfolgreich übernommen wurden, reicht es aus diesen MySQL-Befehl auszuführen:

show variables like 'ft_%'

Wenn schon ein Volltext-Index besteht, muss dieser natürlich erneuert werden. Das macht man mit einem einfachen MySQL-Befehl:

REPAIR TABLE tbl_name QUICK;

Download: stopwords_german.zip

Wer mehr Informationen zum Thema Volltextsuche in MySQL haben will, den empfehle ich diesen Artikel von phpperformance.de

MySQL: Das umfassende Handbuch
1 Star2 Stars3 Stars4 Stars5 Stars (1 Bewertungen, Ø: 5,00 von 5)

1 Kommentar

1 Trackback / Pingback

  1. MySQL: Zeichengrenze für Volltextindex erhöhen « devgeek.de: news, tutorials und links by Mark Buch

Antworten

Jeder freigeschaltete Kommentar erhält einen DoFollow-Link.
Wir schalten aber nur Kommentare frei, die auch wirklich welche sind und/oder den Artikel sinnvoll bereichern oder ergänzen. Also gebt euch ein wenig Mühe :)


*