Volltextsuche in MariaDB
  • 11 Apr 2023
  • 1 Minute zum Lesen

Volltextsuche in MariaDB


Article Summary

Die Volltextsuche (FTS) ermöglicht einen ausgeklügelten Ansatz bei der Textsuche in Totara, insbesondere innerhalb des Katalogs. Details zur Einrichtung mit MariaDB finden Sie auf dieser Seite.  

Sprachunterstützung

MariaDB verwendet standardmäßig eine Zusammenstellung ohne Berücksichtigung von Groß- und Kleinschreibung für die Volltextsuche, aber Sie können bei Bedarf eine andere Zusammenstellung angeben. Zum Beispiel:

$CFG->dboptions['ftslanguage'] = 'utf8_unicode_ci';
 $CFG->dboptions['ftslanguage'] = 'utf8mb4_0900_as_ci';
 $CFG->dboptions['ftslanguage'] = 'utf8mb4_de_pb_0900_ai_ci';

MariaDB unterstützt keine japanischen und anderen Sprachen mit sehr kurzen Wörtern ohne Leerzeichen dazwischen. Sie können die folgende Einstellung aktivieren, um eine grundlegende experimentelle Unterstützung dieser Sprachen zu erhalten:

$CFG->dboptions['fts3bworkaround'] = true;

Nachdem Sie eine dieser Änderungen vorgenommen haben, füllen Sie die FTS-Tabellen erneut aus, indem Sie Folgendes ausführen:

php admin/cli/fts_repopulate_tables.php

Mindestlänge des Suchbegriffs

MariaDBs Standard-Suchzeichenbegrenzung kann durch Bearbeiten der Konfigurationsdatei geändert werden, wie unten dargestellt:

[mysqld]
 innodb_ft_min_token_size=2
 ft_min_word_len=2

Wörter stoppen

Stoppwörter sind eine Reihe von Wörtern, die von der Index- und Suchabfrage ausgeschlossen werden. Sie hängen von der Sprache ab, die bei der Indizierung und Suche verwendet wird, sowie von der Wörterbuchpräsenz für die Datenbankinstallation. Wenn der Nutzer beispielsweise nach „Hotels in Wellington“ sucht, schließt das System „in“ aus der Suche aus.

Weitere Details zu MariaDB-Stoppwörtern finden Sie unter: https://mariadb.com/kb/en/library/full-text-index-stopwords/

Morphologische Suche

Leider unterstützt MariaDB das Ngram-Plugin nicht, das in MySQL zur Durchführung von Word-Stieling verwendet wird. Daher können wir zu diesem Zeitpunkt nicht raten, wie die morphologische Suche in MariaDB aktiviert werden kann.

Unakzentuierte Suche

MariaDB unterstützt standardmäßig Diacritics, hängt aber von der Zusammenstellung ab. Wenn die Zusammenstellung beispielsweise istutf8_general_ci, dann gibt die Suchanfrage, die entweder das Wort 'första' oder 'forsta' enthält, einen Datensatz zurück, der das Wort 'första' enthält.

© Copyright 2024 Totara Learning Solutions. All rights reserved. Some content originally obtained via GPLv3 license and continues to be available under GPLv3. All other content is the sole copyright of Totara Learning Solutions. 


War dieser Artikel hilfreich?

Changing your password will log you out immediately. Use the new password to log back in.
First name must have atleast 2 characters. Numbers and special characters are not allowed.
Last name must have atleast 1 characters. Numbers and special characters are not allowed.
Enter a valid email
Enter a valid password
Your profile has been successfully updated.