Zoek in volledige tekst in MariaDB
  • 28 Feb 2024
  • 1 Minuut om te lezen

Zoek in volledige tekst in MariaDB


Article Summary

Full text search (FTS) maakt het mogelijk om tekst te zoeken in Moodle, vooral binnen de catalogus. Details over hoe je dit kunt instellen met MariaDB kun je vinden op deze pagina.  

Taalondersteuning

MariaDB gebruikt standaard hoofdletter- en accentongevoelige collatie voor het zoeken in volledige tekst, maar je kunt indien nodig een andere collatie opgeven. Bijvoorbeeld:

$CFG->dboptions['ftslanguage'] = 'utf8_unicode_ci';
 $CFG->dboptions['ftslanguage'] = 'utf8mb4_0900_as_ci';
 $CFG->dboptions['ftslanguage'] = 'utf8mb4_de_pb_0900_ai_ci';

MariaDB ondersteunt geen Japanse en andere talen met zeer korte woorden zonder spaties ertussen. Je kunt de volgende instelling inschakelen om een experimentele basisondersteuning voor deze talen te krijgen:

$CFG->dboptions['fts3bworkaround'] = true;

Nadat je een van deze wijzigingen hebt aangebracht, vul je de FTS-tabellen opnieuw in door:

php admin/cli/fts_repopulate_tables.php

Minimumlengte zoekterm

MariaDB's standaard zoektekenlimiet kan gewijzigd worden door het configuratiebestand te bewerken, zoals hieronder getoond:

[mysqld]
 innodb_ft_min_token_size=2
 ft_min_word_len=2

Woorden stoppen

Stopwoorden zijn een reeks woorden die uitgesloten worden van index en zoekopdracht. Ze zijn afhankelijk van de taal die wordt gebruikt tijdens het indexeren en zoeken, evenals de aanwezigheid van het woordenboek voor database-installatie. Als de gebruiker bijvoorbeeld zoekt naar 'Hotels in Wellington', dan sluit het systeem 'in' uit van de zoekopdracht.

Meer details over MariaDB stopwoorden zijn te vinden op: https://mariadb.com/kb/en/library/full-text-index-stopwords/

Morfologisch zoeken

Helaas ondersteunt MariaDB de Ngram-plugin die in MySQL wordt gebruikt om woorden te genereren, dus we kunnen in deze fase niet adviseren hoe morfologisch zoeken in MariaDB kan worden ingeschakeld.

Ongedetailleerde zoekopdracht

Standaard ondersteunt MariaDB diakritica, maar het hangt af van de collatie. Als de collatie bijvoorbeeld utf8_general_ciis, dan zal de zoekopdracht die ofwel het woord 'första' of 'forsta' bevat een record opleveren die het woord 'första' bevat.

© Copyright 2024 Totara Learning Solutions. All rights reserved. Some content originally obtained via GPLv3 license and continues to be available under GPLv3. All other content is the sole copyright of Totara Learning Solutions. 


Was dit artikel nuttig?

Changing your password will log you out immediately. Use the new password to log back in.
First name must have atleast 2 characters. Numbers and special characters are not allowed.
Last name must have atleast 1 characters. Numbers and special characters are not allowed.
Enter a valid email
Enter a valid password
Your profile has been successfully updated.