Dokumentzonen können in der Datei style.xml
definiert werden.
Es stehen darin die folgenden Elemente als Anweisungen zur Verfügung, um die
Behandlung von XML-Tags (also Feldern in der Version) festzulegen:
Die folgende Anweisung bewirkt, dass alle XML-Tags im Dokument ignoriert werden und nur die Inhalte der XML-Elemente indiziert wird.
<ignore xmltag="*"/>
Mit der folgenden Anweisung wird das als xmltag
angegebene
XML-Element ignoriert und nur der Inhalt zwischen seinem Start- und Ende-Tag
indiziert.
<ignore xmltag="section_1"/>
Die folgende Anweisung bewirkt, dass das angegebene XML-Element als Zone
indiziert wird, wenn gleichzeitig die Anweisung ignore
xmltag="*"
vorhanden ist:
<preserve xmltag="section_1"/>
Die folgende Anweisung unterdrückt das gesamte angegebene XML-Element. Das Tag, die Attribute und der Inhalt werden nicht indiziert:
<suppress xmltag="section_1"/>
Die folgende Anweisung bewirkt, dass der Inhalt des angegebenen
XML-Elements als Feld mit dem Namen fieldname
indiziert wird.
Ist fieldname
nicht angegeben, wird als Feldname der Tag-Name
verwendet. Ein bereits bestehender Feldinhalt wird überschrieben, wenn das
optionale Attribut index="override"
angegeben ist.
<field xmltag="column_2" fieldname="vdk_field_2" index="override"/>
Die als Zonen zu indizierenden Elemente können nach dem
Ausschlussverfahren oder dem Einschlussverfahren festgelegt werden. Beim
Ausschlussverfahren werden alle Elemente bis auf diejenigen indiziert, deren
Name mit <ignore xmltag="..."/>
angegeben wurde. Beim
Einschlussverfahren dagegen schließt man zuerst alle Elemente mit <ignore
xmltag="*"/>
aus, um dann die zu indizierenden mit <preserve
xmltag="..."/>
explizit aufzuführen.
Bei beiden Verfahren können die Inhalte der Elemente (d. h. der Zonen) in Feldern abgelegt werden, so dass sie bei der Suche je ermitteltem Dokument im Suchergebnis zurückgegeben werden können. Es ist nicht möglich, ein Element zu ignorieren und gleichzeitig seinen Inhalt in einem Dokumentfeld abzulegen.