Globus-Enterpsise-SearchInfotext-Enterpsise-SearchSucher-Enterpsise-Search
   

Report-Übersicht
Testbericht
Testumgebung
Technische Voraussetzungen
Bereitstellung
Installation
Konfiguration der Suchmaschine
Tuning der Suchmaschine
Ergebnisse optimieren / Auswertungen
Anpassungen an der Oberfläche
Indexierung
Sicherheit
Die Suche
Performance Test
Verhaltenstest

Verhaltenstest

Dubletten
Dubletten werden nur erkannt, wenn die Dateien komplett identisch sind. Sofern bei HTML-Dateien Sessioninformationen in den Links stehen, werden die Dateien gleichen (Text)inhaltes nicht als identisch anerkannt! Bei der Indexierung werden alle Dubletten im Index abgelegt und erst bei der Suche werden die 100% deckungsgleichen Dateien herausgefiltert. So kann bei einer Einschränkung zum Beispiel auf einen Bestimmten Host oder ein bestimmtes Verzeichnis immer eine der Dubletten gefunden werden.

ZIP-Archive
ZIP-Archive werden entpackt und die einzelnen Dateien so indexiert, als wären sie in einem eigenen Verzeichnis. Der Zugriff erfolgt über die URLdirekt, indem das ZIP-Archiv und die jeweilige Datei angegeben werden: http:://host/pfad/archiv.zip?verzeichnis/datei.ext

RAR-Archive
RAR-Archive werden nicht entpackt, der Inhalt wird nicht indexiert.

"Schwarze Löcher"
Dokumente die Ihre Session-ID dynamisch mit in die Links schreiben, werden bei jedem Zugriff als neues Dokument erkannt und somit erneut indexiert. Über die Oberfläche besteht keine Möglichkeit diese Session-Informationen auszublenden.

Werbung

© 2006-2013 by | Kontakt

Copyrightschutz im Internet | Reiseberichte Sandra & Joerg - Kambodscha, Sri Lanka, Neuseeland, China