Verhaltenstest
Dubletten
Dubletten werden nur erkannt, wenn die Dateien komplett identisch sind.
Sofern bei HTML-Dateien Sessioninformationen in den Links stehen, werden die Dateien gleichen (Text)inhaltes nicht als identisch anerkannt!
Bei der Indexierung werden alle Dubletten im Index abgelegt und erst bei der Suche werden die 100% deckungsgleichen Dateien herausgefiltert. So kann bei einer Einschränkung zum Beispiel auf einen Bestimmten Host oder ein bestimmtes Verzeichnis immer eine der Dubletten gefunden werden.
ZIP-Archive
ZIP-Archive werden entpackt und die einzelnen Dateien so indexiert, als wären sie in einem eigenen Verzeichnis. Der Zugriff erfolgt über die URLdirekt, indem das ZIP-Archiv und die jeweilige Datei angegeben werden: http:://host/pfad/archiv.zip?verzeichnis/datei.ext
RAR-Archive
RAR-Archive werden nicht entpackt, der Inhalt wird nicht indexiert.
"Schwarze Löcher"
Dokumente die Ihre Session-ID dynamisch mit in die Links schreiben, werden bei jedem Zugriff als neues Dokument erkannt und somit erneut indexiert. Über die Oberfläche besteht keine Möglichkeit diese Session-Informationen auszublenden.
|