WWW-Proxy-Cache
Im CIP-Pool sind alle
WWW-Browser
so konfiguriert, daß sie defaultmäßig einen Proxy-Cache auf der
wwwproxy.informatik verwenden.
Das heißt, daß alle requests für Dokumente von außerhalb der Universität
anstatt direkt zum Ziel-Server erstmal zum Proxy gehen. Dieser sieht nach,
ob er die Seite schon in seinem Cache hat, und nur falls nicht, geht ein
request nach draußen.
Die Vorteile dieser Installation sind:
- Bei einer genügend hohen Zahl von Benutzern ist die Wahrscheinlichkeit
groß, daß beliebte Seiten im Cache liegen, anstatt von außerhalb
geholt werden zu müssen. Also wird unser Netzanschluß entlastet.
- Möchte man eine Seite während einer Sitzung mehrfach laden, so
geht nur der erste request nach draussen. Die entlastet nicht nur
das Netz, es geht meist auch wesentlich schneller.
Im Allgemeinen braucht sich der Benutzer nicht dafür zu interessieren,
ob seine requests direkt zum Ziel gehen oder durch ein Proxy laufen.
In ein paar Ausnahmefällen ist es jedoch hilfreich, wenn man
folgendes beachtet:
- Beim Abbrechen der Übertragung vom Browser aus wird nicht unbedingt
auch die Verbindung vom Proxy zum Ziel-Server abgebrochen. Dies hat
den Grund, das man die bereits geholten Daten nicht umsonst übertragen
haben möchte (es können keine partiellen Dokumente im Cache gehalten
werden).
Bei uns wurde nun die gegenüber dem normalen Verhalten von
CERN-httpd Proxys abweichende Regel eingeführt, daß eine
Übertragung abgebrochen wird, wenn noch keine 20% des Volumens
geholt wurden.
- Wenn das Proxy eine Seite im Cache findet, geht gar kein request
mehr zum eigentlichen Ziel-Server, d.h. es wird auch nicht überprüft,
ob sich die Seite zwischenzeitlich geändert hat. In der Regel macht
das keine Probleme, da die meisten Seiten nur für kurze Zeit gehalten
werden (die Zeitspanne berechnet sich aus dem Last-modified
Header). Ist man trotzdem der Meinung, daß eine Seite nicht mehr aktuell
ist, kann man im Browser die Funktion reload verwenden. Dann wird
dem Proxy mitgeteilt, daß es den Cache umgehen soll.
- Ältere Browser melden immer Host contacted. Waiting for reply.
Dies bezieht sich aber nur auf den Proxy-Server, d.h. man bekommt
die Meldung auch, wenn der eigentliche Server down ist. In diesem
Fall bringt das Proxy nach einiger Zeit eine Fehlermeldung.
Das Proxy ist freigegeben für alle Rechner der Informatik und erreichbar
unter der URL http://wwwproxy:8080/. Wichtig ist vor allem,
daß die Environment-Variable no_proxy mindestens
uni-erlangen.de enthält, sonst werden auch lokale Seiten in
den Cache kopiert. Beispiel:
setenv http_proxy http://wwwproxy:8080/
setenv ftp_proxy http://wwwproxy:8080/
setenv gopher_proxy http://wwwproxy:8080/
setenv no_proxy wwwcip,uni-erlangen.de,rrze,ftp,gopher,www
CIP-Benutzer brauchen sich um die Environment-Variablen nicht zu kümmern,
hier sind die richtigen Werte in die Browser einkompiliert.
- Siehe auch:
-
Squid Internet Object Cache (aus USA)
-
HTTP-Spezifikation (aus USA)
- CERN httpd
Dokumentation (aus USA)