HTTP Caching

Technik im Hypertext Transfer Protocol

HTTP Caching ist eine Technik im Hypertext Transfer Protocol (HTTP), um Ressourcen (Dokumente, Bilder, Dateien allgemein) anhand bestimmter Kriterien in einem Cache zwischenzuspeichern, um unnötige Datenübertragungen, Serveranfragen zu vermeiden und Zugriffszeiten zu verringern. Da gleichzeitig sichergestellt werden muss, dass die übertragenen Inhalte nicht veraltet sind, ist es nötig, die Zwischenspeicherung von Internetseiten oder anderen Ressourcen genau steuern zu können. Im HTTP-Standard[1] sind dafür eine Reihe von Tags definiert, die das Caching auf Proxy- und Clientebene (Browser-Cache) unterstützen.

Methoden für die Cachekontrolle

Bearbeiten

Für HTTP sind drei grundlegende Mechanismen definiert, um Caches zu kontrollieren: ‚Frische‘, ‚Gültigkeit‘ und ‚Entwertung‘ (englisch freshness, validation, invalidation).

Freshness
erlaubt es, eine bereits erhaltene Antwort wiederzuverwenden, ohne beim Ursprungsserver erneut nachfragen zu müssen und kann sowohl durch den Server wie auch den Client gesteuert werden. Zum Beispiel gibt der Expires-Header ein Datum an, zu dem das übertragene Dokument stale („abgestanden, schal“) wird, und die Angabe Cache-Control: max-age sagt dem Cache, wie viele Sekunden lang die Antwort fresh ist.
Validation
kann verwendet werden, um zu überprüfen, ob eine zwischengespeicherte Antwort noch aktuell ist, nachdem sie schon stale geworden ist. Wenn die Antwort zum Beispiel einen Last-Modified-Header („zuletzt verändert um …“) besitzt, kann ein Cache eine konditionale Anfrage mit dem If-Modified-Since-Header („falls verändert seit …“) absenden um festzustellen, ob sie sich inzwischen geändert hat. Falls die Antwort „nein“ ist, muss der Inhalt nicht erneut gesendet werden.
Invalidation
ist normalerweise eine Nebenwirkung einer anderen Anfrage, die den Cache passiert. Wenn zum Beispiel eine URL, für die eine zwischengespeicherte Antwort vorliegt, später mit einer POST-, PUT- oder DELETE-Anfrage (siehe HTTP) angesprochen wird, so wird die zwischengespeicherte Antwort entwertet, da die neue Anfrage sie höchstwahrscheinlich verändert hat.

Seit HTTP 1.1 gibt es die Möglichkeit im Header den HTTP ETag zu übergeben. Er kennzeichnet eine bestimmte Version einer Ressource.

Literatur

Bearbeiten
  • Chris Shiflett: HTTP developer's handbook. Sams Publishing, Indianapolis IN 2003, ISBN 0-672-32454-7, S. 157 ff.
Bearbeiten

Einzelnachweise

Bearbeiten
  1. Protocols Standards. In: web-cache.com. Abgerufen am 24. Juli 2017.
  2. RFC: 2616 Abschnitt 14.6: Age. (englisch).
  3. RFC: 2616 Abschnitt 14.9: Cache-Control. (englisch).
  4. RFC: 2616 Abschnitt 14.18: Date. (englisch).
  5. RFC: 2616 Abschnitt 14.19: ETag. (englisch).
  6. RFC: 2616 Abschnitt 14.21: Expires. (englisch).
  7. RFC: 2616 Abschnitt 14.24: If-Match. (englisch).
  8. RFC: 2616 Abschnitt 14.25: If-Modified-Since. (englisch).
  9. RFC: 2616 Abschnitt 14.26: If-None-Match. (englisch).
  10. RFC: 2616 Abschnitt 14.27: If-Range. (englisch).
  11. RFC: 2616 Abschnitt 14.28: If-Unmodified-Since. (englisch).
  12. RFC: 2616 Abschnitt 14.32: Pragma. (englisch).
  13. RFC: 2616 Abschnitt 14.44: Vary. (englisch).
  14. RFC: 2616 Abschnitt 13: Caching. (englisch).