1. 什么是缓存

  缓存(cache),原始意义是指访问速度比一般随机存取存储器(RAM)快的一种高速存储器,通常它不像系统主存那样使用 DRAM 技术,而使用昂贵但较快速的 SRAM 技术。缓存的设置是所有现代计算机系统发挥高性能的重要因素之一。

2. 什么是Web缓存

  Web 缓存是指一个 Web 资源(如 html 页面,图片,js,数据等)存在于 Web 服务器和客户端(浏览器)之间的副本。缓存会根据进来的请求保存输出内容的副本;当下一个请求来到的时候,如果是相同的 URL,缓存会根据缓存机制决定是直接使用副本响应访问请求,还是向源服务器再次发送请求。比较常见的就是浏览器会缓存访问过网站的网页,当再次访问这个 URL 地址的时候,如果网页没有更新,就不会再次下载网页,而是直接使用本地缓存的网页。只有当网站明确标识资源已经更新,浏览器才会再次下载网页。
  Web 缓存分为客户端缓存服务端缓存,客户端缓存就是浏览器缓存,而服务器缓存就是常见的NginxRedisMemcached等。
  浏览器缓存是为了节约网络的资源加速浏览,浏览器在用户磁盘上对最近请求过的文档进行存储,当访问者再次请求这个页面时,浏览器就可以从本地磁盘显示文档,这样就可以加速页面的阅览。

3. 浏览器缓存的优点

  • 成本最低的一种缓存实现;
  • 减少网络带宽消耗;
  • 降低服务器压力;
  • 减少网络延迟,加快页面打开速度;

4. 浏览器缓存的执行流程

  先看一下 HTTP 协议中和页面缓存相关的字段:

header 说明
Expires 缓存过期的日期和时间
Cache-Control 设置和缓存相关的配置信息
Last-Modified 请求资源最后修改时间
ETag 请求变量的实体标签的当前值,比如文件的MD5值

  1. 用户首次通过浏览器发送请求到服务端获取数据,客户端是没有对应的缓存,所以需要发送 request 请求来获取数据;
  2. 服务端接收到请求后,获取服务端的数据及服务端缓存的允许后,返回 200 的成功状态码并且在响应头上附上对应资源以及缓存信息;
  3. 当用户再次访问相同资源的时候,客户端会在浏览器的缓存目录中查找是否存在响应的缓存文件;
  4. 如果没有找到对应的缓存文件,则走第二步;
  5. 如果有缓存文件,接下来对缓存文件是否过期进行判断,过期的判断标准是 Expires;
  6. 如果没有过期,则直接从本地缓存中返回数据进行展示;
  7. 如果 Expires 过期,接下来需要判断缓存文件是否发生过变化;
  8. 判断的标准有两个,一个是 ETag(Entity Tag),一个是 Last-Modified;
  9. 判断结果是未发生变化,则服务端返回 304,直接从缓存文件中获取数据;
  10. 如果判断是发生了变化,重新从服务端获取数据,并根据缓存协商(服务端所设置的是否需要进行缓存数据的设置)来进行数据缓存。

5. 浏览器缓存相关指令

  Nginx 需要进行缓存相关设置,就需要用到如下的指令。
  expires: 该指令用来控制页面缓存的作用。可以通过该指令控制 HTTP 应答中的 “Expires” 和 “Cache-Control”。

语法 expires [modified] time
expires epoch|max|off
默认值 expires off
位置 http、server、location
  • time:可以整数也可以是负数,指定过期时间,如果是负数,CacheControl 则为 no-cache,如果为整数或 0,则 Cache-Control 的值为 maxage=time;
  • epoch:指定 Expires 的值为'1 January,1970,00:00:01 GMT'(1970-01-01 00:00:00),Cache-Control 的值 no-cache;
  • max:指定 Expires 的值为'31 December2037 23:59:59GMT'(2037-12-31 23:59:59),Cache-Control 的值为 10 年;
  • off:默认不缓存。

  add_header: 该指令是用来添加指定的响应头和响应值。

语法 add_header name value [always]
默认值 -
位置 http、server、location…

  Cache-Control 作为响应头信息,可以设置如下值:

1
2
3
4
5
6
7
8
9
Cache-control: must-revalidate
Cache-control: no-cache
Cache-control: no-store
Cache-control: no-transform
Cache-control: public
Cache-control: private
Cache-control: proxy-revalidate
Cache-Control: max-age=<seconds>
Cache-control: s-maxage=<seconds>

  缓存响应指令:

指令 说明
must-revalidate 可缓存但必须再向源服务器进行确认
no-cache 缓存前必须确认其有效性
no-store 不缓存请求或响应的任何内容
no-transform 代理不可更改媒体类型
public 可向任意方提供响应的缓存
private 仅向特定用户返回响应
proxy-revalidate 要求中间缓存服务器对缓存的响应有效性再进行确认
max-age=<秒> 响应最大Age值
s-maxage=<秒> 公共缓存服务器响应的最大Age值

参考文献

  【1】https://www.bilibili.com/video/BV1ov41187bq?p=57


  Nginx 实现代理缓存的相关文章已发布:《Nginx从入门到入坟(十四)- Nginx缓存深入研究》