MIP Cache 规范

百度 MIP-Cache 给所有符合规范的 MIP 页面提供 cache 服务,能够主动的提高页面加载速度,为使用 MIP-Cache 服务的页面上的图片、CSS 文件等资源提供缓存服务,这样能做到所有 HTTP 请求来自于同源,能够加速加载速度。

缓存后的页面都是 https 的,安全性更高。

使用方法

提示: 在开发页面时,无需对 MIP Cache 进行额外关注,只要保证 MIP 页面、图片等资源是允许 MIP cache 的 UA(baidumip, baidumib)抓取即可。

在引用图片等静态资源时,无论是否支持 https,直接引用本站服务器上的图片即可。如使用:<mip-img src="http://www.baidu.com/logo.png">

MIP-Cache 生效流程

在 MIP 页被爬虫抓取后,会自动对静态资源的进行缓存,并且替换页面中的静态资源引用地址为缓存地址。搜索结果页会优先跳转到 MIP-Cache url,在 MIP-Cache 缓存到期时进行一次回源,访问原页面 URL 并重新缓存。

MIP cache 的 url 规则

url 规则和下列情况有关:

内容类型:图片、MIP 页面等,图片使用 '/i',其他使用 '/c'

协议类型:使用 TLS,https 的增加 '/s'http 的不加

例如:

1、网页地址或 css、js

https 资源:

originalUrl:https://www.mipengine.org/

cdnMipUrl:https://www-mipengine-org.mipcdn.com/c/s/www.mipengine.org

http 资源:

originalUrl:http://m.example.com/

cdnMipUrl:https://m-example-com.mipcdn.com/c/m.example.com

2、图片

https 资源:

originalUrl:https://www.mipengine.org/static/img/banner_wise_3f04050.jpg

cdnMipUrl:https://www-mipengine-org.mipcdn.com/i/s/www.mipengine.org/static/img/banner_wise_3f04050.jpg

http 资源:

originalUrl:http://www.sinaimg.cn/dy/slidenews/a.jpg

cdnMipUrl:https://www-sinaimg-cn.mipcdn.com/i/www.sinaimg.cn/dy/slidenews/a.jpg

页面编码要求

警告: 强制使用 UTF-8 编码

MIP Cache 更新机制

MIP Cache 常规更新机制

MIP Cache 常规更新机制也是页面最常规,最常用的更新机制。目前页面最短更新周期 52 分钟,当用户访问 MIP 页面时,如果页面缓存已经超时,MIP Cache 会将当前页面返回给用户;与此同时,异步的发起一个请求,去更新 MIP Cache 中存储的页面。这样,后续访问这个页面的用户将会看到更新后的页面。目前,线上页面更新的平均时间(可以理解为有点击的间隔时间)为 1 天左右。目前抓取限制比较多的站点,更新的时效性无法保证,也请相关站长保证自己网站,服务的稳定性。

MIP Cache 快速更新机制

考虑到一些特殊情况,需要尽快更新 MIP Cache 中的页面。比如线上 BUG 紧急修复、发现网页有黄反等需要紧急更新或者删除的内容时,MIP Cache 也开放了单独的清理接口,阅读 MIP-cache 清理 了解更多信息。生效时间大概 5min

MIP Cache 页面删除

如果有一些废弃页面需要删除:

  • 站长首先删除本站原页面
  • 调用 MIP Cache 快速更新机制删除 Cache
  • 删除后,请给 MIP Cache 非 200(404 或者其他)状态码,防止 cache 中缓存错误页。