MIP-Cache 规范

编辑

MIP-Cache 给所有符合规范的 MIP 页面提供 CDN 缓存服务,能够主动的提高页面加载速度,为使用 MIP-Cache 服务的页面上的图片、CSS 文件等资源提供缓存服务,这样能做到所有 HTTP 请求来自于同源,能够加速加载速度。

并且缓存后的页面都是 HTTPS 的,安全性更高。

一、MIP-Cache 使用方法

提示:在开发页面时,无需对 MIP-Cache 进行额外关注,只要保证 MIP 页面、图片等资源是允许 MIP-Cache 的 UA(User Agent)抓取即可。

MIP-Cache 完整 UA(User Agent)为:Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; baidumib;mip; + https://www.mipengine.org)

在引用图片等静态资源时,无论是否支持 HTTPS ,直接引用本站服务器上的图片即可。如使用:<mip-img src="http://www.baidu.com/logo.png">

二、MIP-Cache 生效流程

在 MIP 页被爬虫抓取后,会自动对静态资源的进行缓存,并且替换页面中的静态资源引用地址为缓存地址。搜索结果页会优先跳转到 MIP-Cache URL ,MIP-Cache 缓存到期时进行一次回源访问原页面 URL 并重新缓存。

注意:MIP-Cache 要求被抓取的 MIP 页必须(MUST)使用 UTF-8 编码。

三、MIP-Cache 的 URL 改写规则

URL 规则和下列情况有关:

  • 内容类型:图片、MIP 页面等,图片使用 /i,其他使用 /c
  • 协议类型:使用 TLS,HTTPS 的增加 /s,HTTP 的不加。

例如:

1. MIP-Cache 改写网页地址、CSS、Javascript

HTTPS 资源:

HTTP 资源:

2. MIP-Cache 改写图片地址

HTTPS 资源:

HTTP 资源:

3. MIP-Cache 改写组件 src 地址

由于 src 属性主要用于指向资源地址,MIP-Cache 会对每个组件的 src 进行资源缓存及路径改写。

// 原页面 mip.a.com
<mip-xx src="foo"></mip-xx>
// MIP-Cache 改写后 https://c.mipcdn.com 域名下
<mip-xx src="/i/mip.a.com/foo"></mip-xx>

提示:统计组件需要避让src属性。<mip-xx src="a.gif">改写后地址为<mip-xx src="c.mipcdn.com/i/xx.com/a.gif">,原站不再能收到统计请求。可以重命名属性为tj-src,避让MIP-Cache的改写策略。

四、MIP-Cache 更新机制

1. MIP-Cache 常规更新机制

MIP-Cache 常规更新机制也是页面最常规、最常用的更新机制。各种类型的资源更新策略为:

  • 页面的缓存时间为52分钟-5天(由该页面用户点击量和站点本身稳定性决定)。
  • 图片缓存时间为10天。
  • MIP-JS 组件文件的缓存时间为10分钟。

在当前文件过期后,MIP-Cache 会重新抓取资源。如果是 HTML 页面,MIP-Cache 还会对页面文件进行 MIP 规范校验。如果此时页面内容不再符合 MIP 规范,MIP-Cache 就不再缓存这个页面了。这样,所有 MIP-Cache 中的页面都是最新的,并且符合 MIP 规范。

2. MIP-Cache 快速更新机制

考虑到一些特殊情况,需要尽快更新 MIP-Cache 中的页面。比如线上 BUG 紧急修复、发现网页有黄反等需要紧急更新或者删除的内容时,MIP-Cache 也开放了单独的清理接口,阅读 百度站长平台-MIP-Cache 清理 了解更多信息。生效时间大概5分钟

3. MIP-Cache 页面删除

如果有一些废弃页面需要删除:

  • 站长首先删除本站原页面。
  • 调用 MIP-Cache 接口快速更新机制删除缓存页面。
  • 删除后,请给 MIP-Cache 非 200(404或者其他)状态码,防止 cache 中缓存错误页。