《HTTP 权威指南》笔记:第十六章&第十七章 国际化、内容协商与转码

2023-05-07,,

《HTTP 权威指南》笔记:第十六章 国际化

客户端通过在请求报文中的 Accept-Language 首部和 Accept-Charset 首部来告知服务器:“我理解这些语言.”
服务器通过 Content-type 首部中的 charset 参数和 Content-Language 来告知客户端文件可用的字母表和语言.
两者进行协商,得到最佳的结果.

MIME charset

术语

字符编码方案:将二进制代码转化为字符代码
字符集:将字符代码转换为字符
MIME 字符集:是将特定的编码方案和特定的已编码字符集组合而成.

常见的 MIME charset:

us-ascii
iso-8859-1
utf-8

如果客户端无法推断出字符编码,就假定使用的是 ios-8859-1.

类型

    固定宽度
    可变宽度+无模态:对不同的字符代码采用不同数量的比特.
    可变宽度+有模态:可以通过转义处理相互有重叠的字符集

语言标记

定义:语言标记是命名口语的标准化字符串短语.
子标记定义:语言标记包括一个或多个部分,每个部分称为一个子标记.
类型:

    主子标记:第一个子标记,其值是标准化的;通常表示语言的类型.
    可选子标记:第二个子标记,通常表示某一种语言所在的地区的方言
    其他子标记都是未注册的.·

应用:
在响应报文中的 Content-Language 这个 header 和请求报文中的 Accept-Language 中出现.

《HTTP 权威指南》笔记:第十七章 内容协商与转码

内容协商的目标是在保证一个 URL 的情况下,为客户端提供不同的、最适合的页面.
可以通过三种方法来进行内容协商:

    客户端驱动(存在多个 URL 的问题)
    服务器驱动
    透明协商

服务器驱动的协商

服务器通过对客户端的请求报文进行解析,得到相关的信息,然后决定回应的报文主体,主要的方式有两种:

    通过内容协商首部
    通过其他首部进行变通,例如 User-Agent 首部

内容协商首部——Accpet

内容协商首部是客户端发向服务器的请求报文中的 Accept 首部,它包括:

Accept
Accept-Language
Accept-Charset
Accept-Encoding

透明协商

定义:透明协商是缓存代理在来代表服务器对客户端进行协商的过程,其能够减少服务器的负担.
当缓存中的内容协商首部的值与请求中的协商首部的值不同的时候,需要从原始服务器中请求一份新的文档.

Vary 首部

在缓存存储来自服务器的文件时,在缓存中包含了 Vary 首部.
当第二次有不同的内容协商的请求报文的时候,能够从服务器更新并储存一个 alternate,另外一个名称叫做 variant

内容转码

内容协商的机制中存在一个缺陷:服务器无法满足客户端的内容协商的要求,没有能提供的相应的格式的文件.
这种情况下,可以通过内容转码来进行实现.
常见的类型有下面三种:

    格式转换:将 HTML 格式文件转化为 WML 格式文件,便于无线的客户端查看
    信息综合: 将小节标题生成文档的大纲
    内容注入:不减少内容,,例如自动广告生成器和用户追踪系统

《HTTP 权威指南》笔记:第十六章&第十七章 国际化、内容协商与转码的相关教程结束。

《《HTTP 权威指南》笔记:第十六章&第十七章 国际化、内容协商与转码.doc》

下载本文的Word格式文档,以方便收藏与打印。