菜单

前述 Data URI

2019年2月7日 - JavaScript

细说 Data URI

2015/08/27 · HTML5 ·
URI

原文出处:
李靖(@Barret李靖)   

Data URL 早在 1995 年就被提出,这些时候有很两个版本的 Data URL Schema
定义陆续出现在 VRML 之中,随后不久,其中的一个本子被提上了议案——将它做个一个嵌入式的资源放置在
HTML
语言之中。从 RFC 文档定稿的时光来看(1998年),它是一个很受欢迎的表明。

Data URIs 定义的内容能够看成小文件被插入到其余文档之中。URI
是 uniform resource identifier 的缩写,它定义了接受内容的协议以及附带的有关内容,若是附带的连带内容是一个地址,那么此时的
URI 也是一个 URL (uniform resource locator),如:

ftp://10.1.1.10/path/to/filename.ext http://example.com/source/id

1
2
ftp://10.1.1.10/path/to/filename.ext
http://example.com/source/id

协和前面的内容,可以告知客户端一个规范下载资源的地址,而 URI
并不一定包括一个地点音信,如(demo):

data:image/gif;base64,R0lGODlhEAAOALMAAOazToeHh0tLS/7LZv/0jvb29t/f3//Ub//ge8WSLf/rhf/3kdbW1mxsbP//mf///yH5BAAAAAAALAAAAAAQAA4AAARe8L1Ekyky67QZ1hLnjM5UUde0ECwLJoExKcppV0aCcGCmTIHEIUEqjgaORCMxIC6e0CcguWw6aFjsVMkkIr7g77ZKPJjPZqIyd7sJAgVGoEGv2xsBxqNgYPj/gAwXEQA7

1
data:image/gif;base64,R0lGODlhEAAOALMAAOazToeHh0tLS/7LZv/0jvb29t/f3//Ub//ge8WSLf/rhf/3kdbW1mxsbP//mf///yH5BAAAAAAALAAAAAAQAA4AAARe8L1Ekyky67QZ1hLnjM5UUde0ECwLJoExKcppV0aCcGCmTIHEIUEqjgaORCMxIC6e0CcguWw6aFjsVMkkIr7g77ZKPJjPZqIyd7sJAgVGoEGv2xsBxqNgYPj/gAwXEQA7

其情商为
data,并报告客户端将这几个情节作为 image/gif 格式来分析,需求分析的内容使用的是
base64 编码。它平素包括了情节但并不曾一个规定的资源地址。

图片 1

【新增】:http://www.webhek.com/post/data-url.html

☞ 格式

Data URI 的格式格外大约,如下所示:

// output: ä½ å¥½ -> 使用默许的编码显示,故乱码 data:text/html,你好
// output: 你好 -> 使用 UTF-8 突显 data:text/html;charset=UTF-8,你好
// output: 浣犲ソ -> 使用 gbk 体现(浏览器默许编码 UTF-8,故乱码)
data:text/html;charset=gbk,你好 // output: 你好 -> UTF-8
编码,内容先使用 base64 解码,然后突显data:text/html;charset=UTF-8;base64,5L2g5aW9

1
2
3
4
5
6
7
8
// output: ä½ å¥½ -> 使用默认的编码展示,故乱码
data:text/html,你好  
// output: 你好 -> 使用 UTF-8 展示
data:text/html;charset=UTF-8,你好
// output: 浣犲ソ -> 使用 gbk 展示(浏览器默认编码 UTF-8,故乱码)
data:text/html;charset=gbk,你好
// output: 你好 -> UTF-8 编码,内容先使用 base64 解码,然后展示
data:text/html;charset=UTF-8;base64,5L2g5aW9

千千万万时候咱们采纳 data URI
来展现一些较长的情节,如一串二进制数据编码、图片等,选取 base64
编码可以让内容变得尤其简约。而对图纸来说,在 gzip 压缩之后,base64
图片实际上比原图 gzip
压缩要大,体积增添大概为三分之一,所以利用的时候必要权衡。

引子:在研究FileReader时,有个方法readAsDataURL;然后看到打印出来的东西类似于如下:【data:text/plain;base64,Y29tZSBvbiB0byBidXkgYSBwaWFubyE=】,那个事物居然像个超链接一样能够跳转,在新窗口中显得出文档内容,假使是图片还会展现出图片。于是相比较好奇这是怎么着稳定到图片的职位的,原来那串字符并不曾永恒图片地方,而是将图片的始末平素包罗了进入,所以浏览器就直接解析出来了。具体用法见如下小说

☞ 兼容性

由于出现时间较早,近日主流的浏览器基本都帮助 data URI:

只是一些浏览器对 data URI 的采取存在限制:

Opera 下限制为 4100 个字符,近年来一度去掉了这么些限制 IE 8+ 下限制为 32,768
个字符(32kb),IE9 之后移除了这么些界定

1
2
Opera 下限制为 4100 个字符,目前已经去掉了这个限制
IE 8+ 下限制为 32,768 个字符(32kb),IE9 之后移除了这个限制

☞ 低版本IE的解决之道 – MHTML

MHTML 就是 MIME HTML,是 “Multipurpose Internet Mail Extensions
HyperText 马克up Language”
的简称,它就如一个带着附件的邮件一般,如下所示:

/** FilePath: http://example.com/test.css */ /*!@ignore
Content-Type: multipart/related; boundary=”_ANY_SEPARATOR”
–_ANY_SEPARATOR Content-Location:myidBackground
Content-Transfer-Encoding:base64
iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg==
–_ANY_SEPARATOR– */ .myid { background-image:
url(“data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg==”);
*background-image:
url(mhtml:http://example.com/test.css!myidBackground); }

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
/** FilePath: http://example.com/test.css */
/*!@ignore
Content-Type: multipart/related; boundary="_ANY_SEPARATOR"
 
–_ANY_SEPARATOR
Content-Location:myidBackground
Content-Transfer-Encoding:base64
 
iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg==
–_ANY_SEPARATOR–
*/
 
.myid {
  background-image: url("data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg==");
  *background-image: url(mhtml:http://example.com/test.css!myidBackground);
}

上面的一串注释就好像一个附件,那一个附件内容是一个叫做 myidBackground 的
base64 编码图片,在一个 class 叫做 myid 的 css
中用到了它。那里有几点要求小心:

那里存在一个坑:部分系统匹配形式下的 IE8 也认识 css 中的 hack
符号 *,但是不接济 mhtml,所以地点的始末不会生效。处理方案臆想就唯有应用
IE 的尺度注释了。

摘自: http://www.cnblogs.com/hustskyking/p/data-uri.html

☞ HTTPS 下的安全提醒

HTTPS 打开页面,当在 IE6、7 下使用 data URIs 时,会师到如下提示:

图片 2

MS 的解释是:

您正在查看的网站是个安全网站。它选用了 SSL (避孕套接字层)或
PCT(保密通信技术)那样的鹰潭磋商来确保您所收发新闻的安全性。
当站点使用安全磋商时,您提供的新闻例如姓名或信用卡号码等都因而加密,其余人不能读取。不过,这些网页同时含有未采纳该安全协议的品种

很肯定,IE 嗅到了”未选取安全磋商的档次”。

浏览器在解析到一个 URI
的时候,会首先判断协议头,借使是以 http(s) 开首,它便会确立一个网络链接下载资源,倘使它发现协议头为 data:,便会将其作为一个
Data URI 资源开展解析。

图片 3

但是从 chrome 的瀑布流,我们可以做这么的怀疑:

图中各类 Data URI
都倡导了请求,不过景况都是 data(from cache),禁用缓存之后,仍然那样。所以可以判断,浏览器在下载源码解析成
DOM 的时候,会将 Data URI 的资源解析出来,并缓存在地点,最终 Data URI
每个对应地点都会发起一遍呼吁,只是那么些请求还未建立链接,就被发现存在缓存的浏览器给拍死了。

Data URL 早在 1995
年就被提议,那几个时候有众多个版本的 Data URL Schema
定义陆续出现在 VRML 之中,随后赶忙,其中的一个版本被提上了议案——将它做个一个嵌入式的资源放置在
HTML
语言之中。从 RFC 文档定稿的年华来看(1998年),它是一个很受欢迎的评释。

☞ 安全阀门

Data URI 在 IE 下有诸多安全限制,事实上,很多 xss 注入也得以将 data URI
的源头作为入口,使用 data URI 绕过浏览器的过滤。

JavaScript

// 绕过浏览器过滤 http://example.com/text.php?t="><script
src=”data:text/html,<script>alert(“Xss”)</script><!–

1
2
// 绕过浏览器过滤
http://example.com/text.php?t="><script src="data:text/html,<script>alert("Xss")</script><!–

那里可以很大程度的疏散,很风趣,值得读者去追究。

Data URIs
定义的情节可以当做小文件被插入到其它文档之中。URI
是 uniform resource identifier(统一资源标识符) 的缩写,它定义了接受内容的协议以及附带的连锁内容,假若附带的相关内容是一个地址,那么此时的
URI 也是一个 URL
(uniform resource locator)(统一资源定位符)
,如:

☞ 伸张阅读

图片 4

ftp://10.1.1.10/path/to/filename.ext
http://example.com/source/id

磋商前边的内容,可以告诉客户端一个准儿下载资源的地址,而
URI
并不一定包涵一个地点音信,如(demo):

data:image/gif;base64,R0lGODlhEAAOALMAAOazToeHh0tLS/7LZv/0jvb29t/f3//Ub//ge8WSLf/rhf/3kdbW1mxsbP//mf///yH5BAAAAAAALAAAAAAQAA4AAARe8L1Ekyky67QZ1hLnjM5UUde0ECwLJoExKcppV0aCcGCmTIHEIUEqjgaORCMxIC6e0CcguWw6aFjsVMkkIr7g77ZKPJjPZqIyd7sJAgVGoEGv2xsBxqNgYPj/gAwXEQA7

其情商为
data,并报告客户端将以此情节作为 image/gif 格式来分析,须要分析的内容使用的是
base64
编码。它直接包含了内容但并不曾一个确定的资源地址。

图片 5

☞ 格式

Data URI 的格式非凡简短,如下所示(灰色部分是主导,此外可接纳的一一不可以改变):

data:[<mime type>][;charset=<charset>][;base64],<encoded data>

千千万万时候我们利用 data URI
来表现一些较长的始末,如一串二进制数据编码、图片等,采纳 base64
编码可以让内容变得越发简明。而对图纸来说,在 gzip 压缩之后,base64
图片实际上比原图 gzip
压缩要大,体积扩展大概为三分之一,所以接纳的时候需求权衡。

☞ 兼容性

是因为出现时间较早,近日主流的浏览器基本都扶助data URI:

但是有些浏览器对 data URI
的行使存在限制:

☞ 低版本IE的解决之道 – MHTML

MHTML 就是 MIME HTML,是 “Multipurpose
Internet Mail Extensions HyperText 马克up Language”
的简称,它就像是一个带着附件的邮件一般,如下所示:

/** FilePath: http://example.com/test.css */
/*!@ignore
Content-Type: multipart/related; boundary="_ANY_SEPARATOR"

--_ANY_SEPARATOR
Content-Location:myidBackground
Content-Transfer-Encoding:base64

iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg==
--_ANY_SEPARATOR--
*/

.myid {
  background-image: url("data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg==");
  *background-image: url(mhtml:http://example.com/test.css!myidBackground); 
}

上方的一串注释就像是一个附件,这个附件内容是一个名叫 myidBackground 的 base64 编码图片,在一个 class 叫做 myid 的 css 中用到了它。这里有几点需要注意:

那里存在一个坑:部分种类同盟情势下的
IE8 也认识 css 中的 hack
符号 *,但是不扶助 mhtml,所以地方的内容不会生效。处理方案推测就只有利用
IE 的尺码注释了。

☞ HTTPS 下的安全提醒

HTTPS 打开页面,当在 IE6、7 下使用 data
URIs 时,会看出如下提醒:

图片 6

MS 的表明是:

您正在查看的网站是个平安网站。它利用了
SSL (保险套接字层)或
PCT(保密通信技术)那样的安全磋商来确保您所收发信息的安全性。 
style=”font-size: 18px;”>当站点使用安全磋商时,您提供的信息例如姓名或信用卡号码等都经过加密,其余人不可能读取。可是,这几个网页同时含有未使用该安全磋商的种类

很显然,IE
嗅到了”未使用安全磋商的门类”。

浏览器在分析到一个 URI
的时候,会率先判断协议头,借使是以 http(s) 伊始,它便会确立一个网络链接下载资源,假如它发现协议头为 data:,便会将其视作一个
Data URI 资源举行解析。

图片 7

可是从 chrome
的瀑布流,我们可以做那样的预计:

图中每个 Data URI
都提倡了请求,然而情形都是 data(from cache),禁用缓存之后,依旧那样。所以可以看清,浏览器在下载源码解析成
DOM 的时候,会将 Data URI 的资源解析出来,并缓存在本土,最后 Data URI
每个对应地方都会发起一次呼吁,只是那一个请求还未建立链接,就被发现存在缓存的浏览器给拍死了。

☞ 安全阀门

Data URI 在 IE
下有诸多云浮限制,事实上,很多 xss 注入也可以将 data URI
的源头作为入口,使用 data URI 绕过浏览器的过滤。

// 绕过浏览器过滤
http://example.com/text.php?t="><script src="data:text/html,<script>alert("Xss")</script><!--

此处能够很大程度的发散,很有意思,值得读者去探索。

☞ 扩张阅读

相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图