菜单

细说 Data URI

2019年2月10日 - Ajax

细说 Data URI

2015/08/27 · HTML5 ·
URI

原稿出处:
李靖(@Barret李靖)   

Data URL 早在 1995 年就被提出,这几个时候有为数不少个本子的 Data URL Schema
定义陆续出现在 VRML 之中,随后赶忙,其中的一个本子被提上了议案——将它做个一个嵌入式的资源放置在
HTML
语言之中。从 RFC 文档定稿的光阴来看(1998年),它是一个很受欢迎的申明。

Data URIs 定义的内容可以看成小文件被插入到任何文档之中。URI
是 uniform resource identifier 的缩写,它定义了接受内容的商谈以及附带的有关内容,假使附带的连带内容是一个地址,那么此时的
URI 也是一个 URL (uniform resource locator),如:

ftp://10.1.1.10/path/to/filename.ext http://example.com/source/id

1
2
ftp://10.1.1.10/path/to/filename.ext
http://example.com/source/id

说道后边的内容,可以告诉客户端一个准确无误下载资源的地址,而 URI
并不一定包含一个地点音信,如(demo):

data:image/gif;base64,R0lGODlhEAAOALMAAOazToeHh0tLS/7LZv/0jvb29t/f3//Ub//ge8WSLf/rhf/3kdbW1mxsbP//mf///yH5BAAAAAAALAAAAAAQAA4AAARe8L1Ekyky67QZ1hLnjM5UUde0ECwLJoExKcppV0aCcGCmTIHEIUEqjgaORCMxIC6e0CcguWw6aFjsVMkkIr7g77ZKPJjPZqIyd7sJAgVGoEGv2xsBxqNgYPj/gAwXEQA7

1
data:image/gif;base64,R0lGODlhEAAOALMAAOazToeHh0tLS/7LZv/0jvb29t/f3//Ub//ge8WSLf/rhf/3kdbW1mxsbP//mf///yH5BAAAAAAALAAAAAAQAA4AAARe8L1Ekyky67QZ1hLnjM5UUde0ECwLJoExKcppV0aCcGCmTIHEIUEqjgaORCMxIC6e0CcguWw6aFjsVMkkIr7g77ZKPJjPZqIyd7sJAgVGoEGv2xsBxqNgYPj/gAwXEQA7

其情商为
data,并报告客户端将以此情节作为 image/gif 格式来分析,须要分析的内容使用的是
base64 编码。它向来蕴含了内容但并不曾一个规定的资源地址。

图片 1

【新增】:http://www.webhek.com/post/data-url.html

☞ 格式

Data URI 的格式相当简约,如下所示:

// output: ä½ å¥½ -> 使用默认的编码体现,故乱码 data:text/html,你好
// output: 你好 -> 使用 UTF-8 体现 data:text/html;charset=UTF-8,你好
// output: 浣犲ソ -> 使用 gbk 显示(浏览器默许编码 UTF-8,故乱码)
data:text/html;charset=gbk,你好 // output: 你好 -> UTF-8
编码,内容先采用 base64 解码,然后展示data:text/html;charset=UTF-8;base64,5L2g5aW9

1
2
3
4
5
6
7
8
// output: ä½ å¥½ -> 使用默认的编码展示,故乱码
data:text/html,你好  
// output: 你好 -> 使用 UTF-8 展示
data:text/html;charset=UTF-8,你好
// output: 浣犲ソ -> 使用 gbk 展示(浏览器默认编码 UTF-8,故乱码)
data:text/html;charset=gbk,你好
// output: 你好 -> UTF-8 编码,内容先使用 base64 解码,然后展示
data:text/html;charset=UTF-8;base64,5L2g5aW9

诸多时候咱们拔取 data URI
来显示一些较长的情节,如一串二进制数据编码、图片等,采纳 base64
编码可以让内容变得更为简约。而对图片来说,在 gzip 压缩之后,base64
图片实际上比原图 gzip
压缩要大,体积扩大大致为三分之一,所以利用的时候须求权衡。

引子:在商讨FileReader时,有个点子readAsDataURL;然后看到打印出来的东西类似于如下:【data:text/plain;base64,Y29tZSBvbiB0byBidXkgYSBwaWFubyE=】,那一个事物居然像个超链接一样可以跳转,在新窗口中显得出文档内容,若是是图片还会显示出图片。于是相比较好奇那是怎么着稳定到图片的职位的,原来那串字符并不曾永恒图片地点,而是将图片的始末从来包含了进入,所以浏览器就间接解析出来了。具体用法见如下小说

☞ 兼容性

由于出现时间较早,最近主流的浏览器基本都辅助 data URI:

可是一些浏览器对 data URI 的使用存在限制:

Opera 下限制为 4100 个字符,近日早已去掉了那么些范围 IE 8+ 下限制为 32,768
个字符(32kb),IE9 之后移除了那么些限制

1
2
Opera 下限制为 4100 个字符,目前已经去掉了这个限制
IE 8+ 下限制为 32,768 个字符(32kb),IE9 之后移除了这个限制

☞ 低版本IE的解决之道 – MHTML

MHTML 就是 MIME HTML,是 “Multipurpose Internet Mail Extensions
HyperText 马克up Language”
的简称,它如同一个带着附件的邮件一般,如下所示:

/** FilePath: http://example.com/test.css */ /*!@ignore
Content-Type: multipart/related; boundary=”_ANY_SEPARATOR”
–_ANY_SEPARATOR Content-Location:myidBackground
Content-Transfer-Encoding:base64
iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg==
–_ANY_SEPARATOR– */ .myid { background-image:
url(“data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg==”);
*background-image:
url(mhtml:http://example.com/test.css!myidBackground); }

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
/** FilePath: http://example.com/test.css */
/*!@ignore
Content-Type: multipart/related; boundary="_ANY_SEPARATOR"
 
–_ANY_SEPARATOR
Content-Location:myidBackground
Content-Transfer-Encoding:base64
 
iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg==
–_ANY_SEPARATOR–
*/
 
.myid {
  background-image: url("data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg==");
  *background-image: url(mhtml:http://example.com/test.css!myidBackground);
}

上面的一串注释就像一个附件,这几个附件内容是一个誉为 myidBackground 的
base64 编码图片,在一个 class 叫做 myid 的 css
中用到了它。那里有几点需求留意:

那边存在一个坑:部分系统匹配方式下的 IE8 也认识 css 中的 hack
符号 *,可是不扶助 mhtml,所以地方的内容不会收效。处理方案推测就只有采取IE 的规则注释了。

摘自: http://www.cnblogs.com/hustskyking/p/data-uri.html

☞ HTTPS 下的平安提示

HTTPS 打开页面,当在 IE6、7 下利用 data URIs 时,会晤到如下提示:

图片 2

MS 的解释是:

你正在查看的网站是个平安网站。它利用了 SSL (保险套接字层)或
PCT(保密通信技术)那样的吕梁磋商来确保您所收发音信的安全性。
当站点使用安全磋商时,您提供的音信例如姓名或信用卡号码等都经过加密,其旁人无法读取。但是,这么些网页同时富含未利用该安全协议的品类

很通晓,IE 嗅到了”未选用安全磋商的品种”。

浏览器在分析到一个 URI
的时候,会首先判断协议头,如若是以 http(s) 早先,它便会创立一个互连网链接下载资源,尽管它发现协议头为 data:,便会将其看作一个
Data URI 资源拓展辨析。

图片 3

然则从 chrome 的瀑布流,大家可以做那样的揣测:

图中每个 Data URI
都发起了请求,不过景况都是 data(from cache),禁用缓存之后,如故那样。所以能够判断,浏览器在下载源码解析成
DOM 的时候,会将 Data URI 的资源解析出来,并缓存在本土,最终 Data URI
每个对应地方都会发起几回呼吁,只是那么些请求还未建立链接,就被发觉存在缓存的浏览器给拍死了。

Data URL 早在 1995
年就被提出,那一个时候有好七个版本的 Data URL Schema
定义陆续出现在 VRML 之中,随后赶忙,其中的一个本子被提上了议案——将它做个一个嵌入式的资源放置在
HTML
语言之中。从 RFC 文档定稿的日子来看(1998年),它是一个很受欢迎的发明。

☞ 安全阀门

Data URI 在 IE 下有诸多汉中限制,事实上,很多 xss 注入也可以将 data URI
的源流作为入口,使用 data URI 绕过浏览器的过滤。

JavaScript

// 绕过浏览器过滤 http://example.com/text.php?t="><script
src=”data:text/html,<script>alert(“Xss”)</script><!–

1
2
// 绕过浏览器过滤
http://example.com/text.php?t="><script src="data:text/html,<script>alert("Xss")</script><!–

此处可以很大程度的发散,很风趣,值得读者去追究。

Data URIs
定义的情节可以当做小文件被插入到其它文档之中。URI
是 uniform resource identifier(统一资源标识符) 的缩写,它定义了接受内容的磋商以及附带的相关内容,假诺附带的相关内容是一个位置,那么此时的
URI 也是一个 URL
(uniform resource locator)(统一资源定位符)
,如:

☞ 扩充阅读

图片 4

ftp://10.1.1.10/path/to/filename.ext
http://example.com/source/id

情商前面的情节,可以告诉客户端一个准儿下载资源的地点,而
URI
并不一定包涵一个地方音讯,如(demo):

data:image/gif;base64,R0lGODlhEAAOALMAAOazToeHh0tLS/7LZv/0jvb29t/f3//Ub//ge8WSLf/rhf/3kdbW1mxsbP//mf///yH5BAAAAAAALAAAAAAQAA4AAARe8L1Ekyky67QZ1hLnjM5UUde0ECwLJoExKcppV0aCcGCmTIHEIUEqjgaORCMxIC6e0CcguWw6aFjsVMkkIr7g77ZKPJjPZqIyd7sJAgVGoEGv2xsBxqNgYPj/gAwXEQA7

其情商为
data,并告诉客户端将以此内容作为 image/gif 格式来分析,要求分析的情节使用的是
base64
编码。它直接包罗了内容但并从未一个确定的资源地址。

图片 5

☞ 格式

Data URI 的格式至极简短,如下所示(紫色部分是主题,此外可采取的一一不可能改变):

data:[<mime type>][;charset=<charset>][;base64],<encoded data>

诸多时候大家使用 data URI
来表现一些较长的情节,如一串二进制数据编码、图片等,选取 base64
编码可以让内容变得尤其简便易行。而对图纸来说,在 gzip 压缩之后,base64
图片实际上比原图 gzip
压缩要大,体积伸张几乎为三分之一,所以选取的时候需求权衡。

☞ 兼容性

是因为出现时间较早,方今主流的浏览器基本都接济data URI:

唯独有的浏览器对 data URI
的采用存在限制:

☞ 低版本IE的解决之道 – MHTML

MHTML 就是 MIME HTML,是 “Multipurpose
Internet Mail Extensions HyperText Markup Language”
的简称,它就好像一个带着附件的邮件一般,如下所示:

/** FilePath: http://example.com/test.css */
/*!@ignore
Content-Type: multipart/related; boundary="_ANY_SEPARATOR"

--_ANY_SEPARATOR
Content-Location:myidBackground
Content-Transfer-Encoding:base64

iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg==
--_ANY_SEPARATOR--
*/

.myid {
  background-image: url("data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg==");
  *background-image: url(mhtml:http://example.com/test.css!myidBackground); 
}

上方的一串注释就像是一个附件,这个附件内容是一个名叫 myidBackground 的 base64 编码图片,在一个 class 叫做 myid 的 css 中用到了它。这里有几点需要注意:

此处存在一个坑:部分种类配合情势下的
IE8 也认识 css 中的 hack
符号 *,可是不帮衬 mhtml,所以地点的内容不会生效。处理方案推断就唯有利用
IE 的准绳注释了。

☞ HTTPS 下的福建云茶提示

HTTPS 打开页面,当在 IE6、7 下拔取 data
URIs 时,会看到如下提示:

图片 6

MS 的解说是:

你正在查看的网站是个平平安安网站。它应用了
SSL (安全套接字层)或
PCT(保密通信技术)这样的平安磋商来确保您所收发新闻的安全性。 
style=”font-size: 18px;”>当站点使用安全协议时,您提供的音信例如姓名或信用卡号码等都通过加密,其余人不可以读取。但是,那么些网页同时富含未使用该安全协议的花色

很精通,IE
嗅到了”未使用安全磋商的体系”。

浏览器在分析到一个 URI
的时候,会率先判断协议头,要是是以 http(s) 开首,它便会建立一个互联网链接下载资源,假使它发现协议头为 data:,便会将其当做一个
Data URI 资源拓展辨析。

图片 7

唯独从 chrome
的瀑布流,我们得以做那样的臆度:

图中种种 Data URI
都发起了请求,可是情状都是 data(from cache),禁用缓存之后,依旧那样。所以可以判断,浏览器在下载源码解析成
DOM 的时候,会将 Data URI 的资源解析出来,并缓存在地方,最后 Data URI
每个对应地方都会倡导三次呼吁,只是这么些请求还未创造链接,就被发现存在缓存的浏览器给拍死了。

☞ 安全阀门

Data URI 在 IE
下有诸多金昌限制,事实上,很多 xss 注入也可以将 data URI
的源流作为入口,使用 data URI 绕过浏览器的过滤。

// 绕过浏览器过滤
http://example.com/text.php?t="><script src="data:text/html,<script>alert("Xss")</script><!--

那边可以很大程度的疏散,很有意思,值得读者去探索。

☞ 伸张阅读

相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图