菜单

前述 Data URI

2019年2月5日 - XML

细说 Data URI

2015/08/27 · HTML5 ·
URI

初稿出处:
李靖(@Barret李靖)   

Data URL 早在 1995 年就被指出,那些时候有诸八个本子的 Data URL Schema
定义陆续出现在 VRML 之中,随后不久,其中的一个版本被提上了议案——将它做个一个嵌入式的资源放置在
HTML
语言之中。从 RFC 文档定稿的光阴来看(1998年),它是一个很受欢迎的表明。

Data URIs 定义的情节能够用作小文件被插入到任何文档之中。URI
是 uniform resource identifier 的缩写,它定义了接受内容的情商以及附带的连锁内容,假若附带的相关内容是一个地点,那么此时的
URI 也是一个 URL (uniform resource locator),如:

ftp://10.1.1.10/path/to/filename.ext http://example.com/source/id

1
2
ftp://10.1.1.10/path/to/filename.ext
http://example.com/source/id

情商后边的内容,可以告诉客户端一个规范下载资源的地点,而 URI
并不一定包罗一个地方音讯,如(demo):



1


其情商为
data,并告诉客户端将那些情节作为 image/gif 格式来分析,须求分析的内容使用的是
base64 编码。它一贯包含了内容但并从未一个确定的资源地址。

图片 1



☞ 兼容性

鉴于出现时间较早,近日主流的浏览器基本都援助 data URI:

只是有些浏览器对 data URI 的利用存在限制:

Opera 下限制为 4100 个字符,近来曾经去掉了那个范围 IE 8+ 下限制为 32,768
个字符(32kb),IE9 之后移除了那几个范围

1
2
Opera 下限制为 4100 个字符,目前已经去掉了这个限制
IE 8+ 下限制为 32,768 个字符(32kb),IE9 之后移除了这个限制

☞ 低版本IE的解决之道 – MHTML

MHTML 就是 MIME HTML,是 “Multipurpose Internet Mail Extensions
HyperText 马克up Language”
的简称,它就好像一个带着附件的邮件一般,如下所示:

/** FilePath: http://example.com/test.css */ /*!@ignore
Content-Type: multipart/related; boundary=”_ANY_SEPARATOR”
–_ANY_SEPARATOR Content-Location:myidBackground
Content-Transfer-Encoding:base64
iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg==
–_ANY_SEPARATOR– */ .myid { background-image:
url(“”);
*background-image:
url(mhtml:http://example.com/test.css!myidBackground); }

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
/** FilePath: http://example.com/test.css */
/*!@ignore
Content-Type: multipart/related; boundary="_ANY_SEPARATOR"
 
–_ANY_SEPARATOR
Content-Location:myidBackground
Content-Transfer-Encoding:base64
 
iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg==
–_ANY_SEPARATOR–
*/
 
.myid {
  background-image: url("");
  *background-image: url(mhtml:http://example.com/test.css!myidBackground);
}

上面的一串注释就如一个附件,那一个附件内容是一个称作 myidBackground 的
base64 编码图片,在一个 class 叫做 myid 的 css
中用到了它。那里有几点须求注意:

此地存在一个坑:部分体系匹配格局下的 IE8 也认识 css 中的 hack
符号 *,但是不扶助 mhtml,所以地点的始末不会生效。处理方案估摸就唯有利用
IE 的规范注释了。

Data URIs
定义的内容可以用作小文件被插入到任何文档之中。URI
是 uniform resource identifier(统一资源标识符) 的缩写,它定义了接受内容的商谈以及附带的连带内容,要是附带的连锁内容是一个地方,那么此时的
URI 也是一个 URL
(uniform resource locator)(统一资源定位符)
,如:

☞ HTTPS 下的安全提示

HTTPS 打开页面,当在 IE6、7 下接纳 data URIs 时,会合到如下提示:

图片 2

MS 的诠释是:

你正在查看的网站是个平安网站。它应用了 SSL (保险套接字层)或
PCT(保密通信技术)那样的平安协议来确保您所收发信息的安全性。
当站点使用安全磋商时,您提供的新闻例如姓名或信用卡号码等都由此加密,别的人无法读取。不过,那几个网页同时富含未利用该安全磋商的品种

很显明,IE 嗅到了”未利用安全协议的品类”。

浏览器在分析到一个 URI
的时候,会首先判断协议头,假使是以 http(s) 初叶,它便会树立一个网络链接下载资源,如果它发现协议头为 data:,便会将其看作一个
Data URI 资源拓展辨析。

图片 3

只是从 chrome 的瀑布流,大家得以做这么的质疑:

图中每个 Data URI
都发起了请求,不过景况都是 data(from cache),禁用缓存之后,依然这样。所以可以判明,浏览器在下载源码解析成
DOM 的时候,会将 Data URI 的资源解析出来,并缓存在地头,最终 Data URI
每个对应地点都会发起一回呼吁,只是这么些请求还未创建链接,就被发现存在缓存的浏览器给拍死了。

☞ 安全阀门

Data URI 在 IE
下有诸多有惊无险限制,事实上,很多 xss 注入也得以将 data URI
的源头作为入口,使用 data URI 绕过浏览器的过滤。

// 绕过浏览器过滤
http://example.com/text.php?t="><script src="data:text/html,<script>alert("Xss")</script><!--

此间可以很大程度的发散,很有趣,值得读者去探索。

☞ 扩张阅读

图片 4

☞ 格式

Data URI 的格式相当简短,如下所示(绿色部分是焦点,别的可挑选的一一不可以更改):

data:[<mime type>][;charset=<charset>][;base64],<encoded data>

无数时候大家接纳 data URI
来显现一些较长的情节,如一串二进制数据编码、图片等,采取 base64
编码可以让内容变得越来越简明。而对图纸来说,在 gzip 压缩之后,base64
图片实际上比原图 gzip
压缩要大,体积增添大概为三分之一,所以利用的时候要求权衡。

☞ 格式

Data URI 的格式极度简练,如下所示:

// output: ä½ å¥½ -> 使用默许的编码显示,故乱码 data:text/html,你好
// output: 你好 -> 使用 UTF-8 展示 data:text/html;charset=UTF-8,你好
// output: 浣犲ソ -> 使用 gbk 体现(浏览器默许编码 UTF-8,故乱码)
data:text/html;charset=gbk,你好 // output: 你好 -> UTF-8
编码,内容先接纳 base64 解码,然后呈现data:text/html;charset=UTF-8;base64,5L2g5aW9

1
2
3
4
5
6
7
8
// output: ä½ å¥½ -> 使用默认的编码展示,故乱码
data:text/html,你好  
// output: 你好 -> 使用 UTF-8 展示
data:text/html;charset=UTF-8,你好
// output: 浣犲ソ -> 使用 gbk 展示(浏览器默认编码 UTF-8,故乱码)
data:text/html;charset=gbk,你好
// output: 你好 -> UTF-8 编码,内容先使用 base64 解码,然后展示
data:text/html;charset=UTF-8;base64,5L2g5aW9

过多时候我们应用 data URI
来彰显一些较长的始末,如一串二进制数据编码、图片等,选拔 base64
编码可以让内容变得尤为简明。而对图片来说,在 gzip 压缩之后,base64
图片实际上比原图 gzip
压缩要大,体积增加大概为三分之一,所以选择的时候需求权衡。

【新增】:http://www.webhek.com/post/data-url.html

☞ 安全阀门

Data URI 在 IE 下有诸多有惊无险范围,事实上,很多 xss 注入也得以将 data URI
的源头作为入口,使用 data URI 绕过浏览器的过滤。

JavaScript

// 绕过浏览器过滤 http://example.com/text.php?t="&gt;&lt;script
src=”data:text/html,<script>alert(“Xss”)</script><!–

1
2
// 绕过浏览器过滤
http://example.com/text.php?t="><script src="data:text/html,<script>alert("Xss")</script><!–

那边可以很大程度的分流,很有趣,值得读者去切磋。

图片 5

☞ HTTPS 下的达州提示

HTTPS 打开页面,当在 IE6、7 下使用 data
URIs 时,见面到如下指示:

图片 6

MS 的分解是:

您正在查阅的网站是个平安网站。它使用了
SSL (安全套接字层)或
PCT(保密通信技术)那样的三沙协议来确保您所收发音讯的安全性。 
style=”font-size: 18px;”>当站点使用安全磋商时,您提供的音信例如姓名或信用卡号码等都由此加密,其余人无法读取。不过,那一个网页同时含有未选用该安全磋商的类型

很显眼,IE
嗅到了”未选用安全协议的品种”。

浏览器在解析到一个 URI
的时候,会率先判断协议头,即便是以 http(s) 起头,它便会创造一个网络链接下载资源,假使它发现协议头为 data:,便会将其当做一个
Data URI 资源拓展辨析。

图片 7

可是从 chrome
的瀑布流,我们能够做如此的算计:

图中各种 Data URI
都发起了请求,然而景况都是 data(from cache),禁用缓存之后,仍然那样。所以可以看清,浏览器在下载源码解析成
DOM 的时候,会将 Data URI 的资源解析出来,并缓存在地头,最终 Data URI
每个对应地点都会倡导三遍呼吁,只是这一个请求还未创造链接,就被察觉存在缓存的浏览器给拍死了。

Data URL 早在 1995
年就被提议,这多少个时候有众八个版本的 Data URL Schema
定义陆续出现在 VRML 之中,随后赶忙,其中的一个本子被提上了议案——将它做个一个嵌入式的资源放置在
HTML
语言之中。从 RFC 文档定稿的时日来看(1998年),它是一个很受欢迎的阐明。

摘自: http://www.cnblogs.com/hustskyking/p/data-uri.html

☞ 兼容性

出于现身时间较早,如今主流的浏览器基本都扶助data URI:

唯独有些浏览器对 data URI
的利用存在限制:

☞ 低版本IE的解决之道 – MHTML

MHTML 就是 MIME HTML,是 “Multipurpose
Internet Mail Extensions HyperText 马克up Language”
的简称,它如同一个带着附件的邮件一般,如下所示:

/** FilePath: http://example.com/test.css */
/*!@ignore
Content-Type: multipart/related; boundary="_ANY_SEPARATOR"

--_ANY_SEPARATOR
Content-Location:myidBackground
Content-Transfer-Encoding:base64

iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg==
--_ANY_SEPARATOR--
*/

.myid {
  background-image: url("");
  *background-image: url(mhtml:http://example.com/test.css!myidBackground); 
}

上方的一串注释就像是一个附件,这个附件内容是一个名叫 myidBackground 的 base64 编码图片,在一个 class 叫做 myid 的 css 中用到了它。这里有几点需要注意:

此处存在一个坑:部分种类协作方式下的
IE8 也认识 css 中的 hack
符号 *,可是不帮助 mhtml,所以地点的情节不会立见功用。处理方案推测就只有选取IE 的规格注释了。

其情商为
data,并报告客户端将以此情节作为 image/gif 格式来分析,须要分析的内容使用的是
base64
编码。它一直包涵了情节但并不曾一个规定的资源地址。

引子:在切磋FileReader时,有个艺术readAsDataURL;然后看到打印出来的事物类似于如下:【data:text/plain;base64,Y29tZSBvbiB0byBidXkgYSBwaWFubyE=】,那些事物居然像个超链接一样可以跳转,在新窗口中显得出文档内容,即使是图表还会展现出图片。于是比较好奇那是何等定位到图片的岗位的,原来那串字符并不曾平素图片地方,而是将图纸的始末向来包罗了进入,所以浏览器就间接解析出来了。具体用法见如下小说

ftp://10.1.1.10/path/to/filename.ext
http://example.com/source/id

☞ 增添阅读

讨论后边的情节,能够告诉客户端一个规范下载资源的地点,而
URI
并不一定包蕴一个地方音信,如(demo):

相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图