JavaScript中的Base64编码字符串是什么(base64,javascript,开发技术)

时间:2024-05-03 22:03:10 作者 : 石家庄SEO 分类 : 开发技术
  • TAG :

初步认识

下面的这段字符串,应该是大家都很常见的。

通过这种固定的格式,来表示一张图片,并被浏览器识别,可以完整的展示出图片:

data:image/svg+xml;base64,PHN2ZyB4bWxucz0iaHR0c......

这里展示的是svg格式的图片,当然我们还能加载任何浏览器支持的格式的图片。

这段字符串就是基于Base64编码得来的,其中base64,后面那一长串的字符串,就是Base64编码字符串。

Base64是怎么诞生的

互联网发展早起,电子邮件是最有效的应用。

而电子邮件的SMTP传输协议在早期,只能用于传送7位的ASCII码,而ASCII码就是基于英语设计的,对于非英语国家的文字等资源就无法发送。

为了解决这个问题,后来有了通用互联网邮件扩充MIME,增加了邮件的主体结构,定义了非ASCII码的编码传输规则,这就是Base64。

关于字符编码的知识,请查看前端开发中需要搞懂的字符编码知识

基础定义

Base64是基于64个可打印字符来表示二进制数据的编解码方式。

正因为可编解码,所以它主要的作用不在于安全性,而在于让内容能在各个网关间无错的传输。

这64个可打印字符包括大写字母A-Z、小写字母a-z、数字0-9共62个字符,再加上另外2个 +/

Base64是一种索引编码,每个字符都对应一个索引,具体的关系图,如下:

JavaScript中的Base64编码字符串是什么

这也是名称中64的由来。

编码方式

由于64等于2的6次方,所以一个Base64字符实际上代表着6个二进制位(bit)。

然而,二进制数据1个字节(byte)对应的是8比特(bit),因此,3字节(3 x 8 = 24比特)的字符串/二进制数据正好可以转换成4个Base64字符(4 x 6 = 24比特)。

为什么是3个字节一组呢? 因为6和8的最小公倍数是24,24比特正好是3个字节。

具体的编码方式:

  • 将每3个字节作为一组,3个字节一共24个二进制位

  • 将这24个二进制位分为4组,每个组有6个二进制位

  • 在每组的6个二进制位前面补两个00,扩展成32个二进制位,即四个字节

  • 每个字节对应的将是一个小于64的数字,即为字符编号

  • 再根据字符索引关系表,每个字符编号对应一个字符,就得到了Base64编码字符

JavaScript中的Base64编码字符串是什么

上图中的字符串 'you',经过转换后,得到的编码为: 'eW91'

体积增大

我们可以看到,当3个字符进行Base64转换编码后,最后变成了4个字符。因为每个6比特位,都补了2个0,变成8比特位,对应1字节。

这里正好多了三分之一,所以正常情况下,Base64编码的数据体积通常比原数据的体积大三分之一

这也是为什么我们在前面讲使用Base64编码优化图片时,需要强调是小图标,如果图片都使用该方式,则静态文件会增大很多,并不合适。

= 等号

3个英文字符,正好能转成4个Base64字符。那如果字符长度不是3的倍数,那应该使用什么样的规则呢?

其实也简单,我们在实际使用Base编码时,常会发现有第65个字符的存在,那就是 '=' 符号,这个等于号就是针对这种特殊情况的一种处理方式。

对于不足3个字节的地方,实际都会在后面补0,直到有24个二进制位为止。

但要注意的是,在计算字节数时,会直接使用总长度除以3,如果余数为1则会直接在最后补一个=,如果余数为2则补两个=

因此,转码后的字符串需要补的后缀等号,要么是1个,要么是2个,具体的可以见下图:

JavaScript中的Base64编码字符串是什么

图中第二个,使用的是单独的字符 'd',是为了区分索引字符表里的索引0,这个时候,得到编码中,会存在一个索引0对应的A字符,而'='是直接补上2个。

非ASCII码字符

由于 Base64 仅可对 ASCII 字符进行编码,如果是中文字符等非ASCII码,就需要先将中文字符转换为ASCII字符后,再进行编码才行。

编解码方法

btoa 和 atob

JavaScript提供了两个原生方法,用来处理Base64编码:btoa()atob()

  • btoa(): 将字符串或二进制值转换成Base64编码字符串。

  • atob(): 对base64 编码的字符串进行解码。

btoa('you')//'eW91'atob('eW91')//'you'

注意:

btoa方法只能直接处理ASCII码的字符,对于非ASCII码的字符,则会报错。

atob方法如果传入字符串参数不是有效的Base64编码(如非ASCII码字符),或者其长度不是4的倍数,会报错。

btoa('中')//UncaughtDOMException:ThestringtobeencodedcontainscharactersoutsideoftheLatin1range.atob('y')//UncaughtDOMException:Thestringtobedecodedisnotcorrectlyencoded.

处理中文字符

由于btoa、atob 仅支持对ASCII字符编码,也就是单字节字符,而我们平时的中文都是 2-4 字节的字符。

因此,可以先将中文字符转为 utf-8 的编码,将utf-8编码当做字符,这样就可以对多个单字节字符进行编码。

对于中文可以使用这两个方法: encodeURIComponent()decodeURIComponent()

  • encodeURIComponent():将非ACSII码的字符进行utf-8编码

  • decodeURIComponent():解码使用

如下,编解码中文的方式:

window.btoa(encodeURIComponent('中国'))//'JUU0JUI4JUFEJUU1JTlCJUJE'decodeURIComponent(window.atob('JUU0JUI4JUFEJUU1JTlCJUJE'))//'中国'

第三方库

js-base64

前端常见应用

接下来,我们了解下前端开发中常见的对Base64编码的一些使用场景。 Base64在前端方面的应用,多数都是针对图片的处理,一般都是基于DataURL的方式来使用。

Data URL 由 data:前缀MIME类型(表明数据类型)base64标志位(如果是文本,则可选)以及 数据本身 四部分组成。 具体的格式:data:[<mime type>][;base64],<data>。 这里的第四部分 <data> 数据本身,就是一个Base64字符串。

小图片转码

即开篇说的针对图片优化,使用Base64能减少请求数的,可以在img标签下,或者css中:

<imgsrc="data:image/svg+xml;base64,PHN2ZyB4bWxucz0iaHR0c......Ii8+PC9nPjwvc3ZnPg==">
.icon{background:url(data:image/svg+xml;base64,PHN2ZyB4bWxucz0iaHR0c......Ii8+PC9nPjwvc3ZnPg==);}

当我们使用vue或react框架时,也可以通过url-loader来配置,图标转Base64的大小:

.loader('url-loader').tap(options=>{options.limit=10240//10kbreturnoptions})

文件读取

Web环境下,有提供 FileReader 的API,用来读取文件的数据,可以通过它的 readAsDataURL() 方法,将文件数据读取为Base64编码的字符串数据:

letreader=newFileReader()reader.onload=()=>{letbase64Img=reader.result};reader.readAsDataURL(file)

该方法常用在图片上传中。

Canvas生成图片

Canvas本质上是一个位图图像,它有提供 toDataURL() 方法,将画布导出生成为一张图片,该图片将以Base64编码的格式进行保存。

constdataUrl=canvasEl.toDataURL()//data:image/png;base64,PHN2ZyB4bWxucz0iaHR0c......

其他

除处理图片展示外,还会在特殊数据传输、简单编码和加密、代码混淆、部分证书中,见到Base64编码字符串。

 </div> <div class="zixun-tj-product adv-bottom"></div> </div> </div> <div class="prve-next-news">
本文:JavaScript中的Base64编码字符串是什么的详细内容,希望对您有所帮助,信息来源于网络。
上一篇:Python耙梳加密算法Encryption种类及开发场景是什么下一篇:

11 人围观 / 0 条评论 ↓快速评论↓

(必须)

(必须,保密)

阿狸1 阿狸2 阿狸3 阿狸4 阿狸5 阿狸6 阿狸7 阿狸8 阿狸9 阿狸10 阿狸11 阿狸12 阿狸13 阿狸14 阿狸15 阿狸16 阿狸17 阿狸18