base64编码

2023-05-18

base64.顾名思义,就是基于64个可打印字符来表示二进制数据的一种方法。(它不是加密算法)。对于64个打印字符,我们字需要6个二进制位就可以完全表示了。那么我们如何利用8个二进制位来表示只需要6个二进制位就可以完全表示的可打印字符呢?由于2的6次方等于64,所以我们可以将每6位元为一个单元,对应某个可打印字符。三个字节有24个位元,对应于4个Base64单元,即3个字节需要用4个可打印字符来表示。它可用来作为电子邮件的传输编码。在Base64中的可打印字符包括字母A-Z、a-z、数字0-9,这样共有62个字符,此外还有两个可打印符号在不同的系统中而不同。

Base64索引表:(原始表)

编码过程实例:

编码

上面的三个字节是原文,下面的四个字节是转换后的Base64编码,其前两位均为0。

转换后,我们再通过将二进制转换为可打印字符来得到我们想要的字符串(也就是最终的Base64编码)

我们可以看到经过base64编码后,字符串理论上比之前长1/3,也就是原来的4/3。(除下面两种情况外)。

如果要编码的字节数不能被3整除,最后会多出1个或2个字节,那么可以使用下面的方法进行处理:先使用0字节值在末尾补足,使其能够被3整除,然后再进行base64的编码。在编码后的base64文本后加上一个或两个'='号,代表补足的字节数。也就是说,当最后剩余一个八位字节(一个byte)时,最后一个6位的base64字节块有四位是0值,最后附加上两个等号;如果最后剩余两个八位字节(2个byte)时,最后一个6位的base字节块有两位是0值,最后附加一个等号。

base64编码后一般都有=号,而且密文长度较长的也基本是base64编码。(base64编码的长度不固定)(等号是根据使用情况不同而对64种可打印字符进行修改的结果)。

base64的应用

base64在线解码:http://www1.tc711.com/tool/BASE64.htm

https://zh.wikipedia.org/zh/Base64

《base64编码.doc》

下载本文的Word格式文档,以方便收藏与打印。