为什么不使用4位或16位呢?
我假设一些与硬件相关的原因,并且我想知道8bit 1byte如何成为标准。
自从我从事计算机组织工作以来,还没有一分钟,但是有关“字节” 的相关Wiki提供了一些上下文。
该字节最初是可容纳单个字符的最小位数(我假设为标准ASCII)。我们仍然使用ASCII标准,因此每个字符8位仍然有意义。例如,这句话是41个字节。就我们的目的而言,这很容易计算且实用。
如果我们只有4位,那么除非有2个字节来表示单个字符,否则将只有16个(2 ^ 4)个可能的字符,这在计算上效率较低。如果字节中有16位,则指令集中将有更多的“死空间”,我们将允许65,536(2 ^ 16)个可能的字符,这将使计算机在执行字节级指令时运行效率降低,尤其是因为我们的字符集要小得多。
更正后,ASCII使用7位。
除了“这句话”不是用ASCII编码。它以UTF-8编码。ASCII具有非常有限和专门的用法。UTF-8是Unicode字符集的编码。HTML,XML等所有文本均为Unicode。请参阅此页面的HTTP响应标头,以查看Web服务器是否以UTF-8对其进行了编码。(先按F12,再按F5,然后选择请求名称42842817。)如果查阅HTTP规范,则会发现HTTP标头实际上是ASCII。因此,我们每天都在使用ASCII,但几乎从未在新程序中使用过。
这就是为什么他们将其称为UTF-8?因为它使用完整的8位字节?哈哈
否。之所以称为UTF-8,是因为代码单元是8位。每个代码单元提供21位Unicode代码点所需的一些位。一个代码点需要1到4个UTF-8代码单元。对于UTF-16和UTF-32同样。但是,根据设计,一个代码点永远不需要一个以上的UTF-32代码单元。