你真的理解 Java 的基础数据类型吗

Java 中的基础数据类型有 8 种,分别是:byte, boolean, short, char int, float, long double。

如果要理解这些基础类型如何存储数据,需要知道两个基础知识:

  • 所有数据都是使用二进制表示
  • 数值类型一律使用补码来表示

整数类型

byte 是存储整数的最小类型,只占 1 个字节,因为还需要表示负数,因此只能保存 -128 ~ 127 范围内的数据。

如果把一个超出范围的数值赋值给 byte 会怎么样?

直接赋值无法编译通过:

1
byte b = 129; // 编译通不过

需要通过强转才能编译通过,但得到值不是我们所期望的:

1
byte b = (byte)129; // -127

为什么会出现这样的结果呢?

129 使用二进制表示就是 10000001,但因为所有的数值类型都是使用补码来表示,在强制转换之后,第一位会被认为是符号位,表示负数。

负数补码的反码是除符号位以外取反,所以是:11111110。

负数的原码是反码加1,所以是 11111111,也就是 -127。

short,int,long 与 byte 没有太大区别,唯一的区别就在于占据的字节数量不一样。

  • short 占据 2 个字节,表示的范围是: -32768 ~ 32767
  • int 占据 4 个字节,表示的范围是:-2147483648 ~ 2147483647
  • long 占据 8 个字节,表示的范围是:-9223372036854775808 ~ 9223372036854775807

浮点数类型

Java 中的浮点数有 float 和 double 两种,按照 IEEE754 标准来实现,分别占 4 个字节和 8 个字节。

以 float 来说,总共有 32 位:

float 同样也有符号,所以第 1 位是符号位 (s),后面 8 位是指数位(e),最后面 23 位表示的是小数位(m),形式如下:

$$(-1)^s2^eM$$

这是需要注意的是因为是二进制,所以基数是 2,因为指数 e 有 8 位,所以范围是 -128 ~ 127。

比如说有一个浮点数:1001.11,按照上面的形式,如下:

$(-1)^0$ * $2^3$ * $1.00111$

因为浮点数的小数位会因为精度的问题而出现变化,所以不能使用 == 去比较两个浮点数,否则可能出现意想不到的情况。

double 除了位数不一样,其他与 float 一致。

布尔类型

boolean 的情况比较特殊,boolean 赋值时只能选择 true 或者 false,无法赋值其他的值。

但是在编译时会将 false 换成 0,将 true 换成非零数。

字符类型

由于 Java 使用的是 Unicode,所以作为基本的字符单元,char 使用了 2 个字节的空间,char 实际存储的是该字符在 Unicode 字符集内中的排序位置,即整数。

1
char b = 'a' + 1; // 98

每个 char 只能存储一个字符,所以存储一些英文字符时会浪费一些空间。

1
2
// 成为另一个字符,而不是像字符串拼接一样
char c = 'a' + 'b'; // Ã

在 Java8 之前,String 使用 char 数组来存储字符串,但是从 Java 9 以后,已经替换成 byte 数组了,因为更加灵活,而且存储的效率也更高。

@2020 rayjun