GBK 编码是一种针对汉字的字符编码标准,是汉字编码国家标准 GB 2312-1980 的扩展,也被称为 GBK/GB2312。GBK 编码包含了 GB2312 编码中的全部汉字,并对一些生僻汉字和少数民族文字进行了扩充,共收录了 21003 个中日韩汉字和符号。
GBK 编码是双字节编码,每个字符占用 2 个字节。其中,第一个字节的范围是 0x81 - 0xFE,第二个字节的范围是 0x40 - 0xFE(不包括 0x7F),这样总共可以组合 190 * 94 = 17860 个汉字和符号。
由于 GBK 编码是针对汉字的编码标准,所以在 GBK 编码中,英文字母、数字、标点等非汉字字符仍然只占用一个字节,其编码值与 ASCII 码相同。同时,由于 GBK 编码是 GB2312 编码的扩展,所以 GB2312 中的汉字可以直接使用 GBK 编码解码。
需要注意的是,GBK 编码与 Unicode 编码不同,GBK 编码并不是全球通用的字符编码标准,仅适用于中文语境下的字符编码和文本处理。
相关文章
关注千锋学习站小程序
随时随地免费学习课程
扫一扫快速进入
千锋移动端页面
扫码匿名提建议
直达CEO信箱