Bit(位),又名比特,是计算机中最小的存储单位。
由于计算机内部都是以二进制存储的,所以1个位只能存储0或者1,也就是只能存储两种状态。
如果我们规定用二进制0表示“是”,用二进制1表示“否”,那么就定义了“是否”这两个字符的编码,也就是字符的编码就是字符的二进制表示形式。在同样的编码规则下,不同的字符的二进制表示形式是唯一的,不会重复的。
由于在内存中一般以字节作为存储单位。 8个位组合起来变成了1个字节,比如0 1 0 1 1 0 1 0。
1个位可以存储0或者1两种模式,2个位可以存储00 01 10 11四种模式,依次类推,8个位可以存储2的8次方种模式,也就是256个模式。如果用1个字节来编码的话,总共可以对256个字符进行编码,因为有256种不同的二进制形式。
类似地,如果是用两个字节来编码的话,总共可以对65536个字符进行编码,因为有65536种不同的二进制形式。
比如一种编码规则规定二进制形式“00010000 00000001”可以表示字符“我”,另一种编码规则规定相同的二进制形式“00010000 00000001”可以表示字符“他”,这样就形成了多种不同的编码。
当然,这些编码规则一定是要事先约定的,不然计算机将无法正确的显示字符,也就是如果不事先规定二进制形式“00010000 00000001”用来表示字符“他”还是字符“我”的话,那么在打开文件时,字符将无法显示,因为内容都是以二进制形式存储的。
为了便于信息的沟通,国际上先后推出了各种编码规则,比较有名的有ASCII编码、ANSI编码、UNICODE编码等。
ASCII编码规定用7位二进制位表示128个字符,如下表所示
Bin(二进制) | Dec(十进制) | Hex(十六进制) | 缩写/字符 | 解释 |
0000000 | 0 | 0 | NUL(null) | 空字符 |
0000001 | 1 | 1 | SOH(start of headline) | 标题开始 |
0000010 | 2 | 2 | STX (start of text) | 正文开始 |
0000011 | 3 | 3 | ETX (end of text) | 正文结束 |
0000100 | 4 | 4 | EOT (end of transmission) | 传输结束 |
0000101 | 5 | 5 | ENQ (enquiry) | 请求 |
0000110 | 6 | 6 | ACK (acknowledge) | 收到通知 |
0000111 | 7 | 7 | BEL (bell) | 响铃 |
0001000 | 8 | 8 | BS (backspace) | 退格 |
0001001 | 9 | 9 | HT (horizontal tab) | 水平制表符 |
0001010 | 10 | 0A | LF (NL line feed, new line) | 换行键 |
0001011 | 11 | 0B | VT (vertical tab) | 垂直制表符 |
0001100 | 12 | 0C | FF (NP form feed, new page) | 换页键 |
0001101 | 13 | 0D | CR (carriage return) | 回车键 |
0001110 | 14 | 0E | SO (shift out) | 不用切换 |
0001111 | 15 | 0F | SI (shift in) | 启用切换 |
0010000 | 16 | 10 | DLE (data link escape) | 数据链路转义 |
0010001 | 17 | 11 | DC1 (device control 1) | 设备控制1 |
0010010 | 18 | 12 | DC2 (device control 2) | 设备控制2 |
0010011 | 19 | 13 | DC3 (device control 3) | 设备控制3 |
0010100 | 20 | 14 | DC4 (device control 4) | 设备控制4 |
0010101 | 21 | 15 | NAK (negative acknowledge) | 拒绝接收 |
0010110 | 22 | 16 | SYN (synchronous idle) | 同步空闲 |
0010111 | 23 | 17 | ETB (end of trans. block) | 结束传输块 |
0011000 | 24 | 18 | CAN (cancel) | 取消 |
0011001 | 25 | 19 | EM (end of medium) | 媒介结束 |
0011010 | 26 | 1A | SUB (substitute) | 代替 |
0011011 | 27 | 1B | ESC (escape) | 换码(溢出) |
0011100 | 28 | 1C | FS (file separator) | 文件分隔符 |
0011101 | 29 | 1D | GS (group separator) | 分组符 |
0011110 | 30 | 1E | RS (record separator) | 记录分隔符 |
0011111 | 31 | 1F | US (unit separator) | 单元分隔符 |
0100000 | 32 | 20 | (space) | 空格 |
0100001 | 33 | 21 | ! | 叹号 |
0100010 | 34 | 22 | “ | 双引号 |
0100011 | 35 | 23 | # | 井号 |
0100100 | 36 | 24 | $ | 美元符 |
0100101 | 37 | 25 | % | 百分号 |
0100110 | 38 | 26 | & | 和号 |
0100111 | 39 | 27 | ‘ | 闭单引号 |
0101000 | 40 | 28 | ( | 开括号 |
0101001 | 41 | 29 | ) | 闭括号 |
0101010 | 42 | 2A | * | 星号 |
0101011 | 43 | 2B | + | 加号 |
0101100 | 44 | 2C | , | 逗号 |
0101101 | 45 | 2D | – | 减号/破折号 |
0101110 | 46 | 2E | . | 句号 |
0101111 | 47 | 2F | / | 斜杠 |
0110000 | 48 | 30 | 0 | 数字0 |
0110001 | 49 | 31 | 1 | 数字1 |
0110010 | 50 | 32 | 2 | 数字2 |
0110011 | 51 | 33 | 3 | 数字3 |
0110100 | 52 | 34 | 4 | 数字4 |
0110101 | 53 | 35 | 5 | 数字5 |
0110110 | 54 | 36 | 6 | 数字6 |
0110111 | 55 | 37 | 7 | 数字7 |
0111000 | 56 | 38 | 8 | 数字8 |
0111001 | 57 | 39 | 9 | 数字9 |
0111010 | 58 | 3A | : | 冒号 |
0111011 | 59 | 3B | ; | 分号 |
0111100 | 60 | 3C | < | 小于 |
0111101 | 61 | 3D | = | 等号 |
0111110 | 62 | 3E | > | 大于 |
0111111 | 63 | 3F | ? | 问号 |
1000000 | 64 | 40 | @ | 电子邮件符号 |
1000001 | 65 | 41 | A | 大写字母A |
1000010 | 66 | 42 | B | 大写字母B |
1000011 | 67 | 43 | C | 大写字母C |
1000100 | 68 | 44 | D | 大写字母D |
1000101 | 69 | 45 | E | 大写字母E |
1000110 | 70 | 46 | F | 大写字母F |
1000111 | 71 | 47 | G | 大写字母G |
1001000 | 72 | 48 | H | 大写字母H |
1001001 | 73 | 49 | I | 大写字母I |
1001010 | 74 | 4A | J | 大写字母J |
1001011 | 75 | 4B | K | 大写字母K |
1001100 | 76 | 4C | L | 大写字母L |
1001101 | 77 | 4D | M | 大写字母M |
1001110 | 78 | 4E | N | 大写字母N |
1001111 | 79 | 4F | O | 大写字母O |
1010000 | 80 | 50 | P | 大写字母P |
1010001 | 81 | 51 | Q | 大写字母Q |
1010010 | 82 | 52 | R | 大写字母R |
1010011 | 83 | 53 | S | 大写字母S |
1010100 | 84 | 54 | T | 大写字母T |
1010101 | 85 | 55 | U | 大写字母U |
1010110 | 86 | 56 | V | 大写字母V |
1010111 | 87 | 57 | W | 大写字母W |
1011000 | 88 | 58 | X | 大写字母X |
1011001 | 89 | 59 | Y | 大写字母Y |
1011010 | 90 | 5A | Z | 大写字母Z |
1011011 | 91 | 5B | [ | 开方括号 |
1011100 | 92 | 5C | \ | 反斜杠 |
1011101 | 93 | 5D | ] | 闭方括号 |
1011110 | 94 | 5E | ^ | 脱字符 |
1011111 | 95 | 5F | _ | 下划线 |
1100000 | 96 | 60 | ` | 开单引号 |
1100001 | 97 | 61 | a | 小写字母a |
1100010 | 98 | 62 | b | 小写字母b |
1100011 | 99 | 63 | c | 小写字母c |
1100100 | 100 | 64 | d | 小写字母d |
1100101 | 101 | 65 | e | 小写字母e |
1100110 | 102 | 66 | f | 小写字母f |
1100111 | 103 | 67 | g | 小写字母g |
1101000 | 104 | 68 | h | 小写字母h |
1101001 | 105 | 69 | i | 小写字母i |
1101010 | 106 | 6A | j | 小写字母j |
1101011 | 107 | 6B | k | 小写字母k |
1101100 | 108 | 6C | l | 小写字母l |
1101101 | 109 | 6D | m | 小写字母m |
1101110 | 110 | 6E | n | 小写字母n |
1101111 | 111 | 6F | o | 小写字母o |
1110000 | 112 | 70 | p | 小写字母p |
1110001 | 113 | 71 | q | 小写字母q |
1110010 | 114 | 72 | r | 小写字母r |
1110011 | 115 | 73 | s | 小写字母s |
1110100 | 116 | 74 | t | 小写字母t |
1110101 | 117 | 75 | u | 小写字母u |
1110110 | 118 | 76 | v | 小写字母v |
1110111 | 119 | 77 | w | 小写字母w |
1111000 | 120 | 78 | x | 小写字母x |
1111001 | 121 | 79 | y | 小写字母y |
1111010 | 122 | 7A | z | 小写字母z |
1111011 | 123 | 7B | { | 开花括号 |
1111100 | 124 | 7C | | | 垂线 |
1111101 | 125 | 7D | } | 闭花括号 |
1111110 | 126 | 7E | ~ | 波浪号 |
1111111 | 127 | 7F | DEL (delete) | 删除 |
发表评论