* * * * * *
几乎在同一时刻,东宫,崇文殿西侧耳房。
这里的布置相对简洁。一张长案上,同样设有一套收发装置,旁边备有纸笔。墙上挂着一大幅写满奇怪符号的对照表。
沈清韵、林雨柔、林诗婉三人围在案边。沈清韵今日穿着常服,长发简单绾起,正指着墙上的图表,向林氏姐妹讲解。
林雨柔,作为“太湖水榭”账务总管兼海康基金会会长,对数字和规则有着天生的敏锐。林诗婉, “太湖水榭”秘书长,活泼聪颖,记忆力超群。两人都是明璃商业帝国的核心成员,未来也极可能成为电报系统的首批高级使用者。
“线路还在做最后调试,我们趁此时间,先弄清楚这‘电报’到底如何‘说话’。”沈清韵的声音清晰柔和,“它说的不是我们日常的语言,而是一种编码。这套编码的基础,是‘二进制’。”
她在纸上画了短短两道:“简单说,就是用两种基本状态表示一切。在电线上,就是正脉冲、反脉冲。我们将其定义为‘0’和‘1’。”
她指向图表最上方:“我们定义了32个‘基本字符’,每个字符由5位二进制数表示。这32个字符,被分配给了三组大家熟悉的符号:十天干(甲乙丙丁戊己庚辛壬癸)、十二地支(子丑寅卯辰巳午未申酉戌亥)、以及十个数字(零一二三四五六七八九)。为什么是32个?因为2的5次方是32,正好够分。”
林诗婉眨着大眼睛:“清韵姐姐,用天干地支和数字当基础,倒是好记。可怎么表示那么多字呢?”
“问得好。”沈清韵赞许地看她一眼,“单个5位字符能表达的太有限。所以,我们规定,将两个基本字符组合在一起,形成一个‘发送单元’。这个单元长度是10位二进制,我称之为一个‘字节’。实际发送时,为了检查错误,可以在10位后面再加一位‘奇偶校验位’,比如保证这个‘字节’里‘1’的个数总是奇数或偶数,如果接收时对不上,就知道可能传错了,要求重发。”
她接着讲解核心的编码规则:“两个基本字符组合,有九种可能:天干+地支、天干+数字、地支+数字、天干+天干、地支+地支、数字+天干、数字+地支、数字+数字、以及地支+天干(这个暂时预留)。每种组合,被赋予了不同的使命。”
“首先,天干+地支、天干+数字这两种组合,总共可以提供220种不同的编码。这些编码,被用来表示汉字的‘部首’。”沈清韵在纸上举例,“比如,‘甲子’这个组合,代表‘木’字旁;‘乙丑’代表‘水’字旁……我们将最常用的60个部首,直接对应到天干地支的六十甲子顺序上,便于记忆。接收端如果收到一个属于这两种组合的‘字节’,就知道这是一个‘部首编码’,它需要等待下一个‘字节’。”
“下一个‘字节’,必须是地支+数字组合才有效。这种组合有120种可能,它表示的是‘余部索引’。简单说,就是在这个部首下,具体是哪个字。我们设计时,用地支部分来大致索引这个字的笔画数,方便快速查找。一个部首编码,加上一个余部索引,就能唯一确定一个汉字。理论上,220个部首配合120个余部索引,最多可以表示个不同的字,足以涵盖常见字,甚至还有大量空余,未来可以扩展。”
林雨柔若有所思:“也就是说,发送一个完整的汉字,通常需要两个‘字节’,第一个指明部首,第二个指明是哪个字。”
“对,这是最一般的情况。”沈清韵点头,“但为了效率,我们对高频字和特殊信息做了优化编码,只需一个‘字节’就能表达。”
她指向另外几种组合:
“天干+天干组合,100种可能。其中,以‘甲’、‘乙’开头的20种,被定义为控制符,比如‘开始发送’、‘发送结束’、‘段落断句’、‘请求重发’等。以‘丙’、‘丁’、‘戊’开头的30种,定义为运算符和我引入的一些标点符号,比如加、减、乘、除、等于,以及逗号、句号、问号等。最后50种,则编码为一些标准常用短语,比如‘谨启’、‘敬悉’、‘为盼’等等。”
“地支+地支、数字+天干、数字+地支、数字+数字这四种组合,则被直接编码为以独体字为主的高频常用字,以及零到二十九的数字。比如‘子子’代表‘之’,‘一一’代表‘十一’。”
说到这里,沈清韵特别强调了数字+数字组合的特殊性:“这种组合尤其重要,因为它天然适合表示数字及相关信息。其中,‘零零’到‘二九’这30个编码,直接对应数字0到29。它们不仅可以表示数字本身,还可以用来组合表示日期、时间。比如,约定‘零一’到‘一二’(1-12)表示正月到腊月,‘一三’到‘二四’(13-24)表示闰正月到闰腊月;日期每月30天,当后面跟着表示‘日’的字符时,‘零零’可以代表三十;还可以表示十二时辰(包括‘初’和‘正’共24个)、刻(一刻到四刻)、分(每刻15分钟)等等。”
小主,这个章节后面还有哦,请点击下一页继续阅读,后面更精彩!
喜欢替身公主与她的穿越者小跟班请大家收藏:(m.20xs.org)替身公主与她的穿越者小跟班20小说网更新速度全网最快。