汇编语言的艺术之三：基本认识【第6页】 - 其他开发技术 - 好学IT学院

标签：汇编来源：互联网 作者：本站整理 发布时间：2009-05-20 ★★★〖加入收藏〗〖手机版〗

摘要：第一节应用工具一、对程式的认识写作程式不难，但要写出好程式却不容易。这就好像画图一样，人人都能画，而画出来的图却可能有天壤之别。想作一个好画家，首先要有观察及分析的能力，面对着杂乱的事物，先整理出头绪，找到主题。再在画布上勾出轮廓，这叫做……

第三节处理对象

一、数据资料

数据资料率指可以输入、处理及计算的二进位资料，在工作过程中，安全性为第一考虑因素，同时要兼顾精确以及完整性。此类资料一般说来数量都相当大，要妥善规划资料长度，否则存贮空间会成为执行程式时的主要课题。

写作此类程式时，各种进位制的转换，显示区的定位，计算公式的处理等都应该作为子程式，以便任意调用。

而真正关键问题却在于：数据的极限是否能够明确得知，在有限的范围中，绝对可以设计一种「结构化」的规格，符合效率的需求。否则也应根据其规则性，配合程式的特性，有效地加以处理。

二、文字资料

文字资料多为字符态，拼音文字所应该注意的是，字与字间的空间调整，齐头、齐尾、齐中等变化，行末断字的规定，以及字体、字形、字号等。

中文尚有输入码、内码等处理问题。原则上，如果要考虑中、英文兼容，则应注意萤幕上的字形显示与字码记忆区的位置，应占相同的比例。

目前，由于英文字、码不分，皆占一字元，萤幕上标准格式为25行80字，即采用所谓「文字状态」。而中文字形至少要有16x 16点阵，且需用图形方式（也有采用文字态，再加特殊硬体者，但成本偏高，有碍中文电脑未来发展）。因此，当采用640x 400或近似规格时，中文字形与英文之比，约为2:1。

在此基础上，以二字元为中文的内码长度，是最常用的结构。但是随着技术及观念的进步，有些英文系统已在使用二字元码，是则，中文有使用四字元的必要。

从另一方面来看，大陆所用的「国标码」，系抄自日本五十年代的 JIS CODE －日本工业标准，最多仅能容纳8836个符号，其中「汉字」尚不足八千。而国标码更为精简，收字6763个。中文源自中国，现在却借镜东洋的「工业标准」，且摇身一变，竟成为十余亿人口的「国家标准」，真可谓每下愈况。无独有偶，台湾也有所谓的标准，BIG-5 的13,053字，虽然是国标码的两倍，二者终究是五十与百步之差而已。

为什么要订定这种「辱及先祖」的文字标准呢？谁又够资格订定中文标准呢？从事电脑工作者不过是些「技术专家」，连电脑这一行所有的技术尚未必精通，更何况隔行如隔山，竟然捞过界，捞到文字界这个相离十万八千里的领域去了。

文字是人类思想、文化的载具，先贤先圣们殚精竭虑所创造的文字，就是用来传达他们对宇宙、人生的认知。我们后代子孙不肖，不能领悟其微言大义倒也罢了。对电脑技术瞭解不足，没有能力令电脑应用中文，这也可以理解。但自以为是，依权仗势，妄想偷天换日，仅用少数认识的文字，定为整个国家的「文字标准」，并强制国人接受，这种颟顸就难以令人苟同了。

在运用中文时，由于各家发展的系统观念不一，有的甚至违法盗袭国外软件，为了兼容起见，必须「削足适履」。原则上，中文内码将第一字元中第八位位元设为一，得以与「美国工业标准码」的ASCII (American Standard Code for Infor-mation Interchange)有别。

文字资料处理上最重要的工作，是排序的技术问题，国标码仅六千多字，却分为二集，把常用字放在前集，次常用字在后部。但是这种顺序与使用人的观念毫无关连。除了统计这种使用频率的学者专家外，不可能有几个人理解何字是常用字，何字不是。

于是，当我们要利用电脑的高速效率，将输入的中文加以排序整理时，国标码完全起不了作用。也就是说，编码原为提高效率，而我们的编码只为了编码，与效率毫不相干。

唯一的补救办法是，再建一个排序表，与国标码一一对照使用。

高科技界因为利润高、地位高，故而高论、高见特多，只是动起手来就难免「眼高手低」，再不然则是「高论调、低效率」。

相信人人都有查字典或电话簿的经验，对用英文来说，是轻而易举，中文则麻烦多多。国人只知抱残守缺，自卑自怜，而不求瞭解其因果原理。一般人如此倒也罢了，高科技界倘如此，就有点说不通，甚至令人怀疑是否别具用心。

英文所以方便无他，因其字母具有直接索引的功能！中文则有前人订定了一套「部首、笔画」的索引观念。这在过去资讯不发达的时代，的确是个创见，也足敷应用，但是现代与字母的直接索引相较，在效率上究竟差了一大截。

也有人认为，我们要维护中华文化，就应该死抱着古人所定的索引观念。这种说法只有一点不足，就是忘了把大汉衣冠也穿得整整齐齐，甚至用文房四宝取代现代化事务工具！

麻烦的是，「部首、笔画」是两种不同的索引观念，当没有时间因素介入时，孰先孰后关系不大。可是用到电脑上，就必须定先后次序，否则碍难执行。

对姓氏笔画少的人，当然主张「笔画」优先，姓氏部首明显的，则主张先排「部首」。这点不难理解，出席一个重要的庆典，或在报上亮相，人数一多，排名先后所涉及的利益，至关重大，不能不争！问题在于，除了私利外，部首笔画这种没有效率的索引观念，还有什么实用的价值？如果一定要保存，作为一种特例，当然可以。可是电脑所追求的是效率，每个中文的部首和笔画，都需要建对照表，才能应用，字集越大，空间需求越大，时间消耗也越长。

这还不说，索引不仅是提供给电脑用的，人更需要。仅以查电话本为例，「张伟雄」这个名字，我们凭什么知道其前后的「定位」关系呢？表面上看来，只要查三次部首及其笔画、以及数三次这三个字的笔画。而事实上，在查找的过程中，每遇到一个名字，都要重覆前述的手续，才能加以比较。

有人振振有词说，有些字一眼看过去就知道是几画！至少我个人没有这种本事。而且根据统计，中文平均以十四画的居多，由九至十八画，就很难靠视觉分辨！再若人名一多，视觉就很容易疲劳。

又有人说话了，现在是给电脑排序，与人不相干！殊不知字母排序可以立即执行，而部首、笔画排序要多作三至六次动作，兹以先部首后笔画为例：

1,查本字之部首序值。
　　2,查对照字之部首序值。
　　3,比较两者之大小，决定是否需要再比。
　　4,再比时，查本字笔画数。
　　5,查对照字之笔画数。
　　6,比较两者之大小，以决定序位。

把这些步骤写成程式，以中文两个字元的内码计，（意思是说中文收字在两万以下）如果用对照表的方式，空间当在64KB以上，速度则较英文慢约50倍。再若采用公式计算，空间或能节省，但速度将慢上千、百倍之多。

这还是指两万字以下的情况，若采用汉字全字集，后果将不堪设想。所以「专家」们一致认为，为了效率，字收得越少越好！

怎样才能算是真正的「中文电脑」？我十多年前所面对的「敌人」，是主张将中文字埋葬掉。这种人不难对付，因为到底他们还是中国人，在民族大义的旗帜下，多多少少心中也存着乐见中文电脑成功的意愿。所不同的，只是他们不相信有此可能罢。

现今的「敌人」则顽强得多，他们同样喊着民族大义的口号，又是公认的中文电脑「专家」。更可怕的，目前使用中文电脑的人，不见得对中国文化有什么明确的认识，有个工具列印一些文件，就相当知足了。于是，这些客户也在其主观的立场，认定目前这种「市场占有率高」的半调子，就是「中文电脑」的标准！

是吗？如果中文字有六、七万字，而目前只能用几千、甚至一万多字，那么其他的字呢？算不算是中文，如果算，为什么「中文电脑」中没有？这种电脑能说是「中文电脑」吗？

有人又说了，没有关系，以后再说。怎么说呢？有一种方法，是将文字「分集」，分成：常用字、次常用字、次次常用字、罕用字、罕罕用字等等。且不管是哪位学者有这么大的学问去「分集」，我所知道的只是用这种方法，人无从记忆，中文排序的难度又一倍一倍地加了上去。也难怪当初有人认为中文不科学，这不是明证吗？

其实，中文排序根本没有问题，我们利用仓颉字母作为索引，效率与英文相等，而且收字可以高达千万个。至于记忆空间，一个字元都不需要。更有利的是，用作字典、电话簿等的索引，一查即得。

内码是各个系统、根据其不同的需求、所订的一种资料形式，没有任何理由强制规定。当然，如果内码种类多了，姑不论其编码的好坏，各个中文系统之间，自然会形成难以沟通的障碍。于是有必要建立一种「交换码」，供不同系统的内码，统一交换应用。

这种交换码才有标准化的必要，而且订定之时，应该谨慎从事，要能容纳所有各家系统所收的字，否则无从交换。

不论是哪种码，必然会有其特殊规定，在写作之前，程式师一定要设法找到该系统所用的「码表」，否则无法处理。

第1页第2页第3页第4页第5页第6页第7页第8页第9页第10页第11页
第12页【话题评论】

汇编语言艺术之三基本认识

·Win2003服务器管理的安全配置全攻略

本配置仅适合Win2003，部分内容也适合于Win2000。很多人觉得3389不安全，其实只要设置好，密码够长，攻破3389也不是…

您的每一点爱心都是我们成长的动力

支付宝扫一扫赞助

微信钱包扫描赞助