关于“文泉驿”作为几千年中华文明的见证,浩瀚传统文化传承的载体,汉字是让我们每一个
中国人引以为豪的东方文明的标志之一。我们的祖先创造汉字,书写汉字,利用汉字和汉语的无穷魅力创造出让人叹为观止的文学,艺术。而今天进入了
计算机时代的我们,虽然不再象古人一样手持毛笔,批著简帛,但我们的生活仍然无时无刻离不开汉字。
可以毫不夸张的讲,汉字①是世界上最为复杂和庞大的符号
系统之一。早在殷商时期,我们的先人就创造出了数目巨大的甲骨文,从发掘出来的上万片甲骨中整理出来的单字就有四千余个,而东汉许慎编撰的“说文解字”,收录汉字9353字(一说10516)个。至清朝康熙年间由段玉裁等人收集整理的 “康熙字典”收录汉字竟达47035之多。加上少数民族文字,各种古代典籍上曾经出现但并未广泛使用的古汉字和异体字,汉字总数多达十万以上。
我们是一群致力于在计算机世界中推广汉字,丰富电子汉字资源的志愿者,我们希望通过自己无私的劳动,使得无论你在世界上任何一个角落,都可以免费地获得我们的电子汉字资源,能够流畅地通过汉字进行交流。“文泉驿”是以上述目标为宗旨而自发创建的非赢利性组织。
对于制作电子汉字资源,文泉驿制定了如下子计划:
- 基于开放源代码②的点阵汉字库(优化屏幕显示)
- 基于开放源代码的矢量汉字库
- 基于开放源代码的汉字笔画笔序数据库
- 基于开放源代码的汉字图像识别系统
- 基于开放源代码的汉字笔画识别系统
- 基于开放源代码的汉字信息系统(解释,编码等)
- 开放的非官方电子汉字标准
具体来讲,我们希望完成覆盖Unicode 4.0所包含的7万多汉字的点阵位图(9pt,10pt,11pt,12pt等),笔画笔顺数据库以及基于笔画笔顺数据库生成的不同字型(细宋,中宋,报宋等)的矢量汉字库。这个工作还可以继续扩展到对所有汉字进行注音,释义,通过笔画笔顺进行汉字检索和分类,少数民族语言文字的点阵和矢量字体,以及汉字图像识别和笔画识别算法,
软件的开发。
关于点阵汉字开发对于常见的计算机
操作系统,字体的显示算法需要一些字体的信息来优化屏幕显示效果,英文称为hinting。汉字由于笔画复杂,所以hinting 的方式与西文截然不同。使用在汉字字体中嵌入预先制作的点阵位图既可以有效地避免hinting算法带来的计算开销,同时屏幕上显示的汉字边缘清晰,易于阅读。下面就是使用点阵显示和不使用点阵显示的两个例子:
未使用点阵
中文的显示效果:

使用点阵中文的显示效果:

同时,点阵汉字也是一种非常特殊的汉字形式,如何在点阵有限的网格空间上排步黑白像素,使得即能最好地表现出汉字的笔画特征,又能黑白匀称,显示优美,可以说,制作点阵汉字是一种艺术创作活动。我们制作的点阵汉字字库将可以使用在各种主流计算机操作系统上,特别是同样基于开放源代码的Linux操作系统。
在制作点阵汉字的同时,我们的其他计划也在同时着手开展。我们真心地希望有更多热爱汉字的朋友加入我们的行列,为中文用户减轻困难,为中国文化的传播作出自己的贡献。
①:这里的汉字包含汉语使用和曾经使用的方块汉字以及各个少数民族的语言文字,比如彝文,蒙古文,回文,藏文等。当然,我们的工作还会适当扩充到日语,韩语,越南语等其他东亚文字。
②:这里的开放源代码代表了“免费获得并可以后继开发”的原则,我们将会在这个基本原则上制定具体使用协议,或者使用现有的开放源代码使用协议(比如
GNU General Public License)。