要求:原操作系统代码里只是支撑了藏语呈现,必要做的是落实对那些种类的汉字全角辅助。

FrameBuffer的法规     FrameBuffer
是出未来 2.2.xx 内核个中的生机勃勃种驱动程序接口。

在C5第11中学,HZK16汉字库的运用(mydows’s Blog转发)

hzk16的牵线以致轻松的使用方法

   
Linux是干活在爱慕格局下,所以顾客态进程是爱莫能助象DOS那样选取显卡BIOS里提供的暂停调用来促成直接写屏,Linux抽象出
FrameBuffer那几个设备来供顾客态进度达成间接写屏。Framebuffer机制模仿显卡的效果与利益,将显卡硬件结构抽象掉,可以经过
Framebuffer的读写直接对显存实行操作。客商能够将Framebuffer看成是呈现内部存款和储蓄器的一个影像,将其映射到进度地址空间之后,就可以直接实行读写操作,而写操作能够即刻反应在显示屏上。这种操作是架空的,统意气风发的。顾客无需关切物理显存的职位、换页机制等等具体细节。那些都以由
Framebuffer设备驱动来达成的。

概念如下:
unsigned char str[]=”我”
在运作时str被早先化为2个字节长度,内容为“笔者”的GBK码,为:0xCE(区码卡塔 尔(阿拉伯语:قطر‎,0xD2(位码卡塔 尔(英语:State of Qatar)。
利用如下换算公式获得“作者”在HZK16文件中的地址,从该职位上马的黄金年代风华正茂32字节为“小编”的字样。
    ADD=【(区码-0xa1)×0x5e + (位码-0xa1)】×0x20
根据地点的计量方法,“笔者”的字样地址:0x216E0 。他的C语言字模为:0x04,0x80,0x0E,0xA0,0x78,0x90,0x08,
0x90,0x08,0x84,0xFF,0xFE,0x08,0x80,
0x08,0x90,0x0A,0x90,0x0C,0x60,0x18,
0x40,0x68,0xA0,0x09,0x20,0x0A,0x14,
0x28,0x14,0x10,0x0C

HZK16字库是适合GB2312标准的16×16点阵字库,HZK16的GB2312-80支撑的方块字有67六十一个,符号6八十多个。此中顶尖汉字有37伍12个,按声序排列,二级汉字有3008个,按偏旁部首排列。大家在部分接收地方根本用不到那般多汉字字模,所以在使用时就能够只领到部分字体作为己用。

   
但Framebuffer本人不具备其余运算数据的技巧,就一定要比是叁个目前寄放水的水池.CPU将运算后的结果放到那些水池,水池再将结果流到显示屏.
中间不会对数码做管理.
应用程序也足以直接读写那些水池的内容.在这种体制下,固然Framebuffer须要真正的显卡驱动的支撑,但持有展现职分都有CPU实现,由此CPU
肩负非常重

        
HZK16字库是顺应GB2312规范的16×16点阵字库,HZK16的GB2312-80帮助的汉字有6762个,符号6八十几个。当中一流汉字有37五十八个,按声序排列,二级汉字有3008个,按偏旁部首排列。我们在有些选取场馆根本用不到这么多汉字字模,所以在动用时就足以只领到部分字体作为己用。

HZK16字Curry的16×16中黄炎子孙民共和国字生机勃勃共须要2七十个点来显示,也等于说要求叁十一个字节能力落得显示一个平铺直叙汉字的指标。

framebuffer的器械文件平常是
/dev/fb0、/dev/fb1 等等。

HZK16字Curry的16×16中华夏儿女民共和国字朝气蓬勃共须求258个点来显示,也正是说需求三二十一个字节技能达成展现多个平凡汉字的指标。

我们明白一个GB2312汉字是由多个字节编码的,范围为A1A1~FEFE。A1-A9为符号区,B0到F7为汉字区。每贰个区有玖拾贰个字符(注意:那只是编码的许可约束,不自然都有字型对应,举个例子符号区就有那一个编码空白区域)。上面以汉字“作者”为例,介绍咋样在HZK16文书中找到它对应的三二十个字节的字样数据。

能够用命令: #dd if=/dev/zero of=/dev/fb
清空显示器. 即便展现方式是 1024×768-8 位色,

咱俩知晓叁个GB2312汉字是由多少个字节编码的,范围为A1A1~FEFE。A1-A9为符号区,B0到F7为汉字区。每三个区有91个字符(注意:那只是编码的特许节制,不显明都有字型对应,比方符号区就有好些个编码空白区域卡塔尔。上边以汉字“小编”为例,介绍怎样在HZK16文本中找到它对应的三二十一个字节的字样数据。

日前说起多此中中原人民共和国字占多个字节,这两在那之中前叁个字节为该汉字的区号,后一个字节为该字的位号。此中,每种区记录九十五个汉字,位号为该字在该区中之处。所以要找到“作者”在hzk16库中的地方就必需得到它的区码和位码。(为了差别使用了区码和区号,其实是叁个东西,别被自身误导了卡塔尔国

用命令:$ dd if=/dev/zero of=/dev/fb0
bs=1024 count=768 清空显示器;

前边聊起多在那之中华夏族民共和国字占多少个字节,这两当中前叁个字节为该汉字的区号,后一个字节为该字的位号。个中,每种区记录玖拾伍个汉字,位号为该字在该区中的地点。所以要找到“笔者”在hzk16库中之处就非得得到它的区码和位码。(为了分化使用了区码和区号,其实是多个事物,别被自个儿错误的指导了卡塔尔

区码:区号(汉字的第一个字节卡塔尔-0xa0
(因为汉字编码是从0xa0区开头的,所以文件最前方正是从0xa0区初步,要算出绝对区码)

用命令: #dd if=/dev/fb of=fbfile 
能够将fb中的内容保留下来;

区码:区号(汉字的首先个字节卡塔尔国-0xa0   
(因为汉字编码是从0xa0区初阶的,所以文件最前面正是从0xa0区初阶,要算出相对区码)

位码:位号(汉字的第二个字节卡塔 尔(英语:State of Qatar)-0xa0

能够另行写回荧屏: #dd if=fbfile
of=/dev/fb;

位码:位号(汉字的第三个字节卡塔 尔(英语:State of Qatar)-0xa0

像这种类型我们就足以得到汉字在HZK16中的相对偏移地方:

在行使Framebuffer时,Linux是将显卡置于图形形式下的.

那样我们就足以得到汉字在HZK16中的相对偏移地点:

offset=(94*(区码-1)+(位码-1))*32

 

offset=(94*(区码-1)+(位码-1))*32

表明:1、区码减1是因为数组是以0为开头而区号位号是以1为最早的

    在应用程序中,日常经过将 FrameBuffer
设备映射到进程地址空间的点子使用,比方上面的次第就展开 /dev/fb0
设备,

批注:1、区码减1是因为数组是以0为初叶而区号位号是以1为始发的

2、(94*(区号-1)+位号-1)是壹在那之中华夏族民共和国字字模占用的字节数

并经过 mmap 系统调用进行地址映射,随后用
memset 将显示器清空(这里若是展现格局是 1024×768-8
位色形式,线性内存情势卡塔 尔(英语:State of Qatar):

            2、(94*(区号-1)+位号-1)是叁此中华夏儿女民共和国字字模占用的字节数

3、最后乘以32是因为汉字库文应从该职位起的32字节音信记录该字的字样新闻(前边提到一个汉字要有31个字节呈现卡塔 尔(阿拉伯语:قطر‎

int fb;

           3、最终乘以32是因为汉字库文应从该职位起的32字节音讯记录该字的字样音信(前面提到四个中夏族民共和国字要有三13个字节呈现卡塔 尔(英语:State of Qatar)

 有了摇头地址就足以从HZK16中读取汉字编码了

unsigned char* fb_mem;

有了摇头地址就能够从HZK16中读取汉字编码了,剩下的正是文本操作了,就背着了,要看代码(汉字卡塔尔正是底下的:“hzk16汉字库的粗略读写程序 ”,是贰个最简便易行的c语言程序。

完结思路:

fb = open (“/dev/fb0”, O_RDWR);

                                                 hzk16汉字库的简便读写程序

  1. 问询HZK编码,领会一下切合GB2312规范的普通话点阵字库文件HZK16;
  2. 下载中文GB2312的二进制点阵文件;
  3. 将HZK16.fnt文件放入nihongo文件夹中;
  4. 修改主makefile文件和app_make.txt文件,将原本装载nihongo.fnt的口舌替换到装载HZK16.fnt就可以;
  5. 修正bootpack.c文件,将在此以前分配的装载日语字体的内部存储器扩张,载入字库的文本名;
  6. 在haribote/graphic.c中充分扶持汉字的代码,扩大三个函数用于展示汉字;
  7. 修改putfonts8_asc函数里if (task->langmode == 3)语句块;
  8. 测量试验程序。
  9. 只顾:法文的编码是分为左半有的和右半部分,而小编辈应用的HZK16是分为上半部分和下半部分的。

fb_mem = mmap (NULL, 1024*768,
PROT_READ|PROT_WRITE,MAP_SHARED,fb,0);

hzk汉字点阵   
    
   int    i,j,k;   
   unsigned    char    incode[3]=”小编”;    //    要读出的方块字   
   unsigned    char    qh,wh;   
   unsigned    long    offset;   
   //    占五个字节,    取其区位号   
   qh    =    incode[0]    –    0xa0;/ /获得区码            
   wh    =    incode[1]    –    0xa0;   / /获得位码               
   offset    =    (94*(qh-1)+(wh-1))*32;          /   
*获得偏移地方*    /   
      
   FILE    *HZK;   
   char    mat[32];   
   if((HZK=fopen(“hzk16”,    “rb”))    ==    NULL)   
   {   
   printf(“Can’t    Open    hzk16n”);   
   exit(0);   
   }   
   fseek(HZK,    offset,    SEEK_SET);   
   fread(mat,    32,    1,    HZK);

此地其他的地点相比弄,第5步将大小改正一下,小编的是nihongo = (unsigned
char *) memman_alloc_4k(memman, 55*94*32);

memset (fb_mem, 0, 1024*768);
//这几个命令应该唯有在root能够实践

//显示

第6步,要介怀,HZK16是上下两有个别,分裂于斯拉维尼亚语的左右两有的的组织。

 

for(j=0;j<16;j++)
        for(i=0;i<2;i++)
            for(k=0;k<8;k++)
               
if(mat[j][i]&(0x80>>k)) /*测量试验为1的位则显示*/
                    {

代码如下:

仿照写叁个

                            printf(“%s”,’#’);

void putfont32(char *vram, int xsize, int x, int y, char c, char *font1, char *font2)
{
    int i,k,j,f;
    char *p, d ;
    j=0;
    p=vram+(y+j)*xsize+x;
    j++;
    //上半部分
    for(i=0;i<16;i++)
    {
        for(k=0;k<8;k++)
        {
            if(font1[i]&(0x80>>k))
            {
                p[k+(i%2)*8]=c;
            }
        }
        if(i%2==0){
            for(k=0;k<4;k++){
                f=p[k];
                p[k]=p[7-k];
                p[7-k]=f;
            }
        }else{
            for(k=0;k<4;k++){
                f=p[k+8];
                p[k+8]=p[15-k];
                p[15-k]=f;
            }
        }
       /* for(k=0;k<8/2;k++)
        {
            f=p[k+(i%2)*8];
            p[k+(i%2)*8]=p[8-1-k+(i%2)*8];
            p[8-1-k+(i%2)*8]=f;
        }*/
        if(i%2)
        {
            p=vram+(y+j)*xsize+x;
            j++;
        }
    }
    //下半部分
    for(i=0;i<16;i++)
    {
        for(k=0;k<8;k++)
        {
            if(font2[i]&(0x80>>k))
            {
                p[k+(i%2)*8]=c;
            }
        }
        if(i%2==0){
            for(k=0;k<4;k++){
                f=p[k];
                p[k]=p[7-k];
                p[7-k]=f;
            }
        }else{
            for(k=0;k<4;k++){
                f=p[k+8];
                p[k+8]=p[15-k];
                p[15-k]=f;
            }
        }
        /*for(k=0;k<8/2;k++)
        {
            f=p[k+(i%2)*8];
            p[k+(i%2)*8]=p[8-1-k+(i%2)*8];
            p[8-1-k+(i%2)*8]=f;
        }*/
        if(i%2)
        {
            p=vram+(y+j)*xsize+x;
            j++;
        }
    }
    return;
}

 

                         }else{   printf(“%s”,’-‘);

 

1     fd_fb = open("/dev/fb0",O_RDWR);
 2     if(fd_fb < 0)
 3     {
 4         printf("can't open /dev/fb0 n");
 5         return -1;
 6     }
 7     if(ioctl(fd_fb, FBIOGET_VSCREENINFO, &var))            //取出可变信息
 8     {
 9         printf("can't get var n");
10         return -1;    
11     }
12     if(ioctl(fd_fb, FBIOGET_FSCREENINFO, &fix))            //取出固定信息
13     {
14         printf("can't get fix n");
15         return -1;    
16     }
17     screen_size = var.xres * var.yres * var.bits_per_pixel / 8;    //占内存大小 单位字节
18     line_width = var.xres *  var.bits_per_pixel / 8;         //一行像素大小
19     pixel_width =  var.bits_per_pixel / 8;               //一点像素大小
20     
21     fb_mem = (unsigned char *)mmap(NULL, screen_size,        //mmap 系统调用进行地址映射
22         PROT_READ | PROT_WRITE, MAP_SHARED, fd_fb, 0);
23     if(fb_mem == (unsigned char *) -1)
24     {                                      
25         printf("can't mmap n");
26         return -1;
27     }
28     memset(fb_mem, 0, screen_size);                   //清屏,黑色

                              }

运作结果,大家在euc.txt中参加一些汉字。

 

    fclose(HZK);
     fclose(fp);

威尼斯人平台 1

字符点阵彰显

                               图形LCD模块ACM一九二九4ASB的汉字彰显

参考资料:

8*16像素的字符点阵

1引言

1. 30天操作系统援助中文。

二个字节8位来代表生机勃勃行的8个像素是不是被入选点亮

在依附单片机的智能种类中,汉字彰显模块是非常重大的多少个组成都部队分,它接收广泛、操作轻便、调节和测量检验简便。

各种字符由十四个字节表示

而是,在单片机上显示汉字也存在多少个难题。首先,单片机能源有限,大家无法为了展现汉字占用太多的财富;其次,汉字存款和储蓄读取比较繁琐,使用不方便人民群众;第三,汉字是透过点阵呈现出来的,往往与LCD写入措施不等同,那就得举行转变和调度。

仅须要用asii码值乘以16就足以固定到日前字符的点阵地点

值得注意的是,基于单片机的汉字展现不能够在字符LCD上完结。使用图形LCD有为数不菲独到之处,不仅可以展现汉字,何况能够兑现汉字动态移动和上下滚屏,实现汉字与图片的长短不一展现,同不经常候耗电低。

 

2依照单片机的方块字展现原理

1 static const unsigned char fontdata_8x16[FONTDATAMAX] = {
 2 
 3     /* 0 0x00 '^@' */
 4     0x00, /* 00000000 */
 5     0x00, /* 00000000 */
 6     0x00, /* 00000000 */
 7     0x00, /* 00000000 */
 8     0x00, /* 00000000 */
 9     0x00, /* 00000000 */
10     0x00, /* 00000000 */
11     0x00, /* 00000000 */
12     0x00, /* 00000000 */
13     0x00, /* 00000000 */
14     0x00, /* 00000000 */
15     0x00, /* 00000000 */
16     0x00, /* 00000000 */
17     0x00, /* 00000000 */
18     0x00, /* 00000000 */
19     0x00, /* 00000000 */
20 
21     /* 1 0x01 '^A' */
22     0x00, /* 00000000 */
23     0x00, /* 00000000 */
24     0x7e, /* 01111110 */
25     0x81, /* 10000001 */
26     0xa5, /* 10100101 */
27     0x81, /* 10000001 */
28     0x81, /* 10000001 */
29     0xbd, /* 10111101 */
30     0x99, /* 10011001 */
31     0x81, /* 10000001 */
32     0x81, /* 10000001 */
33     0x7e, /* 01111110 */
34     0x00, /* 00000000 */
35     0x00, /* 00000000 */
36     0x00, /* 00000000 */
37     0x00, /* 00000000 */
38 
39         /*****
40     ****
41     ****
42     ****
43     ****
44     ****
45     ****
46     ****
47     *****/
48 
49     /* 255 0xff '' */
50     0x00, /* 00000000 */
51     0x00, /* 00000000 */
52     0x00, /* 00000000 */
53     0x00, /* 00000000 */
54     0x00, /* 00000000 */
55     0x00, /* 00000000 */
56     0x00, /* 00000000 */
57     0x00, /* 00000000 */
58     0x00, /* 00000000 */
59     0x00, /* 00000000 */
60     0x00, /* 00000000 */
61     0x00, /* 00000000 */
62     0x00, /* 00000000 */
63     0x00, /* 00000000 */
64     0x00, /* 00000000 */
65     0x00, /* 00000000 */
66 
67 };

2.第11中学华夏族民共和国字字模

 

汉字相仿是以点阵式存款和储蓄的,如16×16,24×24点阵(即汉字的字样卡塔 尔(英语:State of Qatar),各种汉字由32字节(16点阵卡塔 尔(阿拉伯语:قطر‎或72字节(24点阵卡塔 尔(英语:State of Qatar)描述。依照汉字的不如字体,也可分为草书字模、陶文字模、燕体字模等等。

刷写8*16字符点阵

汉字的字样其实是汉字字形的图形化。对于16点阵字模,正是把汉字写在叁个16×16的网格内,汉字的笔画能过某网格时该网格就对应1,不然该网格对应0,那样每一网格均对应1或0,把对应1的网格连起来看,便是那一个汉字。汉字就是那样经过字节表示点阵存款和储蓄在字库中的。

 

为了便于搜索所需汉字的点阵,各类汉字都与二个双字节的内码生机勃勃生机勃勃对应。通过汉字的内码能够总括出它的点阵最早字节。现以16点阵为例表明。

1 lcd_put_ascii(int x, int y, unsigned char c )
 2 {
 3     unsigned char *dots = (unsigned char *)&fontdata_8x16[c*16];
 4     int i, b;
 5     unsigned char byte;
 6     
 7     for(i = 0; i < 16; i++)
 8     {
 9         byte = dots[i];
10         
11         for(b = 7; b >= 0; b --)
12         {
13             if(byte & (1<<b))
14             {
15                 /* 显示 */
16                 lcd_put_pixel(x + 7 - b, y + i, 0xffffff);//白
17             }
18             else
19             {
20                         /* 不显示 */
21                 lcd_put_pixel(x + 7 - b, y + i, 0);//黑
22             
23             }
24         }
25     }
26     

先由内码计算出它在汉字库中的区位码,总结公式为:

 

区码=内码第一字节-160

行使HZK16
字库,将它拷贝到内部存款和储蓄器中,使用时直接用数组指向有个别汉字所在地方

位码=内码第二字节-160

 使用#include <sys/stat.h>中的fstat(卡塔尔国函数来计算HZK16文本消息

再由区位码能够拿到它在汉字库中字模第一个字节的地点:

 

(区码×94+位码)×32
于是,能够向后再三再四读出由27个字节组成的该字的点阵数据。

    fd_hzk16 =  open("HZK16",O_RDWR);
    if(fd_hzk16 < 0)
    {
        printf("can't open HZK16 n");
        return -1;
    }

    if(fstat(fd_hzk16, &hzk_stat))    //得到文件统计信息
    {
        printf("can't get fstatn");
        return -1;

    }
    hzk_mem = (unsigned char *)mmap(NULL, hzk_stat.st_size, 
        PROT_READ, MAP_SHARED, fd_hzk16, 0);
    if(hzk_mem == (unsigned char *) -1)
    {
        printf("can't mmap hzk_memn");
        return -1;
    }

2.2汉字展现

 

汉字占用能源太多(如16点阵,每一种汉字就需32字节卡塔尔国,因此日常把汉字库放在EEPROM里,必要出示某些汉字时,先算出它的区位码,再求出点阵伊始地方,从EEPROM中逐大器晚成调出该字的点阵数据,存在缓冲区里,最终依次送往LCD突显,描出该字。需求表达的是汉字存款和储蓄方式与LCD彰显格局有早晚差异。

 

本文使用另风流罗曼蒂克种显示格局,即事先将顺序用到的方块字、符号和数据(为了省去展现空间,能够将数据压成8×16点阵卡塔尔国,编成三个文书文件,用生龙活虎段小程序做出相应小的汉字库,那么些小字库的方块字点阵数据取自于通常汉字库。再通过调换和调度,得到新的汉字库,最终把新字库固化在EEPROM中。单片机只需按序号读出点阵字节,送往LCD就能够显示所需汉字。减轻了单片机的负担,去除了繁杂的研究内码、求起头地点、调换、调度等职业,进步了系统可信性。

HZK16
字库是切合GB2312典型的16×16点阵字库,HZK16的GB2312-80支撑的方块字有67陆十七个,符号6捌十四个。此中一流汉字有3754个,按
声序排列,二级汉字有3008个,按偏旁部首排列。大家在部分采纳场面根本用不到那般多汉字字模,所以在运用时就可以只领到部分字体作为己用。

表116点阵汉字字库存储方式

 

3自定义小字库的炮制

HZK16字Curry的16×16汉字大器晚成共需求259个点来突显,也正是说须求三拾柒个字节技能落得突显三个常常性汉字的目标。

头角峥嵘的汉字库可采用UCDOS下的字库,如16点阵字库HZK16。需求256K空间,用了一点都不小的EEPROM,又不便民读取,而实际上选拔中须求的方块字又非常少,因此我们能够和睦创设小的汉字库,在这里个小字Curry只含有系统需求的汉字。这样,一方面节省读取时间,其他方面大大地节约了财富。

大家清楚一个GB2312汉字是由四个字节编码的,范围为A1A1~FEFE。A1-A9为符号区,B0到F7为汉字区。每叁个区有91个字符(注意:那只是编码的批准限定,不分明都有字型对应,比方符号区就有那么些编码空白区域卡塔尔国。上边以汉字“作者”为例,介绍怎么着在HZK16文本中找到它对应的三15个字节的字样数据。

防止篇幅,这里独有给出流程图(假定事先将所需汉字写到了八个文件文件卡塔 尔(英语:State of Qatar),如图1所示。

 

前边聊起四此中华夏族民共和国字占七个字节,这两当中前叁个字节为该汉字的区号,后一个字节为该字的
位号。个中,各样区记录九十二个汉字,位号为该字在该区中的地点。所以要找到“作者”在hzk16库中之处就务须拿到它的区码和位码。(为了分化使用了区码
和区号,其实是叁个事物,别被小编错误的指导了卡塔 尔(英语:State of Qatar)

将整个汉字字库贮存在EPROM或E2PROM内,程序依据要展现汉字的机内码来调用汉字字模。

 

一点高级单片机,如Samsung的M68300连串叁拾个人单片机,寻址范围可达8M,液晶呈现常用的16×16汉字库二进制数据文件为七百多k,将汉字字仓库储存入大体量的E2PROM,通过地点线可寻址到汉字库中的每一个中中原人民共和国字。

区码:区号(汉字的率先个字节卡塔尔国-0xa0   
(因为汉字编码是从0xa0区开首的,所以文件最前头便是从0xa0区初步,要算出相对区码)

在微处理器中对汉字的识别是由此机内码来实现的,汉字规范机内码为两字节代码。汉字在汉字库中是安分守己区位来排列的,每后生可畏区中有九十多个汉字,种种汉字都对应唯生机勃勃的区号和在本区的位号,汉字输入法中就有区位码方法,实际上,汉字机内码和区位码有正式的应和关系,某些汉字在字库中的区号加上0xa0等于其机内码的高字节,位号加上0xa0等于其机内码的低字节,因而超轻易通进程序总括出要出示的汉字在汉字库中的区位号,即获得了其在汉字库中的偏移地址。

位码:位号(汉字的第二个字节卡塔尔国-0xa0

由于E2PROM中积累了整套汉字库,只须在硬件上设定寄存汉字库的存款和储蓄器片选地址,直接将汉字作为字符数组付给汉字展现函数,通过机内码总结出区号和位号,就可以方便地对汉字字模实行调用了。与前三种艺术相比较,无须事先提取字模和设定其地址用于程序调用,因而在拓宽程序升级,涉及到汉字展现时,不用改过汉字字模数据。

这么我们就能够获得汉字在HZK16中的相对偏移地点:

                                  汉字的字样与体现–汉字的代码种类
目 录
  1.1 汉字机内码
  1.2 汉字地址码
  1.3 汉字沟通码
  1.4 汉字字型码

offset=(94*(区码-1)+(位码-1))*32


 

  在汉字音讯管理系统中存在着冒尖汉字编码。日常的话,在系统的不如部位,可凭仗其情形给汉字定以相应的编码,因为在汉字消息处理系统中存在着数种汉字编码。这一个编码构成了一个汉字的代码体系。

解说:1、区码减1是因为数组是以0为开始而区号位号是以1为发端的

1.1、汉字机内码
  汉字机内码(亦称汉字内码卡塔尔是系统里头管理和储存汉字而使用的代码。扬名四海,西方文字字符的机内码多应用叁个字节来表示的ASCII码,有的系统则运用EBCDIC码。日常只使用7位来表示126个字符,而把高位用作奇偶校验(大概不用卡塔尔国。本国的国家标准GB2312-80分明,叁个汉字用八个字节表示,近些日子明确每一种字节也只用三个人,其高位未作定义。
  为了保障系统的中西文宽容,意味着系统的机内码中必须保障ASCII(IBM-PC选拔该码作为西方文字字符的机内码卡塔 尔(英语:State of Qatar)的采用,同期又要允许汉字机内码的使用,何况使两个之间未有冲突。借使用GB2312-80中的国标码作为机内码,则在系统中并且存在ASCII码和国家标准码时,将会发出二义性。例如,机内有几个字节的内容分别为30H和21H,它们不仅能够象征汉字“啊”的国家标准码,又有什么不可代表字符“0”和“!”的ASCII码。所以,从头到尾地利用国家规范码作为汉字机内码是极其的,一定要加以合适的转换。
  日常景况下是将国家标准码的种种字节的高级职分位成1,作为汉字机内码,这种编码称作为变形国家规范码。那样作既缓慢解决了西方文字机内码与汉字机内码的二义性,又确认保证汉字机内码与国家标准码之间有极简单的对应关系。其团伙如下:

     2、(94*(区号-1)+位号-1)是三个中国字字模占用的字节数

内码 ch1 ch2
   不 不
1字节 1字节

   3、最终乘以32是因为汉字库文应从该职责起的32字节消息记录该字的字样新闻(前边提到六当中华夏儿女民共和国字要有31个字节显示卡塔尔国

  依照CGB2312-80中的汉字、图形符号,依照其岗位分为91个“区”,每种区包括玖拾贰个汉字,每一种汉字字符又称之为“位”。此中“区”的序号,由01到94,“位”的序号,也是从01到94。若以横向表示“位”号,纵向表示“区”号,则“区”和“位”构成叁个二维坐标。给定多少个“区”值和“位”值就能够分明三个唯大器晚成的方块字或图形符号。所以4位数字就能够唯黄金年代明显三个中夏族民共和国字或标识,上面给出汉字的区内和内码对应关系表。

 

区位码(10进制) 内码(16进制)
区号 位号 高字节 低字节
1—9 1—94 A1—A9 A1—FE
10—12 1—94 AA—AC A1—FE
13—15 1—94 AD—AF A1—FE
16—87 1—94 B0—F7 A1—FE

 1 void lcd_put_chinese(int x, int y, unsigned char *str)
 2 {
 3     unsigned int area = str[0] - 0xa1;
 4     unsigned int where = str[1] - 0xa1;
 5     unsigned char *dots = hzk_mem + (area * 94 + where) * 32;
 6     unsigned char byte;
 7     int i,j,b;
 8 
 9     for(i=0; i < 16; i++)
10         for(j=0; j < 2; j++)
11         {
12             byte = dots[i*2 + j];
13             for(b=7; b >=0; b--)
14             {
15                 if(byte & (1<<b))
16                 {
17                     /* 显示 */
18                     lcd_put_pixel(x + j * 8 + 7 - b, y + i, 0xffffff);//白
19                 }
20                 else
21                 {
22                             /* 不显示 */
23                     lcd_put_pixel(x + j * 8 + 7 - b, y + i, 0);//黑
24                 
25                 }
26             }
27         }
28 
29 }

1.2、汉字地址码
  汉字地址码是指汉字字模库(这里首要指整字形的点阵字模库卡塔尔国中寄存各汉字字形消息的逻辑地址码。中国语言军事学系统中的汉字字模库有二种,它们各自存放在RAM(或EPROM卡塔 尔(英语:State of Qatar)八月磁盘上。故中国语言教育学系统中的汉字地址码有两种,黄金年代种选用内部存款和储蓄器地址数来代表(对应RAM和EPROM中的字库卡塔 尔(阿拉伯语:قطر‎,此外生机勃勃种选择盘地址来表示(对应于磁盘中的字库卡塔尔国。由于中国语言管医学系统的汉字字模库中汉字字形音信排列的家有家规,使得中国语言军事学系统的汉字字模库中的汉字字形信息排列种类的法规,使得中国语言管历史学系统的汉字地址码与汉字机内码之间存在着贰个简单易行的函数关系。

 

1.3、汉字沟通码
  汉字调换码是后生可畏种用于汉字音讯管理系统之间,也许与广播发表系统里头开展音信调换的汉字代码。汉字交流码位于后生可畏台机械的言语和另后生可畏台机器(包涵输出设备与记录设备卡塔 尔(阿拉伯语:قطر‎的进口之间。为了要到达系统器材之间或记录媒介物之间音讯置换的指标,汉字调换码必得接纳统后生可畏的花样。近日境内Computer种类所运用的科班新闻管理交流码,是根据国标拟定的,即GB一九八六—
《新闻处理沟通使用的八人编码字符集》;还制定了对应的代码扩张标准,即GB2311

《音信管理调换使用的三个人编码字符集的扩展方法》。因为汉字调换码应与GB一九九〇宽容,并依照GB2311所规定的点子开展编写制定。由于汉字数量远远高于多个人编码所能表示的两千多个常用汉字制订了交流码的国标,即GB2312

《音信置换用汉字编码字符基本集》,此中各个汉字用对应于GB1988的四个陆位码来代表。

 

1.4、汉字字型码
  由于当下汉字消息管理系统中生出汉字字形的艺术多数是数字式的,即以点阵的不二等秘书诀产生汉字,过汉字字形码是指鲜明叁个汉字字形码也就不一样。

对像素举办瞄颜色

                                                      汉字库的施用 

 

UCDOS软件中的文件HZK16为16×16的国家标准汉字点阵文件,以二进制格式存款和储蓄。在文件HZK16中,按汉字区位码从小到大依次存有国家规范区位码表中的有着汉字,每种汉字占用31个字节,每一个区为玖拾贰个汉字。

 1 void lcd_put_pixel(int x, int y, unsigned int color)
 2 {
 3     unsigned char *pen_8 = fb_mem + y * line_width + x * pixel_width;     //当前像素对应内存位置
 4     unsigned short *pen_16;
 5     unsigned int *pen_32;
 6 
 7     unsigned int red, blue, green;
 8     
 9     pen_16 = (unsigned short *)pen_8;
10     pen_32 = (unsigned int *)pen_8;
11     
12     switch(var.bits_per_pixel)
13     {
14         case 8:
15         {
16             *pen_8 = color;            //对应调色板颜色
17             
18             break;
19         }
20         case 16:
21         {
22             /* 5*6*5 */
23             red   = (color >> 16) & 0xff;
24             green = (color >> 8) & 0xff;
25             blue  = (color >> 0) & 0xff;
26 
27             color = ((red >> 3 ) << 11) | ((green >> 2) << 5) | ( blue >> 3);
28             
29             /* 颜色数据为高位 */
30             *pen_16 = color;
31             
32             break;
33         }
34         case 32:
35         {
36             *pen_32 = color;
37             break;
38         }
39         
40     }
41 
42 }

在PC机的文件文件中,汉字是以机内码的样式储存的,每一种汉字占用八个字节:第四个字节为区码,为了与ASCII码差异,范围从十二进制的0A1H从头(小于80H的为ASCII码字符卡塔尔国,对应区位码中区码的第大器晚成区;第一个字节为位码,范围也是从0A1H最初,对应某区中的第多个位码。那样,将汉字机内码减去0A0AH就得该汉字的区位码。

 

比如汉字“房”的机内码为十四进制的“B7BF”,个中“B7”表示区码,“BF”表示位码。所以“房”的区位码为0B7BFH-0A0A0H=171FH。将区码和位码分别调换为十进制得汉字“房”的区位码为“2331”,即“房”的点阵位于第23区的第32个字的地点,约等于在文件HZK16中之处为第32×[(23-1)
×94+(31-1)]=67136B现在的三拾三个字节为“房”的显示点阵。

    lcd_put_ascii(var.xres / 2, var.yres / 2, 'a');
    printf("中: chinese code: %02x %02xn", str[0], str[1]);
    lcd_put_chinese(var.xres / 2 + 32, var.yres / 2, str);

下边给出二个依照汉字机内码(两字节卡塔尔在汉字库中搜索汉字的字样的顺序。字库文件分成四有的,分别设有四片27512(并行EPROM)中。读出的字样存入hz_buffer[32]数组中。

 

int8
hz_buffer[32];//定义32字节数组,用于存款和储蓄点阵字模,该字模为横排字模。

荧屏输出‘a’,“中”

#define int8 unsigned char

 

#define int16 unsigned int

#define int32 unsigned long

/*

函数void read_hz(int16
hz)的参数hz为两字节的机内码,调用方法:read_hz(‘汉’);

对ASCII字符,则read_hz(‘A’+0xa380);读取

*/

void   read_hz(int16 hz){

void   *void_p;//定义三个空类型指针

int8   *int8_p;//定义叁个unsigned char 指针

int8    i;   //定义三个循环变量

int16 area_l,area_h;//定义两个整型变量,用于存款和储蓄区码和位码

int32 pos;  //定义一个long型变量,用于存款和储蓄计算机手艺研商所得字模在字库的职责,

int8   chip;  //字模所在的微电路,可用74HC138等等的微电路译码。

int16 addr;  //在某意气风发集成电路64K字节空间内的地点

   

void_p=&hz;    //空指针指向机内码的低字节

int8_p=void_p;    //char类型指针指向空指针,即机内码的低字节

area_l=*int8_p-0xa0; //机内码低字节能减少排放去0xa0获得区码

area_h=*(int8_p+1)-0xa0; //机内码高字节能减少排放去0xa0获得位码

pos=32*((int32)((area_h-1)*94)+area_l-1);
//计算在二个安然无恙的字库中的地点(256K)

//pos=116672;        
//那是“请”字在HZK16文书中之处,单位为字节。用于测量检验

if(pos<64*1024)   //在率先片27512微芯片

    {

       chip=0;addr=(int16)pos;

    }

else if((pos>=64*1024)&&(pos<128*1024)) //在第二片27512芯片

    {

       chip=1;

       addr=(int16)pos;  

    }

else if((pos>=128*1024)&&(pos<192*1024)) //在第三片27512集成电路

    {

       chip=2;

       addr=(int16)pos;

    }   

else if((pos>=192*1024)&&(pos<256*1024)) //在第四片27512微芯片

    {

       chip=3;

       addr=(int16)pos;         

    }

select_chip(chip);   //选择第chip片27512芯片

for(i=0;i<32;i++)

    {

      hz_buffer[i]=read_data(addr+i); //读取一字节的数目

    }

}

   
 在实际上中,由于现少之甚少使用EPROM微芯片,能够用并口、SPI,I2C接口的大容积Flash、EEPROM微芯片。但I2C接口速度很慢,突显汉字的进程将会相当慢,能够在局地超少字地方使用;而SPI接口的存款和储蓄晶片速度非常的慢,接口轻巧,对于平日的运用途合还能够满意的;对于大气施用的场馆,能够应用并行接口,它具积存空间大,读取速度快的特点,如利用AT29层层的Flash存储器,单片容积能够高达256K上述,就不须求分开积存,但其索要相当多的IO口,接口复杂。所以应基于实际来采撷存款和储蓄器。

 

相关文章