如何用C程序实现将GB2312的6763个汉字按输出到一个文本文件

引文:http://bbs.chinaunix.net/thread-1293425-1-4.html

某人的写法,GBK方式,两个字节一个汉字:


    int i = 32768;
    for (; i < 65536; i ++)
    {
        if (i % 256 < 0x20)
            printf("  ");
        else
        {
            printf("%c%c", i / 256, i % 256);
            if (i % 32 == 31) printf("\n");
        }
    }


汉字的范围肯定小于等于65535,我们可以将所有从0x20(空格)之后到65535的字符直接循环全部打印出来,这里做了一次UTF8转换:

char.tar.bz2

Categories

| | 评论(0)

发表评论

May 2010

            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31          

关于此日记

此日记由 Cnangel 发表于 October 21, 2008 2:48 PM

此Blog上的上一篇日记利用unordered_map代替hash_map

此Blog上的下一篇日记程序员经常犯的一个错误:数组越界

首页归档页可以看到最新的日记和所有日记。

归档

Powered by Movable Type 5.02