空间换时间,查表法的经典例子
前言
我们怎么衡量一个函数/代码块/算法的优劣呢?这需要从多个角度看待。本篇笔记我们先不考虑代码可读性、规范性、可移植性那些角度。
在我们嵌入式中,我们需要根据实际资源的情况来设计我们的代码。
比如当我们能用的存储器空间极其有限的情况,我之前就有遇到这样子的情况,我能用的flash空间只有4KB,但是要实现的功能很多,稍微不注意就超了,这种情况下我们就得多考虑程序占用方面的问题。
如果我们的存储器空间很足,有时候可以牺牲一些存储器空间来换取我们程序的运行速度。查表法就是以空间换取时间
的典型例子。下面看一个经典的例子:
基础例子
编写程序统计一个4bit数据(0x0~0x0F)中1的个数。这里提供两种方法:
1、方法一:常规法
常规法就是依次判断这个4bit的数据的每一位是否为1,并用一个计数变量把1的个数记录下来:
左右滑动查看全部代码>>>
#include <stdio.h>
/* 测试结果 */
struct test_res
{
unsigned int data; /* 数据 */
unsigned int count; /* 数据中1的个数 */
};
struct test_res get_test_res(unsigned int data)
{
/* 保存测试结果 */
struct test_res res;
/* 保证数据总会在0~0xf之间 */
unsigned int temp = data & 0xf;
res.count = 0;
res.data = temp;
/* 循环判断每一位 */
for (int i = 0; i < 4; i++)
{
if (temp & 0x01)
{
res.count++;
}
temp >>= 1;
}
return res;
}
int main(void)
{
struct test_res res = {0};
for (int i = 0; i < 32; i++)
{
res = get_test_res(i);
printf("%2d中二进制位为1的个数有%d\n", res.data, res.count);
}
return 0;
}
运行结果:
unsigned int temp = data & 0xf;
语句就是为了保证数据都是在0x0~0xf之间,即0~15为一个周期,如果输入的数据为16,则当做0来看待,输入的数据为17,则当做1来看待……
2、方法二:查表法
这个例子也可以用查表法来做,把0x0~0xF中的所有数据中每个数据的1的个数都记录下来,存放到一个表中。
这样一来,数据
与数据中1的个数
就建立起了一一对应关系,我们就可以通过数组索引来获取我们想要的结果:
左右滑动查看全部代码>>>
int table[16] = {0, 1, 1, 2, 1, 2, 2, 3, 1, 2, 2, 3, 2, 3, 3, 4};
struct test_res get_test_res(unsigned int data)
{
/* 保存测试结果 */
struct test_res res;
/* 保证数据总会在0~0xf之间 */
unsigned int temp = data & 0xf;
/* 获取结果 */
res.data = temp;
res.count = table[temp];
return res;
}
常规法使用for循环的方式来实现,缺点是占用了不少处理器的时间;查表法的优点弥补了常规法的不足,但是额外占用了一些静态空间。
这里针对这个应用而言处理的数据还是比较简单的,数据范围只是0x0~0xF之间,所以这两种方式可能也都差不多。
那如果以上题目稍微改一下:编写程序统计一个8bit、16bit数据中1的个数。查表法换取的时间就比较明显了。
延伸例子
下面我们先来看一下编写程序统计一个8bit(0x0~0xFF)数据中1的个数
的情况。
1、常规法
把以上代码稍微改一下就可以:
左右滑动查看全部代码>>>
struct test_res get_test_res(unsigned int data)
{
/* 保存测试结果 */
struct test_res res;
/* 保证数据总会在0~0xf之间 */
unsigned int temp = data & 0xff;
res.count = 0;
res.data = temp;
/* 循环判断每一位 */
for (int i = 0; i < 16; i++)
{
if (temp & 0x01)
{
res.count++;
}
temp >>= 1;
}
return res;
}
运行结果:
2、查表法
上面的数据范围仅仅是0x0~0xF
,数据量比较少,建立数据表也比较容易。
这里的数据量范围变成了0x0~0xFF
,比原来多了两百多个数据,这也还可以接受,也还可以全都列出来。
但是针对这里的这个问题有更好的方法:
在这个问题中,8bit的数据可以看做两个4bit数据,这样就可以共用上面4bit数据的数据表。所以我们只要把2个4bit数据的1的个数相加,就是最后的结果。
获取8bit数据1的个数:
左右滑动查看全部代码>>>
struct test_res get_test_res(unsigned int data)
{
/* 保存测试结果 */
struct test_res res;
/* 保证数据总会在0~0xf之间 */
unsigned int temp = data & 0xff;
/* 获取低4位中1的个数 */
unsigned int low_data = temp & 0xf;
unsigned int low_cnt = table[low_data];
/* 获取高4位中1的个数 */
unsigned int high_data = (temp >> 4) & 0xf;
unsigned int high_cnt = table[high_data];
/* 结果 */
res.count = low_cnt + high_cnt;
res.data = temp;
return res;
}
同样的,获取16bit数据也是类似的,把16bit数据当做4个4bit数据。
针对以上这个查表法的例子我们可以总结出:
1、数据表的确定要合适。像上面8bit的情况再重新创建一个数据表把表元素列出来也还可以接受。但是如果是16bit这样子大数据的情况,建立这么大的数据表也不太现实。所以需要考虑如何建立一个合适的数据表。
2、需要权衡空间换取时间是否值得。像16bit这样子大数据的情况,全部列出来的话会大幅度的增加我们的存储开销,这种以空间换时间的情况可能会得不偿失。