DIY编程器网
标题:
基于XC166单片机的DSP优化方法
[打印本页]
作者:
liyf
时间:
2012-1-27 19:40
标题:
基于XC166单片机的DSP优化方法
引言
与专用数字信号处理器(DSP)相比,英飞凌的C166单片机的DSP性能相当差,为了提高C166单片机的DSP处理能力,英飞凌推出了新的16位单片机系列XC166,XC166系列单片机与C166单片机的最主要的区别在于,XC166中的CPU核加入了乘法-累加(MAC)单元,用于提高DSP的功能。MAC单元在XC166中是以一个算法处理单元出现的,类似于CPU中的算术逻辑(ALU)单元。这种结构的优点是可以保持XC166与C166的兼容性。
MAC单元有自己的寻址模式和指令集,MAC指令集是专为开发DSP程序而设计的。独立的寻址模式是为了保证MAS指令能在1个机器周期内完成对2个操作数的间接寻址。与XC166中的一般寻址模式不同,MAC寻址模式有2个地址指针(IDX0/IDX1)及2对地址偏移指针(QX0/QX1,QR0/QR1)用于对双操作数寻址。另外,
[table]
[tr]
[/td][/tr]
(2)汇编程序
在汇编程序中实现数据组处理有多种方法,比如数组操作,数组读入/写出等。
1、数组操作。数组操作是将多个不同的短操作数装入一个长位数的寄存器,然后进行运算操作。比如,1个16位的寄存器可以装入2个8位的来自A/D转换器的数据。下面举例说明数据组处理在汇编程序中的应用。
2、数组读入写出。这种方法是将多个短操作数合并为一个长操作数后进行读入/写出操作,如上面例子中的输入/输出部分。
1.2 数据存储器交织
数据存储器交织的目的是通过重新排列数据在存储器中的位置,以使得程序读写数据的时间最短,比如有2个8位的复数x和y,一般情况下,复数将按下列顺序存入内存:real(x),image(x),real(y),image(y)。但如果想使得读取复数的实部更容易,可以把数据重新排列如下:real(x),real(y),image(x),image(y),如图2所示。
1.3 循环展开
循环展开是一种非常传统的程序优化方法,可以用于所有程序优化中,循环展开的目的是通过重复循环中的程序,减少循环次数,从而减少循环判断指令的执行次数,以此来降低程序执行所需的机器周期,下面举一个例子来说明循环展开在XC164CS单片机中的应用。
1.4 指令流水线重排
[table]
[tr]
[/td][/tr]
第7级--写回。所有外部操作数以及剩余的,在内部DPRAM空间内的操作器被写回。定位在内部SRAM中的操作数进入写回缓冲区。
下面给出一个具体例子:
上面程序的指令流水线如表1所列,(Tn表示机器周期)
2.2 数据相关性排除
在XC166的CPU中,由于指令流水线的设计要求,在使用通用寄存器(GPRs)的指令之间存在一些数据相互依赖的情况,尽管XC166单片机已经使用了专用硬件来检测及解决数据相关性,但仍然有一些不可避免的数据相关性。在编程时,可以充分利用数据相关性来达到程序优化的目的,比如,在用GPR作为间接寻址指针时,如果PGR中的地址值被改变,间接寻址操作必须等待2个机器指令周期后,才能使用GPR作为地址指针寻址。在这种情况下,可以在这2个等待机器周期内插入2条其他单机器周期指令,充分利用这2个周期的等待时间以便程序更优化。
下面举一个例子:
[table]
[tr]
[/td][/tr]
欢迎光临 DIY编程器网 (http://diybcq.com/)
Powered by Discuz! X3.2