TA的每日心情 | 开心 昨天 00:57 |
---|
签到天数: 148 天 [LV.7]常住居民III
荣誉版主
- 积分
- 4154
|
发表于 2024-3-14 07:02:19
|
显示全部楼层
因此, 解决方案一, 建议如下:
1. 努力缩短现有 CPU构架, LCALL指令 和 RET指令 执行周期.
2. 努力做到 DPU32 和 CPU 的标志位同步更新。
3. 努力提升 DPU32 组合微指令的执行周期(否则再多的 DSP指令, 都没用, 提升不了速度和算力)。
4. 尽量补齐 32位基本运算, 包括 32位加法、32位减法、32位x32位=64位乘法、64位/32位=64位(或32位)除法、32位移位等。
尽可能利用现有的 DPU32 输入/输出标志位, 能用最少的代码, 最轻松的级联方法,扩展到 64位或更高位。
5. 数据(参数)传递, ECX,EDX 坚决不能放在 DATA 08H-0FH中, 而要放在 DR8,DR12中, 如能技术解决, 放在堆栈中更好, 以减少Keil数据(参数)传送代码)。
上述 1,2,3 条, 短时间难以实现, 老姚努力加油!
上述 4,5 条, 只要老姚想做, 就能实现!
至余 DPU32 和 M4的DSP 如何比,如何超越 M4的DSP ?
目前的 STC32+DPU32 组合方案, 就整数运算而言, 难于超越M3(因为那些基本指令执行周期很容易推算), 更别提超越 M4的DSP 了。
|
1
喜欢他/她就送朵鲜花吧,赠人玫瑰,手有余香!
-
+2
楼主威武~
|