找回密码
 立即注册
楼主: 神***

向【64位超算中心】前进 ! DPU32@全新32位8051+DSP指令

[复制链接]
  • TA的每日心情
    奋斗
    昨天 07:54
  • 签到天数: 75 天

    [LV.6]常住居民II

    3

    主题

    662

    回帖

    1028

    积分

    金牌会员

    积分
    1028
    发表于 2024-3-12 00:12:25 | 显示全部楼层
    64位
    回复 送花

    使用道具 举报

  • TA的每日心情
    开心
    4 小时前
  • 签到天数: 158 天

    [LV.7]常住居民III

    0

    主题

    407

    回帖

    494

    积分

    中级会员

    积分
    494
    发表于 2024-3-12 02:08:20 | 显示全部楼层
    靡不有初,鲜克有终
    回复 送花

    使用道具 举报

  • TA的每日心情
    开心
    昨天 00:57
  • 签到天数: 148 天

    [LV.7]常住居民III

    39

    主题

    889

    回帖

    4154

    积分

    荣誉版主

    积分
    4154
    发表于 2024-3-12 11:30:36 | 显示全部楼层
    目前的 STC8系列内核, 老姚计划生产增加型 STC8+内核, 具体实施方案是外挂各种数学运算模块, 以提升具体的数学运算速度, 达到超算能力。

    但由于 51指令集的先天不足(一次8位数据读写, 单寻址指针, 没有偏移量寻址, 堆栈指针只有8位, 等等), 使能数据的吞吐能力严重不足,
    严重拖慢整体运行速度, 难以实现超算能力。

    因此, 建议老姚生产一款 STC8++内核的单片机(是核心指令集 是 251 的 SOURCE模式), 这样, Keil C51完全支持这款 STC8++内核的单片机,
    并且支持 C251的标准库函数(改写,重编译后即可), 以 8位机的性能, 升维打败 世上 100%的 8位单片机, 想想就 NB 。   
    可 100%兼容 支持 STC32的各种数学运算模块, 简化 STC32的数学运算模块设计, 以老姚最新设计的 DPU32 模块为例, 可以取消一大半指令,
    所有 16位指令都可取消, 部分简单的 32指令指令也同时可取消, 因为 251本身的指令集, 综合运算速度更快, 应用范围更广(全地址范围),
    而 DPU32应用范围则局限于 EAX-EDX。
    同时, 在不增加模块面积的情况下, 建议 DPU32 增加一部分 64位指令, 组成 DPU32+ 或 DPU64, 进一步提升超算能力
    另外, 如仅在 C251构架下运行, 建议取消 ECX,EDX 专用寄存器, 改为 堆栈指针+偏移量 方式读写, ECX 对应 @SP-4 , EDX 对应 @SP-8 ,
    可进一步和 C251匹配, 简化结构, 简化参数传递, 适应 OS系统, 进一步提升运算速度, 提升超算能力


    回复 支持 反对 送花

    使用道具 举报

    该用户从未签到

    552

    主题

    9532

    回帖

    1万

    积分

    管理员

    积分
    14106
     楼主| 发表于 2024-3-12 11:44:06 | 显示全部楼层
    想想即将上线上产的      STC8051H, 管脚兼容
    天王级的 51单片机,    STC89C52RC / STC12C5A60S2 :
    你说他是  8位的他就是  8位的,烧录时选择  STC8051H-8Bit;
    你说他是32位的他就是32位的,烧录时选择  STC8051H-32Bit;

    截图202403121142134836.jpg
    STC8051H-108MHz-LQFP48/44,PDIP40,研发会议进展,2024/3/7 - 老梁亲测 STC33-ARM 内部平台系列讲座 - 国芯论坛-STC全球32位8051爱好者互助交流社区 - STC全球32位8051爱好者互助交流社区 (stcaimcu.com)

    双核心设计:
    你用 SDCC/IAR C++/KEIL C51 他 就是 8位机
    你用 KEIL C251 他 就是 32位机




    点评

    请问老姚: 双核心设计: 你用 SDCC/IAR C++/KEIL C51 他 就是 8位机 ============================================== 8位机模式下, 机器码(HEX) 执行, 是否支持 前缀 A5 起头的 251源码格式指令? 如是, 就 1  详情 回复 发表于 2024-3-12 12:41
    1 喜欢他/她就送朵鲜花吧,赠人玫瑰,手有余香!
    • +1

      楼主威武~

    回复 支持 反对 送花

    使用道具 举报

    该用户从未签到

    552

    主题

    9532

    回帖

    1万

    积分

    管理员

    积分
    14106
     楼主| 发表于 2024-3-12 11:49:00 | 显示全部楼层
    话说 RISC-V 64Bit 的 CPU, 送个 64位立即数,要分多次啊

    话说 M3/M0 32Bit 的 CPU, 送个 32位立即数,要分多次啊

    回复 支持 反对 送花

    使用道具 举报

  • TA的每日心情
    开心
    昨天 00:57
  • 签到天数: 148 天

    [LV.7]常住居民III

    39

    主题

    889

    回帖

    4154

    积分

    荣誉版主

    积分
    4154
    发表于 2024-3-12 12:30:21 | 显示全部楼层
    假如老姚计划生产增加型 STC8++内核的单片机(核心指令集 是 251 的 SOURCE模式),
    这样, DPU32 原考虑支持 51的指令, 可全部取消.

    以 251为例, 调用 LCALL(3时钟周期) 和 RET(3时钟周期) 汇编编写的 DPU32指令,

    需增加 6个时钟周期, 还未加入 DPU32 指令执行所需的时钟周期.

    251指令 执行 32位 交换, 3个时钟周期.
    251指令 执行 32位 加法  1个时钟周期.
    251指令 执行 32位 减法, 1个时钟周期.
    251指令 执行 32位 清0,  1个时钟周期.
    251指令 执行 32位 置-1, 1个时钟周期.
    251指令 执行 32位 加1,  1个时钟周期.
    251指令 执行 32位 加2,  1个时钟周期.
    251指令 执行 32位 加4,  1个时钟周期.
    251指令 执行 32位 减1,  1个时钟周期.
    251指令 执行 32位 减2,  1个时钟周期.
    251指令 执行 32位 减4,  1个时钟周期.
    251指令 执行 32位 求反, 2个时钟周期.
    251指令 执行 32位 求补, 2个时钟周期.
    251指令 执行 32位 与,   2个时钟周期.
    251指令 执行 32位 或,   2个时钟周期.
    251指令 执行 32位 异或, 2个时钟周期.
    ......

    下列组合运算:
    16 位乘除运算(MMD16_ABX), DPU32 执行 21+6 =27个时钟周期,  
      而 251指令 模拟组合执行时间, 仅 11个时钟周期.         {BX2, BX}=AX*BX/CX
    16 位线性标定(LTC16_BX) , DPU32 执行 22+6 =28个时钟周期,  
      而 251指令 模拟组合执行时间, 仅 12个时钟周期.         {BX2, BX}=(BX-AX)*DX/CX
    32 位乘加运算(MA32_ECX) , DPU32 执行 5+6 =11个时钟周期,
      而 251指令 模拟组合执行时间, 仅 2个时钟周期.         ECX = ECX+AX*BX

    综合上面统计结果, 可知, 是大幅度提速, 进一步提升超算能力。。



    1 喜欢他/她就送朵鲜花吧,赠人玫瑰,手有余香!
    回复 支持 反对 送花

    使用道具 举报

  • TA的每日心情
    开心
    昨天 00:57
  • 签到天数: 148 天

    [LV.7]常住居民III

    39

    主题

    889

    回帖

    4154

    积分

    荣誉版主

    积分
    4154
    发表于 2024-3-12 12:41:30 | 显示全部楼层
    本帖最后由 LAOXU 于 2024-3-12 12:43 编辑
    神农鼎 发表于 2024-3-12 11:44
    想想即将上线上产的      STC8051H, 管脚兼容
    天王级的 51单片机,    STC89C52RC / STC12C5A60S2 :
    你说 ...

    双核心设计:
    你用 SDCC/IAR C++/KEIL C51 他 就是 8位机

    ==============================================

    请问老姚:

    8位机模式下,  机器码(HEX) 执行, 是否支持 前缀 A5 起头的 251源码格式指令?

    如是, 就 100% 完美了

    点评

    支持,都 TFPU32 为主,CPU为辅了,这点大度的奢华格局还是要有的 ===主要是很多老师不愿意去为学生的上百台电脑,装 新的编译器  详情 回复 发表于 2024-3-12 12:46
    回复 支持 反对 送花

    使用道具 举报

    该用户从未签到

    552

    主题

    9532

    回帖

    1万

    积分

    管理员

    积分
    14106
     楼主| 发表于 2024-3-12 12:46:52 | 显示全部楼层
    LAOXU 发表于 2024-3-12 12:41
    双核心设计:
    你用 SDCC/IAR C++/KEIL C51 他 就是 8位机

    支持,都 TFPU32 为主CPU为辅了,这点大度的奢华格局还是要有的
    ===主要是很多老师不愿意去为学生的上百台电脑,装 新的编译器

    点评

    8051H 使用 C251 , 是仅支持 SOURCE模式, 还是支持 双模( BINARY模式 和 SOURCE模式)? 略为详细一点的说明书有吗? 如有请发一份, 尝个鲜.  详情 回复 发表于 2024-3-12 14:00
    回复 支持 反对 送花

    使用道具 举报

  • TA的每日心情
    开心
    昨天 00:57
  • 签到天数: 148 天

    [LV.7]常住居民III

    39

    主题

    889

    回帖

    4154

    积分

    荣誉版主

    积分
    4154
    发表于 2024-3-12 14:00:51 | 显示全部楼层
    神农鼎 发表于 2024-3-12 12:46
    支持,都 TFPU32 为主,CPU为辅了,这点大度的奢华格局还是要有的
    ===主要是很多老师不愿意去为学生的上 ...

    8051H 使用 C251 ,  是仅支持 SOURCE模式, 还是支持 双模( BINARY模式 和 SOURCE模式)?

    略为详细一点的说明书有吗? 如有请发一份, 尝个鲜.
    回复 支持 反对 送花

    使用道具 举报

    该用户从未签到

    552

    主题

    9532

    回帖

    1万

    积分

    管理员

    积分
    14106
     楼主| 发表于 2024-3-12 14:05:47 | 显示全部楼层
    等芯片出来再整理了,最近内部太忙了,
    在忙 车规 AEC-Q100 Grade1(-40 ~ 125度)


    截图202403121404099023.jpg


    截图202403121404454941.jpg

    截图202403121405185621.jpg

    深圳国芯人工智能有限公司-产品_STC32系列 (stcai.com)


    回复 支持 反对 送花

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|手机版|深圳国芯人工智能有限公司 ( 粤ICP备2022108929号-2 )

    GMT+8, 2024-5-20 05:23 , Processed in 0.073003 second(s), 68 queries .

    Powered by Discuz! X3.5

    © 2001-2024 Discuz! Team.

    快速回复 返回顶部 返回列表