找回密码
 立即注册
楼主: 神***

讨论稿,向【64位超算中心】前进 ! DSP/DPU351 + TFPU, DPU32@全新32位8051

[复制链接]

该用户从未签到

552

主题

9492

回帖

1万

积分

管理员

积分
14057
 楼主| 发表于 2024-4-9 10:46:09 | 显示全部楼层
STC8051H 丝印设计中
管脚兼容天王级别的: STC89C52RC, STC12C5A60S2
4/2 已启动 流片进程,2024/6/1儿童节回来 庆贺 51 新生


TFPU32@STC32
TFPU@108MHz, CPU32@43MHz
以【硬件三角函数/反三角函数运算器,硬件浮点运算器】为主的
【新型控制器,处理器】的命名 思考

T: 硬件三角函数/反三角函数运算器
F: 硬件浮点运算器

=====================================

产品 丝印, LQFP48, LQFP44, PDIP40
TFPU@108M       ==>特色,第一行
STC8051H
           ==>主系列,第二行
34K64-QFP48
     ==>RAM容量,FLASH容量,封装,第三行
yywwxxxx.A
       ==>封装时间,版本号,第四行
商品名称:STC8051H-34K64-QFP48

TFPU@108M       ==>特色,第一行
STC8051H
           ==>主系列,第二行
34K64-QFP44
     ==>RAM容量,FLASH容量,封装,第三行
yywwxxxx.A
       ==>封装时间,版本号,第四行
商品名称:STC8051H-34K64-QFP44


TFPU@108M       STC8051H            ==>特色,第一行;主系列,第
                            34K64-PDIP40
     ==>RAM容量,FLASH容量,封装,第二行
                            yywwxxxx.A
         ==>封装时间,版本号,第
商品名称:STC8051H-34K64-PDIP40

www.stcai.com/cp_stc8051hxl

STC8051H-34K64-LQFP48/44, PDIP40
TFPU@108MHz, TFPU 是主力运算单元
TFPU, 三角函数/浮点运算器可以到 108MHz;
PWM@135MHz

PWM支持硬件移相 !

双核心设计:
你用 SDCC/IAR C++/KEIL C51 他就是 8位机
你用 KEIL C251 他就是 32位机

回复 支持 反对 送花

使用道具 举报

  • TA的每日心情
    开心
    昨天 19:56
  • 签到天数: 171 天

    [LV.7]常住居民III

    17

    主题

    371

    回帖

    1359

    积分

    荣誉版主

    积分
    1359
    发表于 2024-4-9 18:58:34 | 显示全部楼层
    STC8051H的datasheet该更新啦。

    关注MDU32单元包含哪些功能、

    点评

    等儿童节更新,现在忙 STC32G96K256 [attachimg]40904[/attachimg]  详情 回复 发表于 2024-4-9 19:44
    回复 支持 反对 送花

    使用道具 举报

    该用户从未签到

    552

    主题

    9492

    回帖

    1万

    积分

    管理员

    积分
    14057
     楼主| 发表于 2024-4-9 19:44:55 | 显示全部楼层
    社区闲人 发表于 2024-4-9 18:58
    STC8051H的datasheet该更新啦。

    关注MDU32单元包含哪些功能、

    等儿童节更新,现在忙 STC32G96K256

    截图202404091944488534.jpg
    深圳国芯人工智能有限公司-产品_STC8H系列 (stcai.com)


    回复 支持 反对 送花

    使用道具 举报

  • TA的每日心情
    开心
    昨天 03:47
  • 签到天数: 146 天

    [LV.7]常住居民III

    39

    主题

    887

    回帖

    4122

    积分

    荣誉版主

    积分
    4122
    发表于 2024-4-12 06:08:06 | 显示全部楼层
    杨为民 发表于 2024-4-6 12:45
    本来“这些汇编程序, 如老姚没合适人员, 我来帮你写,
    挺简单的, 不要一毛钱, 你只需要找人挑刺即可.”

    假如这个示范程序是网友编写的, 我给 100分.
    当然, 100分不是终点, 离真正的 “无缝连接” 还有一点的距离 !
    这个示范程序 在 c251  Large模式下能编译通过, 在 Huge模式下编译通不过.
    如能改成 随机切换 c251  Large模式 / Huge模式, 编译都能通过(通用). 我加 附加分 50分.
    如能改成 在 c251 /c51 编译环境下, 编译都能通过(通用). 我再加 附加分 50分.
    总分(满分)是 200分 !

    假如是我写出这么个程序, 以 满分 100分 计, 我对 这打分是 50分 ----- 不及格 !
    我喜欢 PK, 但仅仅是对我自已 PK, 今天的我努力 打赢 昨天的我. 就是胜利!
    至于偶然 和 网友 PK , 只是找点简易的容易实现的话题而已.
    至于复杂一点的, 想都不想(根本没想过有网友会接盘).
    比如被 XX 引出的话题, 搞个 OS.
    要求:
    1. 滴搭时钟超准(现证明目前的 OS, 滴搭都准确, 无需再努力).
    2. OS 可在最高优先级切换任务(目前的 OS 都在最低优先级或底层任务中切换).
        这个有实用价值 !
    3. 任意时刻关闭总中断 EA, 不影响 OS 的运行和任务切换 .
        我的思维方式, 对方的观点(未验证),先吸收, 然后不断地吸收新观点, 补充更正旧观点 .
        当然, 我在实际使用这个观点时, 会动手进行验证, 不用时, 仅仅不断地收集(总结)相关观点.
        比如: 有网友说, OS的滴搭时钟越走越慢, STC推出永不可关闭的定时器, 我得出定时器定时不准的结论(现证明是错的),
    很简单, 认错修正错误观点, 进而引出新的疑问, 当时 STC推出永不可关闭的定时器, 到底有什么用途(或者什么场合能用到) ?
        我唯一能想到的, 用于 OS系统, 任意时刻关闭总中断 EA, 不影响 OS 的运行和任务切换,
    至于有什么实有价值, 呵呵, 我也没想到, 仅仅是给 永不可关闭的定时器 的应用, 找个理由找条出路而已.

    点评

    滴搭时钟超准(现证明目前的 OS, 滴搭都准确, 无需再努力). 终于承认你是领着大家跟“风车”打架了。但愿你以后别在这样自以为是了。 顺便说一下,你在47楼首先提出的质疑“个人认为, DPU32 指令执行CPU停止工作(只  详情 回复 发表于 2024-4-12 07:32
    假如这个示范程序是网友编写的, 我给 100分. 当然, 100分不是终点, 离真正的 “无缝连接” 还有一点的距离 ! 这个示范程序 在 c251 Large模式下能编译通过, 在 Huge模式下编译通不过. 如能改成 随机切换 c251 Larg  详情 回复 发表于 2024-4-12 07:16
    假如是我写出这么个程序, 以 满分 100分 计, 我对 这打分是 50分 ----- 不及格 ! 我喜欢 PK, 但仅仅是对我自已 PK, 今天的我努力 打赢 昨天的我. 就是胜利! 哈哈,假如是你写的,可以得50分。 可实际上你写不出来  详情 回复 发表于 2024-4-12 07:12
    回复 支持 反对 送花

    使用道具 举报

  • TA的每日心情
    开心
    昨天 03:47
  • 签到天数: 146 天

    [LV.7]常住居民III

    39

    主题

    887

    回帖

    4122

    积分

    荣誉版主

    积分
    4122
    发表于 2024-4-12 06:14:05 | 显示全部楼层
    神农鼎 发表于 2024-4-6 16:23
    你烧录时选择型号来区分跑8位还是跑32位
    【STC8051H - 32Bit】,2K edata, 32K xdata
    【STC8051H - 8Bi ...

    烧录时选择型号,【STC8051H - 8Bit】,256 idata,  32K xdata
    没问题,

    但是, 假如在 C51条件下, 用汇编时, 不开放 【STC8051H - 32Bit】,2K edata, 32K xdata 相关功能,
    我没得玩, 只能打酱油路过~~~

    回复 支持 反对 送花

    使用道具 举报

  • TA的每日心情
    开心
    昨天 03:47
  • 签到天数: 146 天

    [LV.7]常住居民III

    39

    主题

    887

    回帖

    4122

    积分

    荣誉版主

    积分
    4122
    发表于 2024-4-12 06:32:47 | 显示全部楼层
    假如在 C51条件下,  对汇编 开放 【STC8051H - 32Bit】,2K edata, 32K xdata 相关功能,

    那么, STC8051H 的综合性能, 有本质的提升, 能运行 C251的相关各种函数库(改写后), 堆栈 指针 SP 升级到 16位,

    原STC 编写的 51库函数(不太受欢迎, 速度慢) 的现像可彻底改变, 运行速度可接近 C251库函数,

    还有各种复杂点的运算, 不依靠 DPU32, 仅依靠 251 源模式 指令集, 就能大大提升实际运算速度.

    彻底改进 51系的 片外 XRAM 寻址的 低效,  8位 SP 的短板.

    想想就兴奋, 打败世上所有 8位机.

    点评

    开放的,你能想到,就能做到  详情 回复 发表于 2024-4-12 07:23
    回复 支持 反对 送花

    使用道具 举报

    该用户从未签到

    63

    主题

    703

    回帖

    1万

    积分

    荣誉版主

    积分
    10906
    发表于 2024-4-12 07:12:57 | 显示全部楼层
    LAOXU 发表于 2024-4-12 06:08
    假如这个示范程序是网友编写的, 我给 100分.
    当然, 100分不是终点, 离真正的 “无缝连接” 还有一点的距 ...

    假如是我写出这么个程序, 以 满分 100分 计, 我对 这打分是 50分 ----- 不及格 !
    我喜欢 PK, 但仅仅是对我自已 PK, 今天的我努力 打赢 昨天的我. 就是胜利!


    哈哈,假如是你写的,可以得50分
    实际上你写不出来,你没有交你的卷子,你实际得的是0分!

    回复 支持 反对 送花

    使用道具 举报

    该用户从未签到

    63

    主题

    703

    回帖

    1万

    积分

    荣誉版主

    积分
    10906
    发表于 2024-4-12 07:16:39 | 显示全部楼层
    本帖最后由 杨为民 于 2024-4-12 07:18 编辑
    LAOXU 发表于 2024-4-12 06:08
    假如这个示范程序是网友编写的, 我给 100分.
    当然, 100分不是终点, 离真正的 “无缝连接” 还有一点的距 ...

    假如这个示范程序是网友编写的, 我给 100分.
    当然, 100分不是终点, 离真正的 “无缝连接” 还有一点的距离 !
    这个示范程序 在 c251  Large模式下能编译通过, 在 Huge模式下编译通不过.
    如能改成 随机切换 c251  Large模式 / Huge模式, 编译都能通过(通用). 我加 附加分 50分.
    如能改成 在 c251 /c51 编译环境下, 编译都能通过(通用). 我再加 附加分 50分.
    总分(满分)是 200分 !

    我得100分,我很高兴!
    但是从你提出这种“无缝连接” 的想法,曝露出你对C51/C25和A5/A25的语言规范的无知!

    回复 支持 反对 送花

    使用道具 举报

  • TA的每日心情
    开心
    昨天 03:47
  • 签到天数: 146 天

    [LV.7]常住居民III

    39

    主题

    887

    回帖

    4122

    积分

    荣誉版主

    积分
    4122
    发表于 2024-4-12 07:19:55 | 显示全部楼层
    tzz1983 发表于 2024-4-6 12:45
    执行 DSP/DPU351 + TFPU, DPU32  指令时, 为什么要停CPU时钟?   
    我想很多人还是不能理解.  可以继续讨论一 ...

    方法1的优点, 你总结了, 咱再不说了.
    至于缺点, 只要你想做, 就不存在什么互斥访问的(欢迎讨论补充, 让大家对硬件更加认识)
    顺便说一下, 本人早些年前, 熟读老外搞的用200多片TTL设计的CPU, 也设计过世上最烂的4位CPU(仅用14片TTL),
    也搞过多种用TTL设计8位机方案, 不要听 XX 胡言乱语(敬其70多岁, 老小孩了, 咱不和他一般见识).

    本人方案2:
    在 DPU32 中, 增加 EAX'/EBX'/ECX'/EDX' 映像寄存器(5级堆栈).
    C251 状态下 DPU32 执行动作:
    1. 读入 CPU 的 EAX/EBX/ECX/EDX 寄存器
    2. 执行 DPU32 动作
    3. 结果写入 DPU32  EAX'/EBX'/ECX'/EDX' 映像寄存器(压栈).
    4. 由 CPU 读入 最终结果(弹栈).

    C51 状态下 DPU32 执行动作:
    1. CPU 预装 ECX/EDX 内容到 ECX'/EDX' 映像寄存器(按需要执行).
    1. 读入 CPU 的 EAX/EBX 和 ECX'/EDX' 寄存器
    2. 执行 DPU32 动作
    3. 结果写入 DPU32  EAX'/EBX'/ECX'/EDX' 映像寄存器(压栈).
    4. 由 CPU 读入 最终结果(弹栈).
    由于输出都是暂存 DPU32  EAX'/EBX'/ECX'/EDX' 映像寄存器(堆栈)中. 不存在硬件重入问题.

    针对我的方案, 欢迎大家指出可能存在的缺点和错误, 欢迎拍砖!
    纯技术讨论, 至于老姚最终选啥方案, 那是老姚的事.

    ----------------------------------------------------------------------------

    方法4,  即在执行  DSP/DPU351 + TFPU, DPU32 指令时, 停掉CPU的时钟.
    就好像是CPU真的在运行一样的效果. 运算结束后通过DMA把结果放在指定的位置, 并设置好标志.
    此方法的优点很明显, 和真正的指令一样, 效率高, 随时可用, 没有互斥问题.
    缺点, 如果执行时间过长是会影响中断响应频率的,
        综合执行速度比 方法1 慢一些(不管努力提高新增指令速度还是主频),

    如果让我选, 我会选方法1, 在性能不降低的性况下, 速度优先.

    回复 支持 反对 送花

    使用道具 举报

    该用户从未签到

    552

    主题

    9492

    回帖

    1万

    积分

    管理员

    积分
    14057
     楼主| 发表于 2024-4-12 07:23:50 | 显示全部楼层
    LAOXU 发表于 2024-4-12 06:32
    假如在 C51条件下,  对汇编 开放 【STC8051H - 32Bit】,2K edata, 32K xdata 相关功能,

    那么, STC8051H  ...

    开放的,你能想到,就能做到
    1 喜欢他/她就送朵鲜花吧,赠人玫瑰,手有余香!
    • +1

      楼主威武~

    回复 支持 反对 送花

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|手机版|深圳国芯人工智能有限公司 ( 粤ICP备2022108929号-2 )

    GMT+8, 2024-5-18 03:12 , Processed in 0.078536 second(s), 73 queries .

    Powered by Discuz! X3.5

    © 2001-2024 Discuz! Team.

    快速回复 返回顶部 返回列表