0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个简单的8位处理器完整设计过程及verilog代码

FPGA之家 来源:EETOP 作者:EETOP 2023-04-10 11:43 次阅读

一个简单的8位处理器完整设计过程及verilog代码,适合入门学习参考,并含有作者个人写的指令执行过程。

1. CPU定义

我们按照应用的需求来定义计算机,本文介绍一个非常简单的CPU的设计,它仅仅用来教学使用的。我们规定它可以存取的存储器为64byte,其中1byte=8bits。所以这个CPU就有6位的地址线A[5:0],和8位的数据线D[7:0]。

我们仅定义一个通用寄存器AC(8bits寄存器),它仅仅执行4条指令如下:

Instruction Instruction Code Operation
ADD 00AAAAAA AC<—AC+M[AAAAAA]
AND 01AAAAAA AC<—AC^M[AAAAAA]
JMP 10AAAAAA GOTO AAAAAA
INC 11XXXXXX AC<—AC+1

除了寄存器AC外,我们还需要以下几个寄存器:

地址寄存器A[5:0],保存6位地址。

程序计数器PC[5:0],保存下一条指令的地址。

数据寄存器D[7:0],接受指令和存储器来的数据。

指令寄存器IR[1:0],存储指令操作码。

2.取指设计

在处理器执行指令之前,必须从存储器取出指令。其中取指执行以下操作:

1〉通过地址端口A[5:0]从地址到存储器

2〉等待存储器准备好数据后,读入数据。

由于地址端口数据A[5:0]是从地址寄存器中读出的,所以取指第一个执行的状态是

Fetch1: AR<—PC

接下来cpu发出read信号,并把数据从存储器M中读入数据寄存器DR中。同时pc加一。

Fetch2: DR<—M,PC<—PC+1

接下来把DR[7:6]送IR,把DR[5:0]送AR

Fetch3: IR<—DR[7:6],AR<—DR[5:0]

eaa987dc-d66e-11ed-bfe3-dac502259ad0.png

3.指令译码

Cpu在取指后进行译码一边知道执行什么指令,对于本文中的CPU来说只有4条指令也就是只有4个执行例程,状态图如下:

eaba69ee-d66e-11ed-bfe3-dac502259ad0.png

4.指令执行

对译码中调用的4个例程我们分别讨论:

4.1 ADD指令

ADD指令需要CPU做以下两件事情:

1〉从存储器取一个操作数

2〉把这个操作数加到AC上,并把结果存到AC

所以需要以下操作:

ADD1:DR<—M

ADD2:AC<—AC+DR

4.2 AND指令

AND指令执行过程和ADD相似,需要以下操作:

AND1:DR<—M

AND2:AC<—AC^DR

4.3 JMP指令

JMP指令把CPU要跳转的指令地址送PC,执行以下操作

JMP1: PC<—DR[5:0]

4.4INC指令

INC指令执行AC+1操作

INC1: AC<—AC+1

总的状态图如下:

eacdc584-d66e-11ed-bfe3-dac502259ad0.png

5 建立数据路径

这一步我们来实现状态图和相应的寄存器传输。首先看下面的状态及对应的寄存器传输:

Fetch1: AR<—PC

Fetch2: DR<—M,PC<—PC+1

Fetch3: IR<—DR[7:6],AR<—DR[5:0]

ADD1:DR<—M

ADD2:AC<—AC+DR

AND1:DR<—M

AND2:AC<—AC^DR

JMP1: PC<—DR[5:0]

INC1: AC<—AC+1

为了设计数据路径,我们可以采用两种办法:

1〉创造直接的两个要传输组件之间的直接路径

2〉在CPU内部创造总线来传输不同组件之间的数据

首先我们回顾一下可能发生的数据传输,以便确定各个组件的功能。特别的我们要注意把数据载入组件的各个操作。首先我们按照他们改变了那个寄存器的数据来重组这些操作。得到如下的结果:

AR:AR<—PC;AR<—DR[5:0]

PC:PC<—PC+1;PC<—DR[5:0]

DR:DR<—M

IR:IR<—DR[7:6]

AC:AC<—AC+DR;

AC<—AC^DR;

AC<—AC+1

现在我们来看每个操作来决定每个组件执行什么样的功能,AR,DR,IR三个组件经常从其他的组件载入数据(从总线),所以只需要执行一个并行输入的操作。PC和AC能够载入数据同时也能够自动加一操作。

下一步我们把这些组件连接到总线上来,如图所示:

eae5e9d4-d66e-11ed-bfe3-dac502259ad0.png

如上图所示,各个组件与总线之间通过三态连接,防止出现总线竞争。AR寄存器送出存储器的地址,DR寄存器用于暂存存数起来的数据。到现在为止我们还没有讨论有关的控制信号,我们现在只是保证了所有的数据传输能够产生,我们将在后面章节来使这些数据传输正确的产生---控制逻辑。

现在我们来看以下者写数据传输中有没有不必要的传输:

1〉 AR仅仅提供数据给存储器,所以他不需要连接到总线上。

2〉 IR不通过总线提供数据给任何组件,所以他可以直接输出到控制单元(后面章节)。

3〉 AC不提供数据到任何的组件,可以不连接到总线上。

4〉总线是8bit宽度的,但是有些传输是6bit或者2bit的,我们必须制定寄存器的那几位送到总线的那几位。

5〉 AC要可以载入AC和DR的和或者逻辑与的值,数据路径中还需要进行运算的ALU。

由此我们做以下工作:

1〉去掉AR,IR, AC与总线的连接。

2〉我们约定寄存器连接是从总线的低位开始的。AR,PC连接到Bus[5:0],由于IR是接受DR[7:6]的,所以可以连接到总线的Bus[7:6]。

3〉我们设定,AC作为ALU的一个输入,另一个输入来自总线Bus。

下面我们检查是否有争用总线的情况,幸运的是这里没有。修改后的CPU内部组织图如下:

eaf6059e-d66e-11ed-bfe3-dac502259ad0.png

6. ALU设计

这个CPU的ALU执行的功能就是两个操作数相加、逻辑与。这里不作详细介绍。电路如如下:

eb0b8720-d66e-11ed-bfe3-dac502259ad0.png

7. 控制单元

现在我们来考虑如何产生数据路径所需的控制信号,有两种方法:硬布线逻辑和为程序控制。这里我们用硬布线逻辑来实现。

这个简单的CPU需要的控制逻辑由三个部件组成:

1〉计数器:用于保存现在的状态

2〉译码器:生成各个状态的控制信号

3〉其他的组合逻辑来产生控制信号

一个通用的控制单元原理图如下:

eb1bd594-d66e-11ed-bfe3-dac502259ad0.png

对于这个CPU来说,一共有9个状态。所以需要一个4bit的计数器和一个4-16的译码器。接下来的工作就是按照前面的状态转换图来对状态进行赋值。

首先考虑如何的对译码输出状态进行赋值才能达到最佳状态。我们按照以下规则:

1〉给Fetch1赋计数器的0值,并用计数器的清零端来达到这个状态。由这个CPU的状态图可以看出,除了Fetch1状态外的状态都只能由一个状态转化而来,Fetch1需要从4个分支而来,这4个分支就可以发出清零信号(CLR)来转移到Fetch1。

2〉把连续的状态赋连续的计数器值,这样就可以用计数器的INC输入来达到状态的转移。

3〉给每个例程的开始状态赋值时,要基于指令的操作码和这个例程的最大状态数。这样就可以用操作码来生成计数器的LD信号达到正确的状态转移。首先,在Fetch3状态发出LD信号,然后要把正确的例程地址放到计数器的输入端。对这个CPU来说,我们考虑以地址1 [IR] 0作为计数器的预置输入。则得到状态编码如下:

Instruction State IR counter
Fetch Fetch1 0000
Fetch2 0001
Fetch3 0010
ADD ADD1 00 1000
ADD2 00 1001
AND AND1 01 1010
AND2 01 1011
INC INC1 10 1100
JMP JMP1 11 1110

如上表所示,下面我们需要设计产生计数器的LD、INC、CLR等信号,总的控制单元的逻辑如下图:

eb30203a-d66e-11ed-bfe3-dac502259ad0.png

下面我们用这些译码信号来产生数据路径控制所必需的AR、PC、DR、IR、M和ALU的控制信号。首先考虑寄存器AR,他在Fetch1状态取PC的值,并在Fetch3状态取DR[5:0]的值,所以我们得到ARLOAD=Fetch1 or Fetch3。以此类推我们可以得到如下结果:

PCLOAD=JMP1

PCINC=Fetch2

DRLOAD=Fetch1or ADD1 or AND1

ACLOAD=ADD2 or AND2

IRLOAD=Fetch3

对于ALU的控制信号ALUSEL是用来控制ALU做逻辑或者算数运算的,所以有:

ALUSEL=AND2

对于片内总线的控制较为复杂,我们先来看DR,对于DR他只在Fetch3、AND2 、ADD2和JMP1状态占用总线进行相信的数据传输,所以有:

DRBUS=Fetch3 or AND2 or ADD2 or JMP1

其他类似有:

MEMBUS=Fetch2or ADD1 or AND1

PCBUS=Fetch1

最后,控制单元需要产生存储器的读信号(READ),它发生在Fetch2、ADD1、AND1三个状态:

READ=Fetch2or ADD1 or AND1

这样我们得到了总的控制逻辑,完成了整个CPU的设计。

8.设计验证

我们执行如下指令进行设计验证,

0:ADD4

1:AND5

2:INC

3:JMP0

4:27H

5:39H

指令执行过程如下(初始化所有寄存器为全零态):

Instruction State Active Signals Operations Next State
ADD 4 Fetch1 PCBUS、ARLOAD AR<—0 Fetch2
Fetch2 READ、MEMBUS
DRLOAD、PCINC
DR<—04H
PC<—PC+1
Fetch3
Fetch3 DRBUS、ARLOAD
IRLOAD
IR<—00
AR<—04H
ADD1
ADD1 READ、MEMBUS
DRLOAD
DR<—27H ADD2
ADD2 DRBUS、ACLOAD AC<—0+27H Fetch1
AND 5 Fetch1
Fetch2
Fetch3
ADD1
ADD2
INC Fetch1
Fetch2
Fetch3
INC1
JMP 0 Fetch1
Fetch2
Fetch3
JMP1

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18283

    浏览量

    222166
  • 寄存器
    +关注

    关注

    30

    文章

    5030

    浏览量

    117733
  • Verilog
    +关注

    关注

    28

    文章

    1326

    浏览量

    109302
  • 指令
    +关注

    关注

    1

    文章

    580

    浏览量

    35377
  • 代码
    +关注

    关注

    30

    文章

    4555

    浏览量

    66772

原文标题:一个简单的8位处理器完整设计过程及verilog代码

文章出处:【微信号:zhuyandz,微信公众号:FPGA之家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    ARM第款64位处理器“Cortex-A50”系列产品详细资料

    本帖最后由 rebeka 于 2014-3-7 15:31 编辑 小R今天为大家献上ARM第款64位处理器产品资料,ARM早在年就已经开发了自己的第套64
    发表于 03-07 15:27

    详析32嵌入式处理器8位处理器应用开发的三大不同

    ”的设计思想。什么发生了改变目前,国内熟悉8位处理器开发的工程师非常多,开发工具和手段也很丰富,并且价格较低。而32位处理器的开发与8位处理器
    发表于 08-08 14:52

    两种ARM 64位处理器学习平台

    、Cortex-A8的s5pv210,Cortex-A9的exynos4412,每个CPU都是主流的芯片,samsung芯片直是资源比较多的平台。用惯了32位处理器,而当下进入了64位处理器
    发表于 10-26 15:47

    32嵌入式处理器8位处理器应用开发有什么不同?

    化”的设计思想。 什么发生了改变? 目前,国内熟悉8位处理器开发的工程师非常多,开发工具和手段也很丰富,并且价格较低。而32位处理器的开发与8位处理
    发表于 04-06 09:11

    32嵌入式处理器8位处理器应用开发的三大不同点

    ”的设计思想。   什么发生了改变   目前,国内熟悉8位处理器开发的工程师非常多,开发工具和手段也很丰富,并且价格较低。而32位处理器的开发与8
    发表于 06-02 18:52

    32嵌入式处理器8位处理器应用开发的三大不同点

    ”的设计思想。    什么发生了改变    目前,国内熟悉8位处理器开发的工程师非常多,开发工具和手段也很丰富,并且价格较低。而32位处理器的开发与8
    发表于 07-04 08:50

    32位处理器S3C44B0怎么移植?

    S3C44B0是Samsung公司推出的款为手持设备或其他通用设备开发的32位处理器,它基于ARM7TDMI核,没有内存管理单元(MMU)。在采用无MMU的微处理器的嵌入式系统中广泛采用的就是
    发表于 08-19 08:00

    如何将FIFO连接到我的16位处理器

    ,我只需要现成的解决方案,我可以将FIFO连接到我的16位处理器,并可以执行读/写。我开始了解Virtex-E synch FIFO的访问时间请帮助我选择。
    发表于 06-02 15:54

    32位处理器可以装64系统吗 32位处理器能否装64系统分析

    32位处理器可以装64系统吗?从技术角度看,32位处理器是不能装64系统的,因为不支持,不确定的用户可以使用下面的两种方法来检查32位处理器
    发表于 06-28 09:57

    首款支持Linux的64位处理器Cortex-R82,用于存储计算

    主机接口的吞吐量不断提高,4GB的限制和无法运行Linux的情况增加了复杂性,并在某些情况下成为障碍。 Cortex-R82处理器种能够寻址多达1TB地址空间的64位处理器,已针对此类系统进行了优化
    发表于 09-09 16:57

    为什么嵌入式工程师会对8MCU有误解

    写的本书,书中观点是32位处理器的能效比高于8的MCU,理由是32位处理器能快速处理完任务,
    发表于 11-14 09:49

    32位处理器的开发与8位处理器的开发有哪些明显的不同?

    32位处理器的开发与8位处理器的开发有哪些明显的不同?开发32的嵌入式系统需要哪些工具和环
    发表于 04-19 08:11

    何谓32位处理器

    32位处理器首先处理器都是8的倍数:8/16/32/64。表示时钟周期里,
    发表于 07-13 08:41

    为什么说8086是16位处理器

    为什么说8086是16位处理器?什么是编程结构?由哪两部分组成,功能是啥?AD为何又能发地址,又能发数据?io端口是什么?编址方法有哪两种?8086用的哪种?
    发表于 08-06 06:48

    RK3566四核64位处理器有哪些特点及其功能呢

    RK3566四核64位处理器有哪些特点及其功能呢?
    发表于 03-02 06:00