分享好友 最新动态首页 最新动态分类 切换频道
4路组相连cache设计_计算机体系结构——十项优化Cache性能的高级方法
2024-12-27 05:28

本文翻译摘录自“ComputerArchitecture : A Quantitative Approach (6th Edition)”。

4路组相连cache设计_计算机体系结构——十项优化Cache性能的高级方法

本文介绍十项优化Cache性能的高级方法,将这些方法分为如下的五类:

1. 减少命中时间——小的简单的一级Cache和路预测技术,这两项技术还可以降低功耗。

2. 增加Cache带宽——流水线Cache、多Bank Cache和非阻塞Cache,这些技术对功耗有不同的影响。

3. 减少Cache缺失代价——关键字优先、合并写缓存技术,这两项技术对功耗的影响很小。

4. 降低Cache缺失率——编译器优化技术,显然可以减少编译时间,降低功耗。

5. 通过并行技术降低缺失代价和缺失率——硬件预取、编译器预取,这些方法通常会增加功耗,主要是预取到了一些不使用的数据。

通常,上述这些优化项会增加硬件的复杂度。同时,有几个优化方法需要采用高级编译器技术,最后一个需要依赖HBM。下面对这十项优化Cache性能的高级方法进行详细介绍。

一、利用小而简单的一级Cache来降低命中时间和功耗

高速时钟频率和低功耗的限制均促使对一级Cache大小的限制,类似的,使用较低级别的相联度,也可以减少命中时间和功耗,尽管这种权衡更为复杂一些。

Cache命中过程的关键时间路径包括3个步骤:使用地址中的索引确定Tag存储器的地址;比较读取到的Tag值和地址;如果Cache为组相联,则设置多路选择器来选择正确的数据项。直接映射的Cache可以将Tag检查与数据传输重叠进行,有效减少命中时间。此外,低级别的相联度通常也将降低功耗,因为减少了必须访问的Cacheline。

尽管在新的各代微处理器中片上Cache的数量不断增加,但一级Cache大小的涨幅最近趋缓,甚至没有增长,这是因为大容量一级Cache带来的时钟频率的影响。在最近的许多处理器中,设计者通常是对相联度进行更多的优化,而不是大小。选择相联度时的另一个考虑因素是消除地址别名的可能性,对此后文有介绍。

一种可以在制造芯片前判断各项选择对命中时间和功耗影响的方法是使用CAD工具。CACTI是一个用于估算CMOS微处理器上各种Cache结构的访问时间和能耗的程序。对于一个给定的最小工艺尺寸,CACTI估算在不同Cache大小、不同相联度、不同读写端口数,等更复杂的参数条件下的Cache命中时间。下图展示了Cache大小和相联度对命中时间的影响。对于这些参数,直接映射的命中时间略快于2路组相联,2路组相联是4路组相联Cache的1.2倍,4路组相联是8路组相联Cache的1.4倍。

示例:参考上图和下表中的数据,判断一个32KB的4路组相联一级Cache访问时间是否快于32KB的2路组相联一级Cache。假设二级Cache的缺失代价是一级Cache访问时间的15倍。忽略二级Cache之外的缺失。

假设2路组相联Cache的访问时间为1,那么对于2路Cache结构:

对于4路Cache,访问时间是2路的1.4倍。缺失代价占用的时间为15 / 1.4 = 10.1,简单起见,这里假设为10。那么对于4路Cache结构:

通过以上结果可以看出,较高相联度是一种较为糟糕的权衡选择。然而,由于在现代处理器中,Cache访问通常是流水线化的,所以很难评估对时钟周期时间的影响。

功耗在选择Cache大小和相联度时也是一个需要考虑的因素,如下图所示。在128KB或256KB Cache中,当从直接映射变为2路组相联时,高相联度的能耗比从大于2到可以忽略。

当功耗变的比较严重时,设计者会集中于寻找降低Cache访问的功耗。在Cache访问中,决定功耗的另一个关键因素是Cache中块(block)的数量,因为它决定了所访问的“行”的个数。设计者通常会在保持Cache大小不变的情况下,增加块的大小来降低“行”的个数,但这会增加缺失率,尤其是在比较小的一级Cache中。

另一种选择是将Cache组织为Banks,以便仅访问Cache的一部分,即所需块所在的Bank。多Bank Cache的主要用途是增加带宽。多Bank还减少了功耗,因为访问了更少的Cache。许多多核处理器中的3级Cache存在逻辑上是统一的,但在物理上是分布式的,并有效地充当多Bank的Cache。根据请求的地址,实际上只有一个物理3级Cache(一个Bank)被访问。

在最近的设计中,有三种除了功耗和访问时间消耗之外的其他因素使得在1级Cache中使用较高的相联度。第一,许多处理器在访问Cache时至少需要两个时钟周期,因此命中时间较长可能不会产生太严重的影响。第二,将TLB排除在关键路径之外(TLB带来的延迟可能要大于高相联度导致的延迟),几乎所有的一级Cache都是虚拟寻址的,这就将Cache的大小限制为页大小与相联度的乘积,这是因为只有页内的位才能用于索引。在完成虚拟地址到物理地址转换之前对Cache进行索引的问题还有另外一些解决方法,但提高相联度还有其他一些好处,更具吸引力。第三,在引入多线程之后,冲突缺失会增加,从而提高相联度更具吸引力。

二、通过路预测技术来降低命中时间

最新文章
直通车关键词推广添加关键词_直通车关键词推广怎么设置关键词
ˋ^ˊ 拼多多直通车应该怎么开在所有的电商平台里就属拼多多的直通车最简单了。简单到什么程度呢?这样说吧,我刚把关键词自定义玩会,他就给我整下线了,留下我一个人在风中凌乱。好歹自定义还有点技术含量,你把这个砍掉了,未来只留一
网友亲身经历!恒泰福彩App是做任务诈骗软件!被骗提现不了怎么办
恒泰福彩App是做任务诈骗软件!被骗提现不了怎么办技术出嘿《溦:9836356》(一)希望阅读此文的读者能够及时采取措施以减少损失;请及时与团队联系提供解决方案(文章下面图片有咨询方式)若想追回损失资产,务必仔细阅读以下内容。【JFHHERYE
骶骨骨折司法鉴定等级是几级,能享受什么待遇
  一、申请仲裁时效  劳动争议申请仲裁的时效期间为一年。仲裁时效期间从当事人知道或者应当知道其权利被侵害之日起计算。  二、申请仲裁提交的材料  (一)申请人是劳动者的,请提交下列材料:  (1)《劳动仲裁申请书》(详细陈述申
详细分析搜狗SEO优化步骤,助力网站提升搜索引擎排名
随着互联网的快速发展,搜索引擎(SEO)已成为企业网站提升在线曝光度、吸引潜在客户的重要手段。在我国,搜狗作为领先的搜索引擎之一,其SEO优化策略备受关注。本文将深入解析搜狗SEO优化策略,为网站优化提供有益参考。一、布局1. 关键词
网上接单干活的平台有哪些?盘点10大正规接单网站
随着互联网的不断发展,线上可完成的事情也是越来越多了。点餐、购物、甚至是接单干活,这些在网上都已变得稀松平常。越来越多的朋友们开始习惯于在网上接单干活,赚取可观的收益。那么网上接单干活的平台有哪些?本篇文章就将为大家盘点10
谷歌play商店官方正版(play google商店)
谷歌play商店就是谷歌商店,这是一款适用于谷歌安卓手机的应用市场,为您推荐海量游戏和软件资源,还有热门排行榜,轻松熟知哪些应用当下最火,用户可以根据自己喜欢的类别进行下载安装,另外,关于图书、影音等内容,也可以在该软件内购买
李彦宏去了趟莫斯科,中俄最大搜索巨头要"联手"?
张少华中俄两国最大的搜索引擎公司有望强强联手。今日,犀利财经消息称,百度将与俄罗斯的Yandex在电商、搜索等行业合作,从线上线下打通亚欧市场。报道指出,9月1日,百度创始人李彦宏携百度高级副总裁向海龙等一众高管,在俄罗斯首都莫斯
荣耀60怎么设置返回三个键位
荣耀60作为一款备受欢迎的智能手机,其操作系统和用户体验设计都备受关注。对于习惯使用实体按键或三键导航的用户来说,如何在荣耀60上设置返回、主页和多任务三个键位,是一个常见的问题。本文将详细介绍如何在荣耀60上设置这三个键位。首
瞬间顿悟!美国天然气期货开户流程(帮助投资者顺利进入这一市场)
美国天然气期货是全球能源市场中的重要组成部分,其价格波动对全球经济具有深远影响。对于投资者而言,了解如何开设美国天然气期货交易账户并参与市场交易至关重要。将详细介绍美国天然气期货开户的流程和相关注意事项,帮助投资者顺利进入
漫蛙app免费版下载正版
漫蛙app免费版是一款非常优秀的漫画阅读平台!漫蛙app免费版app拥有丰富的漫画资源、良好的阅读体验和社区交流功能,还有个性化推荐、离线下载、漫画制作等特色功能,能够满足用户的多样化阅读需求;如果你是一位漫画爱好者,不妨来尝试一
相关文章
推荐文章
发表评论
0评