分享好友 最新动态首页 最新动态分类 切换频道
2018年12月14日 | Intel 2018架构日公布六大技术战略,透露哪些信息?
2024-12-27 05:19

北京时间12月12日晚,Intel在圣克拉拉举办了架构日活动。Intel揭开了2021年CPU架构路线图、下一代核心显卡、图形业务的未来、全新3D封装技术,甚至部分2019年处理器新架构的面纱。

2018年12月14日 | Intel 2018架构日公布六大技术战略,透露哪些信息?

不仅展示了一系列处于研发中的基于10纳米的系统,将用于PC、数据中心和网络设备,并预览了其他针对更广泛工作负载的技术,还一连分享了聚焦于六个工程领域的技术战略,包括:

英特尔表示,对这些领域的重大投资和技术创新,将为更加多元化的计算时代奠定了基石,到2022年,潜在市场规模将超过3000亿美元。

近一段时间以来,业界一直非常期待看到Intel未来的架构路线图,但自Skylake以来却一直处于犹抱琵琶半遮面的状态。最近几个月Intel简单公布了一部分数据中心产品路线图,包括Cascade Lake,Cooper Lake和Ice Lake以及未来几代,但消费级产品却依旧难产。

在本次架构日活动上,Intel终于带来了消费级的PC处理器架构路线图和Atom架构路线图。

在高性能的Core系列产品线上,Intel列出了未来三年内的三个新代号:Sunny Cove、Willow Cove和Golden Cove,其中离我们最近的Sunny Cove将于2019年上市(PS:你猜会不会鸽^_^)。

据悉,Sunny Cove架构旨在提高通用计算任务下每时钟计算性能和降低功耗,将拥有AVX-512单元,并包含了可加速人工智能和加密等专用计算任务的新功能,将成为Intel下一代PC和服务器处理器的基础架构。

随后的Willow Cove在路线图上位于2020年,很可能也是10nm。Intel将此处的重点列为缓存重新设计(可能意味着L1/L2调整)、新的晶体管优化(基于制造)以及其他安全功能,可能是指新一类侧信道攻击的进一步增强。

Golden Cove则位于图表中的2021年,工艺制程仍是一个问号,可能是10nm也可能是7nm,Intel将进一步提升其单线程性能和人工智能性能,并在核心设计中增加了潜在的网络和AI功能,安全特性看起来也得到了提升。

Atom系列低功耗处理器的架构路线图比酷睿系列的节奏慢,考虑到其历史,这并不奇怪。鉴于Atom必须适应各种设备,业界更多的是期望产品能够提供更广泛的功能,尤其是SoC方面。

即将在2019年推出的架构名为Tremont,专注于单线程性能、网络服务器性能以及电池续航时间的提升。紧随Tremont之后的将是Gracemont,Intel将其列为2021年的产品,可能会拥有更宽的矢量处理单元或支持新的矢量指令。

从路线图上看,Gracemont之后还会有一款“XXXmont”系列核心,Intel正在研究这款新内核在2023年时可能具备的性能、频率和特性。

上面这些是架构的名称,而实际产品可能可能会有另外的代号,也就是酷睿系列近些年来一直使用的“XXX-Lake”命名,比如代号为Ice Lake的处理器就是由Sunny Cove架构的CPU内核与Gen11核心显卡联合构成。

活动中的另一个值得关注的消息是,Intel未来的架构很可能与工艺制程脱离关系。Raja Koduri和Murthy Renduchintala博士解释称,为了让产品线拥有一定的弹性,未来这些架构的最新产品将以当时可用的最佳工艺制程推向市场。

虽然没有明说,但雷锋网认为这应该意味着目前已经名存实亡的“Tick-Tock”策略彻底被扫进了历史的垃圾桶,未来某些核心设计跨越不同制程的情况可能会成为常态。

在封装领域,英特尔推出的 Foveros 是业界首个真正的 3D 封装,可以把整个系统封进一颗芯片中,达成真正的 System in Package 概念,远比目前台积电与三星都在发展的 2D 或 2.5D 封装技术更为先进。

每次听到全新处理器架构的消息时,大家最期待的都是对于新架构的详细分析,以及相对前代的变化情况。

自Skylake于2015年首次推出以来,到目前为止Intel已经推出了Kaby Lake、Coffee Lake和Coffee Lake三代小改款,由于每代提升都不大,被玩家戏称为“挤牙膏”。虽然这次Intel展示了全新的Sunny Cove架构,但遗憾的是其信息还不够全面,主要集中在架构设计的后端部分。

Intel将其微体系结构更新分为两个不同的部分:通用性能提升和特殊用途性能提升,通用性能提升指原始IPC(每时钟指令)吞吐量或频率增加,IPC的增加可能来自核心更宽(每个时钟执行指令更多)、更深(每个时钟更多并行)或更智能(通过前端更好的数据传输),而频率通常是实现和过程的函数,而特殊用途性能提升可以通过其他加速方法(如专用IP或专用指令)来改进特定方案中使用的某些工作负载。

据悉,Sunny Cove在通用性能和特殊用途性能两个方面有着全方位的提升。在架构的后端部分,Intel已经做了包括增加高速缓存大小、增加核心执行宽度、增加L1存储带宽等改进。

Sunny Cove架构的L1数据缓存从32KB升级为48KB,通常当缓存容量增大时,缓存未命中的概率将以平方根的比例降低,因此Sunny Cove架构的L1缓存未命中率理论上可减少22%。同时Sunny Cove架构Core和Xeon处理器的L2缓存也将分别比目前的256KB和1MB有所增加,具体容量尚未可知。

此外,微操作(uOp)缓存和二级TLB虽然不属于后端,但其容量也都相比目前有所增加,这将有助于机器地址转换。图中还可以看到一些其他更改,例如执行端口从8增加到10,允许一次从调度程序中获得更多指令;重排序缓冲区的调度也从每个周期4条指令增加到5条指令;端口4和端口9链接到了一个循环数据存储,使带宽加倍,但AGU存储功能也增加了一倍,这将有助于增加L1-D大小。

Sunny Cove架构的执行端口也发生了重大变化,详情见下图:

我们看到Intel为核心的整数部分配备了更多LEA单元,以帮助进行内存寻址计算,可能有助于通过需要频繁内存计算的安全缓解来帮助改善性能损失,或者帮助提供具有恒定偏移的高性能阵列代码。端口1从Skylake端口5获取MUL(乘法)单元,可能用于重新平衡,但此处还有一个整数分频器单元。这是一个小小的调整,Cannon Lake在其设计中也有一个64位IDIV(带符号整数除法)单元,在这种情况下,它将64位整数除法从97个时钟(混合指令)降低到18个时钟,Sunny Cove可能与之类似。

在整数运算单元方面,端口5的乘法单元已成为“MulHi”单元,在其他架构中,它会在寄存器中留下最重要的半字节以便进一步使用,但目前不能确定它在Sunny Cove核心中的位置究竟是什么。

在浮点运算单元方面,Intel增加了洗牌资源,这是出于消除代码中瓶颈的考虑。Intel没有在核心的浮点运算部分说明FMA(熔加运算)的功能,但既然核心内有一个AVX-512单元,这些FMA中就应至少有一个与之交互。Cannon Lake只有一个512位的FMA,这个FMA很可能在这里,而Xeon的可扩展版本可能会有两个FMA。

Intel列出的其他更新包括分支预测器的改进,以及由TLB和L1-D带来的有效负载延迟降低。不过雷锋网获悉,有人指出这些改进无法帮助到所有用户,可能只有全新的算法才能使用这些特定部分的核心能力。

除了架构上的差异,Sunny Cove还增加了新的指令以帮助加快专业计算任务。随着AVX-512单元的出现,新架构将支持用于大算术计算的IFMA(带符号熔加运算)指令,这些指令在密码学中非常有用。Sunny Cove还支持Vector-AES、Vector Carryless Multiply、SHA、SHA-NI以及Galois Field指令,这些指令也是密码学的一些元素中的基本构建块。

Sunny Cove支持更大的内存容量,其主存储器分页表从4层增加到了5层,支持最多57bit线性地址空间和最多52bit物理地址空间,这意味着服务器处理器理论上可支持单插槽4TB内存。

根据Intel之前的Xeon路线图,Sunny Cove将在2020年与Ice Lake-SP一起在服务器领域上市。为了安全起见,Sunny Cove具有多密钥全内存加密和用户模式指令预防功能。

2015年,Intel推出了采用Gen9核心显卡的Skylake处理器,不过随后Kaby Lake和Coffee Lake的核心显卡都只是Gen9.5而非Gen10。实际上,Intel 10nm Cannon Lake处理器本该对应Gen10,但Intel从未发布过带核心显卡的PC端Cannon Lake处理器。

今天,Intel首席架构师、核心与视觉计算集团高级副总裁兼边缘计算解决方案总经理Raja Koduri直接公布了全新的Gen11核心显卡,并重申了在2020年推出独立图形处理器的计划。

根据路线图,Gen11核心显卡将于2019年开始随10nm处理器一同面世,配备64个EUs(增强型执行单元),运算规模是此前Gen 9核心显卡的2倍,浮点运算性能超过1TFlops。这64个EUs被分成4个切片,每个切片由2个8EUs的子切片组成,每个子切片均拥有指令缓存和3D采样器,而较大的4个切片则拥有2个媒体采样器、1个PixelFE以及额外的加载/存储硬件。

Intel并没有透露太多关于如何提高EU性能的详情,但表示EU内部的浮点运算单元接口是重新设计,支持快速(2x)FP16性能。每个EU均像以前一样支持7个线程,这意味着整个GPU有512个并发管道,Intel表示已经重新设计了内存接口,并将GPU的L3缓存增加到3MB,相比Gen9.5增加了4倍。

Gen11核心显卡的一项重大改进是终于支持了瓦片式渲染,这让Intel成为继2014年的NVIDIA和2017年的AMD之后,最后一个实现这一特性的PC GPU供应商。虽然瓦片式渲染不是解决GPU性能问题的灵丹妙药,但是优化良好的瓦片式渲染可以很好的适应核心显卡的带宽限制。

与此同时,Intel的无损内存压缩技术也有所改善,在最佳情况下性能可提高10%,平均可提高4%。GTI接口现在支持每个时钟读写64字节以增加吞吐量,以与重新设计的内存接口相配合。

Gen11核心显卡还支持Intel全新的多速率着色技术Coarse Pixel Shading(粗像素着色),这与NVIDIA的可变像素着色很相似,能让GPU减少阴影部分像素所需的渲染操作量。Intel为CPS展示了两个演示,其中像素阴影分别作为与相机距离和屏幕中心相关的一个函数,当物体离相机或屏幕中心较远时渲染量减少,其设计目的是帮助VR实现注视点渲染等功能,Intel表示游戏在支持这一技术后可提高约30%的帧率。

Raja Koduri宣布了Intel独立显卡业务的新产品品牌:Xe,目前仍被非正式的称为“Gen12”系列,将从2020年开始覆盖从客户端到数据中心的所有领域,也涵盖了未来的核心显卡解决方案,Intel希望Xe从入门到中档,再到发烧友以及AI,都能向竞争对手最好的产品发起竞争。

Xe将从10nm节点开始,为未来几代图形奠定基础,并将遵循Intel的单一堆栈软件哲学,即希望软件开发人员能够利用CPU、GPU、FPGA和AI,所有这些都使用同一套API,这表明Intel已经准备好围绕一个品牌向前发展。

作为架构日活动的一部分,Intel在现场进行了大量芯片演示,据称这些演示均是基于新的Sunny Cove核心和Gen11核心显卡,目前的演示涉及项目包括7-Zip应用和铁拳7游戏两部分。

7-Zip项目相对直接,演示机的同频性能相较于SkyLake平台提高了75%,展示了Sunny Cove架构的Vector-AES和SHA-NI等新指令所带来的特殊用途性能提升。而在铁拳7中,Sunny Cove+Gen11的演示机与SkyLake+Gen9相比更顺畅,完全超出30fps的最低要求。

内存和存储

推出深度学习参考堆栈(Deep Learning Reference Stack)

最新文章
海外TMT行业2025年度AI需求持续高景气,算力终端应用全产业链投资机会梳理.pptxVIP
算力:AI算力需求持续高景气,单卡到组网集群各产业链环节均受益终端:AI+终端百花齐放,边缘SoC+生态系统+硬件迭代构筑端侧智能体应用:AI应用百舸争流,LLM仍是核心竞争力风险提示请务必参阅正文之后的重要声明1AI算力需求持续高景气,单
部署web项目SpringMVC工程到Linux服务器
补入 这篇博客。 (回忆版,待确认)下载Tomcat的Linux版安装包(.tar.gz),在Linux的目标路径下解压,将开发的工程【生成的war包/编译好的class文件】放到Tomcat的webapps目录下,解压
讯飞星火使用全攻略:详细解析如何高效使用讯飞星火助手!
讯飞星火助手是一款由科大讯飞推出的智能语音助手,它不仅能够提供语音识别、语音合成等多种服务,还可以帮助用户实现更加智能化的生活与工作方式。无论是在日常生活中,还是在办公、学习等场景下,讯飞星火都能大大提升效率。如何高效使用
贝利自动点击器app安卓2024最新版下载
贝利自动点击器app安卓版是一款免费使用的手持手机连接工具软件,不仅可以完全模拟连接功能,还支持返回键Home键多任务,可以帮助您完成重复工作,可以定制各种点击任务,所有功能无需root免费使用。一键自动点击可以节省大量时间和金钱,
超逼真美女写真生成:用AI画出你的完美女神!
在这个充满科技与艺术的时代,AI绘画已经不再是新鲜事。想象一下,你的手机上是否也曾悄然闪现过那些精美绝伦的美女写真?那些无可挑剔的面容,仿佛是糖果般的甜美,仿佛是待人亲切的朋友,而这些影像却只需要轻轻一点击便能生成。今天,我
趣味生成器无法打开的原因和解决办法
趣味生成器安卓版是一款十分好用的软件在使用的时候是可以看到很多的功能在其中的,用户可以随意的使用这些出现的功能,让你可以在最短的时间内轻松的做出一些更改,并且很多的功能都是免费的,让用户可以感受到不一样的使用体验。1、在进
通达信人气趋势副图指标
通达信人气趋势副图指标源码:VAR3:=MA(CLOSE,10);VAR4:=100-ABS(((CLOSE-VAR3)/(VAR3))*(100));VAR5:=LLV(LOW,75);VAR6:=HHV(HIGH,75);VAR7:=(VAR6-VAR5)/(100);VAR8:=SMA((CLOSE-VAR5)/(VAR7),20,1);VAR9:=SMA((OPEN-VAR5)/(VAR7),20,1);
智能机器人阿派
智能机器人阿派是一款引领未来科技发展的创新产品。它拥有先进的人工智能技术,能够执行各种任务,帮助人们提高工作效率和生活品质。智能机器人阿派具备出色的语音识别和自然语言处理能力。无论是和用户进行对话,还是执行指令,它都能够准
大分率排名(全场)
排名球队完赛大-走-小大分率小分率首节场均超分盘路2717-0-1063%37%1.9首节详情2415-0-962.5%37.5%2.7首节详情2817-0-1160.7%39.3%1.3首节详情42716-0-1159.3%40.7%0.8首节详情52615-0-1157.7%42.3%2.6首节详情62715-0-1255.6%44.4%-0.5首
竞价推广优势明显,企业不容错过!
标题:竞价推广优势明显,企业不容错过!正文:在当今竞争激烈的市场环境中,企业要想脱颖而出,竞价推广无疑是一个值得考虑的策略。竞价推广以其明显的优势,成为了众多企业的首选。下面,我们将深入探讨竞价推广的优势,帮助您了解这一推
相关文章
推荐文章
发表评论
0评