-
-
53为什么Apple Silicon在R24中这么强? 如你所见,今天我们要讲的是,为什么,Apple Silicon在Cinebench R24中表现如此的强,连隔壁的X86都甘拜下风,尤其是M4,我看我们的贴吧老哥都跑上192了,简直是非常的厉害。 首先我们需要明白R24是一个比较重LSU的一个benchmark,那么M4刚刚好大提升的就是这部分,那么今天我们引入我们的主题,LSU,LSU是CPU中很重要的一个部分,我们首先需要了解一下什么是LSU。LSU 是 “Load–Store Unit”(加载存储单元)的简称,是一个专
-
25
-
32
-
49
-
38晚上翻笔记发现了自己一堆BP的idea,但又不知道从何说起……
-
19
-
58
-
20
-
0只能说国产工艺的进步比想象中的还不乐观 转自微博 @TAOG_1575 Kirin 9020/ 麒麟9020 圖我都Blur處理,完整寫完 圖一是總整理,重要資訊有: 1 CPP 63nm Minimun metal pitch 40/42nm (M0/M2) Fin 最小 pitch 31nm SRAM area 0.032um2 STD height 252nm (圖二) 這跟9010一樣,所以一樣留在N+2;或許制程在某些地方有改動,但是主要的重點關鍵尺寸沒有微縮 另外對比TSMC N7: 1 CPP 57nm MInimun metal pitch 40nm Fin 最小 pitch 30nm SRAM area 0.027um2 STD height 240nm 可以看到9020的確有N7特徵,但在poly gate pitch做
-
192
-
19
-
30
-
49
-
86what can I say。这BPU还用说,Firestorm同款BPU。TAGE 80KB,ITTAGE 40KB,L0 BTB 2048entry。对这个规模不需要抱太大期待。看看图就知道不如X4水平。ARM的BP算比较一般的,如果放到和今年新出的新世代u-arch那完全比不了。像AMD的16K-entry L1 BTB以及Multiple-Block Ahead Branch Predictor。Apple增加table和BTB的BPU。intel……,额,这个不怎么能讲。前两家的BP都是有相当大的进步。 当然肯定有人会问啊,BPU重要,咋Oyron表现那么好。很正常啊,力大砖飞,4.32GHz+3.52GHz。反正power不要了
-
12麒麟8000Dieshot Photo By@万扯淡 Layout By@Kurnal 图1为8000Dieshot 图2为Decap的Die package图 图3为麒麟810-815(720)-820-8000 同size对比 图4为8000与815的对比 几个事情 1:Nova12/13上的麒麟8000为同一颗,见图2 并不存在所谓新麒麟8000这一说(所谓的01/02更是无稽之谈,我这颗拆机来自与Nova12Pro) 2:工艺与麒麟9000S相同,9000S是什么,8000就是什么 3:产线与麒麟9000S一致(相同的对准标识) 又:麒麟8000与麒麟815(或者叫麒麟720)很相似(见图4) 高清图见bilibili动态
-
106
-
38
-
39
-
5https://github.com/apple-oss-distributions/xnu/blob/main/doc/arm/sme.md
-
67
-
87
-
35what can i say?Qualcomm out! XE比一下M3 Max,一个就是放大版mobile phone chip,另一个才有PC Chip的样子。 先说说整体的floorplan,按理来说,应该把latency敏感的mod放一起,尽可能在distance上去做short latency,然后再让fabric去走四周。(整个顶层的摆放一开始会和design他们讨论很久确定十几种方案,接下来根据IP Core和other mod的area去进行调整。)然而,高通这玩意,还能说啥,只能说performance确实不是他们的目标,to be a joker,确实是目标。 再看看Core,拿Coll和Oyron
-
128
-
22都是@junjie1475 和我做的app,完全可以对比a17因为散热问题,没跑满,跑满大约9.5分吧,功耗和a18基本一致 这个是核心功耗,不过减空载或者主板也应该a17/18大致功耗差不多,都在6w吧 M4其实不会高太多,4.04g应该大约核心4.5w 主板7w吧
-
27
-
30
-
61
-
128首先,P-Core:接近7W 4.05GHz,9W 4.45GHz,和M4一样的3-2Cell。E-Core:0.45W(Core),0.75W(motherboard)。 本来还是有望G6:3600 9200的,不过iOS18导致的掉分,估计最后也就个3300 8800,这很正常,说不定是修security修没了3-5%。如果我这里数据没错,G6 10W 8000,12W 8800,16W 9200,multi core efficiency就这样。G5:2450 7166。 frequency的话,P-Core:4.05GHz,E-Core 2.4GHz,Size A18 and Pro:2P4E。 接下来说说GPU。GPU还是熟悉的M4上那个Apple 9/10GPU,A18 Pro:6C 1.49GHz,A18:5C 1.49GHz。SNL的话极限应
-
168
-
13PS: 此贴,非吧务组成员,请勿留言。谢谢
-
205037嗯,来自开源代码41131a18 2+4 3500/8500 5c GPU snl 1800 a18Pro 2+4 3700/9200 6c GPU snl 2000 m4Pro 8+6 4100/20000 20c GPU snl 7800 m4max 12+6 4100/24000 40c GPU snl 1400042如图所示……16网页链接 某人狂喜之前的测试一律作废162已知8Gen3 Aztec1440P 95/约12.5W 那么8Gen4 ? 已经A17 Pro CPU核心功耗约4W 那么8Gem4 ? (已有数据,看看大家猜测)30最近在研究SME/SVE,arm的simd/fp寄存器重叠的方式和x86那边不太一样(d0,d1同时map到q0的高64和底64bit。对苹果的物理寄存器进行了一些测试。 首先测试Q0寄存器的PRF Allocation limit, m3大约在500多左右,也就是说物理寄存器大小上限为500x128bit。 接着把测试寄存器换成D0,结果和Q0寄存器一样。苹果会给所有大小的寄存器destination分配一个128bit的寄存器空间。 继续测试把destination为d0和d1的指令混合发现limit还是一样, 那么可以得出结论128bit寄存器里不存在register271原来的小吧我看很多都不上了,准备换一些。 欢迎有时间愿意参与管理的吧友申请。。。257测试工具:Arm DS-5 Streamline performance analyzer 测试方法: 根据arm给出的公式计算: Bandwidth (Bytes) = (External Bus Read Beats + External Bus Write Beats) * Bus Width 其中External Bus Read Beats与 External Bus Write Beats由streamline读取GPU的L2cache对应数据获得(GPU也有L1与L2,其中L1由每个ALU独占,L2由一个EE中的所有ALU共享。arm给出的测量带宽方式就是读取L2cache的这两个数据)6129535160这个帖子沿袭通吧传统,作为新的置顶问答贴使用。 可以在这里提有关问题,热心的吧友会随缘回答的。95发78没人测 ,找一点存在感 原贴: http://tieba.baidu.com/p/47089716891202101754安卓的cpu跑分软件不像gpu跑分软件那样受大众认可,测试的难度比较大。 每个厂家的产品在各个跑分里的成绩也不尽相同。所以排名可能略有出入。天梯图只是作为一个参考 并不代表天梯排名越高 用此Soc的产品就越流畅越好。 本次测试使用nbench软件成绩来制作Soc的单线程性能排名 使用passmark performancetest做Soc的多线程性能排名。因为这两个软件的成绩比较稳定 线性比较强。单线程去除了误差比较大的内存跑分 多线程去掉了系统版本影响太大的随机