计算机体系结构量化研究方法第6版(约翰·L.亨尼西,大卫·A.帕特森)

书: https://pan.baidu.com/s/1XseSeFJwB_CgmZqmU5-_rQ?pwd=gb4u
笔记如下:

  1. “摩尔定律的终结迫使体系结构创新从工艺驱动转向设计驱动,能效比成为核心指标。”
  2. “存储墙问题:CPU性能每年提升52%,内存带宽仅增7%,层次化缓存是破局关键。”
  3. “Amdahl定律揭示:优化系统某部分获得的加速受限于该部分被使用的频率。”
  4. “RISC-V开放指令集证明:精简、模块化设计比复杂指令集更适应后摩尔时代。”
  5. “乱序执行通过动态调度隐藏延迟,但分支预测错误会导致20+周期惩罚。”
  6. “多核处理器面临‘暗硅’困境:受限于功耗,无法所有晶体管同时工作。”
  7. “SIMD(单指令多数据)向量化是提升数据级并行的经典方法,现代CPU支持512位向量。”
  8. “GPU的众核架构将80%芯片面积用于计算单元,成就10倍于CPU的吞吐量。”
  9. “RDMA(远程直接内存访问)技术让网卡绕过CPU直接读写内存,延迟降至1微秒级。”
  10. “非易失内存(NVM)模糊存储层次界限,提供字节寻址和持久化能力。”
  11. “数据中心体系结构的黄金法则:均衡设计(1:1:1的CPU/内存/网络带宽配比)。”
  12. “DSA(领域专用架构)如TPU,通过定制化计算单元实现数量级能效提升。”
  13. “内存一致性模型(如x86-TSO)定义多核间内存可见性,影响并发程序正确性。”
  14. “推测执行的安全隐患(如Spectre漏洞)揭示性能与安全的深层矛盾。”
  15. “CXL总线协议实现CPU与加速器内存一致性,构建异构计算统一地址空间。”
  16. “存算一体架构将计算单元嵌入存储器,突破冯·诺依曼瓶颈。”
  17. “量子噪声是量子计算机实用化的主要障碍,纠错码需消耗百万物理量子位。”
  18. “Roofline模型量化计算性能上限:受限于算力(峰值FLOPs)或带宽。”
  19. “敏捷芯片设计(如Chisel)将硬件开发周期从5年缩短至1年,加速架构创新。”
  20. “未来十年体系结构的四大挑战:能效墙、内存墙、编程墙、安全墙。”

发表评论

您的电子邮箱地址不会被公开。 必填项已用 * 标注