【Gemm】内存对齐
# 前言
本篇文章梳理内存对齐的相关概念和知识,并借上一篇文章《【Gemm】Gemm 计算加速》 来简单探讨一下内存排布对计算加速的重要作用。
本篇文章参考和引用了 《nihui 大佬的 ncnn 工程》,《ncnn 初探二:图解 ncnn::Mat 的内存排布》,关于 mat 中 data 的内存排列问题,《Linux 内核:内存管理 —— 内存对齐》等,并询问过大语言模型通义千问、文心一言等。如有不清楚的地方可以点击链接查阅。
作为初学者,错误在所难免,还望不吝赐教。
# 处理器的对齐访问
对齐访问的定义:对齐访问是指处理器在访问内存时,要求访问的起始地址是某个特定数值(通常是 2 的幂)
more...






