【AI编译】如何进行内存分配
# 前言
本文讲解神经网络推理过程中的内存分配相关内容。
作为初学者,错误在所难免,还望不吝赐教。
# Tensor 类型
不同的 tensor 有着不同的生命周期,神经网络推理过程中主要有三种 Tensor 类型:
1. 输入输出 tensor
输出 tensor 是下一节点的输入 tensor,它们一体两面,这种类型的 tensor 生命周期起于 “生产节点”,终于最后一个 “消费节点”。
2. 权重 tensor
权重 tensor 和算子绑定在一起,生命周期随着算子开始,也随算子结束。但也可能存在共享权重的情况,例如 tiling 操作产生的并行算子共享 Weight,算能 TPU
more...







