暮冬Z羡慕的博客 = Пусть этот камень будет более крепким, чем человек = 神经网络推理、加速、AI编译。我必须立刻开始挣扎！

2024-10-1724kwords22 mins.

【TVM】通过代码学习编译流程【3】模型编译

# 前言本系列文章将从代码和流程图入手，详细介绍 TVM AI 编译器的编译流程。本文章为第三篇，对应的 TVM 版本为当前最新版本 1.7。网络上有不少 TVM 工程的教程资源，如果本博客也是其他教程的简单重复的话，则网络的角落里又多了一份纯粹的空间占用者。所以我在想，本文章有什么特点才值得一看呢？我觉得有两个优点: 1、本文从代码出发，不会泛泛而谈，能够从细节了解 TVM；2、自认为结构流程图画的不错，能够从整体上把握 TVM 的脉络。所以，也许值得一看呢。本篇文章介绍 TVM 对模型的编译流程。文章《【TVM】通过代码学习编译流程【2】模型转换》已经介绍了 onnx 模型转换为

more...

2024-10-1320kwords18 mins.

【TVM】通过代码学习编译流程【2】模型转换

# 前言本系列文章将从代码和流程图入手，详细介绍 TVM AI 编译器的编译流程。本文章为第二篇，对应的 TVM 版本为当前最新版本 1.7。网络上有不少 TVM 工程的教程资源，如果本博客也是其他教程的简单重复的话，则网络的角落里又多了一份纯粹的空间占用者。所以我在想，本文章有什么特点才值得一看呢？我觉得有两个优点: 1、本文从代码出发，不会泛泛而谈，能够从细节了解 TVM；2、自认为结构流程图画的不错，能够从整体上把握 TVM 的脉络。所以，也许值得一看呢。本篇文章以 onnx 为例，介绍主流模型转换为 TVM 高级中间表示 Relay IR 的过程。作为初学者，错误在所难免，还望

more...

2024-10-104.4kwords4 mins.

【TVM】通过代码学习编译流程【1】必要知识

# 前言本系列文章将从代码和流程图入手，详细介绍 TVM AI 编译器的编译流程。本文章为第一篇，取名为 “必要知识”，约等于 “大杂烩”。食之无味，弃之可惜。但基于我个人的主观喜好和偏见，这些知识值得在整个代码讲解之前声明。作为初学者，错误在所难免，还望不吝赐教。 # 工程结构 TVM 主要由 C++ 语言和 Python 语言实现。 a.TVM C++ 后端核心代码位于 /home/user/tvm/src C++ 后端核心代码的功能是生成 libtvm.so libtvm_runtime.so，分别是模型编译过程中的需要的 libtv

more...

2024-08-04483words1 mins.

【感想】写作进度报告1

# 介绍四五年前就开始构思一部小说。那时起就不断地撰写纲要，描述关键节点剧情，甚至开始跳着写中间的一些章节。不过总感到不妥，小说的立意太低了，剧情太老套了，可能和 XX 很像，我才不愿意仿写，等等很多原因，我又不得不停下来重新思考整个小说的立意、构思。小说经过了多次彻头彻尾的改造，重新设计了关键节点，调整了新的纲要。不得不说，尽管写作是一个漫长的过程，但是小说的立意构思阶段不见得工作量更小。在几个月前，终于调整好构思之后，重新开始写作。现在写的很慢，之前在学校里会抽时间写一点，现在上班了，只能是下班玩够了之后，写一个小时左右。不知不觉，到今天正文已经有 3 万余字了。特意查了一下，《三体

more...

2024-07-07746words1 mins.

【Winograd】卷积加速算法原理及实现

# 算法原理算法原理还没写，预计将来补上。可以在网络上搜索算法原理。 # 代码实现可以在 github 项目卷积加速算法实现中下载代码实现，运行其中的测试函数： /*winograd 算法 F (2*2, 3*3)仅用于 3*3 卷积，stride=1, dilation=1推荐 w<120 h<120 in_c>16 out_c>16现已支持 pad 之后添加 dilation*/TestWinogradF23ConvLayer()；/*winograd 算法 nchw F (6*6, 3*3

more...

2024-07-056kwords5 mins.

SystemC 等待异步事件解决方案

# 介绍本文为实现 SystemC 响应异步事件解决方案。应用场景： SystemC 是一个支持系统事务级、行为级建模的开源的 C++ library；我们将 SystemC 仿真的模拟叫做模拟器。在很多场景下，模拟器要保持 alive，等待异步 async 事件，做出对应的处理。例如设计一个 SystemC 消费者模拟器，而生产者程序不属于 SystemC 仿真范畴，消费者模拟器需要一直保持等待，并在出现数据后进行处理。世界上没有东西是完美的啊，倒不如说，同时拥有光明和阴影才是完美的，这样的你才是真正的你。 ------ 大家好啊我是暮冬 Z 羡慕以上应用场

more...

2024-06-182.8kwords3 mins.

【TVM】Python脚本实现模型编译和保存

# 前言本篇博客提供简单的 Python 脚本代码，实现 onnx 模型转换编译，保存为 TVM 的 .so .params .json 文件。望长城内外，惟余莽莽；大河上下，顿失滔滔。 --------------- 教员 ------ 大家好啊我是暮冬 Z 羡慕 # Python 脚本实现模型编译和保存脚本中需要修改的就一些路径，很容易看明白，就不再过多介绍了。 import onnx from tvm.contrib.download import download_testdata from PIL import Image import nump

more...

2024-06-163kwords3 mins.

【推理引擎】常见AI推理框架

# 昇腾昇腾官方文档华为昇腾（HUAWEI Ascend）是华为公司推出的一系列人工智能处理器，标志着华为在自主设计人工智能（AI）芯片领域的重要进展。昇腾芯片基于华为自主研发的达芬奇架构，这一架构设计旨在优化 AI 计算的效率和性能，特别是针对深度学习任务进行了专门优化。还可以去找一下《昇腾 AI 处理器架构与编程：深⼊理解 CANN 技术原理及应⽤》等相关书籍。 # NCNN 腾讯 NCNN ncnn 是一个为手机端极致优化的高性能神经网络前向计算框架。 ncnn 从设计之初深刻考虑手机端的部署和使用。无第三方依赖，跨平台，手机端 cpu 的速度快于目前所有已知的开源框架。

more...

2024-06-15364words1 mins.

【3D建模】T110E3卡迪夫蓝调皮肤模型

新的坦克模型，T110E3 卡迪夫蓝调皮肤模型，快要问世了。这里展示制作过程。 # 卡迪夫蓝调皮肤 # 建模过程 # 打印组装 # 最后此模型是摆件，没有行动能力。还是很期待啊。

more...

2024-06-102.8kwords3 mins.

【TVM】C++部署运行TVM

# 前言本篇博客主要介绍如何通过 G++ 编译器编译 C++ 代码，部署 TVM。总感觉，属于我们的时代还没开始，就要结束了呢。 ------ 大家好啊我是暮冬 Z 羡慕 # 现状 TVM 官方文档: 英文文档中文文档主要介绍了通过 Python 脚本和 Python 命令行 tvmc 来编译和部署 TVM。但是以这两种方式部署，部署设备还需要安装 Python 运行环境，带来额外空间占用和开销。显然不能以这种方式部署。 TVM 项目的 howto_deploy 目录下提供了 G++ 编译 C++ 代码部署 TVM 的方式。遗憾的是给的例子没有包含模型的权重.pa

more...