746words1 mins.

# 算法原理 算法原理还没写,预计将来补上。可以在网络上搜索算法原理。 # 代码实现 可以在 github 项目 卷积加速算法实现 中下载代码实现,运行其中的测试函数: /*winograd 算法 F (2*2, 3*3)仅用于 3*3 卷积,stride=1, dilation=1推荐 w<120 h<120 in_c>16 out_c>16现已支持 pad 之后添加 dilation*/TestWinogradF23ConvLayer();/*winograd 算法 nchw F (6*6, 3*3
6kwords5 mins.

# 介绍 本文为实现 SystemC 响应异步事件 解决方案。 应用场景: SystemC 是一个支持系统事务级、行为级建模的开源的 C++ library; 我们将 SystemC 仿真的模拟叫做模拟器。在很多场景下,模拟器要保持 alive,等待异步 async 事件,做出对应的处理。例如设计一个 SystemC 消费者模拟器,而生产者程序不属于 SystemC 仿真范畴,消费者模拟器需要一直保持等待,并在出现数据后进行处理。 世界上没有东西是完美的啊,倒不如说,同时拥有光明和阴影才是完美的,这样的你才是真正的你。 ------ 大家好啊 我是 暮冬 Z 羡慕 以上应用场
9.2kwords8 mins.

# 前置信息 (1)本文讲解使用的例子 以如下的卷积为例,进行昇腾 Im2Col 卷积过程: Input 输入维度为 NHWC :【2,25,25,17】 外圈蓝色代表 pad Kernal 维度为 CCHkWk :【34,17,3,3】 操作为 3*3 卷积 pad=1, Group=1, Stride=1, 2D 卷积 得到输出的维度 为 NHWC : 【22,25,25,18】 从图上可以轻易看出相关信息。 现在想起来,光是遇到你这个家伙,就感觉自己赚到了。 ------ 大家好啊 我是 暮冬 Z 羡慕 (2)矩阵乘运算单元 昇腾
2.8kwords3 mins.

# 前言 本篇博客提供简单的 Python 脚本代码,实现 onnx 模型转换编译,保存为 TVM 的 .so .params .json 文件 。 望长城内外,惟余莽莽;大河上下,顿失滔滔。 --------------- 教员 ------ 大家好啊 我是 暮冬 Z 羡慕 # Python 脚本实现模型编译和保存 脚本中需要修改的就一些路径,很容易看明白,就不再过多介绍了。 import onnx from tvm.contrib.download import download_testdata from PIL import Image import nump
3kwords3 mins.

# 昇腾 昇腾官方文档 华为昇腾(HUAWEI Ascend)是华为公司推出的一系列人工智能处理器,标志着华为在自主设计人工智能(AI)芯片领域的重要进展。昇腾芯片基于华为自主研发的达芬奇架构,这一架构设计旨在优化 AI 计算的效率和性能,特别是针对深度学习任务进行了专门优化。 还可以去找一下 《昇腾 AI 处理器架构与编程:深⼊理解 CANN 技术原理及应⽤》等相关书籍。 # NCNN 腾讯 NCNN ncnn 是一个为手机端极致优化的高性能神经网络前向计算框架。 ncnn 从设计之初深刻考虑手机端的部署和使用。 无第三方依赖,跨平台,手机端 cpu 的速度快于目前所有已知的开源框架。
364words1 mins.

新的坦克模型,T110E3 卡迪夫蓝调皮肤模型,快要问世了。这里展示制作过程。 # 卡迪夫蓝调皮肤 # 建模过程 # 打印组装 # 最后 此模型是摆件,没有行动能力。还是很期待啊。
2.8kwords3 mins.

# 前言 本篇博客主要介绍如何通过 G++ 编译器编译 C++ 代码,部署 TVM。 总感觉,属于我们的时代还没开始,就要结束了呢。 ------ 大家好啊 我是 暮冬 Z 羡慕 # 现状 TVM 官方文档: 英文文档 中文文档 主要介绍了通过 Python 脚本和 Python 命令行 tvmc 来编译和部署 TVM。但是以这两种方式部署,部署设备还需要安装 Python 运行环境,带来额外空间占用和开销。显然不能以这种方式部署。 TVM 项目的 howto_deploy 目录下提供了 G++ 编译 C++ 代码部署 TVM 的方式。遗憾的是给的例子没有包含模型的权重.pa
6.2kwords6 mins.

本文讨论了 ncnn 和 tengine 两个框架在量化推理上的逻辑,并比较了它们之间的区别与联系,以及一点自己的思考。 风雨送春归,飞雪迎春到。 已是悬崖百丈冰,犹有花枝俏。 ---- 教员 ------ 大家好啊 我是 暮冬 Z 羡慕 # 量化 这里仅简单介绍一下量化,不会展开,有机会再详细写一下量化算法。 # 什么是量化 量化的核心思想是将连续的浮点数域映射到一个更小的、离散的整数集合上。这通过将浮点数值舍入或映射到最近的整数值来实现,同时保持整个模型表示的动态范围。例如,一个原本使用 32 位浮点数表示的权重值,在量化后可能会被转换为 8 位的整数,这样每个权重只
916words1 mins.

# 坦克世界皮肤图片 IS-7 皮肤台词:" 原来是这样的: 如果有人回到基地,至少一辆坦克,那就算是一次营救任务。如果无人返回,那就是一次侦察任务。那就是他们在总部报告中对我们的分类方式,而我就是参加了一次营救任务。事情是这样的:我们整个小队一起移动,一些奇怪的大雾导致能见度为 0,坦克只能摸索着前行,就好像在牛奶中前进一样。然后坦克出现了。D 系的坦克。我记得它们的外形,也知道如何应对它们。你也知道,我以前经历过一些战事。接下来又遇到了没有沙子的沙尘暴… 我也不知道该怎么解释。我经历了持续的耳鸣,一些嗡嗡的声音。眼睛仿佛沾满了焦油。奇怪的低语。黑暗… 如同活物一般。我们摔
7.3kwords7 mins.

# 前言 最近开始学习 TVM。感觉 TVM 英文文档中 TVM Codebase Walkthrough by Example 一节对于理解 TVM 工程非常有用。本篇文章只是翻译,可以直接跳转查看英文全文。 这个时代有这么多愿意开源并将技术介绍给我们的行业大牛,真是我们的荣幸,膜拜! ------ 大家好啊 我是 暮冬 Z 羡慕 # Codebase Structure Overview 在 TVM 存储库的根目录中,我们有以下子目录,它们共同构成了大部分代码库。 src C++ code for operator compilation and deployme