3kwords3 mins.

# 昇腾 昇腾官方文档 华为昇腾(HUAWEI Ascend)是华为公司推出的一系列人工智能处理器,标志着华为在自主设计人工智能(AI)芯片领域的重要进展。昇腾芯片基于华为自主研发的达芬奇架构,这一架构设计旨在优化 AI 计算的效率和性能,特别是针对深度学习任务进行了专门优化。 还可以去找一下 《昇腾 AI 处理器架构与编程:深⼊理解 CANN 技术原理及应⽤》等相关书籍。 # NCNN 腾讯 NCNN ncnn 是一个为手机端极致优化的高性能神经网络前向计算框架。 ncnn 从设计之初深刻考虑手机端的部署和使用。 无第三方依赖,跨平台,手机端 cpu 的速度快于目前所有已知的开源框架。
364words1 mins.

新的坦克模型,T110E3 卡迪夫蓝调皮肤模型,快要问世了。这里展示制作过程。 # 卡迪夫蓝调皮肤 # 建模过程 # 打印组装 # 最后 此模型是摆件,没有行动能力。还是很期待啊。
2.8kwords3 mins.

# 前言 本篇博客主要介绍如何通过 G++ 编译器编译 C++ 代码,部署 TVM。 总感觉,属于我们的时代还没开始,就要结束了呢。 ------ 大家好啊 我是 暮冬 Z 羡慕 # 现状 TVM 官方文档: 英文文档 中文文档 主要介绍了通过 Python 脚本和 Python 命令行 tvmc 来编译和部署 TVM。但是以这两种方式部署,部署设备还需要安装 Python 运行环境,带来额外空间占用和开销。显然不能以这种方式部署。 TVM 项目的 howto_deploy 目录下提供了 G++ 编译 C++ 代码部署 TVM 的方式。遗憾的是给的例子没有包含模型的权重.pa
6.2kwords6 mins.

本文讨论了 ncnn 和 tengine 两个框架在量化推理上的逻辑,并比较了它们之间的区别与联系,以及一点自己的思考。 风雨送春归,飞雪迎春到。 已是悬崖百丈冰,犹有花枝俏。 ---- 教员 ------ 大家好啊 我是 暮冬 Z 羡慕 # 量化 这里仅简单介绍一下量化,不会展开,有机会再详细写一下量化算法。 # 什么是量化 量化的核心思想是将连续的浮点数域映射到一个更小的、离散的整数集合上。这通过将浮点数值舍入或映射到最近的整数值来实现,同时保持整个模型表示的动态范围。例如,一个原本使用 32 位浮点数表示的权重值,在量化后可能会被转换为 8 位的整数,这样每个权重只
916words1 mins.

# 坦克世界皮肤图片 IS-7 皮肤台词:" 原来是这样的: 如果有人回到基地,至少一辆坦克,那就算是一次营救任务。如果无人返回,那就是一次侦察任务。那就是他们在总部报告中对我们的分类方式,而我就是参加了一次营救任务。事情是这样的:我们整个小队一起移动,一些奇怪的大雾导致能见度为 0,坦克只能摸索着前行,就好像在牛奶中前进一样。然后坦克出现了。D 系的坦克。我记得它们的外形,也知道如何应对它们。你也知道,我以前经历过一些战事。接下来又遇到了没有沙子的沙尘暴… 我也不知道该怎么解释。我经历了持续的耳鸣,一些嗡嗡的声音。眼睛仿佛沾满了焦油。奇怪的低语。黑暗… 如同活物一般。我们摔
7.3kwords7 mins.

# 前言 最近开始学习 TVM。感觉 TVM 英文文档中 TVM Codebase Walkthrough by Example 一节对于理解 TVM 工程非常有用。本篇文章只是翻译,可以直接跳转查看英文全文。 这个时代有这么多愿意开源并将技术介绍给我们的行业大牛,真是我们的荣幸,膜拜! ------ 大家好啊 我是 暮冬 Z 羡慕 # Codebase Structure Overview 在 TVM 存储库的根目录中,我们有以下子目录,它们共同构成了大部分代码库。 src C++ code for operator compilation and deployme
3.5kwords3 mins.

本文为最基本的 Im2Col 算法的原理及实现。 【Im2Col】卷积加速算法 NCHW 【1】中已经讲了在输入和输出都是 nchw 排布下 Im2Col 算法的实现方式。常见的 tensor 输入有 NCHW 和 NHWC 两种内存排布方式,不同的排布方式各有优劣。排布方式不同,Im2Col 也有区别,本篇主要是在 NHWC 内存排布情况下的 Im2Col 算法原理和基本实现。 慌乱的时候全是破绽,冷静下来,能够找到对方的破绽。 ------ 大家好啊 我是 暮冬 Z 羡慕 # 两种内存排布 卷积神经网络(CNN)的输入数据布局主要有两种标准:NCHW(通道、高度、宽度)和
5.6kwords5 mins.

本文为最基本的 Im2Col 算法的原理及实现。 加速算法道阻且长,想要选择最优的算法,需要通盘考虑现实需求、软件算法、硬件支持,这就是 “坚持理论联系实际”。 所以这里只是对 Im2Col 算法最基本的原理探讨。 探索本就是由正确和错误交织而成,还望各位不吝赐教! 现在想起来,光是遇到你这个家伙,就感觉自己赚到了。 ------ 大家好啊 我是 暮冬 Z 羡慕 # 卷积算法 将 Im2col 算法之前,不得不再提一下卷积。卷积是一种运算,在神经网络中是提取特征的过程,具体的操作过程是在输入特征中不断滑动卷积核大小的窗口,与卷积核做乘加运算,得到输出结果。 先定义一下维度的符
2.1kwords2 mins.

# 编译 在官网上下载 zip 或通过 git 下载: weget https://github.com/OpenMathLib/OpenBLAS.git将文件解压后进入工程主目录 编译 openblas 库 hmake -j32导出 依赖库 make install PREFIX=/path/to/your/admire# cblas_sgemm 函数 ccblas_sgemm(order, transA, transB, M, N, K, ALPHA, A, LDA, B, LDB, BETA, C,
8kwords7 mins.

本文为 C 语言工程调用 C++ 库的解决方案。 应用场景: 需要 C++ 程序编译成的库提供函数接口,来解决 C 语言工程的需求。 想要快速解决问题,直接看 三、通用解决方法 人的出场顺序真的很重要,很多人如果换一个时间认识,换一个时间共处,一切都将是不一样的场景,不一样的结局。所以,人生有无限种可能,我的人生,是现在这一种。感谢大家恰到好处的出现,组成我最好的一种可能。 ------ 大家好啊 我是 暮冬 Z 羡慕 # C++ 库可以编辑的情况 C++ 库由自己编写,可以决定头文件书写的位置 // hello.cpp#include "hel