tnn

2024/4/13 0:23:40

NCNN 模型推理详解及实战

一,依赖库知识速学 aarch64 aarch64,也被称为 ARM64,是一种基于 ARMv8-A 架构的 64 位指令集体系结构。它是 ARM 体系结构的最新版本,旨在提供更好的性能和能效比。与先前的 32 位 ARM 架构相比,aarch64 具有更大的寻址空间、更多的寄存器和更好的浮点性能。 在 Linux …

TNN MatConverter Resize

TNN 的 resize 虽然分通道提供了多个接口,但底层是一起的。整个实现对于灰度图优化非常有限,而3通道或4通道的图像会有加速。缩放的映射关系较为简单,主要分为三步: 一维位置索引和插值系数计算;行内像素插值&#xf…

TNN MatConverter WarpAffine

TNN 的仿射变换形态介于 OpenCV 和 ncnn 之间。其处理流程与 OpenCV 较为相似并做了一些优化,不同的地方在于数据处理宽度为4,比较小。在性能表现方面中规中矩,小图上不及 ncnn。 MatUtils::WarpAffine #mermaid-svg-FNwIOkXOm8kxHfXI .labe…

TNN MatConverter CvtColor NV21TOBGR

OpenCV 中的 carotene 对于 armv7优化较好&#xff0c;而 armv8下则是 NEON 实现。TNN 提供了一套图像预处理接口并且进行了汇编优化。下面以 NV21TOBGR 为例进行介绍。 MatUtils 无成员变量&#xff0c;全部为静态函数。 public://copy cpu <-> device, cpu<->…