-
Notifications
You must be signed in to change notification settings - Fork 2.3k
quickstart_python
wangzhaode edited this page Mar 25, 2026
·
1 revision
本教程带你从安装到推理,完成一个端到端的图像分类任务。
pip install MNN如果 pip 安装失败(可能是当前系统和 Python 版本不支持),可以从源码编译安装,参考 PyMNN 编译。
以 MobileNet V1 为例,先将 ONNX 模型转换为 MNN 格式:
# 转换为 MNN 格式(附带 8bit 权值量化,体积缩小 75%)
mnnconvert -f ONNX --modelFile mobilenet_v1.onnx --MNNModel mobilenet_v1.mnn --weightQuantBits 8from __future__ import print_function
import numpy as np
import MNN
import MNN.cv as cv2
import sys
def inference(model_path, image_path):
# ========== 1. 加载模型 ==========
# 参数:模型路径、输入名列表、输出名列表
net = MNN.nn.load_module_from_file(model_path, ["input"], ["MobilenetV1/Predictions/Reshape_1"])
# ========== 2. 预处理 ==========
image = cv2.imread(image_path)
image = image[..., ::-1] # BGR -> RGB
image = cv2.resize(image, (224, 224))
image = image - (103.94, 116.78, 123.68)
image = image * (0.017, 0.017, 0.017)
image = image.astype(np.float32)
# 创建输入 VARP:[N, H, W, C] NHWC 格式
input_var = MNN.expr.placeholder([1, 224, 224, 3], MNN.expr.NHWC)
input_var.write(image)
# Module 内部使用 NC4HW4 格式,需要转换
input_var = MNN.expr.convert(input_var, MNN.expr.NC4HW4)
# ========== 3. 推理 ==========
output_var = net.forward([input_var])
output_var = output_var[0]
# ========== 4. 后处理 ==========
# 输出也可能是 NC4HW4,转回 NHWC 再读取
output_var = MNN.expr.convert(output_var, MNN.expr.NHWC)
print("预测类别编号:{}".format(np.argmax(output_var.read())))
if __name__ == "__main__":
inference(sys.argv[1], sys.argv[2])运行:
python classify.py mobilenet_v1.mnn test.jpgconfig = {
'backend': 3, # OpenCL GPU
'precision': 2, # FP16
'numThread': 4,
}
rt = MNN.nn.create_runtime_manager((config,))
rt.set_cache("gpu.cache")
net = MNN.nn.load_module_from_file("mobilenet_v1.mnn",
["input"],
["MobilenetV1/Predictions/Reshape_1"],
runtime_manager=rt)后端选项:0=CPU, 1=Metal, 2=CUDA, 3=OpenCL, 7=Vulkan。详见 PyMNN 完整指南。
- LLM 部署指南 — 部署大语言模型
- 模型压缩 — 权值量化、离线量化、FP16 压缩
- C++ 推理-Module API — C++ 高性能推理接口
- Python API 参考 — 完整 Python API 文档