MNN

MNN is a blazing fast, lightweight deep learning framework, battle-tested by business-critical use cases in Alibaba. Full multimodal LLM Android App:[MNN-LLM-Android](./apps/Android/MnnLlmChat/README.md). MNN TaoAvatar Android - Local 3D Avatar Intelligence: apps/Android/Mnn3dAvatar/README.md

MNN 3.4.0 版本发布说明

发布日期: 2026年2月

📌 版本概述

MNN 3.4.0 版本聚焦于 GPU/QNN 后端能力深化、Attention 计算及长文本内存优化 与 GPU 线上运行稳定性 三大核心主题：

GPU/QNN 能力深化: Vulkan 后端新增 LLM 推理支持并引入 CoopMat 矩阵加速指令；Metal 后端支持 TensorAPI 和 Flash Attention；QNN 后端扩展支持 Qwen3 系列和 VL 模型，并新增 Python 直接导出和 OmniQuant 量化能力。
Attention 与长文本内存优化: CPU 和 Metal 后端全面支持 Flash Attention；CPU 支持 KV Cache 量化；新增 Prefix KV Cache 支持；新增统一的 attention_mode 配置选项，为长文本场景显著降低内存占用。
GPU 线上运行稳定性: 新增 iOS 后台检测机制，当 APP 切到后台时 GPU 计算会被系统拒绝，现在会正确返回错误码；修复多个 GPU 后端的稳定性问题。

🚀 版本亮点

Vulkan LLM 支持: Vulkan 后端新增 LLM 推理支持，覆盖更多 Android 设备
Vulkan CoopMat 加速: Vulkan 支持协作矩阵 (CoopMat) 指令，大幅加速矩阵乘法运算
Metal TensorAPI 支持: Metal 后端支持 TensorAPI，M5 芯片性能大幅提升
Metal Flash Attention: Metal 后端实现 Flash Attention，显著降低内存占用
CPU Flash Attention: CPU 后端支持 Flash Attention，新增统一配置选项

MNN 3.4.0 版本发布说明

发布日期: 2026年2月

📌 版本概述

MNN 3.4.0 版本聚焦于 GPU/QNN 后端能力深化、Attention 计算及长文本内存优化 与 GPU 线上运行稳定性 三大核心主题：

GPU/QNN 能力深化: Vulkan 后端新增 LLM 推理支持并引入 CoopMat 矩阵加速指令；Metal 后端支持 TensorAPI 和 Flash Attention；QNN 后端扩展支持 Qwen3 系列和 VL 模型，并新增 Python 直接导出和 OmniQuant 量化能力。
Attention 与长文本内存优化: CPU 和 Metal 后端全面支持 Flash Attention；CPU 支持 KV Cache 量化；新增 Prefix KV Cache 支持；新增统一的 attention_mode 配置选项，为长文本场景显著降低内存占用。
GPU 线上运行稳定性: 新增 iOS 后台检测机制，当 APP 切到后台时 GPU 计算会被系统拒绝，现在会正确返回错误码；修复多个 GPU 后端的稳定性问题。

🚀 版本亮点

Vulkan LLM 支持: Vulkan 后端新增 LLM 推理支持，覆盖更多 Android 设备
Vulkan CoopMat 加速: Vulkan 支持协作矩阵 (CoopMat) 指令，大幅加速矩阵乘法运算
Metal TensorAPI 支持: Metal 后端支持 TensorAPI，M5 芯片性能大幅提升
Metal Flash Attention: Metal 后端实现 Flash Attention，显著降低内存占用
CPU Flash Attention: CPU 后端支持 Flash Attention，新增统一配置选项

MNN

3.4.0

MNN 3.4.0 版本发布说明

📌 版本概述

🚀 版本亮点

Related Projects

mapbox-navigation-android

ToastFish

barcodelib

haze

3.4.0

MNN 3.4.0 版本发布说明

📌 版本概述

🚀 版本亮点

✨ 新功能

LLM/VLM

GPU、QNN 后端

工具与应用

⚡ 性能优化

🐛 缺陷修复

📚 其他改进

🙏 致谢

📦 不兼容变更

MNN 3.4.0 Release Notes

📌 Overview

🚀 Highlights

✨ New Features

LLM/VLM

GPU/QNN Backends

Tools & Apps

⚡ Performance Optimizations

🐛 Bug Fixes

📚 Other Improvements

🙏 Acknowledgements

📦 Breaking Changes

Related Projects

mapbox-navigation-android

ToastFish

barcodelib

haze