Android 平台运行 ONNX 模型指南 | 极客日志

JavaAIjava算法

Android 平台运行 ONNX 模型指南

综述由AI生成在 Android 平台运行 ONNX 模型的多种方案，重点讲解了 ONNX Runtime 的使用。内容包括与其他框架（TensorFlow Lite、MNN、NCNN）的比较，以及 ONNX Runtime 的集成步骤，如依赖添加、Session 初始化、输入输出张量处理和硬件加速配置。文章提供了目标检测（YOLOv8）和本地语音听写（SherpaOnnx）的代码示例，涵盖多输入节点解析与后处理逻辑，适用于移动端高性能推理场景。

星河入梦发布于 2026/3/22更新于 2026/5/2015K 浏览

Android 平台运行 ONNX 模型

概述

ONNX（Open Neural Network Exchange）模型在 Android 平台上的推理主要依赖微软开源的跨平台推理引擎 ONNX Runtime。它支持在 Android 设备上高效运行机器学习模型。

实现方法

1. 使用 ONNX Runtime

ONNX Runtime 是由微软开发的高性能推理引擎，支持在 Android 平台上运行 ONNX 模型。它提供了高效的优化和跨平台支持。

2. 使用 TensorFlow Lite（转换 ONNX 模型）

TensorFlow Lite 是 Android 上常用的轻量级深度学习框架。虽然它原生不支持 ONNX 模型，但可以通过转换工具将 ONNX 模型转换为 TFLite 格式。

3. 使用 PyTorch Mobile

如果 ONNX 模型是从 PyTorch 导出的，可以考虑直接使用 PyTorch Mobile 运行模型，绕过 ONNX 格式（或在必要时转换）。

4. 使用 MNN（Mobile Neural Network）

MNN 是阿里巴巴开发的轻量级推理框架，支持 ONNX 模型，适用于 Android 平台。

5. 使用 NCNN

NCNN 是腾讯优图开发的移动端推理框架，也支持 ONNX 模型。

比较与建议

方法	优点	缺点	适用场景
ONNX Runtime	高性能、硬件加速、跨平台	需要学习 API	通用、高性能推理
TensorFlow Lite	移动端优化、广泛支持	模型转换复杂	轻量级、资源受限设备
PyTorch Mobile	适合 PyTorch 模型、优化良好	不直接支持 ONNX	PyTorch 模型直接部署
MNN	轻量级、多格式支持	社区较小	资源受限设备、跨格式支持
NCNN	高性能、低内存占用	转换复杂、C++ 接口	高性能、低资源需求场景

建议：

如果追求简单性和高性能，ONNX Runtime 是首选，适合大多数场景。
如果模型复杂且需要移动端优化，考虑将 ONNX 转换为 TFLite 或 MNN。
如果模型来自 PyTorch，PyTorch Mobile 是更直接的选择。
对于极致性能和低资源占用，NCNN 是不错的选择，但需要更多开发工作。

注意事项

模型优化：运行前可使用 ONNX 优化工具（如 onnx-simplifier）简化模型，减少计算量。
硬件加速：根据设备支持，选择合适的硬件加速选项（如 NNAPI、GPU）。
兼容性测试：不同框架对 ONNX 算子的支持程度不同，需测试模型兼容性。
安全性：确保模型文件存储在安全位置，避免泄露。

尝试 ONNX Runtime

实现步骤：

预处理输入：根据模型输入要求，将数据（例如图像或张量）转换为格式。

相关免费在线工具

Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online

OnnxTensor

SessionOptions options = new SessionOptions();
options.addNnapi();

OnnxTensor inputTensor = OnnxTensor.createTensor(env, inputData);
Map<String, OnnxTensor> inputs = new HashMap<>();
inputs.put("input_name", inputTensor);
OrtSession.Result outputs = session.run(inputs);

import ai.onnxruntime.OnnxTensor;
import ai.onnxruntime.OrtEnvironment;
import ai.onnxruntime.OrtSession;

OrtEnvironment env = OrtEnvironment.getEnvironment();
OrtSession session = env.createSession(modelPath, new OrtSession.SessionOptions());

implementation 'com.microsoft.onnxruntime:onnxruntime-android:1.18.0'

inputNames: x, h, c, inputNode:x: [1, 512], FLOAT 
inputNode:h: [2, 1, 64], FLOAT 
inputNode:c: [2, 1, 64], FLOAT 
outputNames: prob, new_h, new_c, outputNode: prob: [1, 1], FLOAT 
outputNode: new_h: [2, 1, 64], FLOAT 
outputNode: new_c: [2, 1, 64], FLOAT

val inputs = mapOf(
    "image_input" to imageTensor,
    "text_input" to textTensor
)
val result = session.run(inputs)

val outputNames = session.outputNames // 例如 ["boxes", "scores"]
session.use { it.run(inputs).use { result ->
    val boxes = result.get("boxes") as OnnxTensor
    val scores = result.get("scores") as OnnxTensor
    // 处理 boxes 和 scores
}}

│ ├── main
│ │   ├── AndroidManifest.xml
│ │   ├── assets //测试图片
│ │   │   ├── test_object_detection_0.jpg
│ │   │   └── test_object_detection_1.jpg
│ │   ├── java
│ │   │   └── ai
│ │   │       └── onnxruntime
│ │   │           └── example
│ │   │               └── objectdetection
│ │   │                   ├── MainActivity.kt //主界面
│ │   │                   └── ObjectDetector.kt //关键调用模型实现
│ │   └── res
│ │       ├── drawable
│ │       ├── raw
│ │       │   ├── classes.txt //分类标签
│ │       │   └── yolov8n_with_pre_post_processing.onnx //模型文件
│ │       ├── values
│ │       │   ├── colors.xml
│ │       │   ├── ids.xml
│ │       │   ├── strings.xml
│ │       │   └── themes.xml
│ │       └── xml
│ │           ├── backup_rules.xml
│ │           └── data_extraction_rules.xml

package ai.onnxruntime.example.objectdetection

import ai.onnxruntime.*
import ai.onnxruntime.extensions.OrtxPackage
import android.annotation.SuppressLint
import android.graphics.Bitmap
import android.graphics.BitmapFactory
import android.graphics.Canvas
import android.graphics.Color
import android.graphics.Paint
import android.graphics.PorterDuff
import android.graphics.PorterDuffXfermode
import android.os.Bundle
import android.util.Log
import android.widget.Button
import android.widget.ImageView
import android.widget.Toast
import androidx.appcompat.app.AppCompatActivity
import kotlinx.coroutines.*
import java.io.InputStream
import java.util.*

class MainActivity : AppCompatActivity() {
    private var ortEnv: OrtEnvironment = OrtEnvironment.getEnvironment()
    private lateinit var ortSession: OrtSession
    private lateinit var inputImage: ImageView
    private lateinit var outputImage: ImageView
    private lateinit var objectDetectionButton: Button
    private var imageid = 0
    private lateinit var classes: List<String>

    @SuppressLint("UseCompatLoadingForDrawables")
    override fun onCreate(savedInstanceState: Bundle?) {
        super.onCreate(savedInstanceState)
        setContentView(R.layout.activity_main)
        inputImage = findViewById(R.id.imageView1)
        outputImage = findViewById(R.id.imageView2)
        objectDetectionButton = findViewById(R.id.object_detection_button)
        inputImage.setImageBitmap(BitmapFactory.decodeStream(readInputImage()))
        imageid = 0
        classes = readClasses()

        // Initialize Ort Session and register the onnxruntime extensions package that contains the custom operators.
        // Note: These are used to decode the input image into the format the original model requires,
        // and to encode the model output into png format
        val sessionOptions: OrtSession.SessionOptions = OrtSession.SessionOptions()
        sessionOptions.registerCustomOpLibrary(OrtxPackage.getLibraryPath())
        // 从 raw 中读取模型文件进行初始化
        ortSession = ortEnv.createSession(readModel(), sessionOptions)

        objectDetectionButton.setOnClickListener {
            try {
                // 启动算法检测
                performObjectDetection(ortSession)
                Toast.makeText(baseContext, "ObjectDetection performed!", Toast.LENGTH_SHORT).show()
            } catch (e: Exception) {
                Log.e(TAG, "Exception caught when perform ObjectDetection", e)
                Toast.makeText(baseContext, "Failed to perform ObjectDetection", Toast.LENGTH_SHORT).show()
            }
        }
    }

    override fun onDestroy() {
        super.onDestroy()
        ortEnv.close()
        ortSession.close()
    }

    private fun updateUI(result: Result) {
        val mutableBitmap: Bitmap = result.outputBitmap.copy(Bitmap.Config.ARGB_8888, true)
        val canvas = Canvas(mutableBitmap)
        val paint = Paint()
        paint.color = Color.WHITE // Text Color
        paint.textSize = 28f // Text Size
        paint.xfermode = PorterDuffXfermode(PorterDuff.Mode.SRC_OVER) // Text Overlapping Pattern
        canvas.drawBitmap(mutableBitmap, 0.0f, 0.0f, paint)
        var boxit = result.outputBox.iterator()
        while (boxit.hasNext()) {
            var box_info = boxit.next()
            canvas.drawText("%s:%.2f".format(classes[box_info[5].toInt()], box_info[4]), box_info[0] - box_info[2] / 2, box_info[1] - box_info[3] / 2, paint)
        }
        outputImage.setImageBitmap(mutableBitmap)
    }

    private fun readModel(): ByteArray {
        val modelID = R.raw.yolov8n_with_pre_post_processing
        return resources.openRawResource(modelID).readBytes()
    }

    private fun readClasses(): List<String> {
        return resources.openRawResource(R.raw.classes).bufferedReader().readLines()
    }

    private fun readInputImage(): InputStream {
        imageid = imageid.xor(1)
        return assets.open("test_object_detection_${imageid}.jpg")
    }

    // 调用算法并读取解析结果，最后更新 UI
    private fun performObjectDetection(ortSession: OrtSession) {
        var objDetector = ObjectDetector()
        var imagestream = readInputImage()
        inputImage.setImageBitmap(BitmapFactory.decodeStream(imagestream))
        imagestream.reset()
        var result = objDetector.detect(imagestream, ortEnv, ortSession)
        updateUI(result)
    }

    companion object {
        const val TAG = "ORTObjectDetection"
    }
}

package ai.onnxruntime.example.objectdetection

import ai.onnxruntime.OnnxJavaType
import ai.onnxruntime.OrtSession
import ai.onnxruntime.OnnxTensor
import ai.onnxruntime.OrtEnvironment
import android.graphics.Bitmap
import android.graphics.BitmapFactory
import java.io.InputStream
import java.nio.ByteBuffer
import java.util.*

internal data class Result(var outputBitmap: Bitmap, var outputBox: Array<FloatArray>) {}

internal class ObjectDetector() {
    fun detect(inputStream: InputStream, ortEnv: OrtEnvironment, ortSession: OrtSession): Result {
        // Step 1: convert image into byte array (raw image bytes)
        val rawImageBytes = inputStream.readBytes()
        // Step 2: get the shape of the byte array and make ort tensor
        val shape = longArrayOf(rawImageBytes.size.toLong())
        val inputTensor = OnnxTensor.createTensor(
            ortEnv, ByteBuffer.wrap(rawImageBytes), shape, OnnxJavaType.UINT8
        )
        inputTensor.use {
            // Step 3: call ort inferenceSession run
            val output = ortSession.run(Collections.singletonMap("image", inputTensor), setOf("image_out", "scaled_box_out_next"))
            // Step 4: output analysis
            output.use {
                val rawOutput = (output?.get(0)?.value) as ByteArray
                val boxOutput = (output?.get(1)?.value) as Array<FloatArray>
                val outputImageBitmap = byteArrayToBitmap(rawOutput)
                // Step 5: set output result
                var result = Result(outputImageBitmap, boxOutput)
                return result
            }
        }
    }
}

private fun byteArrayToBitmap(data: ByteArray): Bitmap {
    return BitmapFactory.decodeByteArray(data, 0, data.size)
}

├── main
│   ├── AndroidManifest.xml
│   ├── assets
│   │   ├── sherpa-onnx-paraformer-zh-2023-09-14
│   │   │   ├── model.int8.onnx
│   │   │   └── tokens.txt
│   │   └── silero_vad.onnx
│   ├── java
│   │   └── com
│   │       └── k2fsa
│   │           └── sherpa
│   │               └── onnx
│   │                   ├── FeatureConfig.kt
│   │                   ├── HomophoneReplacerConfig.kt
│   │                   ├── MainActivity.kt
│   │                   ├── OfflineRecognizer.kt
│   │                   ├── OfflineStream.kt
│   │                   └── Vad.kt
│   ├── jniLibs
│   │   ├── arm64-v8a
│   │   │   ├── libonnxruntime4j_jni.so
│   │   │   ├── libonnxruntime.so
│   │   │   ├── libsherpa-onnx-c-api.so
│   │   │   ├── libsherpa-onnx-cxx-api.so
│   │   │   └── libsherpa-onnx-jni.so
│   │   ├── armeabi-v7a
│   │   │   ├── libonnxruntime4j_jni.so
│   │   │   ├── libonnxruntime.so
│   │   │   ├── libsherpa-onnx-c-api.so
│   │   │   ├── libsherpa-onnx-cxx-api.so
│   │   │   └── libsherpa-onnx-jni.so
│   │   ├── x86
│   │   │   ├── libonnxruntime4j_jni.so
│   │   │   ├── libonnxruntime.so
│   │   │   ├── libsherpa-onnx-c-api.so
│   │   │   ├── libsherpa-onnx-cxx-api.so
│   │   │   └── libsherpa-onnx-jni.so
│   │   └── x86_64
│   │       ├── libonnxruntime4j_jni.so
│   │       ├── libonnxruntime.so
│   │       ├── libsherpa-onnx-c-api.so
│   │       ├── libsherpa-onnx-cxx-api.so
│   │       └── libsherpa-onnx-jni.so
│   └── res
│       ├── drawable
│       ├── layout
│       ├── mipmap-anydpi-v26
│       ├── mipmap-hdpi
│       ├── mipmap-mdpi
│       ├── mipmap-xhdpi
│       ├── mipmap-xxhdpi
│       ├── mipmap-xxxhdpi
│       ├── values
│       ├── values-night
│       └── xml

Android 平台运行 ONNX 模型指南

Android 平台运行 ONNX 模型

概述

实现方法

1. 使用 ONNX Runtime

2. 使用 TensorFlow Lite（转换 ONNX 模型）

3. 使用 PyTorch Mobile

4. 使用 MNN（Mobile Neural Network）

5. 使用 NCNN

比较与建议

注意事项

尝试 ONNX Runtime

更多推荐文章

相关免费在线工具

解析 ONNX

示例解读

扩展：ASR，本地语音听写的实现 (SherpaOnnxVadAsr)

参考资料

更多推荐文章

相关免费在线工具

Android 平台运行 ONNX 模型指南

Android 平台运行 ONNX 模型

概述

实现方法

1. 使用 ONNX Runtime

2. 使用 TensorFlow Lite（转换 ONNX 模型）

3. 使用 PyTorch Mobile

4. 使用 MNN（Mobile Neural Network）

5. 使用 NCNN

比较与建议

注意事项

尝试 ONNX Runtime

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

解析 ONNX

示例解读

扩展：ASR，本地语音听写的实现 (SherpaOnnxVadAsr)

参考资料

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具