AI 边缘主机

NVIDIA 产品矩阵图

nvidia_topic

AI 边缘硬件

名称	平台芯片	算力（TOPS）	系统支持	网络接口	特色 / 适用场景
Jetson Orin NX	NVIDIA Orin NX	70–100	Ubuntu + JetPack	2× 千兆 + 可选 Wi-Fi	强力推理 / 多模型并发 / 工业机器人
Jetson Xavier NX	NVIDIA Xavier NX	~21	Ubuntu + JetPack	千兆 ×1 + Wi-Fi 可选	中高算力需求，生态好
RK3588 主板	Rockchip RK3588	~6	Android / Ubuntu / Debian	双千兆	国产低成本，适合轻量化图像/文字识别
魔方派3（RUBIK Pi 3）	Qualcomm QCS6490	~30	Android / Qualcomm Linux	双千兆	商用安卓场景，语音+视觉并发应用
HPM6850 模组主板	兆易创新 + NPU	6~8	RTOS / Linux Lite	千兆 ×1	国产中低功耗边缘视觉任务
RK3576 主板	Rockchip RK3576	~12	Android 14 / Linux	双千兆	RK3588 升级版，支持 LPDDR5
鸿鹄 920-AI 开发板	华为海思 + NPU	~8–10	LiteOS / HarmonyOS	千兆 ×1	IoT 视频类分析，国产化平台

NVIDIA Jetson Orin Nano

NVIDIA Jetson Orin Nano™ 开发者套件

NVIDIA Jetson Orin Nano™ 超级开发者套件是一款紧凑而强大的计算机，它重新定义了小型边缘设备的生成式 AI。它提供高达 67 TOPS 的 AI 性能，较上一代提升 1.7 倍，可无缝运行最流行的生成式 AI 模型，例如视觉转换器、大型语言模型、视觉语言模型等。它仅售 249 美元，凭借NVIDIA AI 软件和广泛的 AI 软件生态系统的支持，为开发者、学生和创客提供最经济实惠且易于访问的平台。现有的 Jetson Orin Nano 开发者套件用户只需升级软件即可体验性能提升，因此现在每个人都可以通过生成式 AI 解锁新的可能性。

jetson_orin_nano

Jetson Orin Nano 架构与规格

项目	说明
CPU 架构	6 核 ARM Cortex-A78AE（64 位）
GPU 架构	NVIDIA Ampere 架构 GPU（最多 1024 CUDA 核心）
AI 加速单元	Ampere 架构 Tensor Core，支持 INT8 / FP16 / FP32
内存	最大 8GB LPDDR5，128-bit 带宽
算力（INT8）	20 TOPS（4GB 版本） / 40 TOPS（8GB 版本）
接口支持	PCIe、USB 3.2、CSI 摄像头接口、GPIO、I2C、SPI 等
操作系统	Ubuntu 20.04 + JetPack SDK
开发支持	TensorRT、CUDA、cuDNN、PyTorch、TensorFlow、ONNX 等

RK3588 vs Jetson Orin Nano AI 推理对比表

对比维度	RK3588	Jetson Orin Nano
架构类型	ARM Cortex-A76 + A55 + 独立 NPU	ARM Cortex-A78AE + Ampere GPU + Tensor Core
推理算力（INT8）	6 TOPS	20~40 TOPS（4GB/8GB）
AI 加速方式	专用 NPU 加速器	GPU + Tensor Core 协同推理
支持精度	INT8，部分支持 FP16	INT8 / FP16 / FP32 全支持
模型格式支持	RKNN（由 ONNX/TFLite 转换）	原生支持 ONNX / TFLite / PyTorch / TF
工具链生态	RKNN Toolkit / rknpu2	JetPack SDK / TensorRT / CUDA
部署流程	需预转换、手动配置 RKNN	可直接部署主流 AI 框架模型
性能表现（YOLOv5s）	约 20–30 FPS	约 90–120 FPS
成本（主板）	￥800–1200	￥1500–3500
适合场景	国产化部署 / 成本敏感应用	高性能 AI 推理 / 模型开发实验

RK3588 在 AI 推理领域的主要竞品

竞品名称	芯片厂商	AI 算力（INT8 TOPS）	架构类型	生态/框架支持	典型应用场景
RK3588	Rockchip	~6 TOPS	ARM + 独立 NPU	RKNN Toolkit，支持 ONNX/TFLite	边缘计算、智能监控、机器人
Snapdragon 8cx Gen3	Qualcomm	15-20 TOPS	ARM + Hexagon DSP/NPU	Qualcomm SNPE，支持多框架	轻薄本、平板、边缘AI
MediaTek Dimensity 9200	MediaTek	~20 TOPS	ARM + APU	MediaTek APU SDK	手机、智能设备
NVIDIA Jetson Orin Nano	NVIDIA	20~40 TOPS	ARM + GPU + Tensor Core	JetPack SDK，TensorRT	工业AI、机器人、无人机
Huawei Ascend 310	华为	16 TOPS	专用 AI 加速器	MindSpore，CANN	云端和边缘AI

CUDA 核心和 Tensor 核心

图像预处理（Resize、Color Convert）：
→ 使用 CUDA 核心（OpenCV GPU模块或 NPP）
深度神经网络推理（如 YOLOv8）：
→ 使用 Tensor 核心（通过 TensorRT 推理加速）

📦 Jetson Orin Nano 核心参数概览

型号	CUDA 核心数量	Tensor 核心数量	GPU 架构	最大 AI 性能
Orin Nano 4GB	512	16	Ampere	20 TOPS（INT8）
Orin Nano 8GB	1024	32	Ampere	40 TOPS（INT8）

🎯 作用对比：CUDA 核心 vs Tensor 核心（在 Jetson Orin Nano 上）

项目	CUDA 核心	Tensor 核心
功能	处理通用 GPU 运算：图像处理、计算机视觉、视频解码等	处理 AI 推理（尤其是卷积、矩阵乘加）
主要用途	OpenCV 加速、图像预处理、视频转码、渲染等	TensorRT、Deep Learning（PyTorch、ONNX）推理
数据类型支持	FP32（主）、FP16、INT32	INT8、FP16、TensorFloat32（TF32）
如何使用	用 CUDA/C++ 编写、OpenCV GPU 模块等	使用 TensorRT / DeepStream / PyTorch + TensorCore 支持
可控性	更灵活编程和调度	自动由框架调用加速，用户不直接编程

📦 Jetson Orin Nano 在物流分拣中心的应用

场景	作用	使用模块
📦 快递包裹识别	识别快递单、二维码、条码	摄像头 + Orin Nano + OCR模型
🎯 自动分拣引导	判断包裹目标区域或滑槽	目标检测模型（如 YOLO）
🧠 尺寸/体积估算	结合深度摄像头进行体积判断	Depth Camera + 推理 + OpenCV
🏷️ 标签/面单缺陷检测	检测是否缺少或损坏	图像分类/检测模型
🤖 与PLC/机械臂协同	下发控制信号	GPIO/串口/CAN 通信
🕸️ 边缘网关 + 云端协同	仅上传识别结果，降低网络压力	MQTT/HTTP + 云平台 API

国内高校学习AI常用平台

平台	主要特点	使用情况
NVIDIA Jetson 系列	生态成熟，支持深度学习全套工具，适合视觉、机器人等课程	多数高校AI、机器人、嵌入式方向主力教学平台
华为昇腾（Ascend）系列	国产AI芯片，配合MindSpore框架，注重云边协同	部分重点高校及科研院所引入，尤其AI基础研究
寒武纪（Cambricon）	国产AI芯片，强调神经网络推理，部分高校实验室使用	AI芯片教学、国产软硬件实践项目
英特尔 Movidius + OpenVINO	轻量级视觉AI加速，适合低功耗嵌入式实验	AI视觉课题与低功耗设备教学
Google Coral Edge TPU	低功耗，适合TensorFlow Lite教学	部分高校做嵌入式AI入门
通用云平台（阿里云、腾讯云、华为云）	云端AI训练与推理，配合线上教学	大量高校课程采用云端资源进行大规模模型训练

Jetson Orin Nano 学习必备技术基础清单

技术领域	是否必须	建议水平	说明
Python 编程	✅ 必须	中级	用于调用 AI 框架、运行推理脚本、处理图像等
Linux 操作系统	✅ 必须	中级	Jetson 运行 Ubuntu；需掌握命令行、软件安装、权限管理等
深度学习基础	✅ 必须	入门-中级	了解 CNN、模型结构、推理与训练的区别，模型格式（如 ONNX）等
AI 框架（PyTorch / TensorFlow）	✅ 必须	入门	能使用基本框架加载模型并运行推理
OpenCV / 图像处理	🟡 建议	入门	摄像头读取、图像预处理、可视化
Jetson 平台知识	🟡 建议	可学习	JetPack SDK、CUDA、TensorRT、硬件接口配置等
嵌入式开发基础	🟠 可选	初步了解	GPIO、I2C、SPI 等，适用于机器人、自动化等场景
C++ 编程	🟠 可选	初步了解	如果使用 C++ 示例或对性能有要求时可选
模型优化知识（TensorRT / INT8 / FP16）	🟠 可选	可后学	部署到产品中时提升推理速度、降低功耗

RK3588

NVIDIA 产品矩阵图

AI 边缘硬件

NVIDIA Jetson Orin Nano

Jetson Orin Nano 架构与规格

RK3588 vs Jetson Orin Nano AI 推理对比表

RK3588 在 AI 推理领域的主要竞品

CUDA 核心和 Tensor 核心

📦 Jetson Orin Nano 核心参数概览

🎯 作用对比：CUDA 核心 vs Tensor 核心（在 Jetson Orin Nano 上）

📦 Jetson Orin Nano 在物流分拣中心的应用

国内高校学习AI常用平台

Jetson Orin Nano 学习必备技术基础清单

CATALOG

FEATURED TAGS

FRIENDS

NVIDIA 产品矩阵图

AI 边缘硬件

NVIDIA Jetson Orin Nano

Jetson Orin Nano 架构与规格

RK3588 vs Jetson Orin Nano AI 推理对比表

RK3588 在 AI 推理领域的主要竞品

CUDA 核心 和 Tensor 核心

📦 Jetson Orin Nano 核心参数概览

🎯 作用对比：CUDA 核心 vs Tensor 核心（在 Jetson Orin Nano 上）

📦 Jetson Orin Nano 在物流分拣中心的应用

国内高校学习AI常用平台

Jetson Orin Nano 学习必备技术基础清单

CATALOG

FEATURED TAGS

FRIENDS

CUDA 核心和 Tensor 核心