8GB 内存的卡片 SBC 跑多模态大模型:Qwen3-VL 2B NPU 实战全记录
副标题:从 0 到跑通,CokePi CPM-3588S + rkllama + Qwen3-VL 2B 一周落地 为什么要在边缘跑大模型? 2026 年是边缘 AI 元年。云端大模型再强,也有三个绕不开的问题: 隐私:摄像头画面、麦克风音频不能上云 延迟:网络往返 + API 排队,响应慢 成本: