用户用四块RTX 4090打造Jarvis级语音助手,称Gemma 4 31B QAT模型表现最佳
一名本地AI爱好者打造了一款私人语音助手,具备语音验证、唤醒词、持续对话、Home Assistant控制、Hermes Agent集成和深度研究等高级功能。系统运行在一台定制服务器上,配备四块改造后的RTX 4090(共192GB显存)、128GB DDR5内存和3000W电源,通过240V/30A烘干机线路供电。在测试了Qwen 397B、MiniMax M3、Nemotron 3 Ultra和GLM 4.7/5.2等大模型后,用户发现谷歌的Gemma 4 31B QAT表现优于所有这些模型,且在同尺寸下速度惊人。该助手通过会议扬声器麦克风部署全家,热量由洗衣房排风扇管理。