
2026年5月23日
ローカルAI
10分
GX10でQwenとGemma 4を載せ替えてわかった、ローカルLLM専用機の現実
ASUS Ascent GX10でGemma 4、Qwen3.6、Qwen3-VLをruntimeごとに載せ替えながら、速度、画像入力、tool calling、OpenClaw/Atlasでの使い勝手を見た。tok/sだけではローカルLLM専用機は評価できない。...
2

ASUS Ascent GX10でGemma 4、Qwen3.6、Qwen3-VLをruntimeごとに載せ替えながら、速度、画像入力、tool calling、OpenClaw/Atlasでの使い勝手を見た。tok/sだけではローカルLLM専用機は評価できない。...

GX10で動かしていたQwen3.6 vLLM構成をBF16からNVFP4版へ差し替えた。GPU対応だけではNVFP4実行にはならないが、モデルとruntimeが揃うと手元ベンチでは1.3〜1.4倍ほど速くなった。...

GX10上のQwenをOpenAI互換APIとして起動し、OpenClaw Gateway経由のmodel.runまでは通った。しかしTelegramグループで返答が見えるかは別問題で、最後は表示設定とtool経路の切り分けにハマった。...

Mac Studio上のGemma 4と、ASUS Ascent GX10上のQwenを同じようなAtlas/OpenClaw系タスクで直接比較した。Qwenはかなり速く、Gemmaは少し慎重だった。...

ASUS Ascent GX10のセットアップ後、まずはMac Studio上のMLX Gemma 4 31BとGX10上のllama.cpp CUDA Gemma 4 31Bを比べた。期待とは逆に、今回の条件ではMac Studioの方が速かった。...

Mac StudioからLLM負荷を逃がすため、ASUS Ascent GX10をローカルAI専用機として導入した。Codex Appと一緒にSSH、DGX Dashboard、アップデート、GPUコンテナ確認まで進めた初期セットアップ記録。...