
2026年6月4日
ローカルAI
8分
Qwenで写真と動画をテキスト化し、人物ラベルまで検索に入れる
写真サムネイル、動画キーフレーム、STT、EXIF/GPS、人物ラベルを組み合わせて、家庭内メディアを自然言語で検索できるようにした実装メモです。...
2

写真サムネイル、動画キーフレーム、STT、EXIF/GPS、人物ラベルを組み合わせて、家庭内メディアを自然言語で検索できるようにした実装メモです。...

外付けストレージにたまった家庭内の写真と動画を、GX10上のQwen、STT、顔検出、SQLite検索でローカルAIメディアライブラリ化する開発記録です。...

Opus 4.7とGX10 Qwenが作った同じSwiftUI電卓アプリのソースを読み、見た目の差がどの制約や状態管理に出ていたのかを確認した。...

Claude CodeのLLMをGX10上のローカルQwenに差し替え、Opus 4.7と同じSwiftUI電卓アプリを作らせた。どちらもビルドとSimulator起動までは到達したが、完成度にははっきり差が出た。...

ASUS Ascent GX10でGemma 4、Qwen3.6、Qwen3-VLをruntimeごとに載せ替えながら、速度、画像入力、tool calling、OpenClaw/Atlasでの使い勝手を見た。tok/sだけではローカルLLM専用機は評価できない。...

GX10で動かしていたQwen3.6 vLLM構成をBF16からNVFP4版へ差し替えた。GPU対応だけではNVFP4実行にはならないが、モデルとruntimeが揃うと手元ベンチでは1.3〜1.4倍ほど速くなった。...