
2026年6月5日
ローカルAI
8分
写真と動画から自動Vlogを作る ローカルAI動画生成パイプライン
インデックス済みの写真と動画から、Qwenのクリップレビュー、STT、人物識別、BGM、LUT、HLSを組み合わせて自動Vlog生成を試した記録です。...
2

インデックス済みの写真と動画から、Qwenのクリップレビュー、STT、人物識別、BGM、LUT、HLSを組み合わせて自動Vlog生成を試した記録です。...

写真サムネイル、動画キーフレーム、STT、EXIF/GPS、人物ラベルを組み合わせて、家庭内メディアを自然言語で検索できるようにした実装メモです。...

外付けストレージにたまった家庭内の写真と動画を、GX10上のQwen、STT、顔検出、SQLite検索でローカルAIメディアライブラリ化する開発記録です。...

Opus 4.7とGX10 Qwenが作った同じSwiftUI電卓アプリのソースを読み、見た目の差がどの制約や状態管理に出ていたのかを確認した。...

Claude CodeのLLMをGX10上のローカルQwenに差し替え、Opus 4.7と同じSwiftUI電卓アプリを作らせた。どちらもビルドとSimulator起動までは到達したが、完成度にははっきり差が出た。...

ASUS Ascent GX10でGemma 4、Qwen3.6、Qwen3-VLをruntimeごとに載せ替えながら、速度、画像入力、tool calling、OpenClaw/Atlasでの使い勝手を見た。tok/sだけではローカルLLM専用機は評価できない。...