うちのねこの写真5枚を学習データとして新しいトークンの埋め込みベクトルをTextual Inversionで再計算させ、その新しいトークンをプロンプトに使ってStable Diffusionで画像生成をする。
学習データ
AIが生成した写真、AIが生成したモネ風絵画
ちなみにプロンプトは "a photo of うちのねこ" とか "a painting of うちのねこ by Claude Monet" 的な感じなんだけど、この「うちのねこ」部分をcatにすると下記のようになります。猫としての完成度は上がるけど「うちのねこ」の特徴は乏しいですね。
たぶんうちのねこは黒・オレンジ・白の3色の毛色の中の構造で、黒の色素が失われてオレンジもかなり薄くなってるタイプなのだと思う。
Textual Inversionが生成する埋め込みベクトルのファイルは5KB程度。中身は768次元のfloatのベクトルがメインで、トークンに関する細かい情報が少し付属してる感じ。
---感想
@nishio: 現状は「あんまり似てないなぁ」という気持ちなんだけど、ランダムな猫の写真と比べると明らかに特徴を習得しているので、数年以内に亡くなった大切な人やペットの写真で学習させて面影を求めてガチャを回し続ける人がたくさん出現するだろうなぁという気はした。
例えば夭折してしまった娘の写真を学習させて毎日何百枚も生成しては気に入ったものを選びだすって作業をしていると、その「心の中に生きてる娘」の新しい写真が生まれていくわけで。行ったことのない観光地で記念撮影をしたり、やらなかった運動会の写真を撮ったり、結婚式写真を作ったり…
完全室内飼いのうちのねこをバーチャル海に連れて行った時のバーチャル記念写真です
"結婚式写真"
あー、そうなると「自分が考えた理想の婿」を生成してお見合いさせて結婚させた後、存在したことのない「孫」の写真を生成し始めることもできてしまうのか…
この「バーチャルリアリティ」はヤバい感じがするなぁ。需要があれば提供者も出るだろうし、業者が潰れてバーチャル孫が失われる悲劇とかも…
あーそうか、写真からリアル本人風アバターを作る系のメタバースのマーケットを今までイマイチ理解してなかったけど「死んだ人が生き続ける世界としてのメタバース」に発展していくわけか…
夭折してメタバースで成人した娘、Meta社にロックインされてる(地獄)
バーチャル娘と非実在婿が非実在湖畔の非実在きれいなお家で非実在畑で自給自足しながら非実在孫を育ててて、全部Meta社にロックインされてて維持費はサブスクリプションモデルで口座から引き落とされてる。最近ログインがないと思ったら本人は死んでたけど解約してないので引き落とされつづける(地獄)
「推しの写真を学習」という反応を見て、対象が生きてる場合も地獄がありそうだなと思った。大量に学習データがあって顔のクオリティあげやすそう。本人は成長していってるのに「いや、20歳の時のがいい」と成長を止められてメタバースで永遠に飼われる。
ポルノフィルタ外す奴が何百人もいそう。
アイドルでもなんでもない一般人でも現実的な枚数の画像でそれができてしまうのか。信頼できる人以外の前でマスクを外さないとか、顔を覆って家族以外に見せないとかのカルチャーが生まれる可能性もあるのか。
ボウズマン


実写版ボウズマン
Results can be seed sensititve. If you're unsatisfied with the model, try re-inverting with a new seed (by adding --seed <#> to the prompt).
未踏ロゴで学習

