201
きた!
テキストから3Dを生成する「DreamFusion」がStable Diffusionで実装されました。
github.com/ashawkey/stabl…
公開されてから1週間で実装。速い。
twitter.com/_akhaliq/statu…
202
スタジオジブリモデルというのを発見した。
Waifu Diffusion 1.3を335枚のスタジオジブリ画像で約20000stepで再トレーニングしたとのこと。個人的にはこれを元に他の概念と融合させてジブリに影響された独自画風を模索するのがいいと思う。
reddit.com/r/sdforall/com…
203
Googleより新しい画像生成AI
「Muse」が発表
muse-model.github.io
既存の拡散モデルや自己回帰モデルより大幅に高速かつ、最先端の画像生成能力を実現したテキストから画像を生成するTransformerモデル
モデルのfine-tuningやinversionなしで、inpainting、outpainting、マスクフリー編集が有効
204
ChatGPT Plusが開始!
openai.com/blog/chatgpt-p…
・ピーク時でも一般的なアクセス
・より速い応答
・新機能やアップデートへの優先アクセス
・月額20ドル
現在アメリカのみで利用可能。数週間でWaitlistの方々を招待し、近日中に他の国にアクセスやサポートを拡大予定
205
iPhoneにChatGPTを使った音声AIアシスタントを設定する方法が公開🎉
リプ欄に丁寧にまとめてくださってます
https://t.co/XWt6b2aM7S
206
無限のキャンバスに生成が可能な
「stablediffusion-infinity」が更新。
優れたUIのWebアプリにアップデート。
かなりDALL・E2のOutpaintingに近い様子です。
Source: github.com/lkwq007/stable…
Colab: colab.research.google.com/github/lkwq007…
reddit.com/r/StableDiffus…
207
ControlNet Openposeで利用できるポーズ集が公開
civitai.com/models/12319/z…
civitai.com/models/11573/z…
208
Stable Diffusionの周辺技術がまとまったサイト
「sdtools」が公開
sdtools.org
209
【悲報】大学でAI研究中ワイ、NovelAIとChatGPTで研究のやる気が失せる
blog.livedoor.jp/itsoku/archive…
210
すごい!Stable DiffusionでVR空間作ってる方の作品がBlockadeLabsと提携してすごいクオリティになってる
twitter.com/ScottieFoxTTV/…
211
拡散モデルを利用した3Dデジタルアバター生成
「Rodin」が発表!
3d-avatar-diffusion.microsoft.com
Microsoftより3Dアバター制作のための生成モデルが発表。顔写真から3Dアバター生成、テキストから3Dアバター生成などが可能
212
新Edge、15ページのPDFを数秒で要約できるみたい、やばい笑
重要なポイントや、質問もできる
twitter.com/AlphaSignalAI/…
213
MicrosoftはOpenAIの49%の株式(100億ドル相当)を取得するため交渉中
watcher.guru/news/microsoft…
初期投資を回収するまで、OpenAIの収入の75%を受け取るという特殊な契約も含まれ、また、残り49%は他の投資家、2%はOpenAIの非営利の親会社にいくと言われている。やば..
214
音楽からダンス生成!
音楽に忠実で、リアルで物理的にもっともらしく、編集可能なダンスを生成することができる「EDGE」が発表。
edge-dance.github.io
新しい評価指標で従来の手法を大幅に改善
215
Apple、ChatGPT搭載アプリの承認拒否
news.yahoo.co.jp/articles/b9556…
216
NVIDIABroadcastが1.4にアップデート!
目線を自動補正する「Eye Contact」など新しい機能が搭載。リモート会議、生放送で、台本読んでてもバレなくできそう、すごい
https://t.co/nkXgylJOVw
217
ControlNet用の手の深度マップライブラリが公開
github.com/jexom/sd-webui…
219
Pythonベースのニューラルネットワークの可視化ツール「ManimML」
github.com/helblazer811/M…
以下はCNNをビジュアル化したもの
https://t.co/LqG8bMpST5
220
人間の指示から数秒で画像編集できる 「InstructPix2Pix」のコードが公開!
「ひまわりとバラを交換」「空に花火を追加」「雪が降っていたら?」などを入力すると画像が編集できる
Project: timothybrooks.com/instruct-pix2p…
code: github.com/timothybrooks/…
demo: huggingface.co/spaces/timbroo…
221
AB_test_01.ckptの出力すごい..
bbs.ruliweb.com/best/board/300…
twitter.com/umiyuki_ai/sta…
222
GPT-4は手描きのスケッチをWebサイトのコードに変換できる
(数時間前の公式GPT-4開発者向けライブの映像)
223
ぼっち・ざ・ろっく!のキャラクターを生成できる画像生成モデルが公開
huggingface.co/alea31415/bocc…
224
OpenAIがトークナイザーをオープンソース化!
非常に高速で、他のオープンソースの代替品よりも3-6倍速いとのこと
github.com/openai/tiktoken
225
マリオのワールドを生成できる
「MarioGPT」が発表!
github.com/shyamsn97/mari…
微調整GPT-2で、スーパーマリオのステージを生成。プロシージャル生成の特定の意図や制約を反映できないという主要課題を解決
以下の画像は「多くのパイプ、多くの敵、小さなブロック、低い標高」のテキスト指示で生成