127
テキストから動画を生成させるために画像拡散モデルをOne-Shot tuningする「Tune-A-Video」が発表
tuneavideo.github.io
テキストと動画のセットを学習させれば、テキストによって被写体や背景の変更、属性の編集、スタイルの転送などを行いつつ、時間的に一貫性のある動画を生成できる
128
Deep Learning論文の実装まとめ
github.com/labmlai/annota…
ニューラルネットワークとそれと関連したアルゴリズムのシンプルなPyTorch実装のコレクション。毎週新しい実装が追加されている
129
ChatGPTが歴史を作る: AIとして初めて映画の脚本と監督を担当
metaroids.com/news/chatgpt-m…
130
汎用日本語言語モデルを目指して作成されたSwich Transformerモデル「GPTSAN」
github.com/tanreinama/GPT…
GPU1台でファインチューニング可能で、生成文章のクラスを指定可能。現在28億パラメーターのモデルが公開
131
Stable Diffusion v2による高解像度inpaintingの実験
ぱっと見違和感なくてすごい
https://t.co/dD8N28zzXO
132
同じキャラクターで複数の角度からの顔を生成するためのガイド
youtube.com/watch?v=Ig1S2g…
133
ChatGPTに相当するオープンソースが公開
github.com/lucidrains/PaL…
Googleの5400億パラメータの言語モデル PaLMアーキテクチャ上でのRLHF (人間のフィードバックによる強化学習) の実装
twitter.com/rasbt/status/1…
134
「ChatGPT」のような対話AI「YouChat」 検索エンジン You.com が公開
japan.cnet.com/article/351978…
135
ChatGPTを使い、言葉でARの物体を操作する
「ChatARKit」が公開
github.com/trzy/ChatARKit
色々な指示がちゃんと効いてる
「手近なテーブルにスポーツカーを置き、90度回転させ、表面に沿って往復運動させる」
「カエルを飛び跳ねるようにして」
https://t.co/auGvf8zXgo
136
UIデザインを生成するために微調整されたStableDiffusion v2.1用Embedding β版が公開
huggingface.co/irateas/web-ui…
137
無料のシームレスなAI製のテクスチャライブラリ
「Free Textures for 3D」が公開
free-textures.art
138
複数視点でのキャラクターを生成するためのStable Diffusion v1.5用Embedding「CharTurner」が公開
civitai.com/models/3036/ch…
139
スプレッドシート用の究極のAIアシスタント
「AI Spreadsheet Assistant」がもうすぐ公開
docs.google.com/forms/d/e/1FAI…
主な機能
- コンテキストに基づいてシートを自動入力
- テキスト入力から数式を生成する
- GPT-3をシートに直接統合する
https://t.co/TtbX5MiY6q
140
手や肌の質感を正確に再現するために、多数のモデルを混ぜ合わせて作られたモデル「Protogen v2.2」が公開
civitai.com/models/3627/pr…
141
Waifu Diffusion 1.4 Anime Epoch 1が公開!
WD Anime1.4はSD 2.1を546万8025点のテキスト+画像を学習したモデルで、このEpoch 1は、トレーニング セットアップが適切に機能することを確認するために作成されたテストモデル
モデル: huggingface.co/hakurei/waifu-…
リリース: gist.github.com/harubaru/8581e…
142
表現力向上のためにあえて醜い要素を統合した「Protogen x3.4」が公開
civitai.com/models/3666/pr…
v2.2にRoboDiffusion、OpenJourney、Analog Diffusion、RPGモデルを少しずつ統合したStable Diffusionベースのモデル
twitter.com/Yamkaz/status/…
143
AIで作られた子供からおじいさんになるまでのアニメーション
https://t.co/MoB5xwxF5C
144
テキストから3Dを生成する新しい手法
「Dream3D」が公開
bluestyle97.github.io/dream3d/
CLIP-Mesh、Dream Fields、PureCLIPNeRFなどの最先端の手法と比較して、優れた視覚的品質と形状精度で、想像力豊な3Dコンテンツを生成することが可能に。コードは近日公開
145
Stable Diffusionを使ってタイムトラベルをし続けているStelfieさんの投稿
twitter.com/StelfieTT/stat…
146
Googleより新しい画像生成AI
「Muse」が発表
muse-model.github.io
既存の拡散モデルや自己回帰モデルより大幅に高速かつ、最先端の画像生成能力を実現したテキストから画像を生成するTransformerモデル
モデルのfine-tuningやinversionなしで、inpainting、outpainting、マスクフリー編集が有効
147
ぼっち・ざ・ろっく!のキャラクターを生成できる画像生成モデルが公開
huggingface.co/alea31415/bocc…
148
ArtStationでの「No AI」運動の投稿が非表示に
親会社EpicのCEO
「デフォルトで画像生成AIを締め出すことはありません。著作権法のフェアユースのルールに該当するような使用を禁止してしまうことになる」「Epicにはイノベーションを阻害するような会社になって欲しくない」
gamespark.jp/article/2022/1…
149
MicrosoftはChatGPTを使用してBingを強化することを計画しており、数か月以内にリリース予定
2022年10月にはBingに「Image Creator」としてDALL-E2を搭載すると発表している。今後Officeアプリにもガンガン搭載されていきそう
theinformation.com/articles/micro…
150
「人工脳」実現へ、脳神経模したイオニクス素子で世界最高性能。低消費電力なAI機器の開発につながる
news.yahoo.co.jp/articles/f6105…