226
「GPT-3」などの最新言語モデルが自然に他者の心を推察する能力である「心の理論」を獲得していたという研究論文
gigazine.net/news/20230210-…
227
Google Colabで英語の論文を無料で翻訳する方法 | @gyakuseさん
qiita.com/sakasegawa/ite…
228
【速報】🚀ChatGPTとWhisperのAPIが利用可能に!!!!!
openai.com/blog/introduci…
ChatGPT(GPT-3.5 Turbo)は既存モデルより10倍安価で、Whisper Large-V2はより高速で、1分あたり$0.006!Snapchat、Quizlet、Instacart、Shopify、Speakなどが既にAPIを利用した新しいアプリを開発中(続く)
229
マリオのワールドを生成できる
「MarioGPT」が発表!
github.com/shyamsn97/mari…
微調整GPT-2で、スーパーマリオのステージを生成。プロシージャル生成の特定の意図や制約を反映できないという主要課題を解決
以下の画像は「多くのパイプ、多くの敵、小さなブロック、低い標高」のテキスト指示で生成
230
OpenAIより3Dモデルを生成するAI「Point-E」が公開!
github.com/openai/point-e
huggingface.co/spaces/openai/…
Nvidia V100 1つで1~2分で3Dモデルを作成可能で以前の最新技術と比較して桁違いに速いとのこと。例えばDreamFusionと比較すると600倍高速。また完全にオープンソースで、コードと重みも両方公開
231
撮影の仕事の変化がもう目の前まできてる
Daz3Dでポーズ制作→ControlNetで画像生成
reddit.com/r/StableDiffus…
232
AI生成画像で作られた2.5Dのクリックアドベンチャーゲーム
traffickinggame.com/ai-assisted-gr…
233
おぉ先週予告されてた新機能きた!
AI動画編集ツール「Runway」にテキストで画像を置き換えする機能(inpainting)が搭載された
今すぐ利用できるとのこと
runwayml.com https://t.co/wyiQYIpHEz
234
Unityが新たなAIエコシステムを構築・発表!
unity.com/ai-beta
AIを活用したゲーム開発ツールを数百万のクリエイターに提供予定で、より速く素晴らしい3Dコンテンツや体験を世界中の数十億人に届けることが可能に
235
Stable Diffusionの周辺技術がまとまったサイト
「sdtools」が公開
sdtools.org
236
2022年の素晴らしいAI論文リストが公開
github.com/louisfb01/best…
わかりやすくて短い動画での解説から、より詳細な記事へのリンク、コードまで一緒にまとまってる
237
すごい!Stable DiffusionでVR空間作ってる方の作品がBlockadeLabsと提携してすごいクオリティになってる
twitter.com/ScottieFoxTTV/…
238
Stable DiffusionのControlNet用3Dリグモデルが公開
3dcinetv.gumroad.com/l/osezw
239
ShopifyがAIで商品説明を数秒で作る機能を公開
shopify.com/blog/ai-produc…
Eコマース用に設計されたShopifyのAIツール「Shopify Magic」によって実現。オンラインストア全体で一貫したトーンで魅力的な製品説明をすばやく生成できるように。今後1年で「Shopify Magic」でさらに多くのツールを強化予定
240
やばいいいぃぃ
OpenAIがAGIへの短期/長期計画を発表!
めっちゃワクワクした!ちょっとまとめる
openai.com/blog/planning-…
短期:
1.段階的にAGIのある世界へ
・AI導入課題を乗り切る最適解、迅速な学習と慎重な反復の緊密なループ
・AGIに近づくにつれ、作成と展開に慎重に(続く)
241
古いぼやけた顔写真を復元する
「Face Photo Restorer」がリリース!
restorephotos.io
しかも完全無料でオープンソース!
https://t.co/thkCkM7hSb
242
ControlNet用ポーズがブラウザで作れる
「Online 3D OpenPose Editor」が公開
zhuyu1997.github.io/open-pose-edit…
243
画像から音楽生成!
「Image to Music」が公開されていたのでやってみた。仕組みはCLIP Interrogatorで画像からテキストを生成して、Mubertでテキストから音楽を生成してる
ここで試せます
huggingface.co/spaces/fffilon…
twitter.com/fffiloni/statu…
244
Multi-ControlNetで完全に手の課題が解決されてる
Canny(エッジ入力)とOpenpose(ボーン入力)
twitter.com/ddPn08/status/…
245
Stable Diffusionを使った音楽生成「Riffusion」を様々な形式で試せる「Riffusion Web UI」が公開!
huggingface.co/spaces/anzorq/…
最大で2分のオーディオを生成することができ、2つのプロンプトの間を補間する機能も搭載
twitter.com/Yamkaz/status/…
246
NVIDIAのInstant NeRF VRのフローター消しゴムでVR空間の要素を消してる様子
地球丸ごとNeRFされた空間に遊びに行きたくなる
https://t.co/AWONsyy26B
247
ControlNet Openposeで利用できるポーズ集が公開
civitai.com/models/12319/z…
civitai.com/models/11573/z…
248
新Edge、15ページのPDFを数秒で要約できるみたい、やばい笑
重要なポイントや、質問もできる
twitter.com/AlphaSignalAI/…
249
どこでもChatGPTが使えるようになる!
「ChatGPT Assistant」が公開
msfrisbie.github.io/chat-gpt-assis…
⌘+Shift+Yで素早く表示させたり、アドレスバーで使えたり、選択した文章をそのまま利用したり、ChatGPT専用タブがあったり、検索結果と同時にChatGPTの結果も表示してくれる機能豊富なChrome拡張
250
IDEにChatGPTを統合 「この関数のテストコードはどこ?」「○○を実装するならどう書けばいい?」など、AIでコードと対話できる「qqbot」登場
itmedia.co.jp/news/articles/…