Seamless(@shiropen2)さんの人気ツイート(新しい順)

1
映像内のあらゆる動く物体を追跡し分離できるAI「SAM-PT」 点を数か所指定するだけの簡単操作 levtech.jp/media/article/… Metaの静止画像セグメンテーション「SAM」と点追跡を組み合わせた動画セグメンテーション。動画最初のフレームの分離したい物体に点するだけ。重なりにも強くオクルージョン回避
2
人の動きに100分の1秒で反応する遠隔片腕ロボット「QIBBOT」。関節数を増やし,より滑らかに動く2本腕の後続ロボットも開発中。qibbot.com Seamless有料ジャーナルより抜粋 buy.stripe.com/14k6oGac05oOcw…
3
生成AIに“生成AIが作った文章”を学習させ続けるとどうなる? 「役立たずになる」と英国チームが報告 itmedia.co.jp/news/articles/… ネット上に言語生成AIが作成した似たような文章が氾濫し,それらを学習する新言語生成AIがデータの多様性が確保されない学習となり破綻する。回避には人が書いた文章が必要。
4
何かに隠れても長時間正確に追跡可能。映像内の物体の動きの軌跡をピクセル単位で追跡する手法「OmniMotion」 levtech.jp/media/article/… 映像内で動く物体を画素レベルで追跡するモーション推定。オクルージョンや長時間の動き,カメラ位置が変わっても一貫性を保った動きの軌跡追跡を高精度で行う。
5
虫の細い触角も抜き取れる。画像内の物体を超高精度で背景と分離する技術「HQ-SAM」 levtech.jp/media/article/… Meta開発のセグメーションモデル「SAM」を改良したハイモデル。蝶の触角やテニスラケットの網目,背景と同化する生き物まで境界を明確にして切り出す。
6
のどぼとけの動きまでリアル 3Dアバターの首の動きを忠実に再現 中国の研究者らが開発 levtech.jp/media/article/… 回した首や表情の変化,話した際の首の皮膚の伸びや喉仏の動きを忠実に再現。実際にエコー検査で複数人の首をスキャンし頸椎の動きを学習。
7
数学の未解決問題「アインシュタイン問題」を“完全解決”する新図形発見 「The hat」を改良 itmedia.co.jp/news/articles/… 今年3月に1種類の図形だけで繰り返しなしで平面を埋め尽くす図形が発見されたが一部図形を裏返さないとだめだった。今回裏返しなし繰り返しなしの新図形が発見された。名前はSpectre
8
音楽から3Dアバターのダンスを高品質に自動生成するAI スウェーデンの研究者らが技術開発 levtech.jp/media/article/… 音楽を入力に3Dアバターの高精度ダンスを生成する拡散モデル。音楽に合わせた格闘技の動作も。鳥やゾンビの真似をしながら歩くことも可能。
9
スマホの充電器から“人間のような音声”を発声、音声アシスタントにこっそり入力するサイバー攻撃 itmedia.co.jp/news/articles/… 攻撃信号を電流に変調し電力網を介して電化製品(PC,TV,充電器等)に内蔵のスイッチング電源に注入。スイッチング電源から合成音声コマンドを発声させ音声アシスタントを制御する
10
床に物が無くなるまで動く全自動お片付けロボット「TidyBot」 どこに何を収納するかは言語モデルで学習 levtech.jp/media/article/… 人それぞれ収納スタイル(収納場所や収納方法)は違う。これらを文章でGPTを学習させ個人に最適化。引き出しを開け入れて閉める。籠に投げて入れる等。未見の物体で精度91%
11
動画を見るマウスの脳活動から映像をAIで復元 スイスの研究者ら「CEBRA」開発 itmedia.co.jp/news/articles/… 30秒600フレームのモノクロ映像をマウスに9回見せプローブを刺した脳から採取した信号と映像をマッピング学習。10回目の脳活動から映像を復元すると95%以上の精度で深層学習モデルが再構築に成功
12
痛みなしで薬物投与できる薄型パッチ 超音波を利用 米MITなどが開発 itmedia.co.jp/news/articles/… テープなしで皮膚に貼り付けられる薄い小型デバイス,超音波で皮膚を通過させて必要な場所にピンポイントで薬物投与する。痛みがないため気がつかないうちに投与できる。
13
25人のAIが一緒に暮らしたら、自我は芽生えるか? ゲームの中で検証 バレンタインなど勝手に企画 itmedia.co.jp/news/articles/… ChatGPT等で制御した2Dキャラ25人がレトロRPG風の町で一緒に生活。各キャラが個性や目標を持ち交流し人格があるかのように独立し創発的な行動を繰り広げる。動画デモあり。
14
1発の注射で大量の薬を埋め込み、時間差で放出する技術 数週間から数カ月先までコントロール可能 itmedia.co.jp/news/articles/… 皮下注射で必要な場所に多くの薬を注入, 薬剤を体内に置き,3日後,5日後,10日後のように各薬剤を時間差放出できる。
15
「AIに毒を盛る」──学習用データを改ざんし、AIモデルをサイバー攻撃 Googleなどが脆弱性を発表 itmedia.co.jp/news/articles/… ネット公開データを大量学習するモデルを攻撃。方法は期限切れのドメイン購入で改ざん,Wikipedia改ざんで攻撃。人種や性差別バイアスの悪化,バックドアを仕込みモデルを制御等
16
YouTubeで“聞こえない音”を流し、スマホを遠隔操作する攻撃 音声アシスタント機能を悪用 itmedia.co.jp/news/articles/… 動画,音楽の裏で聞こえない音(音声コマンド)を流す。聞いた人の周囲のSiri,Alexaが反応。例:PCで動画見る→机上のスマホが反応→ドアロック解除される。Web会議中に会話相手へ攻撃も
17
育てた人の脳細胞をコンピュータに接続、生きたAI「Brainoware」で学習し数式を解くことに成功 levtech.jp/media/article/… 脳オルガノイドを多電極アレイに乗せて,外部からの電気刺激によって入力を受け誘発された神経活動によって出力を送り訓練データを学習するという。
18
QRコードにレーザーを当てて「偽装QRコード」に変える攻撃 悪性サイトに誘導 東海大が発表 itmedia.co.jp/news/articles/… 読み取る時にだけQRコードに遠隔からレーザ光を当てると別サイトに飛ばせる。図右がレーザ(赤点)を当ててるスマホ越し画像。スマホなしで見ると赤点は見えない。図左は当ててない。
19
画像生成AIを「トロイの木馬」で攻撃してみた 生成時に攻撃者が望む画像を出力 米研究者ら「TrojDiff」開発 levtech.jp/media/article/… トロイの木馬に感染させた拡散モデルはユーザーが予測したい画像ではなく攻撃者が予測させたい画像が生成される。攻撃成功は98%以上。
20
見ている画像を脳活動から画像生成AIが高品質に再現 フランスの研究者ら「Brain-Diffuser」開発 levtech.jp/media/article/… 画像を見せた際の脳活動(fMRI信号)から潜在拡散モデル(Versatile Diffusion)含むモデルでその画像に類似した画像を生成。図で性能を確認されたい。左端が元画像,残りが生成画像
21
スマホで“ひそひそ声”を通常の声に変える技術 東大教授「WESPER」開発 itmedia.co.jp/news/articles/… ささやき声,かすれ声などを通常の音声にリアルタイム変換する機械学習モデル。動画でその違いを確認されたい。
22
聞き取れない声を“通常の声”に変える「人工喉」 喉に貼り付ける薄い小型マイクスピーカー itmedia.co.jp/news/articles/… 微小な声や喉頭摘出術などで声を失った方の曖昧な発話を通常の会話レベルの音量の音声合成に変換し再生する喉に貼る装置。喉付近の筋肉運動や音声振動を感知し熱音響効果で音声合成に
23
生きた細胞を内臓に直接3Dプリント 細長いロボットを肛門から挿入、臓器上で造形 itmedia.co.jp/news/articles/… 先端が3自由度でグリグリ曲がるノズルが付いたカテーテルベースの細長いソフトロボットを肛門から挿入し目的の臓器上で生体材料を直接3Dプリントする。
24
ざっと落書きした絵をリアルな3Dモデルに変換する技術 米カーネギーメロン大が開発 levtech.jp/media/article/… セグメンテーションや手書きスケッチなどの2Dラベルマップを入力に異なる視点から対応する画像を3D合成する。ぐりぐり動かせ書き加えたり消したりして編集も行える。
25
単眼カメラ1台で撮影した映像から「動く人物3Dモデル」と「カメラ位置」を抜き出す技術 Decoupling Human and Camera Motion from Videos in the Wild vye16.github.io/slahmr/