みなさんお待たせしました! 我々が翻訳していた,強化学習のバイブルにして最大最高の教科書R・Sutton著『強化学習 (Reinforcement Learning) 第2版』の翻訳書がついに発売されます! 20年の時を経て,深層強化学習等の話題を加え大幅改訂です AI, 強化学習に興味がある方は是非! amazon.co.jp/dp/4627826621/…
海外名門辺りの機械学習博士課程の希望者インフレが進みすぎて「博士課程に入るために、まずは助教になって業績を稼がないと」みたいな大逆転ジョークが爆誕しており、うーんみが深い
LeCun先生が今季行ってきた深層学習の講義で使用された、講義ビデオ、スライド資料、Jupiter Notebookの実装資料などが全て公開に atcold.github.io/pytorch-Deep-L… 深層学習の歴史や基礎から、CV、NLP、RL、音声認識など、広い範囲の最新の話題を扱っているのはさすが深層学習の始祖の講義という感じ
Microsoftがテキスト+画像+音声版GPTとも言える手法を発表しました! "Language Is Not All You Need: Aligning Perception with Language Models" arxiv.org/abs/2302.14045 今後ChatGPTやBingに応用され,画像や音声でも操作できるようになるかもしれず,人間のほとんどの疑問に答えてくれそうです
東大の情報系の学科の進振りの難易度がおかしくなってるのと関連して,コンピュータサイエンスが学べる国内の主要大学の大学院入試の倍率が上がりすぎて,せっかく入試戦争が終わって入学しても,ある程度先を見ている人は行きたいところの院試対策を学部の早い段階で始めるとかも最近聞いたなぁ...
機械学習の実応用に関するサーベイですが、大企業の機械学習エンジニアなど、18人に実際にインタビューした内容をもとに書かれており、かなり気合が入った論文です arxiv.org/abs/2209.09125 機械学習の実装に関わる人たちは、かなり学べることが多そう
GPTシリーズや,その他の言語系の生成AIなど,Transformerを使った主要モデルのまとめカタログが公開されています arxiv.org/abs/2302.07730… これは便利です! 名前を聞いたことがあるモデルは網羅されていて,パラメータ数,公開日,使ったデータ,アプリケーションなどが一目でわかります
とてつもない頻度で研究が出て成果を出している、言語処理の事前学習モデルの大型サーベイ論文が出ました 主要な実装・ライブラリへの解説、案内も付いています arxiv.org/abs/2108.05542 もう全部追うのは不可能なレベル・・・
制御・強化学習、ロボティクス界隈に超朗報です コミュニティでの頻繁に利用される主要な物理シミュレータでありながらも、有料故に手が出しづらく、様々なところで議論が起きていたMuJoCoですが、なんとDeepMindが買収し、無料で解放したようです! deepmind.com/blog/announcem…
スタンフォード大学で使われている線形代数の応用に関する教科書の翻訳版が発売されるようです 既に海外では非常に評価が高い教科書で,AI・機械学習等,普通の線形代数の本では応用が見えにくい部分を学習できます 『スタンフォード ベクトル・行列からはじめる最適化数学』 amazon.co.jp/dp/4065161967/…
Googleのテクニカルライティングの資料と,資料をまとめた日本語記事 技術者や,その他の人でも技術に関する文章を書く人なら必読の内容 "Technical Writing Courses" developers.google.com/tech-writing "Google社のテクニカルライティングの基礎教育資料がとても良かったので紹介したい" qiita.com/yasuoyasuo/ite…
東大の研究室でやっている深層学習の講義、演習教材にGoogle colabを使っているのですが、最近仕様が極端に悪化してきて(セッション数、GPUの制限)、ついに講義前の軽い確認作業でGPUの使用量限界に達してしまうレベルになったので、色々考える必要がありそうです
最近,有名な企業のエンジニア研修資料の公開が続いていますが,ミクシィからも非常に質の高いものが公開されていました mixi-developers.mixi.co.jp/21-technical-t… エンジニアの必須技術はもちろん,人気ゲームをいくつか抱えているためか,Unityなどゲーム開発関連の資料もあり,この手の資料には企業の特色が出るようです
LLMのトークン制限は頻繁に議論になりますが,とんでもない手法が出てきました "LongNet" arxiv.org/abs/2307.02486 トークン長が10億(!)と主張する手法で,ChatGPT/GPT-4が3万,最近の研究のMAXが100万なので凄いインフレです(冒頭の図が強すぎる)… twitter.com/i/web/status/1…
←みんなが想像していたGPT-4 →実際のGPT-4
OpenAIがオープンソースの大規模言語モデルの公開準備をしているという,かなり大きなニュースです. reuters.com/technology/ope… モデルの性能やライセンスにもよりますが,企業や研究機関のLLM開発の転換点になりそう ChatGPT/GPT-4レベルのものだったら世界がひっくり返るレベルですが果たして..
海外大学が公開している最新の機械学習講義についてまとめられています github.com/dair-ai/ML-You… 似たまとめはいくつかありますが、これは本当に最近の講義で評価が高いものに絞ってまとめており、リアルタイムに追加もされているので、最新の話題をカバーしたい場合はおすすめ NLPがかなり多い印象
Google, DeepMindの研究者らによる、分布型強化学習に関する教科書のドラフトが公開されています distributional-rl.org 単なるスカラー値の期待収益ではなく,より情報が多い収益分布を使う手法で、深層強化学習以前から研究(金融応用等)されてきた分野ですが、まさか教科書が出るレベルになるとは
オープンソース界隈の本命Stability AIが,ついに予告していた独自の大規模言語モデル"StableLM"を公開しました! github.com/Stability-AI/S… 現時点ではMAX650億Pのモデルが公開されており,今後1750億のモデル公開を予定している模様 Stable Diffusionに続き,オープンソース LLM界隈の主役になるか
なんと!個人的に今年のトップニュースです 現時点でも深層学習の必読書だったMLPシリーズの『深層学習』が、トランスフォーマーやグラフネット、生成モデル(多分GANやVAEも?)などの最近の大人気モデルを加えて刷新されるようです! 「初代」深層学習本が再び「最強」深層学習本に twitter.com/kspub_kodansha…
東京大学 松尾研の強化学習講座を開講します! 基礎から実機・ロボット等の実応用までを意識した,最先端の講義です 私は初回で基礎・全体的な話と主要ベンチマークにおけるRLの発展,最終回でAlphaGo以降の先端ゲームAIやRLの他分野応用の話をします 受講をお待ちしております! deeplearning.jp/reinforcement_…
論文,書籍,資料のどれ書くにしても,この辺の機械学習・深層学習アーキテクチャの図をほぼ自作していたので,これは救世主的な超本質リポジトリかもしれない・・・ "these images can be FREELY USED in your own blog posts, slides, presentations, or papers under the CC-BY license" とのこと twitter.com/ELYZA_inc/stat…
待望のTransformerのサーベイ論文 あまりにも派生型が出現しすぎて分類の枝の分岐がすごいことになってますが,さすがに一つ一つを詳細に解説するのは無理があったらしく(書籍2つ分とかになりそう),それぞれは簡単な解説で読みやすい A Survey of Transformers arxiv.org/abs/2106.04554
資産運用を機械学習でやる手法をまとめたサーベイ論文 papers.ssrn.com/sol3/papers.cf… 単なるサーベイにとどまらず,論文中で紹介した手法を実装したColab Notebookへのリンクも付いているのは素晴らしい 強化学習だと,進化計算,好奇心による探索などもやっていて,かなり幅広い colab.research.google.com/drive/1FzLCI0A…
深層強化学習を用いた金融・株式取引について,かなり現実的な視点から考察したレビュー論文 研究的には人間のトレーダーを上回る可能性はあるが,まだまだ研究の余地があるとのこと "Deep Reinforcement Learning in Quantitative Algorithmic Trading: A Review" arxiv.org/abs/2106.00123