須山敦志 Suyama Atsushi(@sammy_suyama)さんの人気ツイート(いいね順)

あえて何も言いません 令和の「データサイエンティスト」に必要な能力 toyokeizai.net/articles/-/639…
昔先生から指導を受けてたとき「進捗を確認したいから定期MTGをしたい」ではなく「自分の言ったことが間違っている可能性があるから定期的に話したい」と言われたのが好きで、自分でも真似して使っている
機械学習や深層学習が「ズル」して学習データセットで良い成績を出すという話は結構根深いです。例えば画像中の猫・犬を分類するタスクで、DNNで誤って犬と判定された猫は芝生の上にいたり。学習データ中では屋外の芝生にいるのは犬の方が圧倒的に多かったということなんでしょう。
↓機械学習、思考停止ツールになっている気配があるのが恐ろしい。「人が考えなくても、大量データと処理能力が圧倒的に高い計算アルゴリズムが全部うまくやってくれる」っていう主張も聞きますが、実際うまくやってくれているかどうかすらまともに判断できていないケースがほとんどです。
「ルールベース」って偽物AIの代名詞みたいに言われてますが、本来理想とすべきは明確なルールや法則を抜き出すことなんであり、それができないから機械学習やら確率やら使って何とかその場をしのいでいる、という見方もできます。
高校で物理や化学などは実験の授業があるのに、数学に実験の授業があまりないのはなぜだろう。まずプログラミングの導入を行なって、ちょっとグラフを描いてみたり数列の挙動を調べてみたりする。組み合わせを数え上げたり確率を計算してみても良さそう。
良くある「年収は正規分布に従わないので平均だけ見てもしょうがない」という話は驚くほど今の機械学習応用の問題点を指していると思います.平均値みたいな過度に要約された値を堅固なファクトであるかのように扱い,背後にある構造を無視してしまえば,ほとんど無意味な結論に向かって行きます.
近日MLPシリーズで刊行予定の「ベイズ深層学習」の目次を貼ります. 1章,はじめに 2章,ニューラルネットワークの基礎 3章,ベイズ推論の基礎 4章,近似推論手法 5章,深層学習モデルのためのベイズ推論 6章,深層生成モデルとベイズ推論 7章,深層学習とガウス過程
データサイエンスにおいて「価値のある取り組み」を選定するのは困難を伴います。ここで「何が価値か?」を考え出すと泥沼にハマりがちなので、逆に明らかに価値のない例をいくつか挙げるほうがチェックリストとして機能しやすいと思っています。↓
内容のほんの一部ですが、「ベイズ深層学習」で取り扱うモデルたちの関係性です。線形回帰からスタートして深層ガウス過程(教師なし)までスッキリ繋がります。
そもそも統計手法や機械学習で何かを「立証する」「保証する」っていうのはできなくて、深く考え始めると何もできない感覚がしてきます。個人的には「限られたデータ・情報・時間・費用・計算リソースを活用して精いっぱい妥当な意思決定を行うための方法」くらいに考えています。
Juliaを使うとガウス過程回帰が実質10行程度で実験できる。
機械学習は大量に計算資源を投入して誤った発見を量産しまくっていますね。残念ながらp値ハッキングと全く同じ構造。 BBC News - AAAS: Machine learning 'causing science crisis' bbc.com/news/science-e…
前にもちょっと触れましたが、今AIや機械学習を学ぶ理由って皮肉なことに「活用すること」と同じくらい「騙されないこと」が重要になってきており、「騙されないためのAI学」みたいな本を書きたいと思っています。思っているだけです。
たぶんベイズ全然わかっていないのにここまで熱く語れるってなんかそういう才能ってすごいですね twitter.com/genroncafe/sta…
「機械学習が簡単にできるようになった」というよりか,「簡単にできる部分だけを指して機械学習と呼ぶようになった」の方が感覚的に近いです.
新著出ます。様々な確率的プログラミング言語を紹介しつつ、階層ベイズ、潜在変数モデル、ガウス過程、ベイズ深層学習あたりのPython実装を解説します。 Pythonではじめるベイズ機械学習入門 (KS情報科学専門書) amazon.co.jp/dp/406527978X/
Diffusion modelsの数理的な基礎を理解したい方のための記事が出ています↓。 こちらの内容が難しい場合は、僕の「ベイズ深層学習」をお勧めします。理解に必要な基本は全て網羅されています。 arxiv.org/abs/2208.11970
著者の持橋先生から「ガウス過程と機械学習」をいただきました。本当に冗談ではなく、「ガウス過程を基軸に統計・機械学習が入門できてしまう」というくらいの丁寧な内容です。
↓これまで「人間には全く解釈できないがニューラルネットが見つけた良い特徴量」などというものは見たことがありません。囲碁などのタスクで人知を超えた解を出すことはありますが、それも比較的closedな世界で計算量に物を言わせているというだけで、計算機の能力からしたら昔から普通にある例です。
Julia実装による「意思決定のためのアルゴルズム」。PDF無料です。ベイズから始まり強化学習、マルチエージェントシステムまでカバーしていますね。 Algorithms for Decision Making algorithmsbook.com
先日某所でお話しさせていただいた内容.統計ユーザーはややこしい数理や計算機の知識から解放されるべきと思います.
極言すれば、「人間のやっていることを置き換える」という発想しかできないから今のAI応用は頭打ちな場合が多いんですね。もっと技術自体の特性を理解し、人間の認知能力や情報処理能力をaugmentすることによる価値を追求しないと。
個人的な感触としてディープラーニングは、一部の特定の応用領域を除き、ビジネス面では完全に終わっています。 twitter.com/yutakashino/st…
「扱っている現象が複雑な非線形でモデル化が困難なため、機械学習のXXX法を使って自動で関係性を抽出して予測します」みたいなモチベをよく見ますが、やめておいた方が良いと思います。多くの場合、困難を避けているだけで解決していません。ラボ環境だけで良い数値を叩き出して、本番で失敗します。