202
サイバーエージェントの新卒エンジニア研修資料
developers.cyberagent.co.jp/blog/archives/…
良いコードとは何か
speakerdeck.com/moriatsushi/li…
・体系的に言語化されててわかりやすい
・「品質とスピードはトレードオフではない」
・「凝集度/結合度の指標でモジュールを評価可能」
・「関心を分離し、正しく依存方向を制御」
203
Python x データサイエンスの100本ノック集
numpy
github.com/rougier/numpy-…
pandas
github.com/kunishou/Panda…
データ分析
shuwasystem.co.jp/support/7980ht…
機械学習システム
shuwasystem.co.jp/support/7980ht…
データ加工/可視化
shuwasystem.co.jp/support/7980ht…
AIモデル構築
shuwasystem.co.jp/support/7980ht…
(1/2)
204
組み合わせ最適化について、問題の定式化・解法とPythonコードをセットで学べる講義(全37回)。有名な最適化問題と解法・アルゴリズムが網羅されている。
Python言語による実務で役に立つ100の最適化問題
youtube.com/playlist?list=…
205
高校の先生向け教材だが、機械学習初心者の社会人・大学生が概略を知るのにも良さそう
高等学校情報科「情報Ⅱ」教員研修用教材(本編)
mext.go.jp/a_menu/shotou/…
207
「Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習」
の原著(英語)は全文が無料公開されている
jakevdp.github.io/PythonDataScie…
ソースコード (Notebook) 一式
github.com/jakevdp/Python…
208
書籍「Python ゼロからはじめるプログラミング」のサポートページに、丁寧な解説スライド(全308ページ)が無料公開されている
mitani.cs.tsukuba.ac.jp/book_support/p…
プログラミング自体が初めてという読者向けに、図解やイラストを交えてわかりやすく説明されている
209
自然言語処理についてまとまっているスライド。
かなり作り込まれていて密度が高い。
ゼロから始める転移学習
slideshare.net/techblogyahoo/…
210
PythonやRのチートシートが大量にまとめられているページ
becominghuman.ai/cheat-sheets-f…
前処理:
211
"OpenIntro Statistics"の和訳版「データ分析のための統計学入門」はpdfが無料公開されている
kunitomo-lab.sakura.ne.jp/2021-3-3Open(S…
具体例が多くてわかりやすい。
和訳版は練習問題の解答が省略されているが、原著には奇数番の解答がある(以下リンクで"The Book"を選ぶと無料でDLできる)
leanpub.com/os
212
東大が一般公開している講義「コンピュータシステム概論」では、基本的なPythonプログラミングを動画で学べる。
ocwx.ocw.u-tokyo.ac.jp/course_11409/
213
古代壁画のようなPythonチートシート
github.com/FavioVazquez/d…
214
機械学習のための数学が学べる本「Mathematics for Machine Learning」は無料公開されている
mml-book.github.io
pdf
mml-book.github.io/book/mml-book.…
Tutorial Notebook
github.com/mml-book/mml-b…
前半が数学(線形代数、確率、連続最適化)
後半は機械学習(線形回帰、主成分分析、混合ガウスモデル、SVM)
215
機械学習のチートシート
sites.google.com/view/datascien…
1.バイアスとバリアンスのトレードオフ
2.不均衡データの分類
3.PCAによる次元削減
4.ベイズの定理と分類器
5.回帰分析
6.機械学習における正則化
7.畳み込みニューラルネットワーク
8.有名なCNNアーキテクチャ
9.機械学習におけるアンサンブル手法
216
データ可視化のノウハウを学べる「データビジュアライゼーションの基礎」の原著は、著者が全文を無料公開している
clauswilke.com/dataviz/
Rコード
github.com/clauswilke/dat…
217
単回帰から始めて因果推論入門まで、分析結果の解釈にフォーカスしてわかりやすく解説されている。
「回帰分析から分かること」と「変数選択」
speakerdeck.com/shuntaros/hui-…
218
Web系開発の初歩をわかりやすく解説しているスライド
技術基礎研修「クックパッドを支える仕組み」
speakerdeck.com/osa/introducti…
219
DXについて体系的にまとまっているスライド。DXの阻害要因10選と現実的な解決のヒントも提案されている。
DXを妨げる要因と実現へのアプローチ
speakerdeck.com/yuzutas0/20211…
220
Q. クオンツになりたいですが学生時代に何をしておけば?
A. 数学
Q. アクチュアリーになりたいですが学生時代に何をしておけば?
A. 数学
Q. データサイエンティストになりたいですが学生時代に何をしておけば?
A. 数学
Q. 機械学習エンジニアになりたいですが学生時代に何をしておけば?
A. 数学
221
AI SHIFT社の社内SQL研修資料が無料公開されている
ai-shift.co.jp/techblog/1980
SQLやDBについて基礎からわかりやすくまとまっている
222
ニューヨーク大学が無料公開している「データサイエンスのための数学」講義シリーズ。
共分散行列、線形回帰、正則化、スパース回帰、フーリエ解析、ウェーブレット解析など。
Mathematical Tools for Data Science
cds.nyu.edu/math-tools/
223
馬場さんのサイトLogics of Blueに無料公開されている統計学の講義スライド(1,800枚弱)
logics-of-blue.com/lecture-slides…
文系学生でも理解しやすいように説明が工夫されており、非常にわかりやすい。
※スライドの途中を抜粋するのは著者の要望によりNGです
224
東大や滋賀大が無料公開しているデータサイエンス教材のまとめサイト
mi.u-tokyo.ac.jp/consortium/e-l…
統計および数理基礎
アルゴリズム基礎
データ構造とプログラミング基礎
時系列データ解析
テキスト解析
画像解析
データハンドリング
データ活用実践(教師あり学習)
データ活用実践(教師なし学習)
など
225
SONY R&Dが無料公開している、少データ・少ラベル学習の丁寧な講義動画(全11本)。各回冒頭で全体像と現在地を示してくれるので迷子になりにくい。
youtube.com/playlist?list=…
少データ学習
・データ拡張
・正則化
・転移学習、ドメイン適応
・メタ学習
少ラベル学習
・半教師あり学習
・弱教師あり学習