初学者向け データサイエンスを無料で学べるコンテンツまとめ

Python

東京大学 数理・データサイエンス・AI教育強化拠点コンソーシアム

リテラシーレベルeラーニング教材・講義動画配信 | 数理・データサイエンス・AI教育強化拠点コンソーシアム

東京大学が無償公開しているデータサイエンス・AIに関連する講義資料群。
リテラシーレベルモデルカリキュラム対応教材

Qiita

エンジニアに関する知識を記録・共有するためのサービス - Qiita
Qiitaは、エンジニアに関する知識を記録・共有するためのサービスです。 プログラミングに関するTips、ノウハウ、メモを簡単に記録 & 公開することができます。

エンジニア版ブログのようなもの。
コーディングのチートシート(よく使うコードのまとめ)や諸学者向けの記事が多く、ちょっとした書き方が分からないときにググるとQiitaの良質な記事がヒットするので自然とお世話になる。

「○○をpythonで作ってみた」のような趣味っぽい内容も多いので、娯楽として読んで勉強にもなる。

Kaggle

Kaggle: Your Machine Learning and Data Science Community
Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.

データサイエンスの世界的コンペサイト。
企業がデータサイエンティスト向けに報酬付きのコンペを開催。
コンペに応募されたデータ分析のソースコードを参照できる。
Jupyter Notebook形式で公開されており、ローカルにダウンロードも可能。

Kaggleのおすすめの使い方

参考書を読んでゼロからコーディングするのはハードルが高いので、
まずはKaggleに公開されている優良なコードを引用して覚えていくのが効率的だなぁと感じています。

参考にするコードの探し方

  1. Kaggleでキーワード検索し、PythonとNotebooksでフィルタリング
  2. 検索結果の中からいいね("へ"に似たマーク)の数が多いものをいくつかざっと眺める
  3. その中から簡潔なものを選ぶと◎("EDA"と書かれた詳細すぎる分析をしているものは実際そこまでいらない)
  4. あまりにも古いコードはimport文の書き方等が現行と少し違っていたりするので要注意

直近ではLSTMを学びたくて以下の記事を参考にしました。
Simple LSTM - Kaggle

やりたいことが簡潔に書かれているものを選ぶことで、Notebookポチポチで詰まることなくアウトプットに直結するので、”できた”という達成感が得られる(大事)

また、参考にしたコードがどこかで詰まっても、人のコードの間違いを探して修正するというのは大変なので、できるだけ手を出さないでさっさと諦めるのも大事。

はじめのうちは英語が分からなくて辛いですが、限られたいくつかの同じ単語が出てくるのでそのうち慣れます。
今度データサイエンス初学者向けの頻出単語をまとめますね。

最後まで読んでいただきありがとうございます。

タイトルとURLをコピーしました