データサイエンティスト育成講座(1)
こんばんは。
ブログを書くのは一年ぶりとなりました。
いろいろあった一年でした…(遠い目
はい、そんなわけで。
新年度が始まりまして、
これから仕事で機械学習に触れることになりました。
そいでちょいちょい勉強していたのですが、
今日本を読んで実装してみたり勉強したことまとめられているブログを読んでいて、
「あー、こういうアウトプットしておくの楽しそうだしスキルアップにも役立ちそうだしいいなぁ」
と思い、
思い立ったが吉日。
ということで、ブログを勉強日記として再開することにいたしました。
まぁ気負わずのんびりとね。
読む本は、つい先月発売されたこちらです。
東京大学のデータサイエンティスト育成講座 ~Pythonで手を動かして学ぶデ―タ分析~
- 作者: 塚本邦尊,山田典一,大澤文孝,中山浩太郎,松尾豊[協力]
- 出版社/メーカー: マイナビ出版
- 発売日: 2019/03/14
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
データ分析勉強しなきゃ!
と言ってわざわざ予約して買ったのに、
年度末でバタバタしていてほとんど開きもしなかったという。
とりあえず家で勉強する時間が取れ始めたので、やっていきます。
ブログで公開するような役に立つことなんて書けはしないんですが、
まぁこの新しい本についてブログ書いてる人ってのもまだあまりいなさそうだし、
この本に興味のある人の目に留まることでもあればいいかなと。
さて、第1章「本書の概要とpythonの基礎」から入り、
本を読み進めていくのに必要なJupiter Notebookなどの環境構築を
先週末、ようやく行って読み進める準備ができたところでした。
(PCのアカウントを日本語で作ってしまったがために、Anacondaをインストールする際のパスの設定に問題が生じて一苦労でした。始める前にもうやめようかと思った)
で、今日は
第2章「科学計算、データ加工、グラフ描画ライブラリの使い方の基礎」
を進めています。
具体的には、
Numpy
Scipy
Pandas
Matplotlib
を、初めての人にもわかりやすく使い方を解説するという内容。
Numpyは以前CourseraでAndrew Ng先生の深層学習の講座を受けた際に触って、
Matplotlibはほんの少し遊んだことがある程度ですが、
ScipyとPandasは名前しか知らない。
けど本当に基本的なところだけやってるのでさらっと読めました。
Pandasでデータが勝手に綺麗な表になって出力されたのはちょっと感動しました(小並
今日はこのへんで。