BeautifulSoupでIDとCLASS名が同じ要素を取得する

Pythonではほとんどスクレイピングばかりしてる。最近スクレイピングしていてはまったこと。
ID名とCLASS名が同じでうまくスクレイピングできないものがあったのでメモ。

for day in soup.select("span[id^=thisMonth], span.thisMonth"):

Posted in Python | Leave a comment

数学苦手だけど機械学習やる・Linear Regression with Multiple Variables

CouseraのMachine Learning courseをやってるのでタイトルも英語。もともと数学になじみがないから日本語でなんというのかもわからないけど、複数の変数を持つ線形回帰でいいのかの?Week1 から Week 11までの講座。いまはWeek 2。途中に5問中4問正解しないと先へすすめない小テストが2つ、最後にOCTAVE/MATLABでの課題提出もあってなかなか先に進めない。仕事でいろいろあってさぼっていたら締め切りが3日後に迫ってきたので、講義を復習しつつなんとかLinear Regression with Multiple Variablesの小テストとOCTAVE/MATLABのチュートリアルの小テストをクリア。つぎは初の課題提出。そのやりかたもふくめて頑張って勉強しないと。

Posted in 数学, 機械学習, 雑談・日記 | Leave a comment

数学苦手だけど機械学習やる・ベクトル/行列

CourseraのMachine Learning講座、ようやくWeek 1を終了。途中5問中4問正解しないと先に進めないテストが2つ出て来たけどなんとかクリア。今日はVector(ベクトル)、Matrix(行列)、Transpose(転置)。基本的なところなので、Regression(回帰)の計算に比べると楽だった。

Courseraを理解するには「やさしく学ぶ機械学習を理解するための数学のきほん」をやってからのほうがいいというので買ったんだけど、今の所この本のほうが難しい。たとえば、生徒役の子がベクトルの内積の式をみて「そうそう、内積ってそんな感じだった。」ってセリフが出てくるぐらいなので、対象としてる読者もこれぐらいだと思う。この辺の基本的な知識がないけどCourseraの講座は結構わかりやすいので、あとはググったりでなんたかなってる。

Week 2は Octave を使ってプログラミングもはじまるようなので楽しみ!

Posted in 数学, 機械学習, 雑談・日記 | Leave a comment

数学苦手だけど機械学習やる・回帰

機械学習にまつわる数学の勉強は毎日続けてる。「やさしく学ぶ 機械学習を理解するための数学のきほん」を中心にやってたけど、基本的な数学の知識が足りてないので難しい。よくわからなかったところを、Courseraの動画でもCouseraの方は試験があって、パスしないと次に進めない。試験は8時間内に3回まで。問題も入れ替わるのであてずっぽうでは合格できないようになっている。2回落ちて、よくわからなかったところをしっかり復習して3回目でパス。わかったつもりにならず、動画を止めて自分でも計算してみると理解が深まる。

出てきた数式を解くことに気を取られて肝心なことに気づかなくて、「なんでこの計算してるんだろう?」って感じだったけど、ここで話している「目的関数」って、学習データとテストデータの誤差を求めるやつのこと、とかようやく理解できた。

回帰の勉強が終わったところだけど、微分ってなに?ってところからのスタートなので、ちょっとした達成感。本とCourseraの動画の両方使ってるけど、英語ができるならCourseraのほうがわかりやすい。

Posted in 数学, 機械学習, 雑談・日記 | Leave a comment