Masser’s Blog

データサイエンティスト/Kaggle/Python/ADHD/旅行/サンフレ 等語る予定。

FIFA18のデータからサンフレッチェの選手の価格を予想してみた

データ分析のコンペティションで有名なKaggleはさまざまなデータが公開されています。例えば EA SPORTSからFIFA18のデータが公開されています。そこで今回はこのデータを使用して何か分析をしてみようと思います。(私はFIFA18をしないですが。。。) https:…

今期のサンフレッチェ広島の観客動員数を機械学習で予測した 結果編

今期もJリーグが開幕しました。 私が応援するサンフレッチェもタイの英雄ティーラシンのゴールを守り切って勝つことができました。 まあ課題はありますが、このまま一つずつ勝っていけばいいのではないでしょうか? では今日の観客動員がどうだったか結果発…

KaggleのHouse Pricesに挑戦 その1

今回kaggleの初心者向き課題の一つであるHousingPriceに挑戦しました。とはいいつつも項目数が70以上もあり、参加している人もレベルがかなり高いので前回挑戦したタイタニックに比べればはるかに難しいです。 HousingPriceとは 米国アイオワ州のエイムズと…

今期のサンフレッチェ広島の観客動員数を機械学習で予測した その2(XGBoostのチューニング含む)

今週末にもJリーグが開幕するので、今週発表された週間天気を基にXGBoostのアルゴリズムを使って再度今期の観客を予測しました。今回はKaggleのHouse PricesのコンペをやっていくうちにXGBoostの使い方を覚えたので、XGBoostのチューニングの仕方も併せて乗…

Coursera Machine Learning を学習中

ここ最近機械学習を学ぶ上で評判がいいCoursera Machine Learningを学習しています。 Machine Learning | Coursera スタンフォード大学のAndrew Ngが講義をしていますが、機械学習の権威だとか。けどこういうのが無料で学習できるのがすごくいいですね。すご…

廃線予定の三江線に乗ってみた

年末に帰省のついでに2018年3月31日に廃線予定の三江線に乗ってみました。 まず広島から芸備線で三次に行きました。芸備線に乗るのは高校以来です。今はバスのほうが便利だしねえ。三次で昼食を取った後、14:11発の汽車で江津方面に向かいました。やはりほ…

今期のサンフレッチェ広島の観客動員数を機械学習で予測した

私は広島出身ということもあり、サンフレッチェ広島のサポーターでありますが、これを機械学習で生かせないか考えてみました。そこで2009年から2017年までの観客データやその日の天候、その他の要素から2018年の観客動員数を機械学習で予測してみました。た…

K言語初めてでKaggleのタイタニック生存者予測やってみた

昨今データベース分析の需要があがっておりますが、そのデータベース分析の勉強にもってこいのプラットフォームとしてKaggleがあります。企業がコンペ形式で課題を提示し、世界中から40万人を超えるデータベースサイエンティストが課題に対して最も最適な分…