Kaggleで世界11位になったデータ解析手法~Sansan高際睦起の模範コードに学ぶ
Kaggleの上位入賞者であるKaggle Grandmasterを獲得した、Sansan株式会社のデータサイエンティスト高際睦起さん。模範となるソースコードをもとに考え方や解析手法を教えていただきました。
- 「Porto Seguro’s Safe Driver Prediction」とは?
- 【技法1】前処理
- 【技法2】特徴抽出
- 【技法3】予測モデルの作成
- Kaggle初心者は何から始めるべき?
- データサイエンティストを目指す若き人たちへ
世界中のデータサイエンティストたちが集まり、企業や研究者が投稿したデータに対する高精度なモデルを競い合うプラットフォーム・Kaggle。メンバーは100万人を超えており、良問の多さや参加者のレベルの高さゆえに、機械学習を学ぶ者にとって優れた研鑽(けんさん)の場となっています。
日本国内にも数多くのKaggler(Kaggleに取り組む人)がいますが、上位入賞者であるKaggle Grandmaster1の称号を持つ日本人は4人しかいません(2018年8月2日時点)。そのひとりが、クラウド名刺管理サービス「Sansan」や、名刺アプリ「Eight」を提供するSansan株式会社のデータサイエンティスト高際睦起(たかぎわむつき)さんです。
今回は彼が11位に入賞したコンペ「Porto Seguro’s Safe Driver Prediction」にフォーカスを当て、分析精度を高めるためにどのような手法を用いたのかを解説していただきました。
- 高際 睦起(たかぎわ・むつき)
- Data Strategy & Operation Center
R&D Group 研究員 博士(理学)
東北大学大学院理学研究科物理学専攻博士課程修了。Kaggle Grandmaster。
画像認識、機械学習を使った研究開発に従事中。京都ラボ勤務。
「Porto Seguro’s Safe Driver Prediction」とは?
エンジニアHubに会員登録すると
続きをお読みいただけます(無料)。
続きをお読みいただけます(無料)。
登録ボタンを押すと、利用規約とプライバシーポリシーに同意したことになります。

- すべての過去記事を読める
- 過去のウェビナー動画を
視聴できる - 企業やエージェントから
スカウトが届く