エンジニアHubproduced by エン

若手Webエンジニアのための情報メディア

実践データサイエンス─サンプルコードと図表で学ぶ、前処理・モデル評価・パラメータチューニング

データサイエンスは敷居が高いと思われがちですが、データの前処理からの手順それぞれは意外とシンプルです。この記事で解説する一連の作業は、広範囲ではありますが、どのような問題に対しても基礎となる重要な手順です。

自然言語処理をサービスで活用しよう! Sansanに学ぶ「多種多様なテキスト」からのデータ分析

Sansanのデータ統括部門DSOCで日夜研究を続ける奥田裕樹さんと高橋寛治さんの2人に、名刺という多種多様なテキストを扱う醍醐味をお聞きしました。

データサイエンティストの定義は?必要スキルは?現役データエンジニア/アナリストと考えた結論

需要が高まるデータサイエンティストというロールですが、業務の定義や、必要スキルは一体どのようなものでしょうか。3名のデータエンジニア/アナリストに実践から得た答えを聞きました。

Kaggleで世界11位になったデータ解析手法〜Sansan高際睦起の模範コードに学ぶ

Kaggleの上位入賞者であるKaggle Grandmasterを獲得した、Sansan株式会社のデータサイエンティスト高際睦起さん。模範となるソースコードをもとに考え方や解析手法を教えていただきました。