ISUCONの第一人者・藤原俊一郎さんが語る攻略と学び ― 大切なのは「不満のしきい値」を下げること

Webサービスの高速化を競うISUCONで何度も優勝し問題作成も手がける藤原俊一郎さんに、その攻略方法と魅力、エンジニアが持ち帰れるものを聞きました。

ISUCONの第一人者・藤原俊一郎さんが語る攻略と学び ― 大切なのは「不満のしきい値」を下げること

与えられたWebサービスの高速化を競うITエンジニアの総合格闘技、ISUCON。決められたレギュレーションの中で、いかに自分の知識とスキルを生かしてアプリケーションをいい感じに高速化するか1という課題に魅力を感じるエンジニアも多く、回を重ねるごとに参加者も増えて、2018年10月に開催された「ISUCON8」では528組、1,392名がオンライン予選に参加しました。

1 ISUCON8 まとめ : ISUCON公式Blog 2

2011年の初開催から何度となくISUCONに参加してなんと3回の優勝を果たし、時に出題者に回って参加者を楽しませる側に立ってきたのが、面白法人カヤックで主にバックエンド側のエンジニアとして活躍している組長こと藤原俊一郎さん@fujiwaraです。ISUCON8の問題作成にも携わった同氏に、その攻略方法とコンテストの魅力、そしてISUCONからエンジニアが持ち帰れるものは何かを聞きました。

3

藤原 俊一郎(ふじわら・しゅんいちろう) 4 fujiwara 5 fujiwara

2011年より面白法人カヤック。技術部SREチームリーダー。主にソーシャルゲーム、自社サービスを担当。ISUCON優勝3回、出題2回。最近の趣味はマネージドサービスの隙間を埋める隙間家具のようなツールをGoで作ってOSSにすること。著書に『みんなのGo言語[現場で使える実践テクニック](共著、技術評論社)がある。

また、2011年の第1回大会で初優勝して以来、出題した回を除いて全てのISUCONで本戦に出場している(2回目までは予選なし)。戦歴の詳細についてはブログ「酒日記 はてな支店」を参照。

結果 対応する藤原さんのブログ記事
1 優勝 #isucon で優勝してきました
2 優勝 #isucon2 で優勝してきました
3 出題 ISUCON3 を開催しました
4 3位 ISUCON4本選で3位に敗れました
5 優勝 ISUCON5 で優勝しました
6 準優勝 ISUCON6で準優勝でした
7 本戦敗退 ISUCON 7 本選で負けてきました
8 出題 ISUCON8 本選出題記

改善し、計測する ― ISUCONとは開発サイクルを回すこと

── 藤原さんがISUCONに参加するきっかけは何でしたか?

藤原 ISUCONの前に「チューニンガソン」というイベントがありました。データベースの割り当てメモリを増やしたり、同時接続数を増やしたりとインフラ側でいろいろチューニングできるコンテストです。ただし、アプリケーションのコードに手を入れることは許されないレギュレーションで、「それだけじゃ面白くないよね」と@tagomorisさんが言い出して始まったのが、ISUCONです。

 はっきりとは覚えていないんですが、その案内をたぶんTwitterで見たんでしょうね。先着20チームが参加できるというので、すぐ当時の同僚と組んでエントリーしました。

── 第1回でいきなり優勝できた勝因は何だったと思いますか?

藤原 参加したのはカヤックに転職して約半年後だったんですが、その当時手がけていた「koebu」というサービスが長く負荷に苦しんでおり、入社以来、いろいろ安定させたり、サーバを移転させたりして戦っていた経験がありました。そこでやってきたことがうまくはまったんだと思います。

koebuは、2007年に開設された音声コンテンツによるWebコミュニティ。2014年にサイバーエージェントに譲渡され、2016年9月をもって終了した。

── ISUCONでは3人までのチームを組むため、個人の経験だけでなくチームとしてどう臨むかも大切になりますよね。

藤原 ISUCONで参加者がやれることはいっぱいあるのですが、競技時間は8時間(朝10時から夕方18時まで)しかないため、複数のメンバーが同じ作業をしても意味がありません。かといって、互いのやっていることを全く知らなくてもダメなんです。方針を決めて共有しておくことが大切ですね。一人で好き勝手にコードを書いてても動きませんから。

 「ここはこう直しましょう」と方針を決めて、役割分担をして作業し、できたら結合して、ベンチマークをかけるという一連のサイクルを効率的に回せると、点数につながります。私はこれまで、基本的に会社の人か元同僚と一緒に出ているので、互いの得意なこと・できることを知っていたことも大きかったと思います。

── そのサイクルは、インフラエンジニアとしての普段の業務に近いのでしょうか?

藤原 いえ、インフラの設定だけいじっていてもスコアは全然変わらないので、どちらかというとアプリケーション開発フローに近く、それを回すことが大切になってきます。

 立てた方針に意味があったかはどうかは、ベンチマークのスコアを見れば分かります。また、スコアは変わらなくてもサーバの負荷が下がることもあり、これもサーバのリソースが空くという意味で有効な手ですから、ベンチマークはもちろん、他のメトリクスを計測して、意味があったかどうかを判断しています。

── 8時間という時間の使い方も重要になると思いますが、どう配分しているのですか?

藤原 最初の1時間は、サーバ上で快適に作業できる環境作りに費やすようにしています。問題サーバにはデプロイ用のツールも何も用意されておらず、ただファイルが置いてあるだけです。それをGitで管理して、プルリクエストをマージしたらすぐデプロイされる環境を作ったり、開発に必要なツールをインストールします。

 競技中には、負荷を見るツールとしてdstatやnetdataを、ログを解析するツールとしてはalppt-query-digestを使っています。他には、kataribeを使っている方も多いようです。

 私がそうしたタスクを担当して、環境が構築できるまでの間、他の2人にはコードを下読みして、明らかにおかしいところを探してもらいます。ISUCONの問題のコードは何千行もないので、ざっと見れば何をやっているかが分かります。

 あとは、計測ですね。先ほども言いましたが、いろんなメトリクスを見るコマンドやツールを使ったり、どの処理にどのくらい時間がかかるかをログに記録したりします。すると、「このAPIは平均1秒かかるけれど、こっちは0.5秒で済む」といったことが見えてきます。

 ここで大事なのは、重いところを直すことです。軽いところをいくら直しても、重いところに引っ張られて全然性能が出ないので。そうやって直すと、相対的に別のところが重くなる。これを順番に繰り返して直していくと、理想的にはどんどん早くなるはずです。

── 時間の使い方で他に大切なことがあれば教えてください。

藤原 大きな決断をいつまでに下すかもポイントですね。ISUCONでは、いくら途中で高いスコアを出しても、最終的に動かないと0点になるので、あまりギリギリになって大きな改造をすると動かなくなるリスクがあります。

 私の場合、データベースの載せ替えといったレベルの大改造をするなら、15時(8時間のうち5時間が経過)を1つのデッドラインにして、それまでに決断が下せないなら今までの延長戦上でいく、そういうざっくりしたタイムラインを設けています。

 もう1つ、最後の30分から1時間は動作確認に費やしています。よくあるのが、インストールしたアプリが動かない、起動しないケースです。再起動しないと有無を言わせず失格なので、ちゃんと再起動して動作するかの確認に当てています。

 準備をして方針を決め、大改造のデッドラインを決めて作業し、最後に仕上げをする……うまくいった回はそれが全部はまりましたね。逆にダメなときはそこがぐだぐだで、大改造の決断ができないうちにズルズルいって、最後の動作確認も遅れに引きずられて……という感じでした。

── どんなところがうまくいかなかったんでしょうか?

藤原 例えば、第4回では、Cache-Controlヘッダーをいじれば一気に負荷が下がるのに、そこに気付けませんでした。

 また、第7回は大敗北したんですが、敗因は分かっていて、WebSocketでやり取りされるメッセージの計測がちゃんとできていなかったんですよ。それで効率的な手が打てませんでした。

6 藤原俊一郎さん、面白法人カヤック 技術部

「コンテストのためのコンテスト」ではない、現実に即した出題

エンジニアHubに会員登録すると
続きをお読みいただけます(無料)。
登録ボタンを押すと、利用規約プライバシーポリシーに同意したことになります。
登録のメリット
  • すべての過去記事を読める
  • 過去のウェビナー動画を
    視聴できる
  • 企業やエージェントから
    スカウトが届く