ヤフー株式会社 / リーダー
アクセス解析
自社のサービス開発のためのアクセス解析を開発しました。 弊社では多種のサービスを開発しているため、まずそれぞれのサービスでどのような指標を使っているかの調査から行い、企画担当と協力して必要な分析指標の調査を行いました。 基本的な集計値中心ですが、それぞれ正確な定義を行いました。 例えば、単なるPageViewでも、ロボットアクセスは入れるのか、ユーザIDが取得できないユーザは入れるのかを決めました。 また、複数サーバに渡るアクセスログを集めてくる際に、一時的に収集が遅れたデータをどうするのかなどを考えました。 また、社内でも活用が始まったばかりのHadoopを本格的に使うことで、社内のDaily数百GBという大量のアクセスログをサービスごとのマスターデータとJoinした上で数時間以内に集計するシステムを作り、HadoopだけではなくCDBなども適切に組み合わせて構築することで、高速に集計できるが、サービスごとに違う分析軸で集計ができるようなシステムを構築しました。 また、アトリビューション集計など、複雑な集計についても検討&一部チャレンジし、ベーシックな部分を実装しました。