SimilarWeb データメソドロジー

本ガイドでは、SimilarWebがどのようにデジタル世界の動向を計測し、世界190カ国以上で、何百万ものウェブサイトとアプリに関する最も信頼のおけるインサイトを提供するメソドロジーを説明致します。

SimiliarWebのデータメソドロジーは多角的なアプローチを採用しており、下記の主となるデータソースを活用して、包括的かつ信頼のおける自社・競合のデジタルプロファイルを提供しています。

  1. グローバル・パネルデータ
  2. データパートナー
  3. 公開されたデータソース
  4. 直接計測データ
  5. SimilarWebの基本的な考え方
  6. SimilarWebと自社分析ツール
  7. 直接計測データだけでは不十分

 

 

1. グローバルパネルデータ

SimilarWebのグローバルパネルはどこから提供されているのか

SimilarWebは、過去10年間で、価値の高い消費者向け製品を完全無償・無広告で配布する成功モデルを築き上げてきました。これら製品をユーザーがダウンロードする際、モバイルおよびデスクトップのパネルに参加することに同意、つまりオンラインのデジタル活動を弊社に提供してデジタル世界の動向理解に協力することに同意しています。

なぜSimilarWebのパネルは堅強といえるのか

これら製品は、高い評価を受けていると同時に、高いユーザー維持率を保っています。また、広告に邪魔されることなく、他に類のないユーザー体験を提供しています。弊社では、これら製品から得るパネルデータに意図的なバイアスがかかることを避けるため、その使用はもとより、ダウンロードすることを促進・誘導することは決してありません。高価値・高ユーザー維持率の、多種多様なツールやエンターテインメント製品が、製品パネルに首尾一貫性したパネルデータを提供し、オンライン活動を代弁する価値を生み出しているのです。

SimilarWebのパネルサイズについて

上記で述べている通り、SimilarWebのパネルは、デジタル動向を理解するために使用している複数のデータソースの一つでしかありません。弊社が産出する推計データは、各国のラーニングセットと実際の市場からのフィードバックを参照しながら試験・評価されます。そして、提供できるデータ精度が弊社基準を上回った場合にのみ、当該国のデータが製品上で公開されます。パネル数は国やプラットフォームごとに異なっており、また時系列でもその数は変動しますが、弊社では、当該国の人工1%に当たるオンライン人口があることが適切な基準点であると判断しています。

SimilarWebは、お客様の企業の将来に関わることもある重大なビジネス判断を支援するもので、私にとって製品データの信頼性は極めて重要なことと考えています。

ユーザーはなぜSimilarWebのパネルに参加するのか

パネルに参加するユーザーは、対象となる特定の消費者向けアプリに価値を見出しています。このような価値の交換はよく見受けられるビジネスモデルで、例えばアプリの質向上を目的としてデータ収集のために製品を無償公開することなどは珍しくありません。また、よく知られている例ではGoogleとFacebookも同じようなモデルを採用しています。ただ、GoogleならびにFacebookと異なり、これらがPII(個人情報)データを収集するのに対し、SimilarWebが収集するデータは匿名です。

先に述べたとおり、SimilarWebのパネルユーザーは「オプトイン」しています。オプトインにあたり、ユーザーには、匿名データを共有することが二段階確認され、またそれは各製品のプライバシーでも説明されています。また、SimilarWebのデータ収集は、GDPR(一般データ保護規則)に完全準拠して行われています。

SimilarWebのパネルを構築する消費者向け製品の例とは

弊社のパネルを構築する消費者向けプロダクトは、様々なプラットフォーム上で作成され、取得され、パートナーシップを組んでおり、大きく次の3カテゴリーに分かれています:セキュリティ(ウィルス対策など)、パフォーマンス/生産性向上(デバイス速度やストレージなど)、パーソナライゼーション(よりパーソナライズされたブラウズ体験のためのツールなど)。典型的な例は、SimilarWebおよびSimilar Sitesの拡張機能です。尚、前項でも述べた理由により、パネルソースとなる消費者向け製品のフルリストは公開しておりません。

SimilarWebの大規模なリサーチ部門では、各国のラーニングセットとパネルがデータ精度を担保するのに十分なサイズであることを日々検証し、またバイアスを排除しています。これにより、弊社製品データがオンライン動向を代弁し得るものとして成り立っているのです。

SimilarWebは、IPアドレスやPII(個人情報)を収集しているのか

SimilarWebはPIIやIPアドレスを収集することはありません。多様なメカニズムとアルゴリズムを用いて、個人の特定可能なデータを収集してしまうリスクを排除しています。

GDPRへの準拠

SimilarWebは、GDPRはもとより、SaaS企業に適用される全てのプライバシー法および規制に確実に準拠していることの確認に、多くの時間・努力・リソースを費やしています。

SimilarWebはPIIやIPアドレスを収集することはありません。SimilarWebが収集するグローバルパネルデータは匿名で、個人を特定できる情報は含まれません。

 

2. データパートナー

SimilarWebのデータパートナーシップとは

SimilarWebは、製品上で提供される世界中のデジタル動向に関するインサイトを補完するため、消費者向け製品経由で収集されるプラットフォームに加え、データパートナーを模索・維持しています。

SimilarWebは第三者機関と協働していますが、弊社内でも多くの消費者向け製品やラーニングセットを有しているため、これら第三者機関に依存しているということはありません。第三者機関と協働することについては、もちろんのことながら、相互に商的価値を交換するという関係があります。

データパートナーシップに関するよくある質問

Q: このようなデータはどこから取得しているのですか?

A: SimilarWebは世界中のInternet Service Providers (ISPs)とパートナーシップを結び、匿名に集計されたログデータの提供を受けています。こうしたデータは、消費者向け製品を通じて収集された世界中のデジタル行動に関するインサイトを補完するために利用されています。

ISPからのデータは、ウェブサイトやアプリ上の利用行動を集計しているもので、個別ユーザーの行動は提供されません。

 

3. 公開されたデータソース

SimilarWebが使っているパブリックデータとは

SimilarWebのパブリックデータソースは、公開(パブリック)されているオンライン情報の集合体を指します。Googleなど検索エンジンがウェブをインデックスするのと同様に、SimilarWebは毎月10億以上のパブリックデータを検知し、インデックスするための自動技術を採用しています。

SimilarWebは、このようにインデックスされたパブリックデータで、サイト間、アプリ間の関連相関性を構築し、あらゆるウェブサイト、あらゆるインタラクションをカテゴライズすることで、サイト分類とサブドメインをマッピングすることができるようになっています。

SimilarWebは、全てのデジタルチャネルのトラフィック内訳を横断的に提供している、唯一のマーケット・インテリジェンス・カンパニーです。

 

4. 直接計測データ

SimilarWebは直接計測データをどのように活用しているか

SimilarWebは何百何千ものウェブサイトとアプリが、Google Analytics、Adobe Analytics、アプリデベロッパーデータなどの直接計測データを共有することでも成長を続けています。

3,000以上の顧客数、600万以上の無償版サイトの訪問者、毎月のようにトップ出版物に引用されるデータ、ということからもわかるように、SimilarWebはデジタル世界を測るスタンダードとして大きな信頼を得ています。だからこそ多くの企業が自社の直接計測ツールをSimilarWebにつなぎ、自社サイトの指標に透明性を追加するという選択をしています。

共有された直接計測データによって、SimilarWebは特定の市場・業界におけるバイアスを較正し、様々なデータソースから得た情報をサンプルデータからインテリジェントな推測値に変換することができているのです。

従来の線形解析的メソドロジーと異なり、SimilarWebは直接計測データを用いて提供データのバイアスを科学的に軟性します。これにより、あらゆるサイトにおけるデータサンプルを推計インテリジェンスに転換することができているのです。

自社の直接計測データとSimilarWebが示すデータに差異があるのはなぜか

直接計測ツール間であってもデータの差異は生じますし、ましてマーケット・インテリジェンスのデータと比較することは適切ではありません。理由は以下の通りです:

メソドロジーの違い

多くのビジネスで、自社ドメインへのトラフィックを計測・分析するため直接計測ツールが利用されています。これらツールには類似する技術が使われているにも関わらず、各ツールが示す計測値にはしばしば隔離があります。理由としては、セッション数やセッション時間といった基本的な標準値の計測法が異なっているためです。例えば、あるツールでは重複する訪問を計測しなかったり、ボットによる訪問を排除したりするのに対し、別のツールではそれをしていません。 

人的要因

ウェブサイトに埋め込まれているトラッカーや分析用コードのあり方は、企業ごとに全く異なります。例えば、ウェブサイトに追加される新しいページで、数年間にも渡ってこれらコードが埋め込まれないまま運用されていることがあります。また、ウェブサイトがブログやオンラインショップなど異なる形態のサイトを有する場合、これらページへのコード埋め込みが忘れられていることもあります。一方で、ウィジェット、アプリ、ブラウザ・プラグイン、メールクライアントなど、様々な場所にトラッカーを埋め込んで訪問数やページ数が増大されているケースもあります。 

訪問数が少ない

SimilarWebはサンプルデータを使用しています。つまり、製品パネルに世界中の全ユーザー情報を有している訳ではありません。従って、訪問数が少ないウェブサイトにおいては、統計的な観点から、弊社の推計が必ずしも十分な精度を発揮しない場合があります。一般的な使い方として、SimilarWebは月に10万以上の訪問があるウェブサイトについて十分な推計データを提供できると考えています。 

直接計測データについてよくある質問

Q: 企業がSimilarWebに直接計測ツールを接続するのはなぜですか。

A: SimilarWebのような独立した第三者ツールで自社サイトの評価がなされることで、対外的なブラディングや投資増が期待できるからです。

SimilarWebとGoogle Analyticsの接続については、こちらをご覧ください。

 

5. SimilarWebの基本的な考え方

「唯一無二」の情報源は存在しない

弊社の把握しているところでは、2つの直接計測ツール間での平均計測値ギャップは+/-30%となっています。直接計測ツールは自社ウェブサイトトラフィックを計測する上で重要なツールではありますが、競合値の推測データと比較すべきものではありません。

SimilarWebは統一された、同一のメソドロジーによるデータを提供

ビジネスにおいては、直接計測システムが実測値を得る手段として選ばれる一方、SimilarWebはサイト同士の「同一の」「統一された」方法で計測された値として活用されています。

サイト規模が大きいほど、推計値の精度が上がる

パネル情報をベースにした計測メソドロジーについては同じことが言えますが、サンプル数が多いほど、精度は向上します。

 

6. SimilarWebと自社分析ツール

SimilarWebと自社の分析ツールの矛盾が解消されないのはなぜか

比較しようとする指標設定が次の観点から同一であるか、再確認してください:

      1. 比較分析対象期間は同一ですか?
      2. 比較しているデバイスは同一ですか?(デスクトップ/モバイル/合計)
      3. 同一指標で比較していますか?(ユニーク訪問者数、訪問数など)

以上ご確認いただいた上で、ご覧になっている数値のギャップが依然として解消されない場合には、お手数ですが弊社までお問い合わせ下さい。データチームにて、調査させていただきます。

 

7. 直接計測データだけでは不十分

類似するテクノロジーを活用する直接計測ツールは多々ありますが、それら直接ツール間で比較した際の結果データには、不一致が発生します。更に、Google Analytics同士でも、指標設定やバージョンの違いがあれば、データに不一致が生じます。

例えば、直接計測ツールAからツールBに変更した際、多くの場合20~30%程度で数字のギャップが生じることがわかっています。この理由の一つが「ボット」によるトラフィック、あるいはクローリングやスクレーピングのロボットによるもので、実際のユーザ行動を反映しないトラフィックです。こうしたボット・トラフィックは、直接計測から度外視されるべきですが、直接計測ツールはそれぞれ異なる方法論でこうしたボット・トラフィックを認識・除外するため、ツール間の統計にズレが生じることになります。

直接計測ツールを既に導入し活用されている企業において、SimilarWebが提供するマーケット・インテリジェンスを活用してビジネスの「コンテクスト」」を理解することは、競合理解や獲得戦略最適化において大きな利益が期待できます。

この記事は役に立ちましたか?
18人中11人がこの記事が役に立ったと言っています