定義
データセンタープロキシは、商用ホスティングプロバイダー、クラウドプラットフォーム、またはコロケーション施設のIP割り当てから発信される送信IPアドレスを持つプロキシサーバーです。Amazon Web Services、Google Cloud Platform、Microsoft Azure、DigitalOcean、OVHcloud、Hetzner Online、Linode(現Akamai)、または世界中の数千の小規模なホスティングプロバイダーのいずれかのネットワークから発信されます。
インターネットトラフィックがデータセンタープロキシを経由してルーティングされると、宛先サーバーは、Comcast、BT、またはJioなどの消費者ISPによって家庭用ブロードバンド接続およびモバイルサブスクライバーに割り当てられた住宅用IPアドレスとは対照的に、商用ホスティングプロバイダーのネットワークに属するソースIPアドレスを認識します。この区別が重要な理由は、MaxMind、Spamhaus、IPinfo、およびその他の企業が管理するIP評判データベースが、ホスティングプロバイダーのアドレス範囲を明示的に分類し、データセンターIPを非消費者トラフィックとして自明に識別できるからです。
データセンタープロキシの仕組み
データセンタープロキシの展開は通常、ホスティングプロバイダーでプロビジョニングされた1つ以上のサーバーで構成されています。各サーバーには、ホスティングプロバイダーのIP割り当てから1つ以上のパブリックIPv4またはIPv6アドレスが割り当てられます。プロキシソフトウェア(一般的にはSquid、Dante、またはカスタムSOCKS5またはHTTPプロキシデーモン)はポートをリッスンして、ターゲット宛先への着信接続要求を転送し、サーバーのデータセンターIPを見かけ上のソースとして置き換えます。
クライアントは、プロキシのアドレスとポートを使用してプロキシサーバーに接続し、必要に応じて認証し、リクエストを発行します。プロキシはこれらのリクエストをターゲットウェブサイトに転送し、応答を返します。ターゲットウェブサイトはデータセンターIPを訪問者のアドレスとして記録しています。
データセンタープロキシのプロビジョニングは迅速で安価です。単一のクラウドサーバーは数百または数千の同時接続を処理でき、主要なプロバイダーからのIPv4アドレスは時間あたり数セント未満の費用がかかります。これにより、Webスクレイピング、価格監視、自動テストなどの大量の自動化タスクに魅力的です。
スピードとコストの利点には、根本的な検出可能性の問題が伴います。すべての主要なIP評判データベースは、ホスティングプロバイダーのIP範囲の包括的で定期的に更新されたリストを保守しています。例えば、MaxMindのGeoIP2 Anonymous IPデータベースは、3,000を超える既知のホスティングおよびVPN ASNからのアドレスを明示的にフラグします。Cloudflareのボット管理製品は、彼らのネットワークを横断するすべてのトラフィックに同様の分類を適用しています。SpamhausのBGPブロックリストには多くのホスティングプロバイダー範囲が含まれています。これらのデータベースを照会するプラットフォーム(これはコンテストフラウド防止の標準的なプラクティスです)は、深い分析を必要とせずに、最初のネットワークレイヤーでデータセンター起点の投票を拒否できます。
どこで遭遇するか
データセンタープロキシは、正当な技術操作に普遍的です。Cloudflare、Fastly、Akamaiなどのコンテンツ配信ネットワークはデータセンターIPからウェブコンテンツを提供しています。Cisco AnyConnectやGlobalProtectなどのビジネスVPNサービスはデータセンターエンドポイントを通じてコーポレートトラフィックをルーティングしています。価格比較サービスおよび市場調査会社向けのWebスクレイピングインフラストラクチャはデータセンターサーバー上で実行されています。
フラウド検出コンテキストでは、データセンターIPは、コンテストプラットフォームがチェックする最初のシグナルとして遭遇されます。Cloudflare Bot Management、DataDome、HUMAN Securityを含む最新のアンチボットプラットフォームは、ホスティングプロバイダー範囲から発信されるすべてのリクエストを拒否または厳密に調査する初期段階のフィルターとしてデータセンターASN分類を使用しており、さらなる分析を必要としません。
実践的な例
ソーシャルメディアコンテストプラットフォームはすべての投票投稿でIPアドレスをログして、各アドレスをMaxMindのGeoIP2データベースでリアルタイムで実行しています。12時間のウィンドウで、2,400票がIPアドレスからAmazon Web Services、OVHcloud、DigitalOceanのものとしてデータベースによって分類されるものから到着しています。プラットフォームの検証ロジックは、これらの投票を集計データベースに到達する前に自動的に破棄し、破棄されたログは監査目的で保存されています。
コンテストフラウド研究者は、10のオンラインコンテストプラットフォーム全体でデータセンタープロキシおよび住宅用プロキシを通じて投稿された投票の受け入れ率を比較する分析を公開しています。研究は、データセンター起点の投票がネットワークレイヤーで8つの10プラットフォームのうち8つによって拒否されることを示していますが、住宅用起点の投票は10プラットフォーム全体で同じ初期フィルターに合格しています。研究者は、すべての8つの拒否ケースでASN分類への差を起因しています。
コンテストプラットフォームのセキュリティチームはアクセスログを確認し、競合他社のマーケティング機関がHetznerからレンタルされたデータセンターIPを使用して数百の投票を送信したことを発見しています。IP範囲のASNは登録されたホスティングプロバイダーであるため、すべての投稿は静かに破棄されています。チームはこのデータを使用してコンテストスポンサーに対するフラウド試行を記録しています。
関連概念
**住宅IPアドレスはデータセンターIPへの代替を表しています。消費者が割り当てたアドレスは、本物の家庭またはモバイル接続から発信されることでASN分類フィルターに合格しています。ASN多様性分析は、少数のASN内に濃縮されたトラフィックを検出するネットワークレベルの手法です。これはデータセンタープロキシ使用の特性パターンです。モバイルキャリアIP**アドレスは中間を占めています。ホスティングプロバイダーではなくモバイルキャリアによって割り当てられると、それらは消費者トラフィックとして分類されますが、別の特性を持っています。特にキャリアグレードNATがプラットフォームによる処理方法に影響を与えています。
制限と注意
IP分類データベースは完全に正確または完全に最新ではありません。IPアドレスブロックはホスティングプロバイダーとISP間で継続的に売買され、再割り当てされています。1年前は住宅用だったブロックは、現在データセンター範囲にあるかもしれません、またはその逆です。MaxMind、IPinfo、および同様のベンダーは彼らのデータベースの精度統計を公開していますが、不一致が発生し、時々合法的なユーザーが企業または教育ネットワークを通じて接続されることが誤ってデータセンタートラフィックとして分類されます。