Definition
En datacenter-proxy är en proxyserver vars utgående IP-adress kommer från IP-tilldelningen hos en kommersiell hostingleverantör, molnplattform eller kollokationsanläggning. När internettrafik dirigeras genom en datacenter-proxy ser destinationsservern en käll-IP-adress som tillhör nätverket hos ett företag som Amazon Web Services, Google Cloud Platform, Microsoft Azure, DigitalOcean, OVHcloud, Hetzner Online, Linode (numera Akamai) eller en av tusentals mindre hostingleverantörer världen över.
Detta står i kontrast till bostads-IP-adresser, som tilldelas av konsument-ISP:er som Comcast, BT eller Jio till hushållsbredbandsanslutningar och mobilabonnenter. Skillnaden spelar roll eftersom IP-renomméedatabaser — upprätthållna av MaxMind, Spamhaus, IPinfo och andra — uttryckligen klassificerar hostingleverantörers adressintervall, vilket gör datacenter-IP-adresser triviellt identifierbara som icke-konsumenttrafik.
Hur datacenter-proxyer fungerar
En datacenter-proxy-utrullning består vanligen av en eller flera servrar som tillhandahålls hos en hostingleverantör. Varje server tilldelas en eller flera offentliga IPv4- eller IPv6-adresser från hostingleverantörens IP-tilldelning. Proxy-mjukvara — vanligen Squid, Dante eller en anpassad SOCKS5- eller HTTP-proxy-daemon — lyssnar på en port och vidarebefordrar inkommande anslutningsförfrågningar till destinationen och ersätter serverns datacenter-IP som den synbara källan.
Klienter ansluter till proxyservern med proxyns adress och port, autentiserar om så krävs och utfärdar sina förfrågningar. Proxyn vidarebefordrar dessa förfrågningar till målwebbplatsen och returnerar svaren. Målwebbplatsen registrerar datacenter-IP:n som besökarens adress.
Datacenter-proxyer är snabba och billiga att tillhandahålla — en enda molnserver kan hantera hundratals eller tusentals samtidiga anslutningar, och IPv4-adresser från stora leverantörer kostar bråkdelar av ett öre per timme. Detta gör dem attraktiva för automatiserade uppgifter med hög volym, såsom web scraping, prisövervakning och automatiserad testning.
Hastighets- och kostnadsfördelen kommer med ett grundläggande detekterbarhetsproblem: varje större IP-renomméedatabas upprätthåller heltäckande, regelbundet uppdaterade listor över hostingleverantörers IP-intervall. MaxMinds GeoIP2 Anonymous IP-databas, till exempel, flaggar uttryckligen adresser från över 3 000 kända hosting- och VPN-ASN:er. Cloudflares bothanteringsprodukter tillämpar liknande klassificering på all trafik som passerar deras nätverk. Spamhaus BGP-blockeringslista innehåller många hostingleverantörsintervall. Varje plattform som frågar dessa databaser — vilket är standardpraxis för tävlingsbedrägeriförebyggande — kan avvisa datacenter-baserade röster vid det första nätverkslagret innan någon djupare analys krävs.
Var du stöter på det
Datacenter-proxyer är allestädes närvarande i legitim teknisk verksamhet: innehållsleveransnätverk som Cloudflare, Fastly och Akamai serverar webbinnehåll från datacenter-IP-adresser; affärs-VPN-tjänster som Cisco AnyConnect och GlobalProtect dirigerar företagstrafik genom datacenter-slutpunkter; web-scraping-infrastruktur för prisjämförelsetjänster och marknadsundersökningsföretag körs på datacenter-servrar.
I bedrägeridetekteringssammanhang är datacenter-IP-adresser den första signalen som en tävlingsplattform kontrollerar. Moderna antibot-plattformar, inklusive Cloudflare Bot Management, DataDome och HUMAN Security, använder datacenter-ASN-klassificering som ett tidigt-stadie-filter som avvisar eller hårt granskar varje förfrågan som kommer från ett hostingleverantörsintervall utan att kräva ytterligare analys.
Praktiska exempel
En social-medie-tävlingsplattform loggar IP-adresser med varje röstinlämning och kör varje adress genom MaxMinds GeoIP2-databas i realtid. I ett 12-timmarsfönster anländer 2 400 röster från IP-adresser som databasen klassificerar som tillhörande Amazon Web Services, OVHcloud och DigitalOcean. Plattformens valideringslogik kasserar automatiskt dessa röster innan de når räknedatabasen, och loggen över kasserade röster bevaras för revisionsändamål.
En tävlingsbedrägeriforskare publicerar en analys som jämför acceptansgrader för röster som lämnats in genom datacenter-proxyer kontra bostadsproxyer på tio online-tävlingsplattformar. Studien finner att datacenter-baserade röster avvisas direkt av 8 av 10 plattformar på nätverkslagret, medan bostadsbaserade röster passerar samma initiala filter på alla 10 plattformar. Forskaren tillskriver skillnaden ASN-klassificering i alla åtta avvisningsfall.
Ett säkerhetsteam på en tävlingsplattform granskar sina åtkomstloggar och upptäcker att en konkurrents marknadsföringsbyrå lämnade in hundratals röster med datacenter-IP-adresser hyrda från Hetzner. IP-intervallets ASN är en registrerad hostingleverantör, så alla inlämningar kasserades tyst. Teamet använder denna data för att dokumentera bedrägeriförsöket för tävlingssponsorn.
Relaterade begrepp
Bostads-IP-adresser representerar alternativet till datacenter-IP-adresser — konsument-tilldelade adresser som passerar ASN-klassificeringsfiltret genom att komma från äkta hushålls- eller mobilanslutningar. ASN-diversitets-analys är den nätverksnivå-teknik som upptäcker trafik koncentrerad inom ett litet antal ASN:er, vilket är ett karakteristiskt mönster för datacenter-proxy-användning. Mobiloperatörs-IP-adresser intar en mellanställning: tilldelade av mobiloperatörer snarare än hostingleverantörer klassificeras de som konsumenttrafik men har distinkta egenskaper — särskilt carrier-grade NAT — som påverkar hur plattformar hanterar dem.
Begränsningar / förbehåll
IP-klassificeringsdatabaser är inte perfekt korrekta eller perfekt aktuella. IP-adressblock köps, säljs och omfördelas mellan hostingleverantörer och ISP:er kontinuerligt. Ett block som var bostadsbaserat för ett år sedan kan nu vara i ett datacenter-intervall, eller vice versa. MaxMind, IPinfo och liknande leverantörer publicerar noggrannhetsstatistik för sina databaser, men avvikelser förekommer och orsakar ibland att legitima användare som ansluter genom företags- eller utbildningsnätverk felaktigt klassificeras som datacenter-trafik.