日本无卡码高清免费v-人妻奶水人妻系列-熟女少妇精品一区二区-国产女人18毛片水真多1-中文字幕av在线一二三区

惡意蜘蛛或者爬蟲UA特征公布(2024版)

我們做網(wǎng)站,往往都是機器比真人少,不僅影響我們查看數(shù)據(jù)的真實性,也影響網(wǎng)站服務器的負載,其中很多未知名的機器天天爬,不知道是采集還是掃漏洞、或者是撒網(wǎng)式攻擊注入,讓人煩不勝煩!那么我們有什么好的辦法呢?唯一的辦法就是對該類訪問進行屏蔽。但是通過IP來訪問,實在是收效甚微,主要原因是我們沒有大量的數(shù)據(jù)來進行分析各IP的訪問行為。

對于一些高明的機器訪問,我們很難判斷是真人還是機器,但是我們可以通過UA來對某些訪問者進行限制。雖然不能全面禁止惡意機器的訪問,但是大部分無意義的訪問者是可以攔截在網(wǎng)站之外的。

惡意蜘蛛或者爬蟲UA特征公布(2024版)插圖

惡意蜘蛛或者爬蟲UA特征公布(2024版)插圖1

一、判斷蜘蛛的真實性

很多機器訪問的時候會模擬百度蜘蛛、谷歌蜘蛛進行訪問,這里我們就需要對蜘蛛真實性進行有效的識別。其中最有效的辦法是通過收集各大搜索引擎的全部蜘蛛IP來進行匹配,但是要收集蜘蛛的所有IP比較困難,除非搜索引擎公布了所有蜘蛛的IP,不然很難做到全面。最簡單的辦法則是對蜘蛛的IP進行反查詢,查詢其DNS解析記錄。比如:

百度蜘蛛:DNS記錄需包括(baidu.com)

谷歌蜘蛛:DNS記錄需包括(googlebot.com)

必應蜘蛛:DNS記錄需包括(search.msn.com)

這里主要是針對模仿蜘蛛進行訪問的機器,他既然選擇模仿蜘蛛而避免被屏蔽,說明其行為的目的并不單純,大可放心攔截封禁!

二、非法UA特征

對于一些沒有模擬知名蜘蛛的普通訪問者,凡是有一些特征的UA,基本可以直接屏蔽:

AhrefsBot

AwarioBot

BLEXBot

Barkrowler

CensysInspect

Criteo

DataForSeoBot

DigExt

DnyzBot

DotBot

ExtLinksBot

Ezooms

FlightDeckReports

Go-http-client

Grapeshot

Heritrix

HttpClient

HubSpot

InternetMeasurement

Knowledge AI

Linguee Bot

MJ12bot

MauiBot

MegaIndex

RepoLookoutBot

SemrushBot

SurdotlyBot

Web-Crawler

WellKnownBot

Yellowbrandprotectionbot

ZoominfoBot

axios

fasthttp

github

libcurl

paloaltonetworks

python

seokicks

serpstatbot

webprosbot

Go-http-client

python-requests

ubuntu

Java

DataForSeoBot

MJ12bot

AhrefsBot

BLEXBot

DotBot

Barkrowler

Adsbot

SM-G900P

SemrushBot

PetalBot

GPTBot

Apache-HttpClient

ds-robot

amazonbot

msray-plus

Go-http-client

YandexBot

Python

SkyworkSpider

facebook

ChatGLM-Spider

Knowledge AI

Linguee Bot

Wordup-1

PycURL

curl/7.29.0

okhttp

ChatGLM-Spider

python

Python-urllib/3.10

Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.2)

Dalvik/2.1.0

Mozilla/4.0 (compatible; MSIE 9.0; Windows NT 6.1)

Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0)

Go-http-client/1.1

Mozilla/5.0 (Windows NT 10.0; WOW64; rv:48.0) Gecko/20100101 Firefox/48.0

Mozilla/5.0 (compatible; iaskspider/1.0; MSIE 6.0)

這里面有ai蜘蛛、服務器機器UA、go和python等服務UA、很多l(xiāng)inux系統(tǒng)的機器UA是空,比如寶塔的linux機器訪問是空UA,所以空UA基本也是可以屏蔽掉的。當然,我這里分享的東西可能還不夠全面,也可能有重復的,其余的等待大家補充!

THE END
主站蜘蛛池模板: 免费吃奶摸下激烈视频| 国内一区二区三区香蕉aⅴ| 一本加勒比hezyo无码人妻| 国产精品久久无码不卡黑寡妇 | 国产人妻人伦精品久久久| 亚洲欧洲日产国码无码动漫| 国产精品人妻系列21p| 亚洲精品欧美综合四区| 老男人久久青草av高清| 久久午夜无码免费| 国产无套流白浆视频免费| 精品久久人人爽天天玩人人妻| 青青草原综合久久大伊人精品| 女性女同性aⅴ免费观女性恋| av在线中文字幕不卡电影网| 久久久久影院美女国产主播| 色欲麻豆国产福利精品| 国产精品无码久久一线| 亚洲日本一区二区三区在线播放| 日本肉体xxxx裸交| 极品老师腿张开粉嫩小泬| 欧美亚洲亚洲日韩在线影院| 永久免费无码网站在线观看| 免费无码十八禁污污网站| 午夜精品久久久久久久四虎| 久久久噜噜噜久久熟女色| 无码h肉在线观看免费一区| 亚洲精品久久午夜麻豆| 乌克兰少妇性做爰| 免费看成人午夜福利专区| 色综合久久久无码中文字幕| 国产精品一区二区三乱码| 免费国产一区二区三区四区 | 少妇人妻88久久中文字幕| 午夜时刻免费入口| 少妇高潮无套内谢麻豆传| 日本午夜免费福利视频| 亚洲一区二区无码偷拍| 无码专区 丝袜美腿 制服师生| 久久久久国产精品麻豆ar影院| 动漫精品专区一区二区三区不卡|