برگزیده های پرشین تولز

راهنمایی برای مسدود کردن همه ربات ها در اچ تی اکسس

Business plan

کاربر فعال کسب درآمد از اینترنت
کاربر فعال
تاریخ عضویت
30 سپتامبر 2015
نوشته‌ها
10,747
لایک‌ها
14,007
محل سکونت
❤️️ ❤️️ ❤️️ ❤️️ ❤️️
دوستان, بجای اینکه تک تک ربات های مزاحم رو مسدود کنیم هیچ کد و دستوری برای اچ تی اکسس هست برای مسدود کردن همه ربات ها بجز...؟
"همه بجز a"
ولی الان وارد کردن دستی هست یعنی "فقط a, b, c و..."
مثلا فقط ربات گوگل بتونه وارد بشه و هیچ ربات دیگه ای دسترسی نداشته باشه
 

MOHAMMAD026_1

مدیر بخش ویژه وب مستر
مدیر انجمن
تاریخ عضویت
16 ژوئن 2014
نوشته‌ها
5,059
لایک‌ها
8,688
محل سکونت
ROOT
این کد تست شده و جواب میده:
Apache config:
RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} ^.*bot.*$ [NC]
RewriteCond %{HTTP_USER_AGENT} !^.*Googlebot.*$
RewriteRule !^robots\.txt$ - [F]

همه ربات هارو بجز ربات گوگل، مسدود میکنه
یه قابلیت هم داره که همه ربات ها به robots.txt دسترسی دارن. حتی وقتی که گوگل بات نباشن!
 

Business plan

کاربر فعال کسب درآمد از اینترنت
کاربر فعال
تاریخ عضویت
30 سپتامبر 2015
نوشته‌ها
10,747
لایک‌ها
14,007
محل سکونت
❤️️ ❤️️ ❤️️ ❤️️ ❤️️
یه قابلیت هم داره که همه ربات ها به robots.txt دسترسی دارن. حتی وقتی که گوگل بات نباشن!
ممنون ولی این موردش چه کاربردی داره؟
به یک لینک هم دسترسی داشته باشن ممکنه بتونه اختلال ایجاد کنه, دیداس و...
 

MOHAMMAD026_1

مدیر بخش ویژه وب مستر
مدیر انجمن
تاریخ عضویت
16 ژوئن 2014
نوشته‌ها
5,059
لایک‌ها
8,688
محل سکونت
ROOT
ممنون ولی این موردش چه کاربردی داره؟
به یک لینک هم دسترسی داشته باشن ممکنه بتونه اختلال ایجاد کنه, دیداس و...
محدود کردن ربات ها از طریق robots.txt خیلی بهتر جواب میده تا اینکه بصورت فنی مسدود کنیم
وقتی robots.txt رو بخونن و بدونن که محدود هستن، دیگه سعی نمیکنن صفحات بیشتری رو crawl کنند (البته باید ربات از فایل فوق و دستورات پیروی کنه)
این در حالی هست که اگر بصورت فنی مسدود کنی، ربات فکر میکنه در اون لحظه سایت مشکل داره و هی مجدد تلاش میکنه و همین باعث بار اضافه رو سرور میشه
به یک لینک هم دسترسی داشته باشن ممکنه بتونه اختلال ایجاد کنه, دیداس و...
فایل های متنی مثل این، توسط وب سرور هندل میشن و معمولا توسط وب سرور کش میشن(چون فایل static هستن). بنابراین نمیشه حملات موثری روی این نوع فایل های ثابت انجام داد
 
بالا