วิธีแก้ปัญหามี Bot จำนวนมาก crawl เว็บ

หากเว็บของคุณถูกบอทจำนวนมาก crawl จนเกิดปัญหาโหลดช้า หรือเปลืองทรัพยากรเซิร์ฟเวอร์ ลองใช้วิธีต่อไปนี้เพื่อป้องกันและจัดการบอท:


🔹 1. ปิดกั้นบอทด้วย robots.txt

ไฟล์ robots.txt ใช้ควบคุมบอทที่ทำตามกฎ (แต่บอทอันตรายอาจไม่สนใจ)
สร้างหรือแก้ไขไฟล์ robots.txt ที่ root directory ของเว็บคุณ

User-agent: * Disallow: /

 

คำอธิบาย:

  • User-agent: * → ใช้กับทุกบอท
  • Disallow: / → ไม่ให้เข้าเว็บเลย

หากต้องการบล็อกเฉพาะบอทบางตัว (เช่น AhrefsBot, SemrushBot):

User-agent: AhrefsBot Disallow: / User-agent: SemrushBot Disallow: /

 

📌 ข้อเสีย: วิธีนี้ไม่สามารถบล็อกบอทที่ละเมิดกฎ เช่น สแปมบอท


🔹 2. ใช้ .htaccess บล็อกบอทโดยตรง

ถ้าเซิร์ฟเวอร์เป็น Apache, คุณสามารถใช้ .htaccess เพื่อบล็อกบอทจาก User-Agent

RewriteEngine On RewriteCond %{HTTP_USER_AGENT} (AhrefsBot|SemrushBot|MJ12bot|Baiduspider) [NC] RewriteRule .* – [F,L]

 

คำอธิบาย:

  • RewriteCond → เช็กว่า User-Agent ตรงกับลิสต์ที่กำหนด
  • RewriteRule .* – [F,L] → ปฏิเสธการเข้าถึง

📌 เพิ่มการบล็อกไอพีของบอท

Deny from 192.168.1.100 Deny from 45.33.22.0/24

 


🔹 3. ใช้ Cloudflare ป้องกันบอท

Cloudflare มี Bot Management และ Firewall Rules ที่ช่วยป้องกันบอทได้

  • เปิด Bot Fight Mode
  • ตั้ง Firewall Rules → บล็อกบอทที่มีพฤติกรรมผิดปกติ
  • ใช้ Rate Limiting → จำกัดจำนวน request จากไอพีที่น่าสงสัย

🔹 4. ใช้ WordPress Plugin ป้องกันบอท

ถ้าใช้ WordPress, มีปลั๊กอินช่วยบล็อกบอท เช่น

Wordfence Security → บล็อกบอทและมี firewall
Blackhole for Bad Bots → ดักจับบอทที่ละเมิดกฎ robots.txt
WP-Optimize → บล็อกบอทที่ใช้ทรัพยากรหนัก


🔹 5. ตรวจสอบ Log และบล็อกไอพีที่น่าสงสัย

เช็ก access log ของเซิร์ฟเวอร์เพื่อดูว่า มีบอทจากไอพีไหนที่เข้ามาถี่เกินไป

cat /var/log/apache2/access.log | grep “bot”

 

จากนั้นใช้ iptables หรือ csf firewall บล็อกไอพี

iptables -A INPUT -s 192.168.1.100 -j DROP

 


🔹 6. ใช้ CAPTCHA หรือ Challenge

ถ้าบอทพยายามโจมตีฟอร์มหรือ API ของเว็บ

  • เพิ่ม reCAPTCHA ของ Google
  • ใช้ Cloudflare Turnstile แทน CAPTCHA

🎯 สรุปวิธีแก้ปัญหา

บล็อกบอทผ่าน robots.txt (ได้ผลกับบอททั่วไป)
ใช้ .htaccess หรือ Firewall บล็อกไอพีและ User-Agent
ใช้ Cloudflare ป้องกันบอทที่ซับซ้อน
ติดตั้ง WordPress Plugin ป้องกันบอท
เช็ก Log และบล็อกไอพีที่ผิดปกติ

🔹 แนะนำ: ถ้าปัญหารุนแรง ควรใช้ Cloudflare + Firewall Rules + .htaccess เพื่อปิดกั้นบอทอัตโนมัติ 🚀

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *