ما هو ملف robots.txt ولماذا يمنع ظهورك؟
![]() |
| كيفية إصلاح الحظر في robots.txt وضمان ظهور موقعك في نتائج البحث |
علامات تؤكد أن موقعك محظور بسبب robots.txt
- رسالة في مشرفي المواقع (GSC) 📌 عند فحص رابط معين في Google Search Console، تظهر لك رسالة صريحة باللون الأحمر أو الرمادي تقول: "تمت الفهرسة، على الرغم من حظره بواسطة ملف robots.txt" أو "محظور بواسطة robots.txt".
- اختفاء الوصف في نتائج البحث 📌 عندما تبحث عن موقعك في جوجل، قد يظهر الرابط، لكن بدلاً من الوصف (Meta Description)، تظهر عبارة: "لا تتوفر معلومات لهذا الموقع" أو "تم حجب الوصف لهذا الكيان".
- تراجع حاد ومفاجئ في الزيارات 📌 إذا قمت بتعديل تصميم الموقع أو تثبيت إضافة أمان جديدة، ثم انخفضت الزيارات إلى الصفر فجأة، فالشك الأول يذهب مباشرة إلى ملف الروبوتس.
- فشل أدوات الفحص المباشر 📌 عند محاولة استخدام ميزة "Live Test" في مشرفي المواقع، تفشل الأداة في جلب الصفحة وتعطيك خطأ "Crawl failed" بسبب الحظر.
- تحذيرات من إضافات السيو 📌 إضافات مثل Rank Math أو Yoast SEO في ووردبريس غالباً ما تظهر تنبيهاً في لوحة التحكم إذا اكتشفت إعداداً يمنع الأرشفة.
- فحص النطاق يدوياً 📌 عند كتابة `yourdomain.com/robots.txt` في المتصفح، تظهر لك أوامر `Disallow: /` التي تعني حظر كل شيء.
- عدم أرشفة الصور 📌 اختفاء صور موقعك من "صور جوجل" قد يكون دليلاً على أنك منعت العناكب من الوصول لمجلد الوسائط (Uploads) عن طريق الخطأ.
- تأخر أرشفة المقالات الجديدة 📌 رغم نشرك لمحتوى جديد، لا يظهر في البحث لأسابيع، لأن العناكب "ممنوعة" من الدخول لاكتشافه.
- رسائل بريد إلكتروني من جوجل 📌 ترسل جوجل أحياناً تنبيهات شهرية حول "Coverage Issues" تشير لزيادة عدد الصفحات المحظورة.
- أخطاء في خريطة الموقع 📌 عند تقديم Sitemap، تظهر حالة "Couldn't fetch" لأن الروبوتس يمنع الوصول للخريطة نفسها.
فهم أوامر robots.txt (اللغة التي تفهمها العناكب)
- User-agent (وكيل المستخدم): هو اسم الروبوت الذي تخاطبه. عندما تكتب `User-agent: *` فأنت تخاطب "جميع" العناكب بلا استثناء. أما إذا كتبت `User-agent: Googlebot` فأنت توجه الأمر لعناكب جوجل فقط.
- Disallow (ممنوع الدخول): هذا هو الأمر الأخطر. أي شيء تكتبه بعد هذه الكلمة يصبح منطقة محظورة. مثال: `Disallow: /wp-admin/` يعني "ممنوع دخول لوحة تحكم الأدمن"، وهو أمر صحيح. لكن `Disallow: /` تعني "ممنوع دخول الموقع بالكامل".
- Allow (مسموح الدخول): يستخدم هذا الأمر لعمل استثناء داخل قاعدة حظر. مثلاً، إذا حظرت مجلداً كاملاً ولكنك تريد السماح بملف واحد داخله، تستخدم هذا الأمر.
- Sitemap (خريطة الموقع): هو سطر اختياري لكنه هام، تضع فيه رابط خريطة موقعك لتدل العناكب عليها مباشرة.
- التعليقات (#): أي سطر يبدأ بعلامة الشباك `#` يعتبر ملاحظة للبشر ولا تقرؤه الروبوتات.
أشهر الأخطاء القاتلة التي تسبب الحظر
- الخطأ الكارثي (Disallow: /) 📌 هذا السطر البسيط `Disallow: /` يخبر جوجل بحظر الموقع كاملاً من الصفحة الرئيسية وحتى آخر مقال. يحدث هذا غالباً عندما ينسى المطور إزالة خيار "منع محركات البحث من أرشفة هذا الموقع" في إعدادات ووردبريس بعد انتهاء تطوير الموقع.
- حظر ملفات التصميم (CSS & JS) 📌 في الماضي، كان حظر مجلدات التصميم أمراً عادياً. اليوم، جوجل تحتاج لرؤية ملفات CSS و JavaScript لتعرف هل موقعك متجاوب مع الهواتف أم لا. حظر هذه الملفات يمنع جوجل من "رؤية" الموقع كما يراه المستخدم، مما يضر بالسيو.
- تضارب الأوامر 📌 كتابة أمر يسمح بالدخول لصفحة معينة، ثم كتابة أمر آخر يمنع الدخول لنفس الصفحة في سطر لاحق قد يسبب ارتباكاً للعناكب، وعادة ما تأخذ العناكب بالأمر الأكثر تقييداً (الحظر).
- استخدام الكود غير القياسي 📌 استخدام أوامر لا تدعمها جوجل (مثل `Noindex` داخل ملف الروبوتس). جوجل أعلنت رسمياً أنها توقفت عن دعم أمر Noindex في ملف robots.txt، واستخدامه لن يمنع الفهرسة بل قد يسبب مشاكل زحف.
- حظر الصور عن طريق الخطأ 📌 استخدام أمر `Disallow: /images/` أو ما شابه لمنع سرقة الصور يؤدي لاختفائها من بحث صور جوجل، وهو مصدر زيارات مهم جداً للمتاجر والمواقع الإخبارية.
خطوات إصلاح ملف robots.txt عملياً
إذا كنت تستخدم إضافة SEO مثل Rank Math أو Yoast SEO، فالأمر سهل جداً ولا يتطلب دخول الاستضافة. في إضافة Rank Math، اذهب إلى: General Settings > Edit robots.txt. ستجد مربعاً يحتوي على الأكواد، قم بمسح أي سطر يحتوي على `Disallow: /` واستبدله بالكود الافتراضي الصحيح. في إضافة Yoast، اذهب إلى: Tools > File editor. ستجد نفس المحرر. قم بالتعديل ثم اضغط "Save changes to robots.txt".
إذا لم تكن تستخدم ووردبريس، أو تفضل التعديل اليدوي: 1. ادخل إلى حساب cPanel الخاص بك. 2. توجه إلى "File Manager" (مدير الملفات). 3. ادخل لمجلد `public_html` (المجلد الرئيسي للموقع). 4. ابحث عن ملف باسم `robots.txt`. (إذا لم تجده، قم بإنشاء ملف نصي جديد بنفس الاسم). 5. اضغط بزر الفأرة الأيمن واختر "Edit". 6. قم بإزالة أكواد الحظر واكتب الكود السليم، ثم احفظ التغييرات.
اختبار الملف كيف تتأكد أن الحظر زال؟
- Google Search Console: رغم نقل الأداة، يمكنك استخدام "فحص الرابط" (URL Inspection). ضع رابط صفحة كانت محظورة واضغط Enter. ثم اضغط "Test Live URL". إذا ظهرت النتيجة باللون الأخضر "URL is available to Google"، فهذا يعني نجاح الإصلاح.
- أداة Merkle Robots Testing Tool: أداة خارجية ممتازة. تضع فيها رابط موقعك ومحتوى ملف الروبوتس الجديد، وتخبرك هل العناكب قادرة على الدخول أم لا.
- التحقق اليدوي: ادخل للرابط `yourdomain.com/robots.txt` وتأكد أن التغييرات التي أجريتها قد تم حفظها بالفعل وظهرت للعلن (قد تحتاج لمسح كاش المتصفح أو كاش الموقع).
- مراقبة السجلات (Server Logs): للمتقدمين، مراجعة سجلات السيرفر ستوضح لك عودة Googlebot لطلب صفحات الموقع بنجاح (Status code 200) بدلاً من أن يتم صده.
جدول مقارنة الأوامر الصحيحة vs الأوامر الخاطئة
| الكود (Syntax) | المعنى والتأثير | التصرف الصحيح |
|---|---|---|
| Disallow: / | ⛔ حظر الموقع بالكامل. كارثة للسيو. | احذفه فوراً إلا إذا كان الموقع قيد التطوير. |
| Disallow: | ✅ (فارغ) يعني السماح بكل شيء. ممتاز. | هذا هو الوضع الافتراضي الآمن. |
| Disallow: /wp-admin/ | ✅ حظر لوحة التحكم. إجراء أمني جيد. | اتركه كما هو، لا يؤثر على الأرشفة. |
| Disallow: /tag/ | ⚠ حظر صفحات الوسوم. مفيد لمنع التكرار. | استخدمه بحذر، الأفضل استخدام meta noindex. |
| User-agent: Googlebot | توجيه الأمر لجوجل فقط وتجاهل الباقي. | الأفضل استخدام User-agent: * للشمولية. |
ما بعد الإصلاح كيفية استعادة الأرشفة بسرعة
- أعد إرسال خريطة الموقع 📌 اذهب لـ Google Search Console > Sitemaps، وقم بتقديم رابط الخريطة مرة أخرى. هذا ينبه جوجل بوجود تحديثات هيكلية.
- استخدم ميزة "طلب الفهرسة" 📌 للصفحة الرئيسية والصفحات المهمة جداً، استخدم أداة "URL Inspection" واضغط على "Request Indexing". هذا يضع صفحتك في طابور الأولويات للزحف.
- انشر الرابط في السوشيال ميديا 📌 الإشارات الاجتماعية (Social Signals) قد تجذب العناكب بشكل غير مباشر وتسرع عملية اكتشاف المحتوى المتاح حديثاً.
- راقب تقرير التغطية (Coverage) 📌 خلال الأيام التالية، تابع قسم "Pages" في مشرفي المواقع. يجب أن تبدأ أخطاء "Blocked by robots.txt" بالتناقص تدريجياً، بينما يزداد عدد الصفحات في قسم "Indexed".
الأسئلة الشائعة حول ملف robots.txt
1. هل حذف ملف robots.txt بالكامل يحل المشكلة؟
نعم، تقنياً إذا لم يجد جوجل الملف، فإنه يفترض أن "كل شيء مسموح". ولكن هذا ليس حلاً مثالياً لأنك تفقد القدرة على منع أرشفة الصفحات الإدارية والخاصة، كما تفقد مكان وضع رابط الـ Sitemap. الأفضل هو إصلاح الملف وليس حذفه.
2. هل الحظر في robots.txt يزيل الصفحة من جوجل فوراً؟
لا، الحظر يمنع "الزحف" (Crawling) وليس الفهرسة (Indexing) بشكل مطلق. إذا كان هناك روابط خارجية تشير لصفحتك المحظورة، قد تظهر في جوجل ولكن بدون وصف (Meta Description).
3. هل يمكنني استخدام robots.txt لمنع فهرسة المقالات الضعيفة؟
لا يُنصح بذلك. لمنع فهرسة صفحة معينة، الأفضل استخدام وسم `noindex` في كود الصفحة نفسها (Meta Tag). ملف الروبوتس مخصص لتوفير ميزانية الزحف (Crawl Budget) وليس للتحكم في جودة الفهرسة.
4. كم من الوقت يستغرق جوجل للتعرف على التغييرات؟
عادة ما يتم تحديث ملف الروبوتس لدى جوجل كل 24 ساعة. أما إعادة فهرسة الصفحات التي كانت محظورة قد تستغرق من بضعة أيام إلى أسابيع حسب حجم موقعك وشهرته.
5. هل يؤثر حجم ملف robots.txt على السيو؟
نعم، جوجل وضعت حداً أقصى لحجم الملف وهو 500 كيلوبايت. إذا تجاوز ملفك هذا الحجم (وهو نادر جداً)، قد يتوقف جوجل عن قراءته بالكامل.
