لا فهرسة

قيمة في العلامات الوصفية لبوتات الإتش تي إم إل تمنع بوتات البحث من فهرسة الصفحة، وبالتالي عدم ظهورها في نتائج البحث.
هذه النسخة المستقرة، فحصت في 1 أغسطس 2024. ثمة 3 تعديلات معلقة بانتظار المراجعة.

noindex (لا فهرسة) هي قيمة في الوسوم الوصفية [الإنجليزية] لبوتات الإتش تي إم إل تمنع بوتات البحث من فهرسة الصفحة، وبالتالي عدم ظهورها في نتائج البحث.[1][2] تتضمن الأسباب التي قد تجعل المرء يرغب في استخدام هذه الوسم الوصفي توجيه البوتات بعدم فهرسة قاعدة بيانات كبيرة جدًا، أو صفحات الويب المؤقتة جدًا، أو صفحات الويب قيد التطوير، أو صفحات الويب التي يرغب الشخص في الاحتفاظ بها بشكل أكثر خصوصية، أو الطابعة و إصدارات الصفحات الملائمة للجوال. نظرًا لأن عبء احترام وسم noindex الخاصة بموقع الويب يقع على عاتق مؤلف بوت البحث، فقد لل يُلتزم بهذه العلامات في بعض الأحيان. كما يختلف أحيانًا تفسير وسم noindex قليلًا من شركة محرك بحث إلى أخرى.

عدم فهرسة الصفحات بأكملها

عدل
<html>
<head>
  <meta name="robots" content="noindex">
  <title>Don't index this page</title>
</head>

القيم المحتملة لمحتوى الوسم الوصفي هي: "none" و"all" و"index" و"noindex" و"nofollow" و"follow". من الممكن أيضًا الجمع بين القيم،[1] على سبيل المثال:

التوجيهات الخاصة بالبوت

عدل

يمكن تقييد توجيه noindex فقط على برامج بوت معينة عن طريق تحديد قيمة "name" مختلفة في الوسم الوصفي. على سبيل المثال، لحظر بوت غوغل على وجه التحديد،[3] حدد:

<meta name="googlebot" content="noindex">

أو، لحظر بوت بينغ، حدد:

<meta name="bingbot" content="noindex">

أو لحظر بوت بايدو، حدد:

<meta name="baiduspider" content="noindex">

ملف robots.txt

عدل

يمكن استخدام ملف robots.txt لمنع الزحف.

عدم فهرسة جزء من الصفحة

عدل

من الممكن أيضًا استبعاد جزء من صفحة الويب، على سبيل المثال نص التنقل، من الفهرسة بدلًا من الصفحة بأكملها. هناك تقنيات مختلفة للقيام بذلك. من الممكن استخدام عدة معًا. من غير المعروف أن عنكبوت الفهرسة الرئيسي في غوغل، غوغل بوت، يتعرف على أي من هذه التقنيات.

الوسم <noindex>

عدل

قدم محرك البحث الروسي ياندكس وسم <noindex> جديدة تمنع فهرسة المحتوى بين العلامات. للسماح لكود المصدر بالتحقق من صحته، بدلاً من ذلك يمكن استخدام:[4]

<p>
Do index this text.
<noindex>Don't index this text.</noindex>
<!--noindex-->Don't index this text.<!--/noindex-->
</p>

تتعرف عناكب الفهرسة الأخرى أيضًا على وسم <noindex>، بما في ذلك أتومز.[5]

تنسيق ميكروفورمات

عدل

توجد مواصفات مسودة تنسيقات ميكروفورمات لعام 2005 بنفس الوظيفة. يبحث ملف تعريف استبعاد البوت عن السمة والقيمة "class=robots-noindex" في وسوم الإتش تي إم إل:[6]

<p>Do index this text.</p>
<div class="robots-noindex">Don't index this text.</div>
<span class="robots-noindex">Don't index this text.</span>
<p class="robots-noindex">Don't index this text.</p>

من الممكن أيضًا الجمع بين القيم، [6] على سبيل المثال:

<div class="robots-noindex robots-follow">Text.</div>

ياهو!

عدل

في عام 2007، قدمت ياهو! وظائف مماثلة للتنسيق المصغر في عنكبوتها. ومع ذلك، فإن عنكبوت ياهو! غير متوافق من حيث أنه يبحث عن قيمة class="robots-nocontent" وعن هذه القيمة فقط:[7]

<p>Do index this text.</p>
<div class="robots-nocontent">Don't index this text.</div>
<span class="robots-nocontent">Don't index this text.</span>
<p class="robots-nocontent">Don't index this text.</p>

نقطة مشاركة

عدل

يستبعد iFilter الخاص بشير بوينت 2010 المحتوى الموجود داخل وسم <div> مع السمة والقيمة class="noindex". لم تُستبعد عناصر <div> الداخلية في البداية، ولكن ربما تغير هذا. ومن غير المعروف أيضًا ما إذا كان من الممكن تطبيق السمة على علامات أخرى غير <div>.[8]

<p>Do index this text.</p>
<div class="noindex">Don't index this text.</div>

تعليقات منظمة

عدل

جهاز بحث جوجل

عدل

يستخدم جهاز بحث جوجل [الإنجليزية] التعليقات المنظمة:[9]

<p>
Do index this text.
<!--googleoff: all-->
Don't index this text.
<!--googleon: all-->
</p>

تستخدم عناكب الفهرسة الأخرى أيضًا تعليقاتها المنظمة.

انظر أيضا

عدل

المراجع

عدل
  1. ^ ا ب Robots and the META element, Official W3 specification
  2. ^ About the Robots <META> tag
  3. ^ Using meta tags to block access to your site, Google Webmasters Tools Help
  4. ^ "Using HTML tags". webmaster → help. ياندكس. Section: <noindex> tag. اطلع عليه بتاريخ 2013-03-25.
  5. ^ "General Search FAQ". Help. Atomz. 2013. Section: How do I exclude parts of my site from being searched?. مؤرشف من الأصل في 2021-12-08. اطلع عليه بتاريخ 2013-03-23. Need to prevent parts of individual pages from being searched? If you want to exclude portions of a page from indexing, surround the text with <noindex> and </noindex> tags. This is useful, for example, if you want to exclude navigation text from searches.(التسجيل مطلوب) 
  6. ^ ا ب Janes، Peter (18 يونيو 2005). "Robot Exclusion Profile". Microformats. اطلع عليه بتاريخ 2013-03-24.
  7. ^ Garg، Priyank (2 مايو 2007). "Introducing Robots-Nocontent for Page Sections". Yahoo! Search Blog. ياهو!. مؤرشف من الأصل في 2014-08-20. اطلع عليه بتاريخ 2013-03-23.
  8. ^ "Control Search Indexing (Crawling) Within a Page with Noindex". Microsoft Developer. مايكروسوفت. 7 يونيو 2010. مؤرشف من الأصل في 2017-11-04. اطلع عليه بتاريخ 2017-11-04.
  9. ^ "Administering Crawl: Preparing for a Crawl". Google Search Appliance. Google Inc. 23 أغسطس 2012. Section: Excluding Unwanted Text from the Index. مؤرشف من الأصل في 2012-11-23. اطلع عليه بتاريخ 2013-03-23.