
يوميًا يعالج محرك بحث جوجل مليارات الاستعلامات ويقوم بفحص مئات المليارات من صفحات الويب المفهرسة لديه خلال جزء من الثانية وذلك بهدف إنجاز هذه المهمة وتقديم النتائج الأكثر صلة وفائدة وموثوقية وتستخدم جوجل مجموعة مُعقدة من أنظمة الترتيب والتصنيف الآلية حيث تقوم هذه الأنظمة بتحليل مجموعة واسعة من العوامل والإشارات المرتبطة بالمحتوى.. لذلك أقدم لكم في هذا المقال نظرة عميقة حول أبرز أنظمة الترتيب والتصنيف في جوجل، استنادًا إلى المعلومات الرسمية بجانب معرفتي بمجال تحسين محركات البحث.
أبرز أنظمة تصنيف جوجل
فيما يلي بعض الأنظمة الرئيسية التي تؤثر في الوقت الحالي على نتائج البحث وبواسطتها يتم ترتيب وتصنيف نتائج صفحة محرك البحث طبقا للاستعلامات التي يطلبها المستخدمين:
1. نظام BERT
- التعريف: هو عبارة عن نظام ذكاء اصطناعي مُتقدم يعتمد على معالجة اللغات الطبيعية (NLP) ويعتمد في بنيته الاساسية علي ما يُعرف باسم المحولات Transformers.
- الاهداف والمهام التي يقوم بها النظام: يعمل نظام BERT على تمكين جوجل من فهم الفروق الدقيقة وسياق الكلمات ضمن استعلامات البحث والمحتوى، حيث يركز على كيفية تعبير مجموعات الكلمات عن معاني ونوايا مختلفة، ويتخطى اساليب مطابقة الكلمات المفتاحية البسيطة.
- التأثيرات: يسمح لمحرك البحث بفهم الاستعلامات الحوارية (الكلامية) أو المعقدة بشكل أفضل ويعطي محرك البحث الامكانية لمطابقتها مع المحتوى الذي يتلائم مع المعنى الأساسي بدقة حتى لو لم تكن الكلمات المفتاحية الدقيقة موجودة.
2. أنظمة معلومات الأزمات (Crisis Information Systems)
- التعريف: هي عبارة عن مجموعة من الأنظمة المُصممة لإظهار المعلومات الهامة أثناء الأزمات.
- الاهداف والمهام التي تقوم بها: يقوم بتوفير معلومات موثوقة ومحدثة وقابلة للتنفيذ في الوقت المناسب عندما يكون المستخدمون في أمس الحاجة إليها.
- مكونات واغراض النظام: غرصة للمساعدة في الأزمات الشخصية حيث تحدد الاستعلامات المتعلقة بالانتحار او الاعتداء الجنسي او التسمم او العنف القائم على النوع الاجتماعي أو إدمان المخدرات حيث تقدم تلك الانظمة معلومات التواصل لمنظمات الدعم الموثوقة وخطوط المساعدة ذات الصلة.
- ميزة تنبيهات SOS لتلك الانظمة: يتم تفعيلها أثناء الكوارث الطبيعية (الزلازل – الفيضانات – حرائق الغابات) أو الأزمات الأخرى واسعة النطاق حيث تقوم بعرض انباء وتحديثات من الحكومات والسلطات الرسمية، وتقدم جهات الاتصال في حالات الطوارئ وكذلك مسارات الخرائط ونصائح السلامة وروابط التبرع للدعم والمساعدة.
3. أنظمة إلغاء التكرار (Deduplication Systems)
- التعريف: هي عبارة عن انظمة وخوارزميات مصممة لإدارة وإزالة التكرار في نتائج البحث.
- الاهداف والمهام التي تقوم بها: تعمل على تجنب عرض صفحات متعددة تحتوي على محتوى متشابه جدًا لنفس الاستعلام وبالتالي توفر تجربة مستخدم أفضل وأكثر كفاءة وعادة ما يتم عرض النسخة الأكثر صلة أو الأساسية والتي يتم تحديدها بـ تاج الكانونيكال (canonical tag).
- التأثير: تقلل الفوضى في النتائج .. وللعلم ان هذا ينطبق أيضا على المقتطفات المميزة (Featured Snippets) فإذا تم عرض صفحة كمقتطف مميز فعادة تتم إزالة النتيجة العادية من الصفحة الأولى حيث يمكن للمستخدمين في اغلب الاحيان العثور على النتائج المحذوفة عبر رابط في أسفل صفحة النتائج إذا لزم الأمر.
4. نظام المطابقة التامة للدومين (Exact Match Domain – EMD System)
- التعريف: هو عبارة عن نظام يقوم بتعديل الإشارة المُحددة وذات صلة او متعلقة بأسماء الدومينات.
- الاهداف والمهام التي يقوم بها: يقوم بمنع إعطاء الاولوية والتصنيف الغير مبرر للمواقع التي تستخدم أسماء دومينات تتطابق تماما مع استعلامات بحث ذات قيمة عالية (مثل best-seo-course.com) بينما يمكن أن تكون الكلمات المفتاحية في الدومين إشارة ثانوية حيث يضمن هذا النظام عدم المبالغة في تقدير تلك الاشارة مع إعطاء الأولوية لجودة المحتوى الفعلي وملاءمته.
- التأثير: يقلل هذا النظام من ممارسة تسجيل الدومينات المحشوة بالكلمات المفتاحية فقط لأغراض الترتيب في النتائج الاولى.
5. أنظمة الحداثة (Freshness Systems – QDF)
- التعريف: هي عبارة عن مجموعة من الخوارزميات التي تعطي الأولوية للمحتوى الحديث او محتوى متعلق بفاعليات واحداث مهمة حيث تنشط هذه الانظمة عندما تكون الاحداث مهمة (استعلام يستحق الاهتمام – Query Deserves Freshness).
- الاهداف والمهام التي تقوم بها: تقوم بالعمل على تقديم معلومات محدثة للاستعلامات التي تكون فيها الحداثة مهمة وحاسمة.
- التأثير: يقدم نتائج ذات صلة بالاستعلامات حول الأحداث الجارية (مثل نتائج الانتخابات) او اخر الأحداث الهامة (مثل زلزال اليوم) او نتائج حول إصدارات المنتجات أو الأحداث المتكررة (مثل اسعار الذهب اليوم) وغالبا تلك الاحداث تؤدي إلى تفعيل هذه الأنظمة لتصنيف المحتوى الأحدث بشكل بارز.
6. أنظمة تحليل الروابط و PageRank
- التعريف: هي عبارة عن مجموعة أنظمة بما في ذلك خوارزمية PageRank التي تعتبر من الركائز الاساسية لمحرك البحث جوجل حيث تقوم بتحليل بنية الروابط على الويب.
- الاهداف والمهام التي تقوم بها: تقوم بالعمل على فهم العلاقات بين الصفحات وتحديد سلطة الصفحة (authority) وتقييم الملاءمة بناء على كيفية ربط الصفحات ببعضها البعض حيث ان الروابط من الصفحات ذات السمعة الطيبة وذات الصلة تعمل بمثابة أصوات ثقة او اشارات لزيادة الموثوقية.
- التأثير: لا تزال خوارزمية PageRank قائمة على الرغم من تطورها الكبير منذ إنشائها في حين انها جزءا من أنظمة التصنيف الأساسية لـ Google لكونها تساعد على تحليل الروابط في تحديد المصادر الموثوقة والجديرة بالثقة .. وللعلم ان تحقيق معايير الـ E-E-A-T يتم عن طريق استخدام التحقق الخارجي للروابط كإشارة للموثوقية.
7. أنظمة الأخبار المحلية (Local News Systems)
- التعريف: هي عبارة عن أنظمة مصممة لتحديد وإبراز المحتوى الإخباري من المواقع والمصادر المحلية.
- الاهداف والمهام التي تقوم بها: تعمل على توفير معلومات حول وجهات نظر واخبار محلية ذات صلة بالأحداث الإخبارية خاصة ضمن مميزات الظهور بصفحة النتائج مثل أهم الأخبار أو أقسام الأخبار المحلية المخصصة.
- التأثير: تعزز ظهور مواقع ومنصات الاخبار والصحافة المحلية عندما يشير قصد او نية استعلام المستخدم إلى الحاجة لمعلومات محلية او اخبارية.
8. نظام MUM (Multitask Unified Model)
- التعريف: هو عبارة عن نموذج ذكاء اصطناعي متقدم قادر على فهم وتوليد اللغة عبر مهام ولغات مختلفة .. إنه أقوى بكثير من نظام BERT.
- الاهداف والمهام التي يقوم بها: يُستخدم حاليا لتطبيقات محددة ومعقدة ضمن اليات البحث وليس للتصنيف والترتيب العام بصفحة النتائج وتشمل الأمثلة تحسين عمليات البحث عن معلومات محددة مثل معلومات لقاح كورونا COVID-19 وتحسين الشروحات المصاحبة للمقتطفات المميزة.
- التأثير: يوضح أبحاث الذكاء الاصطناعي المتطورة لدى جوجل (E-E-A-T) ويتم تطبيقه بشكل انتقائي لتحسين تجربة المستخدم في سيناريوهات استرجاع المعلومات المعقدة.
(ملاحظة: قد يتوسع دوره في المستقبل).
9. نظام المطابقة العصبية (Neural Matching)
- التعريف: هو عبارة عن نظام قائم على الذكاء الاصطناعي يتجاوز الكلمات المفتاحية لفهم المفاهيم الأساسية.
- الاهداف والمهام التي يقوم بها: يعمل على ربط المفاهيم المُعبر عنها في استعلام المستخدم بالمفاهيم المُمثلة في صفحات الويب حتى لو لم يتم استخدام نفس المصطلحات.
- التأثير: يُحسن الملاءمة من خلال فهم المرادفات والأفكار ذات الصلة والمواضيع الأوسع مما يؤدي إلى نتائج تتطابق بشكل أفضل مع قصد ونية المستخدم.
10. أنظمة المحتوى الأصلي (Original Content Systems)
- التعريف: هي عبارة عن أنظمة تركز على تحديد المحتوى الأصلي وإعطائه الأولوية.
- الاهداف والمهام التي تقوم بها: تعمل على مكافأة الصفحات التي تقدم قيمة فريدة او تقارير أصلية او تحليلات متعمقة أو أبحاث موثوقة وتقوم بتصنيفها أعلى من الصفحات التي تكتفي بتجميع المحتوى أو إعادة صياغته بشكل طفيف كما تدعم استخدام الكانونيكال تاج (rel=”canonical”) للمساعدة في تحديد النسخة الاساسية بعيداً عن المحتوى المكرر.
- التأثير: تدعم بشكل مباشر مبادئ HCU من خلال تقدير المحتوى الفريد.
11. نظام تصنيف المقاطع (Passage Ranking System)
- ما هو: هو عبارة عن نظام ذكاء اصطناعي يمكنه تحديد وفهم مدى صلة أقسام أو مقاطع نصوص معينة داخل صفحة الويب.
- الاهداف والمهام التي يقوم بها: يعمل على إبراز الصفحات التي قد تكون فيها المعلومات الأكثر صلة موجودة في عمق المحتوى بدلاً من وجودها فقط في العناوين الرئيسية أو في المقدمة.
- التأثير: يسمح لـ Google بتصنيف أجزاء ذات من الصفحة ذات صلة عالية حتى لو كانت الصفحة تغطي مواضيع متعددة مما يحسن النتائج للاستعلامات المحددة جدا او الاستعلامات الطويلة (long-tail).
12. نظام RankBrain
- ما هو: هو عبارة عن نظام ذكاء اصطناعي .. يعتبر أحد أول تطبيقات التعلم الآلي الرئيسية لـ Google في التصنيف والترتيب.
- الاهداف والمهام التي يقوم بها: يساعد Google على فهم العلاقة بين الكلمات والمفاهيم المجردة مما يمكّنه من تفسير الاستعلامات الجديدة أو الغامضة (تلك التي لم يرها كثيرًا من قبل) والعثور على محتوى ذي صلة قد لا يحتوي على مصطلحات الاستعلام الدقيقة.
- التأثير: يحسن قدرة Google على التعامل مع حوالي 15% من الاستعلامات اليومية الجديدة تماما عن طريق ربطها بالمفاهيم المعروفة.
13. أنظمة المعلومات الموثوقة (Reliable Information Systems)
- التعريف: هي عبارة عن مجموعة من الأنظمة تعمل معا لتقييم جودة المعلومات وموثوقيتها ورفع مستواها.
- الاهداف والمهام التي يقوم بها: تعمل على تعزيز المصادر الموثوقة وخفض ترتيب وتصنيف المحتوى منخفض الجودة أو المضلل ورفع مستوى الصفحات عالية الجودة، لا سيما للمواضيع المهمة والحساسة (مثل الصحة والشؤون المالية والمعلومات المدنية التي يشار إليها بـ YMYL: Your Money or Your Life).
- التأثير: تتضمن آليات لعرض إشعارات للمحتوى حول الموضوعات سريعة التطور أو عندما تكون الثقة في الجودة الإجمالية للنتائج المتاحة منخفضة حيث يتماشى هذا بشكل مباشر مع E-E-A-T (التأكيد على الموثوقية والجدارة بالثقة) و HCU تحديث المحتوي المفيد.
14. أنظمة الخفض القائمة على الإزالة (Removal-Based Demotion Systems)
- التعريف: هي عبارة عن أنظمة تستخدم أنواع معينة بكم كبير من عمليات إزالة المحتوى من الموقع كإشارة لخفض تصنيف الموقع بمعني انها تراقب عدد مرات الازالة للموقع.
- الاهداف والمهام التي تقوم بها: تعمل على تقليل ظهور المواقع التي تنشر محتوى به مشاكل مثل المحتوى المضلل او محتوي عليه حقوق ملكية او محتوي عشوائي بشكل متكرر.
- المحفزات: الإزالات القانونية تعتبر من المحفزات الرئيسية لهذه الانظمة حيث ان الحجم الكبير لطلبات إزالة طبقا لحقوق الطبع والنشر الصالحة (DMCA) والتشهير او السلع المقلدة (التقليد والغير اصلية) أو الإزالات التي تتم للمحتوي بأمر من جهات رسمية يمكن أن يؤدي إلى خفض تصنيف المحتوى الآخر المنشور على نفس الموقع حيث ينطبق هذا بشدة على مواد الاعتداء الجنسي على الأطفال (CSAM) والمحتوى الخبيث الذي يروج لاشياء تحث علي العنف او المواد الضارة حيث يتم إزالة المحتوى دائما وخفض ترتيب وتصنيف المواقع التي تحتوي على نسبة عالية من انواع المحتوى الخبيث والمضلل.
- إزالة المعلومات الشخصية: المعدل الكبير لعمليات إزالة المعلومات الشخصية التي تتضمن مواقع ذات ممارسات استغلالية (مثل فرض رسوم للإزالة) أو محتوى التشهير الإلكتروني (doxxing) أو الصور الشخصية الصريحة التي تم إنشاؤها أو مشاركتها دون موافقة صاحبها (حقيقية أو مزيفة) يمكن أن يؤدي إلى خفض الترتيب والتصنيف.
- التأثير: تعمل هذه الانظمة كرادع قوي ضد استضافة أو نشر محتوى ضار أو غير قانوني على نطاق واسع.
15. نظام المراجعات (Reviews System)
- التعريف: عبارة عن خوارزميات مصممة خصيصا لتقييم محتوى المراجعات (للمنتجات والخدمات او الوجهات السياحية … إلخ).
- الاهداف والمهام التي يقوم بها: يعمل مكافأة المراجعات عالية الجودة التي تقدم تحليلا ثاقبا ومرجعات أصلية بدليل على الخبرة ومكتوبة بواسطة خبراء حقيقيين أو هواة متحمسين يعرفون الموضوع جيدا ولديهم خبرة به .. حيث يهدف إلى إبراز المراجعات الأصيلة والمفيدة على المراجعات السطحية أو غير الأصلية.
- التأثير: يشجع منشئي المحتوى على إنتاج مراجعات قيمة حقا تستند إلى الخبرة العملية والمعرفة الفعلية وهذا يتماشى مع HCU و E-E-A-T.
16. نظام تنوع المواقع (Site Diversity System)
- التعريف: عبارة عن نظام مصمم للحد من عدد النتائج من نفس الموقع في نتائج البحث الاولى.
- الاهداف والمهام التي يقوم بها: يعمل على توفير مجموعة كبيرة من النتائج والمصادر للمستخدمين لمعظم الاستعلامات.
- التأثير: يعطي الفرصة للمواقع الجديدة .. بشكل عام تهدف Google إلى عدم إظهار أكثر من نتيجتين من نفس الدومين (بما في ذلك الدومينات الفرعية التي يتم التعامل معها عادة كجزء من الدومين الاصلي) في النتائج الاولي … كما توجد استثناءات إذا قرر النظام أن المزيد من النتائج من موقع واحد ذات صلة وخاصة لاستعلام معين قد تكون مهمة ومفيدة للمستخدم.
17. أنظمة كشف المحتوى غير المرغوب فيه (Spam Detection Systems – بما في ذلك SpamBrain)
- التعريف: هي عبارة عن مجموعة من الأنظمة قائمة على الذكاء الاصطناعي وغيرها مصممة لتحديد وتحييد المحتوى غير المرغوب فيه (الاسبام) على الويب.
SpamBrain هو مكون رئيسي يعمل بالذكاء الاصطناعي للحد من المحتوى العشوائي.
- الاهداف والمهام التي يقوم بها: تعمل على منع المحتوى الذي ينتهك سياسات المحتوى غير المرغوب فيه لـ Google (مثل الإخفاء والمحتوى الذي يتم إنشاؤه تلقائيا والمحتوى المنسوخ والروابط الاحتيالية) من الظهور في نتائج البحث.
- التأثير: تعمل على الحد من المحتوى العشوائي .. فهي حاسمة للحفاظ على قابلية استخدام البحث وموثوقيته حيث يتم تحديث هذه الأنظمة باستمرار لمكافحة تكتيكات الاسبام المتطورة.
الأنظمة المتقاعدة (المُدمجة في التصنيف الأساسي)
اذكر لكم هذه الأنظمة للمعرفة فقط حيث تم دمج وظائفها أو مبادئها في أنظمة اخرى حديثة أو أصبحت الآن جزءًا من خوارزميات التصنيف الأساسية لـ Google:
1. نظام المحتوى المفيد (Helpful Content System)
عبارة عن نظام تم أطلاقه في عام 2022 يعمل على مكافأة المحتوى الذي يركز على الإنسان أولا ويهتم بتجربة المسخدم .. واعتبارا من مارس 2024 تم دمج هذا النظام وإشاراته ومصنفاته مباشرة في أنظمة التصنيف الأساسية وأصبح تقييم مدى فائدة المحتوى الآن جزءا أساسيا ومستمرا من التصنيف والترتيب بنتائج البحث ولم يعد مرتبطا بتحديث مُحدد.
2. نظام الطائر الطنان (Hummingbird)
عبارة عن نظام كان تعديلا رئيسيا على الخوارزمية الأساسية لجوجل في عام 2013 مع التركيز على البحث الدلالي وفهم قصد ونية الاستعلام الذي يقصده المستخدم واصبحت مبادئه أساسية للبحث الحديث الذي استمر في التطور بشكل كبير منذ ذلك الوقت.
3. نظام باندا (Panda System)
عبارة عن نظام تم إطلاقه في عام 2011 بغرض استهداف المحتوى منخفض الجودة (مثل المحتوى السطحي ومزارع المحتوى بغرض الباك لينك) وتم دمجه في خوارزميات التصنيف الأساسية عام 2015 وتظل مبادئه المتعلقة بجودة المحتوى فعالة حتي الان.
4. نظام البطريق (Penguin System)
عبارة عن نظام تم اطلاقه عام 2012 لمكافحة الروابط الاحتيالية والاسبام وتم دمجه في أنظمة التصنيف الأساسية (ليعمل في الوقت الفعلي) وتستمر مبادئه المتعلقة بجودة الروابط حتى الان.
الخلاصة:
تشكل أنظمة ترتيب وتصنيف Google نظام بيئي معقد وديناميكي ومترابط .. في حين أن فهم تلك الأنظمة بشكل فردي يوفر سياق قيم ومن المهم أن نعلم أنها تعمل معا ويتم تحسينها باستمرار من خلال الذكاء الاصطناعي والتعلم الآلي .. وللعلم ان جوجل لا تكشف عن التاثيرات الحقيقية او مدى التأثير أو التفاعل بين هذه الأنظمة.
وبالنسبة لمنشئي المحتوى والمطورين ومتخصصي تحسين محركات البحث تظل الاستراتيجية الأكثر فعالية هي التركيز على إنشاء محتوى مفيد وموثوق يركز على الإنسان أولا ويهتم بالمستخدم ويسعى لإفادته وتلبية احتياجاته حسب نية البحث.
ومن المهم توضيح الخبرة (Expertise) وتقديم تجربة مستخدم إيجابية (Experience) وإظهار الموثوقية (Authoritativeness) والجدارة بالثقة (Trustworthiness) – أي ان مبادئ E-E-A-T من المعايير المهمة.
بجانب الالتزام بالإرشادات التقنية ومعايير الجودة من Google وذلك من خلال إعطاء الأولوية لقيمة المستخدم .. وبذلك فإنك توائم جهودك مع الأهداف الأساسية لأنظمة ترتيب وتصنيف بحث Google.