كيف تعمل محركات البحث ولماذا يجب أن تهتم

ما هو محرك البحث؟

يتكون محرك البحث من شيئين رئيسيين: قاعدة بيانات للمعلومات ، وخوارزميات تحسب النتائج التي يتم إرجاعها وترتيبها لاستعلام معين.

في حالة محركات بحث الويب مثل Google ، تتكون قاعدة البيانات من تريليونات من صفحات الويب ، وتنظر الخوارزميات في مئات العوامل لتقديم النتائج الأكثر صلة.

كيف عمل محركات البحث؟

تعمل محركات البحث من خلال أخذ قائمة بعناوين URL المعروفة ، والتي تنتقل بعد ذلك إلى المجدول . ل جدولة  تقرر متى الزحف  كل URL .  ثم تنتقل الصفحات التي يتم تتبعها إلى المحلل اللغوي  حيث يتم استخراج المعلومات الحيوية وفهرستها . تحليل  الروابط تذهب إلى جدولة ، والتي تعطي الأولوية للمن الزحف  و إعادة الزحف، .

عندما تبحث عن شيء ما ، تعرض محركات البحث صفحات متطابقة ، وتقوم الخوارزميات  بترتيبها حسب مدى الصلة بالموضوع.

إليك رسم تخطيطي من Google يوضح هذه العملية:

رسم تخطيطي بسيط يوضح كيفية عمل محركات البحث بواسطة Google

سنغطي خوارزميات الترتيب قريبًا.

أولاً ، دعنا نتعمق في الآليات المستخدمة لإنشاء فهرس ويب والحفاظ عليه للتأكد من أننا نفهم كيفية عملها. هذه هي جدولة ، الزحف ، التوزيع،  و الفهرسة .

ملاحظة جانبية.

تنطبق هذه العملية فقط على محركات بحث الويب مثل Google و Bing و DuckDuckGo.

هناك أنواع أخرى من محركات البحث مثل Amazon و YouTube و Wikipedia التي تعرض نتائج من مواقعها على الويب فقط.

الجدولة

ل جدولة  بتقييم الأهمية النسبية للعناوين الجديدة والمعروفة.

ثم يقرر وقت الزحف إلى عناوين URL الجديدة وعدد مرات إعادة الزحف إلى  عناوين URL المعروفة.

زحف

الزاحف  هو برنامج كمبيوتر يقوم بتنزيل صفحات الويب.

 تكتشف محركات البحث محتوى جديدًا من خلال إعادة الزحف إلى الصفحات المعروفة بانتظام حيث تتم إضافة روابط جديدة غالبًا بمرور الوقت.

على سبيل المثال ، في كل مرة ننشر فيها مشاركة مدونة جديدة ، يتم دفعها إلى أعلى الصفحة الرئيسية لمدونتنا ، حيث يوجد رابط.

تفسير

يقوم  المحلل اللغوي  باستخراج الروابط من الصفحة ، إلى جانب معلومات أساسية أخرى. ثم يرسل عناوين URL المستخرجة إلى المجدول  والبيانات المستخرجة للفهرسة .

الفهرسة

الفهرسة  هي المكان الذي تتم فيه إضافة  المعلومات التي تم تحليلها من  الصفحات التي تم الزحف إليها إلى قاعدة بيانات تسمى فهرس البحث .

فكر في ذلك كمكتبة رقمية للمعلومات حول تريليونات من صفحات الويب.

ما هي خوارزمية محرك البحث؟

يعد اكتشاف المحتوى وفهرسته الجزء الأول من اللغز. تحتاج محركات البحث أيضًا إلى طريقة لترتيب النتائج المطابقة عندما يُجري المستخدم عملية بحث. هذه هي وظيفة خوارزميات محرك البحث.

يحتوي كل محرك بحث على خوارزميات فريدة لترتيب صفحات الويب.

ولكن نظرًا لأن Google هو إلى حد بعيد محرك البحث الأكثر استخدامًا (على الأقل في العالم الغربي) ، فهذا هو المحرك الذي سنركز عليه طوال الجزء المتبقي من هذا الدليل.

كيف تعمل Google؟

تعمل Google بنفس الطريقة تقريبًا كما هو موضح أعلاه.

أنه يزحف  على شبكة الإنترنت، و فهارس  محتويات يجدها. بعد ذلك ، عند البحث عن شيء ما ، فإنه يجد نتائج مطابقة ويصنفها خوارزميًا حسب مدى الصلة بالموضوع في جزء من الثانية.

يعمل Google بشكل جيد كمحرك بحث لثلاثة أشياء:

أولاً ، يزحفون ويعيدون الزحف إلى الويب على نطاق أكبر من أي شخص آخر.

وقد سمح لهم ذلك ببناء والحفاظ على أكبر وأحدث مؤشر على هذا الكوكب.

ثانيًا ، لقد استثمروا بكثافة في نماذج اللغة التي تسمح لهم بفهم المعنى الحقيقي وراء حتى أكثر الاستعلامات الغامضة أو غير الصحيحة.

على سبيل المثال، فهم يدركون انه اذا كنت تبحث عن “الإيطالية restront ،” كنت تعني “الايطالية مطعم “.

أبعد من ذلك ، فهم أيضًا المرادفات.

لهذا السبب عندما تبحث عن “كيفية كسب المال عبر الإنترنت” ، فإنك ترى مرادفات بالخط العريض مثل “كسب” و “نقد” في النتائج.

إنها جيدة جدًا في هذا الأمر حتى أن بعض نتائج البحث لا تذكر حتى استعلام البحث الدقيق.

هنا ، تدرك Google أن “كسب نقود إضافية عبر الإنترنت” يعني نفس “كسب المال عبر الإنترنت” وأنها نتيجة ذات صلة بطلب البحث.

ثالثًا ، والأهم من ذلك ، يمكن أن تعرض خوارزميات الترتيب الخاصة بهم النتائج الأكثر صلة بجميع محركات البحث.

كيف تعمل خوارزميات بحث Google

تبحث Google في مئات العوامل للعثور على المحتوى ذي الصلة وتصنيفه.

لا أحد يعرف ما هي كل هذه ، لكننا نعرف عن أهمها.

دعونا نناقش القليل منها.

أهمية موضوعية

تنص Google على أنه عندما تحتوي صفحة الويب على نفس الكلمات الرئيسية التي يحتوي عليها استعلام البحث ، خاصة في المواضع البارزة مثل العناوين ، فإن ذلك يعد علامة على الصلة.

لكن هذه الفكرة ليست مضمونة ، ولهذا يبحث Google أيضًا عن وجود كلمات أخرى ذات صلة على الصفحة.

إليك كيف تشرحها Google :

فقط فكر: عندما تبحث عن “كلاب” ، فربما لا تريد صفحة تحتوي على كلمة “كلاب” مئات المرات.

مع وضع ذلك في الاعتبار ، تقوم الخوارزميات بتقييم ما إذا كانت الصفحة تحتوي على محتوى آخر ذي صلة بخلاف الكلمة الرئيسية “كلاب” – مثل صور الكلاب أو مقاطع الفيديو أو حتى قائمة السلالات.

لإعطاء مثال آخر ، لنفترض أن لديك مقالًا حول “كيفية الحصول على رخصة القيادة”.

ربما يجب أن يحتوي على أقسام فرعية حول ترخيص السيارات والدراجات النارية والحافلات ، وذكر الكلمات والعبارات مثل الطريق ، القيادة ، الترخيص ، الامتحان ، السلامة ، ورخصة الامتياز الكامل .

من المحتمل أن يساعد وجود كلمات وعبارات ذات صلة مثل هذه على زيادة ثقة Google في أن صفحتك تتعلق بما تقوله.

لإعطاء مثال آخر ، تخيل أنك تريد إنشاء قائمة بأفضل الممثلين.

انظر إلى أي من النتائج في الصفحة الأولى ، وستلاحظ شيئًا مثيرًا للاهتمام.

جميعهم تقريبًا يذكرون أشخاصًا مثل روبرت دي نيرو ، وجاك نيكلسون ، وميريل ستريب.

قد يساعد ذكر هؤلاء الأشخاص أو الكيانات في صفحتك على زيادة ثقة Google بأن الصفحة هي نتيجة ذات صلة بطلبات البحث مثل “أفضل الممثلين”.

القصد من البحث

تدرك Google أن الأشخاص يجرون عمليات بحث لسبب ما ، وأن فهم هذا السبب يساعدهم في إرجاع نتائج بحث أفضل وإنشاء المزيد من المستخدمين الراضين.

وبعبارة أخرى ، فإنهم يعملون بجد لترتيب المحتوى الذي يتوقع المستخدمون رؤيته.

هذا هو السبب في أن جميع النتائج الرئيسية لـ “iPhone X unboxing” هي مقاطع فيديو .

 

في حين أن نتائج “iPhone X box” هي صور وقوائم منتجات:

 

تدرك Google أنه على الرغم من استخدام لغة مماثلة ، فإن الهدف من  عمليات البحث هذه يختلف تمامًا. إنهم يعملون بجد لتقديم نتائج تطابق نمط المحتوى ونوع المحتوى وتنسيق المحتوى وزاوية المحتوى التي يرغب المستخدمون في رؤيتها.

تُعرف هذه بـ 4 C القصد من البحث.

نمط المحتوى

يمكن تقسيم نمط المحتوى إلى ثلاث مجموعات: مقاطع الفيديو والصور والمحتوى النصي.

بالنسبة لمعظم الاستفسارات ، يكون النمط السائد والأكثر رغبة في المحتوى في النتائج واضحًا تمامًا. بالنسبة للآخرين ، مثل “الورود الوردية” ، تدرك Google أن النية مختلطة وتعرض أنماطًا متعددة من المحتوى.

نوع المحتوى

يقع نوع المحتوى عادةً في واحدة من أربع مجموعات: مشاركات المدونة والمنتج والفئة والصفحات المقصودة.

على سبيل المثال ، جميع نتائج “كيفية بدء مدونة” هي مشاركات مدونة.

تنسيق المحتوى

ينطبق تنسيق المحتوى في الغالب على مشاركات المدونات ومقاطع الفيديو والصفحات المقصودة. بالنسبة إلى مشاركات المدونة ، فإن الأنماط الشائعة هي “الكيفية” ، وإدراج المنشورات ، والبرامج التعليمية ، ومقالات الرأي ، والمقالات الإخبارية.

جميع نتائج “نصائح المدونات” هي مشاركات قائمة.

بالنسبة للصفحات المقصودة ، قد يكون التنسيق عبارة عن آلة حاسبة أو أداة تفاعلية.

زاوية المحتوى

تشير زاوية المحتوى إلى نقطة البيع الرئيسية للمحتوى. بالنسبة لمعظم الاستفسارات ، هناك زاوية سائدة في نتائج البحث.

على سبيل المثال ، تتركز معظم نتائج “نصائح التدوين” الأعلى مرتبة حول المبتدئين.

نضارة

تدرك Google أن نضارة النتائج تهم بعض عمليات البحث أكثر من غيرها.

على سبيل المثال ، يتطلب استعلام مثل “ما الجديد في Netflix” نتائج حديثة للغاية لأن الباحثين يريدون معرفة الأفلام والبرامج التلفزيونية التي تمت إضافتها مؤخرًا إلى النظام الأساسي لدفق الفيديو. نتيجة لذلك ، تعطي Google أولوية لنتائج البحث التي تم نشرها أو تحديثها في الآونة الأخيرة.

بالنسبة إلى الاستفسارات مثل “أفضل سماعات الرأس” ، تظل النضارة مهمة – ولكن ليس كثيرًا. وبعبارة أخرى ، من غير المرجح أن تكون قائمة عام 2015 ذات فائدة كبيرة لأن تقنية سماعة الرأس تتحرك بسرعة. إنها لا تتحرك بسرعة كبيرة لدرجة أن المنشور الذي تم نشره الشهر الماضي لم يعد مفيدًا.

يعرف Google ذلك ويعرض النتائج التي تم تحديثها أو نشرها في الأشهر القليلة الماضية.

هناك أيضًا استفسارات تكون فيها حداثة النتائج غير ذات صلة في الغالب ، مثل “كيفية ربط ربطة عنق”. لم يتغير شيء بشأن هذه العملية منذ عقود لذلك لا يهم ما إذا كانت نتائج البحث من الأمس أو 1998. إن Google تعرف ذلك وليس لديها هواجس حول ترتيب نتيجة من 2013 في الموضع رقم 2.

جودة المحتوى

تريد Google ترتيب محتوى عالي الجودة فوق المحتوى منخفض الجودة. تكمن المشكلة في أن جودة المحتوى صعبة بشكل موضوعي ، لذا فإن Google تنظر إلى شيء يسمى E ‑ AT في محاولة للقيام بذلك.

إليك كيفية عمل E-AT باختصار:

لنفترض أنك تبحث عن “كيفية كتابة أغنية”.

عند الاختيار ، من شبه المؤكد أنك تفضل قراءة شيء بواسطة بيونسي مني.

لماذا ا؟ لأن بيونسيه هو كتابة الأغاني خبير  و سلطة  الرقم الذي كنت على ثقة من  أن يعطي النصائح المفيدة حول هذا الموضوع.

الآن ، في حين أن E ‑ AT مهم لجميع الاستفسارات.

إلا أنه أمر حاسم لما تحب Google أن تسميه YMYL أو البحث عن أموالك أو حياتك.

تقول Google أن استفسارات YMYL هي تلك التي من المحتمل أن تؤثر على سعادة الشخص أو صحته أو استقراره المالي أو سلامته في المستقبل.على سبيل المثال ، خذ استفسارًا مثل “جرعة آمنة من الإيبوبروفين؟”

في هذه الحالة ، قد يكون لإرجاع النتائج التي تفشل في إثبات E-AT آثارًا مهددة للحياة.

إذا كانت الصفحة غير دقيقة ، فيجب ألا تظهر في نتائج البحث – بغض النظر عن مدى ملاءمتها.

ومع ذلك ، فإن المحتوى نفسه ليس الشيء الوحيد الذي يؤثر على E ‑ AT. أشياء مثل الروابط الخلفية التي  تشير إلى الصفحة مهمة أيضًا.

فكر في الروابط الخلفية على أنها تصويتات من مواقع ويب أخرى.

عندما يربط شخص ما بصفحة ما ، فإنه يشهد على ذلك الجزء من المحتوى ويوصي قرائه بذلك.

ربما هذا هو السبب في أن معظم الدراسات واسعة النطاق تظهر علاقة واضحة بين الروابط الخلفية والتصنيفات ، بما في ذلك دراستنا لـ 920 مليون صفحة :

ومع ذلك ، من المهم ملاحظة أنه لا يتم إنشاء جميع الروابط الخلفية على قدم المساواة.

و أهمية  و سلطة  من موقع ربط وصفحة ويب مهمة أيضا.

على سبيل المثال ، لنفترض أن لديك مقالة حول بدء عمل تجاري. 

ستعطي Google وزنًا لرابط خلفي من دليل إدارة الأعمال الصغيرة لتمويل نشاطك التجاري

أكثر من رابط مشابه من مشاركة على موقع صديقك في blogspot حول ما فعلوه في نهاية الأسبوع الماضي.

سهولة الاستخدام

تريد Google ترتيب صفحات الويب التي تجعل مستخدميها سعداء ، وهذا يتجاوز عرض النتائج ذات الصلة.

 يجب أن يكون المحتوى سهل المنال وسهل الاستهلاك.

هناك عدد من عوامل التصنيف المؤكدة التي تساعد في ذلك.

سرعة الصفحة

لا أحد يحب انتظار تحميل الصفحات ، ويعرفها Google. 

لهذا السبب جعلوا سرعة الصفحة عامل ترتيب لعمليات البحث على أجهزة سطح المكتب في عام 2010

وبعد ذلك لعمليات البحث على الأجهزة المحمولة في عام 2018 .

التوافق مع الجوّال

يتم إجراء 65٪ من عمليات بحث Google على أجهزة الجوال.

وهو ما يفسر سبب كون التوافق مع الأجهزة المحمولة عامل تصنيف لعمليات البحث عبر الأجهزة المحمولة

اعتبارًا من عام 2015 .

ومنذ تموز (يوليو) 2019 ، أصبح التوافق مع الأجهزة الجوّالة أيضًا عامل ترتيب لعمليات البحث على أجهزة سطح المكتب

بفضل تحول Google إلى ” الفهرسة أولاً للجوّال “. 

وهذا يعني أن Google “تستخدم في الغالب إصدار الجوال للمحتوى للفهرسة والتصنيف” عبر جميع الأجهزة.

Content Protection by DMCA.com

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *