सर्च इंजन कैसे काम करता है?

क्या आपने कभी सोचा की आपको केवल सर्च करने के कुछ सेकंड में जानकारी देने वाला सर्च इंजन कैसे काम करता है। यदि आपको नहीं पता है तो आपको आज यह पता चल जाएगा।

सर्च इंजन एक ऐंसा टूल है जिसने हमारी ज़िंदगी बदल दी है। हमें जो भी जानकारी चाहिए वह हम चुटकियों में सर्च इंजन का इस्तेमाल करके प्राप्त कर सकते हैं।

वैसे तो सर्च इंजन बहुत सारे हैं लेकिन सर्च इंजन का नाम लेते ही केवल सर्च इंजन हमारे मन में आता है और वह है गूगल और आये भी क्यों न गूगल सबसे प्रसिद्ध सर्च इंजन है जिसका इस्तेमाल हम दिन में दर्जनों बार करते हैं।

आज हम गूगल को ध्यान में रखते हुए सर्च इंजन की कार्यविधि को जानेंगे।

सर्च इंजन कैसे काम करता है?

सर्च इंजन तीन भागों में कार्य करता है Crawling, Indexing और Ranking.

1. वेब पेज की ढूंढना और उन्हें क्रॉल करना

गूगल या सर्च इंजन बोट एक तरह की कंप्यूटर स्क्रिप्ट होती हैं जो की web pages को ढूंढती हैं और उन्हें क्रॉल करती हैं। गूगल इन bots को spider भी कहता है।

जब सर्च इंजन नए थे तब केवल links की मदद से सर्च इंजन को वेब पेज की उपस्थिति के बारे में पता लगता था और उस लिंक का इस्तेमाल करके बोट पेज पर जाता था और उसे क्रॉल करता था।

लेकिन अब गूगल और अन्य सर्च इंजन लिंक के साथ बहुत से तरीकों के इस्तेमाल से वेब पेज का पता लगाते हैं। कुछ सर्च इंजन के webmaster tool होते हैं जिसमें कोई अपनी वेबसाइट को जोड़कर वेबसाइट और उसके पेज की उपस्थिति के बारे में सर्च इंजन को बताया जा सकता है।

जब किसी सर्च इंजन को नया पेज मिलता है तो सर्च इंजन उस पेज को क्रॉल करता है।

Crawling एक प्रक्रिया है जिसमें सर्च इंजन का बोट किसी web page को स्कैन करता है और जानने की कोशिश करता है की पेज किस विषय में है या किस सवाल के जवाब के रूप में लिखा गया है।

इसके अलावा crawler/bot अन्य जानकारी भी पाने की कोशिश करता है जैसे वेब पेज किस भाषा में है आदि।

सर्च इंजन बोट इंटरनेट पर मौजूद सभी पेज को क्रॉल नहीं करता है क्योंकि इंटरनेट पर सभी पेज पब्लिक नहीं है।

जैसे एक private instagram account की images आदि world wide web का हिस्सा नहीं है। इस तरह की चीजें deep web का हिस्सा होती हैं और इनके एक्सेस के लिए पासवर्ड की जरूरत होती है। तो सर्च इंजन न तो इसे क्रॉल कर सकेगा और न ही किसी तरह की अन्य की प्रक्रिया कर सकता है।

2. वेब पेज को index करना

सर्च इंजन के द्वारा क्रॉलिंग से मिले डाटा को अपने सर्वर में स्टोर करने की प्रक्रिया को indexing कहते हैं।

वेब पेज के क्रॉल हो जाने के बाद सर्च को पेज के बारे में बहुत सी जानकारी मिलती है। सर्च इंजन को क्रॉलिंग से पता चल जाता है की वेब पेज पर क्या जानकारी दी गयी है।

सर्च इंजन क्रॉलिंग से मिले डाटा को अपने सर्वर में स्टोर करता है ताकि जरूरत पड़ने पर वह उस वेब पेज को सम्बंधित सर्च के लिए दिखा सके।

सर्च इंजन हर पेज को इंडेक्स नहीं कर सकते हैं। वह केवल उन्हीं पेज को इंडेक्स कर सकते हैं तो उन्हें इंडेक्स करने की इजाजत देते हैं। वेबसाइट के html के हेड में noindex robots tag का इस्तेमाल करने से सर्च इंजन बोट वेब पेज को इंडेक्स नहीं करता है।

3. वेब पेज को रैंक करना

Crawling और indexing करने के बाद सर्च इंजन को बहुत से वेब pages के बारे में पता चल जाता है। अब सर्च इंजन इन pages को रैंक करता है।

सर्च इंजन कई तरह के algorithms और machine learning आदि का इस्तेमाल करके बहुत से क्वालिटी चेक करता है और जानने की कोशिश करता है की web page अच्छा है या नहीं।

वेब पेज किस सर्च query (सवाल) के सर्च रिजल्ट में दिखाना है, किस लोकेशन के लिए दिखाना है, किस व्यक्ति को दिखाना है और किस पोजीशन पर दिखाना है सर्च इंजन इस चरण में यह तय करता है।

यदि web page सच में अच्छा है और अच्छी जानकारी देता है, सर्च करने वाले व्यक्ति की चाह को पूरा करता है तो सर्च इंजन वेब पेज को सर्च रिजल्ट में दिखाने लगता है।

वेब पेज जितना अच्छा होगा उसका जितना अच्छा seo (सर्च इंजन में वेबसाइट को रैंक कराने के लिए की जाने वाली चीजें) उसके सर्च रिजल्ट में आने की संभावना उतनी ही अधिक हो जायेगी।

समय के साथ वेब पेज की सर्च रिजल्ट में स्थिति बदलती रहती है।

सर्च इंजन की कार्यविधि मैंने आपको बहुत ही कम शब्दों में बताई है। असल में सर्च इंजन और खास कर बड़े सर्च इंजन बहुत ही जटिल तरीके से कार्य करते हैं और जिसे आसान भाषा में समझाना बहुत मुश्किल है।

फिर भी मैंने आपको कम शब्दों में बहुत अच्छी जानकारी देने का प्रयास करते हुए बताया है की सर्च इंजन कैसे काम करता है।

आशा करता हूँ की आपको यह जानकारी अच्छी लगेगी और आप इस पोस्ट को अपने सोशल मीडिया का इस्तेमाल करते हुए अपने दोस्तों के साथ शेयर करेंगे।

Share This Article!

Leave a Reply

Your email address will not be published. Required fields are marked *