Popular Web Search Engine |
नमस्कार मित्रों, जैसा की सब जानते है की वेब पर किसी भी विषय के बारे में जानना हो तो ब्राउज़र के एड्रेस में लिखते है और सर्च कर लेते है, जो की ब्राउज़र में सेव पहले से ही डिफाल्ट सर्च इंजन हमें परिणाम दिखाता है।
लेकिन वेब सर्च इंजिन क्या है? यह कैसे काम करता है? आईये जाने।
एक वेब सर्च इंजन वह सॉफ्टवेयर है जिसे वर्ल्ड वाइड वेब से सबंधित सूचनाओं को खोजने के लिए बनाया गया है। सर्च रिजल्ट (खोजे गये परिणामों) को सामान्यत: परिणामों की एक सूचि के रूप में प्रस्तुत किया जाता है, जिसे "सर्च इंजन रिजल्ट पेज" (s.e.r.p.) कहा जाता है। सुचना वेब पेज, छवियों और अन्य कई तरह की फाइलों का मिश्रण हो सकता है। कुछ सर्च इंजन डाटा बेस अथवा ऑपन डायरेक्ट्रीज (Open Directories) से भी डाटा माईन (खोज) करते हैं।
एक सर्च इंजन वास्तविक समय में निम्नलिखित प्रक्रियाओं को सम्भालता है:
1. वेब क्रलिंग/ वेब स्पाइडर
2. इंडेक्सिंग (अनुक्रमण)
3. सर्चिंग (खोजना)
एक वेब क्राउलर वह इंटरनेट बोट (bot) है जो वेब अनुक्रमण (इंडेक्सिंग) के लिए वर्ल्ड वाइड वेब को व्यवस्थित तरीके से ब्राउज करता है। सर्च इंजन वेब क्राउलिंग या स्पाइडर सोफ्टवेयरों का उपयोग अपनी वेब कंटेंट (सामग्री) या दुसरी वेबसाइट के कंटेंट अनुक्रमण को अद्यतन (अपडेट) बनाने के लिए करते हैं। वेब क्राउलर विजिट किये गये सभी पृष्ठों की प्रतिलिपि (कॉपी) तेयार कर प्रस्तुत कर सकता है जिसके डाउनलोड किये गये पेजों को बाद में सर्च इंजन द्वारा अनुक्रमित किया जा सकता है जिसे उपयोगकर्ता (यूजर) और अधिक कुशलता से खोज (सर्च) सकता है।
इंडेक्सिंग अनुक्रमण का अर्थ वेब पेज पर पाए गये सबंधित शब्दों और परिभाषित हो सकने वाले टोकनो को उनके डोमेन-नेम और एच.टी.एम.एल. (HTML) फिल्ड से जोड़ना है। इनका जोड़ सार्वजनिक डेटा बेस में किया जाता है जो वेब सर्च क्वेरी के लिए उपलब्ध रहता है। यूजर के द्वारा एक शब्द के रूप में भी क्वेरी की जा सकती है। अनुक्रमण (इंडेक्स) सबंधित सूचनाओं को शीघ्र से शीघ्र खोजने में मदद करता है।
आमतौर पर जब कोई यूजर कोई क्वेरी करता है तो वह कुछ शब्दों का समूह होता है। इंडेक्स में निहित तौर पर उन सभी वेबसाईटों के नाम होते हैं जहाँ क्वेरी शब्दों के कीवर्ड होते हैं एवं उन्हें तत्काल या क्षणिक तौर पर इंडेक्स से प्राप्त किया जा सकता है। वास्तविक प्रोसेसिंग लोड इन वेब-पेज (खोजे गये परिणामों) को सूचीबद्ध करने में लगता है।
सर्च इंजन की उपयोगिता परिणामों की प्रासंगिकता पर निर्भर करती है। उसी शब्द /शब्दांशों से सबंधित जानकारी लाखों वेबसाइट पर उपलब्ध होती है लेकिन उनमें से कुछ पेज दूसरों की तुलना में क्वेरी से अधिक प्रासंगिक एवं लोकप्रिय हो सकते हैं। अधिकतर सर्च इंजन परिणामों की रैंकिंग करके सबसे अच्छे परिणामों को सर्च रिजल्ट के रूप में प्रस्तुत करते हैं।
कौनसा पेज सबसे ज्यादा मैच करता है? किस क्रम में परिणामों को दिखाया जाना है? यह सुनिश्चित करने की प्रक्रिया हरेक सर्च इंजन अलग-अलग होती है। शोध के अनुसार, आज सबसे ज्यादा लोकप्रिय सर्च इंजन जिन्हें इंटरनेट समुदायों द्वारा अत्यधिक काम में लिया जा रहा है वो निम्न है:
1. गूगल (Google)2. बिंग (Bing)
3. याहू (Yahoo)
4. बायडू
5. एओएल (AOL जिसे पहले अमेरिकन ऑनलाइन कहा जाता था)
6. आस्क
7. लाइकोस
गूगल सर्च जिसे सामान्यत: गूगल वेब सर्च या गूगल कहकर संबोधित किया जाता है, गूगल इनकार्पोरेशन का एक वेब सर्च इंजन है। यह वर्ल्ड वाइड वेब पर सबसे ज्यादा इस्तेमाल होने वाला सर्च इंजन है, जिसमे हर रोज तीस करोड़ से भी अधिक सर्च किये जाते हैं। गूगल के सर्च-रिजल्ट पेज का ऑर्डर "पेजरैंक" नामक पेटेंटेड प्रायोरिटी रैंक अल्गोरिद्म पर आधारित है।
गूगल सर्च का मुख्य उद्धेश्य वेब सर्वर पर सार्वजानिक रूप से उपलब्ध दस्तावेजों में शब्दों की खोज करना है ना की डेटाबेस में उपलब्ध चित्र या डाटा खोजना। यह मूल रूप से 1997 में लेरी पेज और सर्गेइ ब्रिन द्वारा विकसित किया गया था।
बिंग भी एक वेब सर्च इंजन है जिसे पहले लाइव (Live) सर्च, विंडोज लाइव सर्च एवं एम.एस.एन. (MSN सर्च) के नाम से भी जाना जाता था। इसे "डिसीजन इंजन" के रूप में माइक्रोसॉफ्ट द्वारा विज्ञापित किया गया था। बिंग का अनावरण 28 मई 2009 को माइक्रो सॉफ्ट के सीईओ स्टीव बाल्बर द्वारा किया गया।
अगली बार मिलते है कुछ ऐसी ही जानकारीवर्धक पोस्ट के साथ।
अगर आपको ये ब्लॉग पसंद आ रहा है तो अभी इसके सदस्य बने और फेसबुक पर ताजा अपडेट पाने के लिए ब्लॉग का फेसबुक फेन पेज लाइक करें, धन्यवाद।