Hindi Tech Blog

16 अक्तूबर 2018

वेब सर्च इंजन क्या है? यह कैसे काम करता है?

Popular Web Search Engine
Popular Web Search Engine


नमस्कार मित्रों, जैसा की सब जानते है की वेब पर किसी भी विषय के बारे में जानना हो तो ब्राउज़र के एड्रेस में लिखते है और सर्च कर लेते है, जो की ब्राउज़र में सेव पहले से ही डिफाल्ट सर्च इंजन हमें परिणाम दिखाता है।

लेकिन वेब सर्च इंजिन क्या है? यह कैसे काम करता है? आईये जाने।

एक वेब सर्च इंजन वह सॉफ्टवेयर है जिसे वर्ल्ड वाइड वेब से सबंधित सूचनाओं को खोजने के लिए बनाया गया है। सर्च रिजल्ट (खोजे गये परिणामों) को सामान्यत: परिणामों की एक सूचि के रूप में प्रस्तुत किया जाता है, जिसे "सर्च इंजन रिजल्ट पेज" (s.e.r.p.) कहा जाता है। सुचना वेब पेज, छवियों और अन्य कई तरह की फाइलों का मिश्रण हो सकता है। कुछ सर्च इंजन डाटा बेस अथवा ऑपन डायरेक्ट्रीज (Open Directories) से भी डाटा माईन (खोज) करते हैं।

एक सर्च इंजन वास्तविक समय में निम्नलिखित प्रक्रियाओं को सम्भालता है:
1. वेब क्रलिंग/ वेब स्पाइडर
2. इंडेक्सिंग (अनुक्रमण)
3. सर्चिंग (खोजना)

एक वेब क्राउलर वह इंटरनेट बोट (bot) है जो वेब अनुक्रमण (इंडेक्सिंग) के लिए वर्ल्ड वाइड वेब को व्यवस्थित तरीके से ब्राउज करता है। सर्च इंजन वेब क्राउलिंग या स्पाइडर सोफ्टवेयरों का उपयोग अपनी वेब कंटेंट (सामग्री) या दुसरी वेबसाइट के कंटेंट अनुक्रमण को अद्यतन (अपडेट) बनाने के लिए करते हैं। वेब क्राउलर विजिट किये गये सभी पृष्ठों की प्रतिलिपि (कॉपी) तेयार कर प्रस्तुत कर सकता है जिसके डाउनलोड किये गये पेजों को बाद में सर्च इंजन द्वारा अनुक्रमित किया जा सकता है जिसे उपयोगकर्ता (यूजर) और अधिक कुशलता से खोज (सर्च) सकता है।

इंडेक्सिंग अनुक्रमण का अर्थ वेब पेज पर पाए गये सबंधित शब्दों और परिभाषित हो सकने वाले टोकनो को उनके डोमेन-नेम और एच.टी.एम.एल. (HTML) फिल्ड से जोड़ना है।  इनका जोड़ सार्वजनिक डेटा बेस में किया जाता है जो वेब सर्च क्वेरी के लिए उपलब्ध रहता है। यूजर के द्वारा एक शब्द के रूप में भी क्वेरी की जा सकती है। अनुक्रमण (इंडेक्स) सबंधित सूचनाओं को शीघ्र से शीघ्र खोजने में मदद करता है।

आमतौर पर जब कोई यूजर कोई क्वेरी करता है तो वह कुछ शब्दों का समूह होता है। इंडेक्स में निहित तौर पर उन सभी वेबसाईटों के नाम होते हैं जहाँ क्वेरी शब्दों के कीवर्ड होते हैं एवं उन्हें तत्काल या क्षणिक तौर पर इंडेक्स से प्राप्त किया जा सकता है। वास्तविक प्रोसेसिंग लोड इन वेब-पेज (खोजे गये परिणामों) को सूचीबद्ध करने में लगता है।

सर्च इंजन की उपयोगिता परिणामों की प्रासंगिकता पर निर्भर करती है। उसी शब्द /शब्दांशों से सबंधित जानकारी लाखों वेबसाइट पर उपलब्ध होती है लेकिन उनमें से कुछ पेज दूसरों की तुलना में क्वेरी से अधिक प्रासंगिक एवं लोकप्रिय हो सकते हैं। अधिकतर सर्च इंजन परिणामों की रैंकिंग करके सबसे अच्छे परिणामों को सर्च रिजल्ट के रूप में प्रस्तुत करते हैं।

कौनसा पेज सबसे ज्यादा मैच करता है? किस क्रम में परिणामों को दिखाया जाना है? यह सुनिश्चित करने की प्रक्रिया हरेक सर्च इंजन अलग-अलग होती है। शोध के अनुसार, आज सबसे ज्यादा लोकप्रिय सर्च इंजन जिन्हें इंटरनेट समुदायों द्वारा अत्यधिक काम में लिया जा रहा है वो निम्न है:
1. गूगल (Google)
2. बिंग (Bing)
3. याहू (Yahoo)
4. बायडू
5. एओएल (AOL जिसे पहले अमेरिकन ऑनलाइन कहा जाता था)
6. आस्क
7. लाइकोस

गूगल सर्च जिसे सामान्यत: गूगल वेब सर्च या गूगल कहकर संबोधित किया जाता है, गूगल इनकार्पोरेशन का एक वेब सर्च इंजन है। यह वर्ल्ड वाइड वेब पर सबसे ज्यादा इस्तेमाल होने वाला सर्च इंजन है, जिसमे हर रोज तीस करोड़ से भी अधिक सर्च किये जाते हैं। गूगल के सर्च-रिजल्ट पेज का ऑर्डर "पेजरैंक" नामक पेटेंटेड प्रायोरिटी रैंक अल्गोरिद्म पर आधारित है।
गूगल सर्च का मुख्य उद्धेश्य वेब सर्वर पर सार्वजानिक रूप से उपलब्ध दस्तावेजों में शब्दों की खोज करना है ना की डेटाबेस में उपलब्ध चित्र या डाटा खोजना। यह मूल रूप से 1997 में लेरी पेज और सर्गेइ ब्रिन द्वारा विकसित किया गया था।

बिंग भी एक वेब सर्च इंजन है जिसे पहले लाइव (Live) सर्च, विंडोज लाइव सर्च एवं एम.एस.एन. (MSN सर्च) के नाम से भी जाना जाता था। इसे "डिसीजन इंजन" के रूप में माइक्रोसॉफ्ट द्वारा विज्ञापित किया गया था। बिंग का अनावरण 28 मई 2009 को माइक्रो सॉफ्ट के सीईओ स्टीव बाल्बर द्वारा किया गया।

अगली बार मिलते है कुछ ऐसी ही जानकारीवर्धक पोस्ट के साथ।

अगर आपको ये ब्लॉग पसंद आ रहा है तो अभी इसके सदस्य बने और फेसबुक पर ताजा अपडेट पाने के लिए ब्लॉग का फेसबुक फेन पेज लाइक करें, धन्यवाद।

3 टिप्पणियां:

  1. आपकी इस प्रविष्टि् की चर्चा कल बुधवार (17-10-2018) को "विद्वानों के वाक्य" (चर्चा अंक-3127) पर भी होगी।
    --
    सूचना देने का उद्देश्य है कि यदि किसी रचनाकार की प्रविष्टि का लिंक किसी स्थान पर लगाया जाये तो उसकी सूचना देना व्यवस्थापक का नैतिक कर्तव्य होता है।
    --
    हार्दिक शुभकामनाओं के साथ।
    सादर...!
    डॉ.रूपचन्द्र शास्त्री 'मयंक

    जवाब देंहटाएं
  2. namskar,kripya deep web search engine ke baare men bhi hindi me bataye.

    जवाब देंहटाएं
  3. https://www.myhinditricks.com/2017/05/google-facebook-twitter-kisne-banaya-hai.html

    जवाब देंहटाएं

नमस्कार मित्रों मुझे आपकी टिप्पणी और सुझाव का इन्तजार है, साथ ही साथ अगर आपको लगता है की ब्लॉग में कहीं कोई लिंक काम नहीं कर रहा है तो मुझे अवश्य सूचित करें, धन्यवाद।

loading...