सर्च इंजन क्या है ? सर्च इंजन कौन-कौन से हैं ?

सर्च इंजन एक साफ्टवेयर सिस्टम है जो वल्र्ड वाइड वेब (WWW) से सूचना प्राप्त करने के लिए बनाया गया है। यह जानकारी वेब पेज, चित्रों एवं अन्य प्रकार की फाइल्स के रूप में प्रदान करता है । आर्ची (Archie) को सबसे पहला सर्च इंजन माना जाता है जिसका प्रयोग FTP फाइल्स की खोज के लिए किया जाता था। जबकि टेक्स्ट आधारित खोज के लिए सबसे पहले वेरोनिका सर्च इंजन का प्रयोग किया गया था।

सर्च इंजन क्या है

अन्य साइटों की तरह यह सर्च इंजन भी वेब साइटें ही हैं। इनका कार्य वल्र्ड वाइड वेब (www) पर रखी सामग्री के भण्डार में से लोगों को उनके काम की सामग्री ढूंढने में मदद करना है। यदि आपको जो सामग्री चाहिए उसका सही पता नहीं है तो यह सर्च इंजन ही आपकी मदद करता है उसे  खोजने में इसलिए आज करोड़ों लोग इसे बार बार काम में लेते हैं। इस प्रकार की मदद के लिए आजकल अनेक सर्च इंजन मौजूद हैं। 

सर्च इंजन के मुख्य कार्य 

सामग्री ढूंढने के कई तरीके होने के बाद भी सभी सर्च इंजन तीन कार्य करता है-

  1. स्पाइडर या रोबोट या क्राउलर प्रोग्राम (Spider or robot or crawler program)
  2. इन्डेक्सिंग (Indexing)
  3. सर्च इंटरफेस (Search interface)

क्राउल (Crawler)

क्राउल शब्द का अर्थ है खोजना या ढूँढना। सर्च इंजन में स्पाइडर को कभी-कभी क्राउलर या वेब क्राउलर भी कहा जाता है। इनका यूज सर्च इंजन के द्वारा वेब साइट व वेब पेज को संगृहीत करने के लिए किया जाता है। सर्च इंजन को उन सभी वेब साइट्स व वेब पेज की सूचना चाहिए होती है जिसमें खोज सूचना उपलब्ध रहती है। यदि ऐसा नहीं हो पाता है तो सर्च इंजन का खोज किये गये वेब पेज को list करना व Priority के अनुसार Display करने में मुश्किल होगी। Spider or robot or crawler एक स्पेशल प्रोग्राम है जो कि robot.txt फाइल के माध्यम से प्रेसित किये गये keywords से Web server पर वेब पेज की खोज Java Script, CSS, Title, Contents, Metadata को खोजने का काम करता है। प्राप्त परिणामों को डाटाबेस को सूचना देता है। crawler न केवल वेब पेज को खोजता है बल्कि साथ-साथ उन्हें Rank करता है। 

इन्डेक्सिंग (Indexing)

इन्डेक्सिंग अर्थात सूची बनाना है । Unsystematic result को Systematic result रिजल्ट में प्रस्तुत करने का काम  Indexing के माध्यम से किया जाता है यह Indexing System को ज्यादातर सर्चइंजन गोपनीय रखते है। क्योंकि यही इन्डेक्सिंग तकनीकि सर्चइंजन को सटीक व प्रमाणिक बनाती है।  यह सारी प्रक्रिया आटोमेटिक होती है। यह प्रक्रिया Indexing कहलाती है। सर्च इंजन पर Indexing प्रक्रिया कुछ महत्वपूर्ण मानक सिद्धान्तों के सफल प्रयोग के द्वारा सम्पन्न हेाती है। यह Indexing search results में इस प्रकार से सुव्यवस्थित करके results देता है कि यूजर  का results उसके search एकदम नजदीक या उचित होता है।

सर्च इंटरफेस (Search interface)

सर्च इंटरफेस (Search interface) एक प्रोग्राम होता है जिससे यूजर अपनी जिज्ञासा को keywords के रूप में भेजता है। जिसे Crawler व Indexing के माध्यम से प्राप्त कर Relevant information present करती है। यह सूचना वेब पेज के रूप में उपलब्ध होती है। ज्यादातर सर्च इंजन keywords के रिजल्ट एक सूची के रूप में उपलब्घ कराते हैं। ये परिणाम नए से पुराने के क्रम में होते हैं। सर्च इंटरफेस पर सही रिजल्ट प्राप्त करने के लिए बड़े वाक्यों की जगह छोटे-छोटे की-वर्ड का प्रयोग करना चाहिए। न केवल सटीक परिणाम प्राप्त होते हैं बल्कि तुरंत परिणाम भी प्राप्त होते है। सर्च इंजन में सर्च करते समय कीवर्ड का प्रयोग Boolean Operators AND/OR/NOT के साथ प्रयोग करने से अधिक सही परिणाम प्राप्त किये जा सकते हैं। Phrase Search का प्रयोग भी सही और जल्दी परिणाम प्राप्त करने में सहायक है। 

Search Engine Spider, Crawler, Index and User Interface की सहायता से ये कार्य करते है।

  1. यूजर को किसी विषय पर वाक्यों, मुहावरों या शब्दों के रूप में Query करने देता है।
  2. Query को डाटाबेस में खोजने का काम करता है।
  3. Query से जो सूचनाएं वेब पेज पर समान होती हैं उन्हें इकट्ठा करता है।
  4. एकत्रित वेब पेज को उपलब्ध करता है।
  5. सर्च इंजन यूजर को Query को सुधारने व दुबारा भेजने करने की भी सुविधा देता है।

इंटरनेट के प्रमुख सर्च इंजन

कुछ लोकप्रिय सर्च इंजनों की सूची यहां प्रस्तुत है-

  1. www.aol.com
  2. www.altavista.com
  3. www.dogpile.com
  4. www.directhit.com
  5. www.dmoc.com
  6. www.exite.com
  7. www.fastsearch.com
  8. www.go.com
  9. www.goto.com
  10. www.google.com
  11. www.hotbot.com
  12. www.iwon.com
  13. www.intelliseck.com
  14. www.looksmart.com
  15. www.lycos.com
  16. www.yahoo.com
  17. www.webtop.com

भारतीय सर्च इंजन निम्न हैं –

  1. www.khoj.com
  2. www.hindustan.net
  3. www.rediff.com
  4. www.indianfo.com
  5. www.123india.com
  6. www.indianindex.com
  7. www.locateindia.com
  8. www.haratseek.com
  9. www.sholay.com

सर्च इंजन का उपयोग

जिस प्रकार हमें किसी वांछित व्यक्ति का टेलीफोन नं. पता न होने की स्थिति मे टेलीफोन डायरेक्टीª हमारी सहायता के लिये उपलब्ध होती है, उसी प्रकार उपयुक्त सूचना प्राप्त करने के लिये पेज सर्च करने की दो विधियाँ है।

1.  कुछ साइटस कैटेगरी एवं सब कैटेगरी के अनुसार षाॅर्ट करके वेब पेजेस रिटर्न करती है। जैसे याहू (विभिन्न साइटस http://www.yahoo.com एवं http:// yahoo.no आदि)

2. वेवसाइट्स सर्च इंजन आफर करती है, जो वेब पेजेस की लिस्ट रिटर्न करती है जो कि सर्च वर्ड या स्ट्रिंग से मैच करके टेक्स्ट सर्च करते हैं। जैसे गूगल (http://www.google.com), alvista (http://www.alvista.com), एवं fast search (http://www.alltheweb.com)

You May Also Like