पृष्ठ अनुक्रमण। खोज इंजन "Google" और "यांडेक्स" द्वारा साइट का त्वरित अनुक्रमण

विषयसूची:

पृष्ठ अनुक्रमण। खोज इंजन "Google" और "यांडेक्स" द्वारा साइट का त्वरित अनुक्रमण
पृष्ठ अनुक्रमण। खोज इंजन "Google" और "यांडेक्स" द्वारा साइट का त्वरित अनुक्रमण
Anonim

हर वेबमास्टर जानता है कि लोगों को खोज इंजन से उसके संसाधन पर जाना शुरू करने के लिए, इसे अनुक्रमित करने की आवश्यकता है। साइट अनुक्रमण क्या है, इसे कैसे किया जाता है, और इसका अर्थ क्या है, इसके बारे में हम इस लेख में बताएंगे।

इंडेक्सिंग क्या है?

पृष्ठ अनुक्रमण
पृष्ठ अनुक्रमण

तो, "इंडेक्सिंग" शब्द का अर्थ है रजिस्टर में कुछ दर्ज करना, उपलब्ध सामग्रियों की एक जनगणना। साइट अनुक्रमण पर भी यही सिद्धांत लागू होता है। वास्तव में, इस प्रक्रिया को खोज इंजन के डेटाबेस में इंटरनेट संसाधनों के बारे में जानकारी दर्ज करना भी कहा जा सकता है।

इस प्रकार, जैसे ही उपयोगकर्ता Google खोज क्षेत्र में एक और वाक्यांश दर्ज करता है, स्क्रिप्ट उसे एक परिणाम लौटाएगी, जिसमें आपकी साइट का शीर्षक और उसका संक्षिप्त विवरण शामिल है, जिसे हम नीचे देखते हैं।

इंडेक्सिंग कैसे की जाती है?

साइट अनुक्रमण
साइट अनुक्रमण

खुद को अनुक्रमित करना ("यांडेक्स" है, या Google - कोई भूमिका नहीं निभाता) काफी सरल है। इंटरनेट का पूरा वेब, आईपी-एड्रेस के डेटाबेस पर ध्यान केंद्रित करता है जो खोज इंजन के पास है, शक्तिशाली रोबोटों द्वारा स्कैन किया जाता है - "मकड़ियों" जो इकट्ठा करते हैंआपकी साइट के बारे में जानकारी। प्रत्येक खोज इंजन में उनमें से एक बड़ी संख्या है, और वे दिन में 24 घंटे स्वचालित रूप से काम करते हैं। उनका काम आपकी साइट पर जाना और डेटाबेस में डेटा दर्ज करते समय उस पर सभी सामग्री को "पढ़ना" है।

परिणामस्वरूप, सिद्धांत रूप में, साइट अनुक्रमण संसाधन के स्वामी पर अधिक निर्भर नहीं करता है। यहां निर्णायक कारक खोज रोबोट है जो साइट पर आता है और इसकी खोज करता है। यह वही है जो आपकी साइट के खोज परिणामों में प्रकट होने की गति को प्रभावित करता है।

अनुक्रमण की शर्तें?

पृष्ठ अनुक्रमण की जाँच करें
पृष्ठ अनुक्रमण की जाँच करें

बेशक, हर वेबमास्टर के लिए यह फायदेमंद होता है कि उसका संसाधन खोज परिणामों में जल्द से जल्द दिखाई दे। यह प्रभावित करेगा, सबसे पहले, साइट को पहले स्थान पर लाने की शर्तें, और दूसरी, जब साइट के मुद्रीकरण के पहले चरण शुरू होते हैं। इस प्रकार, जितनी जल्दी खोज रोबोट आपके संसाधन के सभी पृष्ठों को "खाएगा", उतना ही बेहतर होगा।

प्रत्येक खोज इंजन का अपने डेटाबेस में साइट डेटा दर्ज करने के लिए अपना एल्गोरिथ्म होता है। उदाहरण के लिए, यांडेक्स में पृष्ठों का अनुक्रमण चरणों में किया जाता है: रोबोट लगातार साइटों को स्कैन करते हैं, फिर जानकारी की व्यवस्था करते हैं, जिसके बाद तथाकथित "अपडेट" होता है, जब सभी परिवर्तन प्रभावी होते हैं। ऐसे आयोजनों की नियमितता कंपनी द्वारा स्थापित नहीं की जाती है: वे हर 5-7 दिनों में एक बार आयोजित किए जाते हैं (एक नियम के रूप में), हालांकि, वे 2 और 15 दिन पहले दोनों जगह ले सकते हैं।

उसी समय, Google में साइट का अनुक्रमण एक अलग मॉडल का अनुसरण करता है। इस खोज इंजन में, इस तरह के "अपडेट" (आधार अपडेट) नियमित रूप से होते हैं, इसलिए, हर बार प्रतीक्षा करें जब तक कि रोबोट डेटाबेस में जानकारी दर्ज न करें, और फिर यहहर कुछ दिनों में आदेश दिया जाएगा, जरूरत नहीं है।

उपरोक्त के आधार पर, हम निम्नलिखित निष्कर्ष निकाल सकते हैं: यांडेक्स में पृष्ठ 1-2 "अपडेट" (अर्थात औसतन 7-20 दिनों में) के बाद जोड़े जाते हैं, और Google में यह बहुत तेज़ी से हो सकता है - सचमुच दिन में।

एक ही समय में, निश्चित रूप से, प्रत्येक खोज इंजन की अपनी विशिष्टताएँ होती हैं कि अनुक्रमण कैसे किया जाता है। उदाहरण के लिए, यांडेक्स में एक तथाकथित "फास्ट बॉट" है - एक रोबोट जो कुछ घंटों में समस्या में डेटा दर्ज कर सकता है। सच है, उसे अपने संसाधन पर ले जाना आसान नहीं है: यह मुख्य रूप से समाचार और वास्तविक समय में विकसित होने वाली विभिन्न हाई-प्रोफाइल घटनाओं से संबंधित है।

सूचकांक में कैसे प्रवेश करें?

यांडेक्स अनुक्रमण
यांडेक्स अनुक्रमण

खोज इंजन में अपनी साइट को कैसे अनुक्रमित किया जाए, इस प्रश्न का उत्तर सरल और जटिल दोनों है। पृष्ठ अनुक्रमण एक प्राकृतिक घटना है, और यदि आप इसके बारे में सोचते भी नहीं हैं, लेकिन बस कहें, अपना ब्लॉग रखें, धीरे-धीरे इसे जानकारी से भर दें, तो खोज इंजन समय के साथ आपकी सामग्री को पूरी तरह से "निगल" जाएगा।

एक और बात यह है कि जब आपको पेज इंडेक्सिंग को तेज करने की आवश्यकता होती है, उदाहरण के लिए, यदि आपके पास तथाकथित "उपग्रहों" का नेटवर्क है (लिंक बेचने या विज्ञापन देने के लिए डिज़ाइन की गई साइटें, जिनकी गुणवत्ता आमतौर पर खराब होती है). इस मामले में, आपको उपाय करने की आवश्यकता है ताकि रोबोट आपकी साइट पर ध्यान दें। निम्नलिखित को सामान्य माना जाता है: साइट के URL को एक विशेष रूप में जोड़ना (इसे "AddUrl" कहा जाता है); लिंक निर्देशिकाओं के माध्यम से संसाधन पता चलाना; निर्देशिकाओं में पता जोड़ेंबुकमार्क और बहुत कुछ। इन तरीकों में से प्रत्येक कैसे काम करता है, इस बारे में SEO फ़ोरम पर कई चर्चाएँ हैं। जैसा कि अभ्यास से पता चलता है, प्रत्येक मामला अद्वितीय है, और उन कारणों का अधिक सटीक रूप से पता लगाना मुश्किल है कि एक साइट को 10 दिनों में और दूसरे को 2 महीनों में क्यों अनुक्रमित किया गया था।

सूचकांक में तेजी लाने के लिए कैसे?

यांडेक्स में पेज इंडेक्सिंग
यांडेक्स में पेज इंडेक्सिंग

हालांकि, किसी साइट को इंडेक्स में तेजी से लाने के पीछे का तर्क उससे लिंक करने पर आधारित है। विशेष रूप से, हम मुक्त और सार्वजनिक साइटों (बुकमार्क, निर्देशिका, ब्लॉग, फ़ोरम) पर URL सेट करने के बारे में बात कर रहे हैं; बड़ी और लोकप्रिय साइटों पर लिंक खरीदने के बारे में (उदाहरण के लिए, सैप एक्सचेंज का उपयोग करके); साथ ही addURL फॉर्म में साइटमैप जोड़ने के लिए। शायद अन्य तरीके भी हैं, लेकिन जिन्हें पहले ही सूचीबद्ध किया जा चुका है, उन्हें सुरक्षित रूप से सबसे लोकप्रिय कहा जा सकता है। याद रखें, सामान्य तौर पर, सब कुछ साइट और उसके मालिक के भाग्य पर निर्भर करता है।

कौन सी साइटों को अनुक्रमित किया जाता है?

पृष्ठ अनुक्रमण अक्षम करें
पृष्ठ अनुक्रमण अक्षम करें

सभी खोज इंजनों की आधिकारिक स्थिति के अनुसार, फ़िल्टर की एक श्रृंखला से गुजरने वाली साइटें अनुक्रमणिका में आ जाती हैं। कोई नहीं जानता कि उत्तरार्द्ध में क्या आवश्यकताएं हैं। यह केवल ज्ञात है कि समय के साथ वे सभी इस तरह से सुधार करते हैं जैसे कि उपयोगकर्ता के लिए उपयोगी जानकारी नहीं रखने वाले लिंक और अन्य संसाधनों को बेचकर पैसा कमाने के लिए बनाई गई छद्म साइटों को फ़िल्टर करना। बेशक, इन साइटों के रचनाकारों के लिए, मुख्य कार्य पृष्ठों को यथासंभव अनुक्रमित करना है (आगंतुकों को आकर्षित करना, लिंक बेचना, आदि)।अगला)

खोज इंजन किन संसाधनों पर प्रतिबंध लगाते हैं?

पिछली जानकारी के आधार पर, हम यह निष्कर्ष निकाल सकते हैं कि किन साइटों के SERPs में नहीं आने की सबसे अधिक संभावना है। खोज इंजन के आधिकारिक प्रतिनिधियों द्वारा भी यही जानकारी दी गई है। सबसे पहले, ये गैर-अद्वितीय, स्वचालित रूप से जेनरेट की गई सामग्री वाली साइटें हैं जो आगंतुकों के लिए उपयोगी नहीं हैं। इसके बाद ऐसे संसाधन आते हैं जिनमें कम से कम जानकारी होती है, जो लिंक बेचने के लिए बनाई जाती है, इत्यादि।

सच है, यदि आप खोज इंजन के परिणामों का विश्लेषण करते हैं, तो आप इन सभी साइटों को इसमें पा सकते हैं। इसलिए, यदि हम उन साइटों के बारे में बात करते हैं जो खोज परिणामों में मौजूद नहीं होंगी, तो हमें न केवल गैर-अद्वितीय सामग्री, बल्कि कई अन्य कारकों पर भी ध्यान देना चाहिए - कई लिंक, अनुचित रूप से व्यवस्थित संरचना, और इसी तरह।

सामग्री छुपाना। पेज इंडेक्सिंग को कैसे निष्क्रिय करें?

खोज इंजन साइट पर सभी सामग्री को क्रॉल करते हैं। हालांकि, एक ऐसी तकनीक है जिसके द्वारा आप खोज रोबोट की पहुंच को किसी विशेष खंड तक सीमित कर सकते हैं। यह robots.txt फ़ाइल का उपयोग करके किया जाता है, जिस पर खोज इंजन के "मकड़ियों" प्रतिक्रिया करते हैं।

पृष्ठ अनुक्रमण को गति दें
पृष्ठ अनुक्रमण को गति दें

यदि यह फ़ाइल साइट के रूट में रखी गई है, तो इसमें लिखी गई स्क्रिप्ट के अनुसार पृष्ठों की अनुक्रमणिका आगे बढ़ेगी। विशेष रूप से, आप एक ही आदेश के साथ अनुक्रमण को अक्षम कर सकते हैं - अस्वीकृत करें। इसके अतिरिक्त, फ़ाइल साइट के उन अनुभागों को भी निर्दिष्ट कर सकती है जिन पर यह प्रतिबंध लागू होगा। उदाहरण के लिए, पूरी साइट की अनुक्रमणिका को प्रतिबंधित करने के लिए, यह निर्दिष्ट करने के लिए पर्याप्त हैएक स्लैश "/"; और खोज परिणामों से "दुकान" अनुभाग को बाहर करने के लिए, आपकी फ़ाइल में निम्नलिखित विशेषता निर्दिष्ट करने के लिए पर्याप्त है: "/ दुकान"। जैसा कि आप देख सकते हैं, सब कुछ तार्किक और बेहद सरल है। पेज इंडेक्सिंग बहुत आसानी से बंद हो जाती है। उसी समय, खोज रोबोट आपके पृष्ठ पर जाते हैं, robots.txt पढ़ते हैं और डेटाबेस में डेटा दर्ज नहीं करते हैं। तो आप खोज में साइटों की कुछ विशेषताओं को देखने के लिए आसानी से हेरफेर कर सकते हैं। अब बात करते हैं कि इंडेक्स कैसे चेक किया जाता है।

मैं पेज इंडेक्सिंग की जांच कैसे कर सकता हूं?

यैंडेक्स या Google डेटाबेस में कितने और कौन से पेज मौजूद हैं, यह पता लगाने के कई तरीके हैं। पहला - सबसे सरल - खोज फ़ॉर्म में संबंधित अनुरोध सेट करना है। यह इस तरह दिखता है: site:domen.ru, जहाँ आप domen.ru के बजाय क्रमशः अपनी साइट का पता लिखते हैं। जब आप ऐसा अनुरोध करते हैं, तो खोज इंजन निर्दिष्ट URL पर स्थित सभी परिणाम (पृष्ठ) दिखाएगा। इसके अलावा, केवल सभी पृष्ठों को सूचीबद्ध करने के अलावा, आप अनुक्रमित सामग्री की कुल संख्या भी देख सकते हैं ("परिणामों की संख्या" वाक्यांश के दाईं ओर)।

दूसरा तरीका है विशेष सेवाओं का उपयोग करके पेज इंडेक्सिंग की जांच करना। अब उनमें से बड़ी संख्या में हैं, उन्हें xseo.in और cy-pr.com कहा जा सकता है। ऐसे संसाधनों पर, आप न केवल पृष्ठों की कुल संख्या देख सकते हैं, बल्कि उनमें से कुछ की गुणवत्ता भी निर्धारित कर सकते हैं। हालाँकि, आपको इसकी आवश्यकता केवल तभी होगी जब आप इस विषय की अधिक गहराई से समझ रखते हों। एक नियम के रूप में, ये पेशेवर SEO टूल हैं।

"मजबूर" अनुक्रमण के बारे में

मैं तथाकथित के बारे में भी कुछ लिखना चाहूंगा"मजबूर" अनुक्रमण, जब कोई व्यक्ति विभिन्न "आक्रामक" विधियों का उपयोग करके अपनी साइट को अनुक्रमणिका में लाने का प्रयास करता है। अनुकूलक ऐसा करने की अनुशंसा नहीं करते हैं।

खोज इंजन, कम से कम, एक नए संसाधन से जुड़ी अत्यधिक गतिविधि को देखते हुए, कुछ प्रकार के प्रतिबंध लगा सकते हैं जो साइट की स्थिति को नकारात्मक रूप से प्रभावित करते हैं। इसलिए, सब कुछ करना बेहतर है ताकि पृष्ठों की अनुक्रमणिका यथासंभव जैविक, क्रमिक और चिकनी दिखे।

सिफारिश की: