हर वेबमास्टर जानता है कि लोगों को खोज इंजन से उसके संसाधन पर जाना शुरू करने के लिए, इसे अनुक्रमित करने की आवश्यकता है। साइट अनुक्रमण क्या है, इसे कैसे किया जाता है, और इसका अर्थ क्या है, इसके बारे में हम इस लेख में बताएंगे।
इंडेक्सिंग क्या है?
तो, "इंडेक्सिंग" शब्द का अर्थ है रजिस्टर में कुछ दर्ज करना, उपलब्ध सामग्रियों की एक जनगणना। साइट अनुक्रमण पर भी यही सिद्धांत लागू होता है। वास्तव में, इस प्रक्रिया को खोज इंजन के डेटाबेस में इंटरनेट संसाधनों के बारे में जानकारी दर्ज करना भी कहा जा सकता है।
इस प्रकार, जैसे ही उपयोगकर्ता Google खोज क्षेत्र में एक और वाक्यांश दर्ज करता है, स्क्रिप्ट उसे एक परिणाम लौटाएगी, जिसमें आपकी साइट का शीर्षक और उसका संक्षिप्त विवरण शामिल है, जिसे हम नीचे देखते हैं।
इंडेक्सिंग कैसे की जाती है?
खुद को अनुक्रमित करना ("यांडेक्स" है, या Google - कोई भूमिका नहीं निभाता) काफी सरल है। इंटरनेट का पूरा वेब, आईपी-एड्रेस के डेटाबेस पर ध्यान केंद्रित करता है जो खोज इंजन के पास है, शक्तिशाली रोबोटों द्वारा स्कैन किया जाता है - "मकड़ियों" जो इकट्ठा करते हैंआपकी साइट के बारे में जानकारी। प्रत्येक खोज इंजन में उनमें से एक बड़ी संख्या है, और वे दिन में 24 घंटे स्वचालित रूप से काम करते हैं। उनका काम आपकी साइट पर जाना और डेटाबेस में डेटा दर्ज करते समय उस पर सभी सामग्री को "पढ़ना" है।
परिणामस्वरूप, सिद्धांत रूप में, साइट अनुक्रमण संसाधन के स्वामी पर अधिक निर्भर नहीं करता है। यहां निर्णायक कारक खोज रोबोट है जो साइट पर आता है और इसकी खोज करता है। यह वही है जो आपकी साइट के खोज परिणामों में प्रकट होने की गति को प्रभावित करता है।
अनुक्रमण की शर्तें?
बेशक, हर वेबमास्टर के लिए यह फायदेमंद होता है कि उसका संसाधन खोज परिणामों में जल्द से जल्द दिखाई दे। यह प्रभावित करेगा, सबसे पहले, साइट को पहले स्थान पर लाने की शर्तें, और दूसरी, जब साइट के मुद्रीकरण के पहले चरण शुरू होते हैं। इस प्रकार, जितनी जल्दी खोज रोबोट आपके संसाधन के सभी पृष्ठों को "खाएगा", उतना ही बेहतर होगा।
प्रत्येक खोज इंजन का अपने डेटाबेस में साइट डेटा दर्ज करने के लिए अपना एल्गोरिथ्म होता है। उदाहरण के लिए, यांडेक्स में पृष्ठों का अनुक्रमण चरणों में किया जाता है: रोबोट लगातार साइटों को स्कैन करते हैं, फिर जानकारी की व्यवस्था करते हैं, जिसके बाद तथाकथित "अपडेट" होता है, जब सभी परिवर्तन प्रभावी होते हैं। ऐसे आयोजनों की नियमितता कंपनी द्वारा स्थापित नहीं की जाती है: वे हर 5-7 दिनों में एक बार आयोजित किए जाते हैं (एक नियम के रूप में), हालांकि, वे 2 और 15 दिन पहले दोनों जगह ले सकते हैं।
उसी समय, Google में साइट का अनुक्रमण एक अलग मॉडल का अनुसरण करता है। इस खोज इंजन में, इस तरह के "अपडेट" (आधार अपडेट) नियमित रूप से होते हैं, इसलिए, हर बार प्रतीक्षा करें जब तक कि रोबोट डेटाबेस में जानकारी दर्ज न करें, और फिर यहहर कुछ दिनों में आदेश दिया जाएगा, जरूरत नहीं है।
उपरोक्त के आधार पर, हम निम्नलिखित निष्कर्ष निकाल सकते हैं: यांडेक्स में पृष्ठ 1-2 "अपडेट" (अर्थात औसतन 7-20 दिनों में) के बाद जोड़े जाते हैं, और Google में यह बहुत तेज़ी से हो सकता है - सचमुच दिन में।
एक ही समय में, निश्चित रूप से, प्रत्येक खोज इंजन की अपनी विशिष्टताएँ होती हैं कि अनुक्रमण कैसे किया जाता है। उदाहरण के लिए, यांडेक्स में एक तथाकथित "फास्ट बॉट" है - एक रोबोट जो कुछ घंटों में समस्या में डेटा दर्ज कर सकता है। सच है, उसे अपने संसाधन पर ले जाना आसान नहीं है: यह मुख्य रूप से समाचार और वास्तविक समय में विकसित होने वाली विभिन्न हाई-प्रोफाइल घटनाओं से संबंधित है।
सूचकांक में कैसे प्रवेश करें?
खोज इंजन में अपनी साइट को कैसे अनुक्रमित किया जाए, इस प्रश्न का उत्तर सरल और जटिल दोनों है। पृष्ठ अनुक्रमण एक प्राकृतिक घटना है, और यदि आप इसके बारे में सोचते भी नहीं हैं, लेकिन बस कहें, अपना ब्लॉग रखें, धीरे-धीरे इसे जानकारी से भर दें, तो खोज इंजन समय के साथ आपकी सामग्री को पूरी तरह से "निगल" जाएगा।
एक और बात यह है कि जब आपको पेज इंडेक्सिंग को तेज करने की आवश्यकता होती है, उदाहरण के लिए, यदि आपके पास तथाकथित "उपग्रहों" का नेटवर्क है (लिंक बेचने या विज्ञापन देने के लिए डिज़ाइन की गई साइटें, जिनकी गुणवत्ता आमतौर पर खराब होती है). इस मामले में, आपको उपाय करने की आवश्यकता है ताकि रोबोट आपकी साइट पर ध्यान दें। निम्नलिखित को सामान्य माना जाता है: साइट के URL को एक विशेष रूप में जोड़ना (इसे "AddUrl" कहा जाता है); लिंक निर्देशिकाओं के माध्यम से संसाधन पता चलाना; निर्देशिकाओं में पता जोड़ेंबुकमार्क और बहुत कुछ। इन तरीकों में से प्रत्येक कैसे काम करता है, इस बारे में SEO फ़ोरम पर कई चर्चाएँ हैं। जैसा कि अभ्यास से पता चलता है, प्रत्येक मामला अद्वितीय है, और उन कारणों का अधिक सटीक रूप से पता लगाना मुश्किल है कि एक साइट को 10 दिनों में और दूसरे को 2 महीनों में क्यों अनुक्रमित किया गया था।
सूचकांक में तेजी लाने के लिए कैसे?
हालांकि, किसी साइट को इंडेक्स में तेजी से लाने के पीछे का तर्क उससे लिंक करने पर आधारित है। विशेष रूप से, हम मुक्त और सार्वजनिक साइटों (बुकमार्क, निर्देशिका, ब्लॉग, फ़ोरम) पर URL सेट करने के बारे में बात कर रहे हैं; बड़ी और लोकप्रिय साइटों पर लिंक खरीदने के बारे में (उदाहरण के लिए, सैप एक्सचेंज का उपयोग करके); साथ ही addURL फॉर्म में साइटमैप जोड़ने के लिए। शायद अन्य तरीके भी हैं, लेकिन जिन्हें पहले ही सूचीबद्ध किया जा चुका है, उन्हें सुरक्षित रूप से सबसे लोकप्रिय कहा जा सकता है। याद रखें, सामान्य तौर पर, सब कुछ साइट और उसके मालिक के भाग्य पर निर्भर करता है।
कौन सी साइटों को अनुक्रमित किया जाता है?
सभी खोज इंजनों की आधिकारिक स्थिति के अनुसार, फ़िल्टर की एक श्रृंखला से गुजरने वाली साइटें अनुक्रमणिका में आ जाती हैं। कोई नहीं जानता कि उत्तरार्द्ध में क्या आवश्यकताएं हैं। यह केवल ज्ञात है कि समय के साथ वे सभी इस तरह से सुधार करते हैं जैसे कि उपयोगकर्ता के लिए उपयोगी जानकारी नहीं रखने वाले लिंक और अन्य संसाधनों को बेचकर पैसा कमाने के लिए बनाई गई छद्म साइटों को फ़िल्टर करना। बेशक, इन साइटों के रचनाकारों के लिए, मुख्य कार्य पृष्ठों को यथासंभव अनुक्रमित करना है (आगंतुकों को आकर्षित करना, लिंक बेचना, आदि)।अगला)
खोज इंजन किन संसाधनों पर प्रतिबंध लगाते हैं?
पिछली जानकारी के आधार पर, हम यह निष्कर्ष निकाल सकते हैं कि किन साइटों के SERPs में नहीं आने की सबसे अधिक संभावना है। खोज इंजन के आधिकारिक प्रतिनिधियों द्वारा भी यही जानकारी दी गई है। सबसे पहले, ये गैर-अद्वितीय, स्वचालित रूप से जेनरेट की गई सामग्री वाली साइटें हैं जो आगंतुकों के लिए उपयोगी नहीं हैं। इसके बाद ऐसे संसाधन आते हैं जिनमें कम से कम जानकारी होती है, जो लिंक बेचने के लिए बनाई जाती है, इत्यादि।
सच है, यदि आप खोज इंजन के परिणामों का विश्लेषण करते हैं, तो आप इन सभी साइटों को इसमें पा सकते हैं। इसलिए, यदि हम उन साइटों के बारे में बात करते हैं जो खोज परिणामों में मौजूद नहीं होंगी, तो हमें न केवल गैर-अद्वितीय सामग्री, बल्कि कई अन्य कारकों पर भी ध्यान देना चाहिए - कई लिंक, अनुचित रूप से व्यवस्थित संरचना, और इसी तरह।
सामग्री छुपाना। पेज इंडेक्सिंग को कैसे निष्क्रिय करें?
खोज इंजन साइट पर सभी सामग्री को क्रॉल करते हैं। हालांकि, एक ऐसी तकनीक है जिसके द्वारा आप खोज रोबोट की पहुंच को किसी विशेष खंड तक सीमित कर सकते हैं। यह robots.txt फ़ाइल का उपयोग करके किया जाता है, जिस पर खोज इंजन के "मकड़ियों" प्रतिक्रिया करते हैं।
यदि यह फ़ाइल साइट के रूट में रखी गई है, तो इसमें लिखी गई स्क्रिप्ट के अनुसार पृष्ठों की अनुक्रमणिका आगे बढ़ेगी। विशेष रूप से, आप एक ही आदेश के साथ अनुक्रमण को अक्षम कर सकते हैं - अस्वीकृत करें। इसके अतिरिक्त, फ़ाइल साइट के उन अनुभागों को भी निर्दिष्ट कर सकती है जिन पर यह प्रतिबंध लागू होगा। उदाहरण के लिए, पूरी साइट की अनुक्रमणिका को प्रतिबंधित करने के लिए, यह निर्दिष्ट करने के लिए पर्याप्त हैएक स्लैश "/"; और खोज परिणामों से "दुकान" अनुभाग को बाहर करने के लिए, आपकी फ़ाइल में निम्नलिखित विशेषता निर्दिष्ट करने के लिए पर्याप्त है: "/ दुकान"। जैसा कि आप देख सकते हैं, सब कुछ तार्किक और बेहद सरल है। पेज इंडेक्सिंग बहुत आसानी से बंद हो जाती है। उसी समय, खोज रोबोट आपके पृष्ठ पर जाते हैं, robots.txt पढ़ते हैं और डेटाबेस में डेटा दर्ज नहीं करते हैं। तो आप खोज में साइटों की कुछ विशेषताओं को देखने के लिए आसानी से हेरफेर कर सकते हैं। अब बात करते हैं कि इंडेक्स कैसे चेक किया जाता है।
मैं पेज इंडेक्सिंग की जांच कैसे कर सकता हूं?
यैंडेक्स या Google डेटाबेस में कितने और कौन से पेज मौजूद हैं, यह पता लगाने के कई तरीके हैं। पहला - सबसे सरल - खोज फ़ॉर्म में संबंधित अनुरोध सेट करना है। यह इस तरह दिखता है: site:domen.ru, जहाँ आप domen.ru के बजाय क्रमशः अपनी साइट का पता लिखते हैं। जब आप ऐसा अनुरोध करते हैं, तो खोज इंजन निर्दिष्ट URL पर स्थित सभी परिणाम (पृष्ठ) दिखाएगा। इसके अलावा, केवल सभी पृष्ठों को सूचीबद्ध करने के अलावा, आप अनुक्रमित सामग्री की कुल संख्या भी देख सकते हैं ("परिणामों की संख्या" वाक्यांश के दाईं ओर)।
दूसरा तरीका है विशेष सेवाओं का उपयोग करके पेज इंडेक्सिंग की जांच करना। अब उनमें से बड़ी संख्या में हैं, उन्हें xseo.in और cy-pr.com कहा जा सकता है। ऐसे संसाधनों पर, आप न केवल पृष्ठों की कुल संख्या देख सकते हैं, बल्कि उनमें से कुछ की गुणवत्ता भी निर्धारित कर सकते हैं। हालाँकि, आपको इसकी आवश्यकता केवल तभी होगी जब आप इस विषय की अधिक गहराई से समझ रखते हों। एक नियम के रूप में, ये पेशेवर SEO टूल हैं।
"मजबूर" अनुक्रमण के बारे में
मैं तथाकथित के बारे में भी कुछ लिखना चाहूंगा"मजबूर" अनुक्रमण, जब कोई व्यक्ति विभिन्न "आक्रामक" विधियों का उपयोग करके अपनी साइट को अनुक्रमणिका में लाने का प्रयास करता है। अनुकूलक ऐसा करने की अनुशंसा नहीं करते हैं।
खोज इंजन, कम से कम, एक नए संसाधन से जुड़ी अत्यधिक गतिविधि को देखते हुए, कुछ प्रकार के प्रतिबंध लगा सकते हैं जो साइट की स्थिति को नकारात्मक रूप से प्रभावित करते हैं। इसलिए, सब कुछ करना बेहतर है ताकि पृष्ठों की अनुक्रमणिका यथासंभव जैविक, क्रमिक और चिकनी दिखे।