Table of Contents
अध्याय 2
आँकड़ों का संग्रह
• आँकड़ा-संग्रह का अर्थ और उद्देश्य समझ सकें;
• प्राथमिक एवं द्वितीयक स्रोतों के बीच अंतर कर सकें;
• आँकड़ा-संग्रह की विधि समझ सकें;
• जनगणना एवं प्रतिदर्श सर्वेक्षण के बीच अंतर कर सकें;
• प्रतिचयन की प्रविधि से परिचित हो सकें;
• द्वितीयक आँकड़ों के कुछ महत्वपूर्ण स्रोतों के बारे में जान सकें।
प्रस्तावना
पिछले अध्याय में आपको अर्थशास्त्र की विषयवस्तु की जानकारी मिली। इसके साथ ही आपने अर्थशास्त्र में सांख्यिकी की भूमिका एवं महत्त्व के बारे में भी पढ़ा। इस अध्याय में आप आँकड़ों के स्रोतों एवं आँकड़ा-संग्रह की विधि के बारे में अध्ययन करेंगे। आँकड़ों के संग्रह का उद्देश्य किसी समस्या के स्पष्ट एवं ठोस समाधान के लिए साक्ष्य को दर्शाना है।
अर्थशास्त्र में प्रायः एेसे कथनों से आपका सामना होता है, जैसे-
"अनेक उतार-चढ़ावों के पश्चात् खाद्यान्नों का उत्पादन 1970-71 में 10.8 करोड़ टन से बढ़कर 1978-79 में 13.2 करोड़ टन हो गया, किंतु 1979-80 में फिर से गिर कर 10.8 करोड़ टन हो गया। उसके बाद खाद्यान्नों का उत्पादन 2015-16 तक लगातार बढ़ कर 25.2 करोड़ टन हो गया तथा 2016-17 में इसने 27.2 करोड़ टन का आँकड़ा छू लिया।"
आप इस कथन में यह देख सकते हैं कि विभिन्न वर्षाें में खाद्यान्नों का उत्पादन एक समान नहीं रहा है। यह फसल-दर-फसल तथा वर्ष-दर-वर्ष बदलता रहा है। चूँकि ये मूल्य परिवर्तनशील होते हैं, अतः इन्हें चर कहा जाता है। इन चरों को प्रायः X, Y, Z आदि अक्षरों द्वारा प्रदर्शित किया जाता है। प्रत्येक चर का मूल्य प्रेक्षण कहलाता है। उदाहरण के लिए - भारत में खाद्यान्न उत्पादन 1970-71 में 108 मिलियन टन से लेकर वर्ष 2016-17 में 272 मिलियन टन के बीच रहा, जैसा कि सारणी में दिखाया गया है। यहाँ पर वर्षाें को चर X के द्वारा और भारत में खाद्यान्नों के उत्पादन को (मिलियन टनों में) चर Y के द्वारा प्रस्तुत किया गया हैः
यहाँ पर चर X तथा Y के मूल्य ‘आँकड़े’ हैं, जिनके द्वारा हम भारत में खाद्यान्नों के उत्पादन के बारे में जानकारी प्राप्त कर सकते हैं। खाद्यान्नों के उत्पादन में उतार-चढ़ाव की प्रवृत्ति को जानने के लिए हमें विभिन्न वर्षों के लिए भारत में खाद्यान्न उत्पादन के ‘आँकड़ों’ की आवश्यकता पड़ती है। आँकड़ा एक एेसा साधन है, जो सूचनाएँ प्रदान कर समस्या को समझने में सहायक होता है।
आप जानना चाहते होंगे कि ये ‘आँकड़े’ कहाँ से आते हैं और हम इन्हें कैसे संगृहीत करते हैं? निम्नलिखित अनुभाग में हम आँकड़ों के प्रकार, आँकड़ों को संगृहीत करने की विधि तथा साधनों तथा आँकड़ों के स्रोतों की चर्चा करेंगे।
2. आँकड़ों के स्रोत क्या हैं?
सांख्यकीय आँकड़े दो स्रोतों से प्राप्त किए जा सकते हैं। गणनाकार (वह व्यक्ति जो आँकड़ा संग्रह करता है) जाँच-पड़ताल या पूछताछ करके आँकड़े एकत्र कर सकता है। एेसे आँकड़े प्राथमिक आँकड़े कहे जाते हैं, चूँकि ये प्रत्यक्ष रूप से प्राप्त की गई जानकारी पर आधारित होते हैं। मान लें कि आप विद्यालयी बच्चों के बीच किसी फिल्मी सितारे की लोकप्रियता की जानकारी लेना चाहते हैं। इस संबंध में वांछित जानकारी लेने के लिए आपको काफी बड़ी संख्या में विद्यालय के छात्रों से प्रश्नों के माध्यम से पूछताछ करनी होगी। इस विधि से आप जो आँकड़े प्राप्त करते हैं, वह प्राथमिक आँकड़ों का एक उदाहरण है।
यदि किसी दूसरी संस्था द्वारा इन आँकड़ों को संगृहीत एवं संशोधित (संवीक्षित एवं सारणीकृत) किया जाता है तो इन्हें ‘द्वितीयक आँकड़े’ कहते हैं। इन आँकड़ों को या तो प्रकाशित स्रोतों से जैसे सरकारी रिपोर्ट, दस्तावेज, समाचार पत्र, अर्थशास्त्रियों द्वारा लिखित पुस्तकें, या किसी अन्य स्रोत से प्राप्त किया जा सकता है, जैसे वेबसाइट। अतः ये आँकड़े उन स्रोतों के लिए प्राथमिक हैं जो उन्हें पहली बार संगृहीत एवं संसाधित करते हैं, तथा बाद में प्रयोग करने वाले सभी स्रोतों के लिए ये द्वितीयक हैं। द्वितीयक आँकड़ों के उपयोग से समय एवं धन की बचत होती है। उदाहरण के लिए, मान लें छात्रों में किसी सिनेमा कलाकार की लोकप्रियता के बारे में आँकड़ों को एकत्र करने के पश्चात् आप एक रिपोर्ट प्रकाशित करते हैं। यदि आप द्वारा संग्रह किए गए आँकड़ों का उपयोग कोई इसी तरह के किसी अध्ययन के लिए करता है, तो उसके लिए यह द्वितीयक आँकड़े हो जाते हैं।
3. हम आँकड़े कैसे संगृहीत करते हैं?
क्या आप जानते हैं कि कोई विनिर्माता अपने किसी उत्पाद के संबंध में या कोई राजनैतिक पार्टी अपने किसी उम्मीदवार के विषय में कैसे निर्णय करती है? वे उत्पाद-विशेष या उम्मीदवार-विशेष के बारे में जन- समुदाय से प्रश्नों के माध्यम से सर्वेक्षण करते हैं। इस सर्वेक्षण का उद्देश्य कुछ विशिष्टताओं जैसे कीमत, गुणवत्ता, उपयोगिता (उत्पाद के संबंध में) और लोकप्रियता, ईमानदारी और निष्ठा (उम्मीदवार के संबंध में) के बारे में जानकारी एकत्र करना होता है। सर्वेक्षण का उद्देश्य आँकड़ों को संगृहीत करना होता है। सर्वेक्षण वह विधि है, जिसके द्वारा विभिन्न व्यक्तियों से सूचना एकत्र की जाती है।सर्वेक्षण के साधनों की तैयारी
सर्वेक्षणों में उपयोग किया जाने वाला सर्वाधिक प्रचलित साधन प्रश्नावली या साक्षात्कार अनुसूची है। प्रश्नावली या तो स्वयं उत्तरदाता द्वारा भरी जाती है या फिर शोधकर्ता (गणनाकार) अथवा प्रशिक्षित जाँचकर्ता द्वारा भरी जाती है। प्रश्नावली या साक्षात्कार अनुसूची तैयार करने में आपको निम्नलिखित बातों का ध्यान रखना चाहिएः
• प्रश्नावली बहुत लम्बी नहीं होनी चाहिए ।
जहाँ तक संभव हो सके, प्रश्नों की संख्या कम से कम होनी चाहिए। लंबी प्रश्नावली उत्तरदाताओं को हतोत्साहित करती है।
• प्रश्नावली समझने में आसान होनी चाहिए ।
अस्पष्ट या कठिन शब्दों से बचना चाहिए।
• प्रश्न एेसे क्रम में व्यवस्थित किए जाने चाहिए कि उत्तर देने वाला व्यक्ति आराम से उत्तर दे सके।
• प्रश्नावली सामान्य प्रश्नों से आरम्भ होकर विशिष्ट प्रश्नों की ओर बढ़नी चाहिए।
प्रश्नावली की शुरुआत सामान्य प्रश्नों के साथ होनी चाहिए और विशिष्ट प्रश्न क्रमशः बाद में दिए जाने चाहिए। इससे उत्तरदाता निश्चिन्त हो जाता है। उदाहरणार्थः
गलत प्रश्न
(क) क्या बिजली के प्रभार में वृद्धि को उचित ठहराया जा सकता है?
(ख) क्या आपके क्षेत्र में बिजली की पूर्ति नियमित रहती है?
सही प्रश्न
(क) क्या आपके क्षेत्र में बिजली की पूर्ति नियमित रहती है?
(ख) क्या बिजली के प्रभार में वृद्धि को उचित ठहराया जा सकता है?
• प्रश्न यथातथ्य एवं स्पष्ट होने चाहिए। उदाहरणार्थः
गलत प्रश्न
आप आकर्षक दिखने के लिए अपनी आय का कितना प्रतिशत भाग कपड़ों पर खर्च करते हैं?
सही प्रश्न
आप अपनी आय का कितना प्रतिशत भाग कपड़ों पर खर्च करते हैं?
• प्रश्न अनेकार्थक या अस्पष्ट नहीं होने चाहिए। प्रश्न एेसे हों ताकि उत्तरदाता शीघ्र, सही एवं स्पष्ट उत्तर देने में सक्षम रहे। उदाहरणार्थः
गलत प्रश्न
क्या आप प्रतिमाह पुस्तकों पर बहुत पैसा खर्च करते हैं?
सही प्रश्न
सही विकल्प पर सही ()का निशान लगाएँ।
आप प्रतिमाह पुस्तकों पर कितना खर्च करते हैं?
(क) 200/- रु से कम
(ख) 200/- से 300/- रु के बीच
(ग) 300/- से 400/- रु के बीच
(घ) 400/- रु से अधिक
• प्रश्न दोहरी नकारात्मकता वाले नहीं होने चाहिए।
प्रश्नों को ‘क्या आप नहीं’ से शुरू नहीं करना चाहिए, क्योंकि इनसे पूर्वाग्रह-ग्रस्त उत्तर मिलने की संभावना हो सकती है। उदाहरणार्थः
गलत प्रश्न
क्या आप एेसा नहीं सोचते कि धूम्रपान को निषिद्ध किया जाना चाहिए।
सही प्रश्न
क्या आप सोचते हैं कि धूम्रपान को निषिद्ध किया जाना चाहिए?
• प्रश्न संकेतक प्रश्न नहीं होने चाहिए, जिससे उत्तरदाता को जवाब देने के लिए सूत्र मिले। उदाहरणार्थः
गलत प्रश्न
क्या आप इस उच्च कोटि की चाय के स्वाद को पसंद करते हैं?
सही प्रश्न
आपको इस चाय का स्वाद कैसा लगा?
• प्रश्न से उत्तर के विकल्प का संकेत नहीं मिलना चाहिए? उदाहरणार्थः
गलत प्रश्न
क्या आप कॉलेज के बाद नौकरी करना चाहेंगी या गृहिणी बनना चाहेंगी?
सही प्रश्न
आप कॉलेज के बाद क्या करना चाहेंगी?
प्रश्नावली में परिमितोत्तर (संरचित) प्रश्न या मुक्तोत्तर (असंरचित) प्रश्न हो सकते हैं। उपरोक्त प्रश्न, कि एक विद्यार्थी कॉलेज के बाद क्या करना चाहता है, एक मुक्तोत्तर प्रश्न है।
संरचित प्रश्न या असंरचित प्रश्न या तो द्विविध प्रश्न हो सकते हैं या फिर बहुविकल्पी प्रश्न हो सकते हैं। जब किसी प्रश्न के उत्तर में ‘हाँ’ या ‘नहीं’ के मात्र दो ही विकल्प होते हैं तो इसे द्विविध प्रश्न कहते हैं।
जब प्रश्नावली के अंतर्गत दो से अधिक उत्तरों के विकल्प होते हैं, वहाँ बहुविकल्पी प्रश्न अधिक उपयुक्त होते हैं। उदाहरणार्थ,
प्रश्न - आपने अपनी ज़मीन क्यों बेंच दी?
(क) कर्ज चुकाने के लिए।
(ख) बच्चों की शिक्षा हेतु धन की व्यवस्था के लिए।
(ग) किसी अन्य संपत्ति में निवेश हेतु।
(घ) कोई अन्य कारण (कृपया स्पष्ट करें)।
मुक्तोत्तर प्रश्न विश्लेषण की दृष्टि से उपयोग, स्कोर तथा कोड के लिए आसान होते हैं, क्योंकि उत्तरदाताओं को दिए गए विकल्पों में से उत्तर चुनना होता है। लेकिन इनके उपयुक्त विकल्प लिखने में कठिनाई होती है। इन विकल्पों को स्पष्ट तौर से लिखा जाना चाहिए ताकि मुद्दे के दोनों पहलुओं का प्रतिनिधित्व हो सके। यहाँ पर एक संभावना यह भी रहती है कि व्यक्ति-विशेष का सही उत्तर, दिए गए विकल्पों में से कोई भी न हो। इस के लिए कोई अन्य का विकल्प दिया जाना चाहिए, जहाँ उत्तरदाता अपना वह उत्तर लिख सके, जिसकी अपेक्षा शोधकर्ता/सर्वेक्षक को भी नहीं होती। इसके अलावा, बहु-विकल्पी प्रश्नों की एक अन्य सीमा यह भी है कि इसमें उत्तरदाता को अनेक वैकल्पिक उत्तर देकर प्रतिबंधित कर दिया जाता है, अन्यथा उत्तरदाता इन विकल्पों से भिन्न उत्तर भी दे सकता था।
मुक्तोत्तर प्रश्न के अंतर्गत व्यक्ति को उत्तर देने की अधिक व्यक्तिगत छूट रहती है, लेकिन इनकी सही व्याख्या करने में कठिनाई होती है तथा इन्हें स्कोर करने में मुश्किल होती है, चूँकि उत्तरों में काफी विभिन्नता होती है। उदाहरणार्थ,
प्रश्न - वैश्वीकरण के विषय में आपके क्या विचार हो सकते है?
आँकड़ा-संग्रह की विधि
क्या आपने कोई एेसा टेलीविजन शो देखा है, जिसमें रिपोर्टर ने बच्चों, गृहणियों या आम जनता से क्रमशः उनकी परीक्षा या साबुन के किसी ब्रांड या किसी राजनीतिक पार्टी के बारे में प्रश्न पूछा हो? इन प्रश्नों के पूछने का उद्देश्य आँकड़ा-संग्रह करने के लिए सर्वेक्षण करना है। आँकड़ा-संग्रह की तीन आधारभूत विधियाँ हैंः (क) वैयक्तिक साक्षात्कार (ख) डाक द्वारा सर्वेक्षण (प्रश्नावली भेजना) और (ग) टेलीफोन-साक्षात्कार।
वैयक्तिक साक्षात्कार
यह विधि तभी उपयोग में लाई जाती है जब शोधकर्ता सभी सदस्यों के पास जा सकता हो। इसमें शोधकर्ता (जाँचकर्ता) आमने-सामने होकर उत्तरदाता से साक्षात्कार करता है।
वैयक्तिक साक्षात्कारों को कई कारणों से प्राथमिकता दी जाती है। इसमें सर्वेक्षक एवं उत्तरदाता के बीच व्यक्तिगत संपर्क होता है। सर्वेक्षक या साक्षात्कारकर्त्ता को यह अवसर मिलता है कि वह उत्तरदाता को अध्ययन के उद्देश्य के बारे में बता सके तथा उत्तरदाता की किसी भी पूछताछ का जवाब दे सके। इसमें साक्षात्कारकर्त्ता उत्तरदाता से यह निवेदन कर सकता है कि वह विशेष महत्व के बिंदुओं को विस्तार से बताए। इससे अपनिर्वचन (गलत व्याख्या) तथा गलतफहमी से बचा जा सकता है। साथ ही उत्तरदाता की प्रतिक्रियाओं को देख कर कुछ संपूरक सूचनाएँ भी प्राप्त हो सकती हैं।
वैयक्तिक साक्षात्कार की कुछ कमियाँ भी हैं। यह काफी खर्चीली होती है तथा इसमें प्रशिक्षित साक्षात्कार कर्त्ताओं की ज़रूरत होती है। इसमें सर्वेक्षण पूरा करने में काफी अधिक समय लगता है। कभी-कभी शोधकर्ता/सर्वेक्षक की उपस्थिति के कारण उत्तरदाता सही बात नहीं भी बताते हैं।
डाक द्वारा प्रश्नावली भेजना
जब सर्वेक्षण में आँकड़ों को डाक द्वारा संगृहीत किया जाता है, तो प्रत्येक उत्तरदाता को डाक द्वारा प्रश्नावली इस निवेदन के साथ भेजी जाती है कि वह इसे पूरी कर एक निश्चित तारीख तक वापस अवश्य भेज दे। इस का सबसे बड़ा लाभ है कि यह बहुत कम खर्चीली होती है। इसके साथ ही इस विधि के द्वारा शोधकर्त्ता/सर्वेक्षक काफी दूर-दराज के क्षेत्रों तक पहुँच सकते हैं, जो संभवतः व्यक्ति या टेलीफोन की पहुँच से भी बाहर हो सकते हैं। इस विधि में साक्षात्कारकर्त्ता उत्तरदाताओं पर प्रभाव भी नहीं डाल पाते। साथ ही, यह उत्तरदाता को पर्याप्त समय देता है ताकि, वह सोच-विचार कर प्रश्नों के उत्तर दे सके। आजकल आन लाइन सर्वेक्षण या संक्षिप्त संदेश सेवा (SMS) द्वारा सर्वेक्षण काफी लोकप्रिय हो रहे हैं। क्या आप जानते हैं कि अॉन लाइन सर्वेक्षण कैसे आयोजित किए जाते हैं?
इस विधि की कमी यह है कि इसमें लोगों तक सर्वेक्षक की पहुँच सीमित हो जाती है, क्योंकि बहुत से लोगों के पास निजी टेलीफोन नहीं भी हो सकते हैं। इसके साथ टेलीफोन साक्षात्कार की कमी यह भी है, कि संवेदनशील मुद्दों पर उत्तरदाताओं की उन प्रतिक्रियाओं को दृश्य रूप में नहीं देखा जा सकता है, जो इन विषयों पर सही जानकारी प्राप्त करने में सहायक होती हैं।
क्रियात्मक गतिविधियाँ
• आपको एक एेसे व्यक्ति से जानकारी (सूचनाएँ) प्राप्त करनी है जो भारत के दूर-दराज के गाँव में रहता है। इस व्यक्ति से सूचना प्राप्त करने के लिए आँकड़ा-संग्रह की कौन सी विधि सर्वाधिक उपयुक्त रहेगी और क्यों? विवेचना कीजिए।
• आपको किसी विद्यालय की अध्ययन गुणवत्ता के बारे में अध्यापक से एक साक्षात्कार करना है। यदि वहाँ पर विद्यालय का प्रधानाचार्य उपस्थित है, तो किस प्रकार की समस्याएँ पैदा हो सकती हैं?
प्रायोगिक सर्वेक्षण
एक बार जब सर्वेक्षण हेतु प्रश्नावली तैयार हो जाए तो यह सलाह दी जाती है कि एक छोटे समूह का सर्वेक्षण करके देख लिया जाना चाहिए, जिसे प्रायोगिक सर्वेक्षण के रूप में या प्रश्नावली की पूर्व-परीक्षा के रूप में जाना जाता है। सर्वेक्षण के बारे में प्रारंभिक अनुमान लगाने में प्रायोगिक सर्वेक्षण सहायक होता है। यह प्रश्नावली के पूर्व-परीक्षण में भी सहायक होता है, ताकि प्रश्नों की कमियों एवं त्रुटियों को पता किया जा सके। इसके साथ ही प्रायोगिक सर्वेक्षण प्रश्नों की उपयुक्तता, निर्देशों की स्पष्टता, सर्वेक्षक (गणनाकार) की कार्य-दक्षता तथा वास्तविक सर्वेक्षण में आनेवाली लागत एवं समय का अनुमान लगाने में भी सहायता करता है।
4. जनगणना तथा प्रतिदर्श सर्वेक्षण
जनगणना या पूर्ण गणना (Census or Complete Enumeration)
वह सर्वेक्षण, जिसके अंतर्गत जनसंख्या के सभी तत्व शमिल होते हैं, उसे जनगणना या पूर्ण गणना की विधि कहा जाता है। यदि कुछ खास संस्थाएँ भारत की संपूर्ण जनसंख्या के बारे में अध्ययन की रुचि रखती हैं, तो उन्हें भारत के सभी शहरों एवं गाँवों के सभी परिवारों के बारे में जानकारी प्राप्त करनी होगी। इस विधि की प्रमुख विशेषता है कि इसके अंतर्गत संपूर्ण जनसंख्या की प्रत्येक व्यष्टिगत इकाई को सम्मिलित करना होता है। आप एेसा नहीं कर सकते हैं कि कुछ इकाइयों को चुन लें और कुछ को छोड़ दें। आपने संभवतः भारत की जनगणना के बारे में सुना होगा, जो हर दस साल में एक बार होती है। इसके अंतर्गत घर-घर जाकर जानकारी ली जाती है और पूरे भारत के हर एक परिवार को इसमें सम्मिलित किया जाता है। इसके अंतर्गत जन्म एवं मृत्युदर, साक्षरता, रोजगार, आयु संभाविता या प्रत्याशित आयु, जनसंख्या के आकार एवं सरंचना आदि के जनसांख्यिकीय आँकड़े जुटाए जाते हैं, जिन्हें भारत के महानिदेशक द्वारा संगृहीत एवं प्रकाशित किया जाता है। भारत में पिछली जनगणना 2011 में की गई थी।
जनगणना 2001 के अनुसार भारत की जनसंख्या 2011 की जनगणना के अनुसार भारत की जनसंख्या 121.09 करोड़ है, जो 2001 में 102.87 करोड़ थी। 1901 की जनगणना ने देश की जनसंख्या 23.83 करोड़ दर्शाई थी। तब से 110 वर्षों की समयावधि में, देश की जनसंख्या 97 करोड़ से भी अधिक बढ़ गई है। जनसंख्या की औसत वार्षिक वृद्धि दर, जो 1971-81 में 2.2 प्रतिशत प्रतिवर्ष थी, 1991-2001 में घटकर 1.97 प्रतिशत हो गई तथा 2001-2011 में 1.64 हो गई।
जनसंख्या तथा प्रतिदर्श (Population and Sample)
सांख्यिकी में ‘समष्टि’ शब्द का तात्पर्य है अध्ययन-क्षेत्र के अंतर्गत आने वाली सभी मदों/इकाइयों की समग्रता। अतः समष्टि एक एेसा समूह है, जिस पर किसी अध्ययन के परिणाम लागू हो सकें। सर्वेक्षण के उद्देश्य के अनुसार किसी समष्टि के अंतर्गत सदैव एेसी सभी व्यष्टि तथा इकाइयाँ/मदें आती हैं, जिनमें कुछ विशेषताएँ (या विशेषताओं का समूह) हों। प्रतिदर्श चुनने में पहला कार्य समष्टि की पहचान करना है। एक बार जब समष्टि की पहचान हो जाती है तो शोधकर्ता इसका अध्ययन करने का एक तरीका चुनता है। यदि शोधकर्ता को लगता है कि समूची समष्टि या जनसंख्या का सर्वेक्षण संभव नहीं है, तो वह एक प्रतिनिधि प्रतिदर्श चुन सकता है। एक आदर्श प्रतिदर्श (प्रतिनिधि प्रतिदर्श) सामान्यतः समष्टि से छोटा होता है तथा अपेक्षाकृत कम लागत एवं कम समय में समष्टि के बारे में पर्याप्त सही सूचनाएँ प्रदान करने में सक्षम होता है।
मान लें कि आप, किसी क्षेत्र-विशेष के लोगों की औसत आय के बारे में अध्ययन करना चाहते हैं। गणनाविधि के अनुसार, आपको उस क्षेत्र के प्रत्येक व्यक्ति की आय का पता करने के बाद उनका कुल योग करके वहाँ के लोगों की संख्या से भाग देकर वहाँ के लोगों की औसत आय पता करनी होगी। इस विधि के अंतर्गत बहुत खर्च आएगा, क्योंकि इसके लिए भारी संख्या में परिगणकों की भर्ती करनी होती है। इसके विकल्प के रूप में, आप उस क्षेत्र के, कुछ व्यक्तियों का प्रतिदर्श चुन कर उनकी आय को जान लेते हैं। चुने गए समूह के व्यक्तियों की औसत आय ही उस पूरे क्षेत्र के लोगों की औसत आय होती है। उदाहरण के लिए-
• शोध समस्याः मणिपुर राज्य के चूराचाँदपुर जिले के कृषि श्रमिकों की आर्थिक स्थिति का अध्ययन करना।
• समष्टिः चूराचाँदपुर जिले के समस्त कृषि श्रमिक।
• प्रतिदर्श (नमूना)ः चूराचाँदपुर जिले के 10 प्रतिशत कृषि श्रमिक।
अधिकतर सर्वेक्षण प्रतिदर्श सर्वेक्षण ही होते हैं। सांख्यिकी में इन्हें कई कारणों से प्राथमिकता दी जाती है। यह प्रतिदर्श कम खर्च में एवं अल्प समय में पर्याप्त विश्वसनीय एवं सही सूचनाएँ उपलब्ध करा सकते हैं। प्रतिदर्श, चूँकि समष्टि से छोटा होता है, अतः सघन पूछताछ के द्वारा अधिक विस्तृत सूचनाएँ संगृहीत की जा सकती हैं। इसके लिए परिगणकों की छोटी टोली की ही जरूरत होगी, जिन्हें आसानी से प्रशिक्षित किया जा सकता है तथा उनके कार्य की निगरानी भली-भाँति की जा सकती है। अब प्रश्न यह उठता है कि इस प्रतिदर्श का चयन कैसे करें? प्रतिदर्श चयन के दो प्रचलित तरीके हैं, जिन्हें यादृच्छिक एवं अयादृच्छिक प्रतिदर्श कहते हैं। इन दोनों प्रकार के प्रतिदर्शाें के अंतर का विवरण आगे दिया जा रहा है।
क्रियात्मक गतिविधियाँ
• भारत एवं चीन में अगली जनगणना किन-किन वर्षाें में की जाएगी?
• यदि आप XI वीं कक्षा की अर्थशास्त्र की नई पाठ्यपुस्तक के बारे में छात्रों की राय जानना चाहते हैं, तो आप की समष्टि क्या होगी और प्रतिदर्श क्या होगा?
• यदि कोई शोधकर्ता पंजाब में गेहूँ की फसल के औसत उत्पादन का आकलन करना चाहता है, तो उसकी समष्टि और प्रतिदर्श समूह क्या होंगे?
यादृच्छिक प्रतिचयन
जैसा कि नाम से स्पष्ट है, यादृच्छिक प्रतिचयन वह होता है, जहाँ समष्टि प्रतिदर्श-समूह से व्यष्टिगत इकाइयों (प्रतिदर्श) को यादृच्छिक रूप से चुना जाता है। मान लें कि सरकार एक क्षेत्र-विशेष में रहने वाले परिवारों के बजट पर पेट्रोलियम पदार्थाें की कीमतों की वृद्धि के प्रभाव की जाँच करना चाहती है। इसके लिए 30 परिवारों का प्रतिनिधिक (यादृच्छिक) प्रतिदर्श प्राप्त करके उसका अध्ययन करना है। इनके चुनाव के लिए पहले उस क्षेत्र के सभी 300 परिवारों के नाम पर्चियों पर लिखे जाते हैं और फिर उन पर्चियों को पूरी तरह आपस में मिला दिया जाता है। इसके बाद, उसमें से साक्षात्कार के लिए बारी-बारी से 30 नाम पर्चियों द्वारा चुन लिए जाते हैं।
यादृच्छिक प्रतिचयन में प्रत्येक व्यक्ति के चुने जाने की समान संभावना होती है और चुना गया व्यक्ति ठीक वैसा ही होता है, जैसा कि नहीं चुना गया व्यक्ति। उपर्युक्त उदाहरण में 300 प्रतिदर्श इकाइयों (प्रतिचयन रचना) की समष्टि में सभी इकाइयों को, 30 इकाइयों के प्रतिदर्श में, चुने जाने का समान अवसर प्राप्त हुआ। अतः इस तरह से निकाले गए प्रतिदर्श को ही यादृच्छिक प्रतिदर्श कहा जाता है। इस विधि को लाटरी विधि के नाम से भी जाना जाता है। आजकल यादृच्छिक प्रतिदर्शों के चयन के लिए कंप्यूटर प्रोग्राम का उपयोग किया जाता है।
निर्गम निर्वाचन (Exit Poll)
आपने देखा ही होगा कि जब चुनाव होते हैं तो टेलीविजन नेटवर्क चुनाव संबंधी समाचार दिखाते हैं। इसके साथ ही ये लोग इसका पूर्वानुमान भी दिखाते हैं कि कौन सी पार्टी जीत सकती है। इसे निर्गम मतदान (एेग्जिट पोल) के रूप में किया जाता है। इसके अंतर्गत मतदान केंद्रों से मतदान करके निकलने वाले मतदाताओं से यादृच्छिक प्रतिदर्श लेने के लिए पूछा जाता है कि उन्होंने किसे मत दिया है। यहाँ मतदाताओं के प्रतिदर्श द्वारा प्राप्त आँकड़ों से चुनाव जीतने वालों के बारे में पूर्वानुमान लगाया जाता है। आपने देखा होगा कि निर्गम निर्वाचन सदैव सही अनुमान नहीं लगाते हैं। क्यों?
क्रियात्मक गतिविधि
• आपको भारत में खाद्यान्न उत्पादन की पिछले 50 वर्षाें की प्रवृत्ति का विश्लेषण करना है। चूँकि सभी 50 वर्षाें के लिए आँकड़े एकत्रित करना मुश्किल है, अतः आपको 10 वर्षाें के एक प्रतिदर्श का चयन करना है। आप यादृच्छिक संख्या सारणी का प्रयोग करते हुए अपने प्रतिदर्श कैसे चुनेंगे?अयादृच्छिक प्रतिचयन
एेसी स्थिति भी हो सकती है जब आपको किसी क्षेत्र के 100 परिवारों में से 10 को चुनना हो। आपको यह तय करना है कि किन परिवारों को चुनें और किन्हें छोड़ दें। आप एेसे घरों को चुन सकते हैं, जो आपके लिए सुविधा जनक हों या फिर अपने मित्र या परिचित के घर को चुन सकते हैं। इस मामले में, आप 10 परिवारों को चुनने के लिए अपने निर्णय (पूर्वाग्रह) का प्रयोग करते हैं। एेसी स्थिति मेें 100 परिवारों में से आपके द्वारा चुने गए 10 परिवार, अयादृच्छिक प्रतिदर्श द्वारा नहीं चुने गए हैं। अतः किसी अयादृच्छिक प्रतिदर्श में उस समष्टि की सभी इकाइयों के चुने जाने की समान संभावनाएँ नहीं होती हैं और इसमें सर्वेक्षक की सुविधा या निर्णय की भूमिका महत्वपूर्ण हो जाती है। इन्हें चूँकि प्रायः अपने निर्णय, उद्देश्य, सुविधा तथा नियतमात्रा (कोटा) के आधार पर चुना जाता है, अतः इसे अयादृच्छिक प्रतिदर्श के रूप में जाना जाता है।5. प्रतिचयन एवं अप्रतिचयन त्रुटियाँ
प्रतिचयन त्रुटियाँ (Sampling Errors)
संख्यात्मक मानों वाली जनसंख्या की दो महत्वपूर्ण विशेषताएँ होती हैं जो यहाँ सुसंगत हैं। पहली, केंद्रीय प्रवृत्ति, जिसका मापन औसत (मध्यमान), माध्य या बहुलक के द्वारा किया जा सकता है। दूसरी, विचलन, जिसका मापन ‘मानक विचलन’, ‘माध्य विचलन’, परास आदि की गणना द्वारा किया जा सकता है।
प्रतिदर्श का उद्देश्य जनसंख्या प्राचलों के एक या अधिक आकलनों को प्राप्त करना होता है। प्रतिचयन त्रुटि प्रतिदर्श आकलन तथा उसी के जनसंख्या प्राचल (समष्टि विशेष जैसे औसत आय आदि के वास्तविक मूल्य) में अंतर को इंगित करता है।
उदाहरणार्थ-
मणिपुर के 5 कृषकों की आमदनी का उदाहरण लें। मान लें, चर x (कृषकों की आमदनी) के मापन 500, 550, 600, 650, 700 हैं। हमने देखा कि यहाँ समष्टि का औसत (500 + 550 + 600 + 650 + 700) ÷ 5 = 3000 ÷ 5 = 600 है।
अब मान लीजिए हम दो व्यक्तियों का एक एेसा प्रतिदर्श चुनते हैं जहाँ x के मूल्य 500 एवं 600 हैं।
अब प्रतिदर्श का औसत (500+600)÷ 2 = 1100 ÷ 2 = 550 होता है।
यहाँ आकलन की प्रतिचयन त्रुटि है= 600 (असली मान) -550 (आकलन) = 50
अप्रतिचयन त्रुटियाँ (Non sampling Errors)
अप्रतिचयन त्रुटियाँ प्रतिचयन त्रुटियों की अपेक्षा अधिक गंभीर होती हैं। एेसा इसलिए होता है कि प्रतिचयन त्रुटियों को बड़े आकार के प्रतिदर्श लेकर कम किया जा सकता है, पर अयादृच्छिक त्रुटियों को कम करना असंभव है, चाहे प्रतिदर्श का आकार बड़ा ही क्यों न रखा जाए। यहाँ तक कि जनगणना में भी अयादृच्छिक त्रुटि की संभावना हो सकती है। अयादृच्छिक त्रुटियों के कुछ उदाहरण निम्नलिखित हैंः
आँकड़ा अर्जन में त्रुटियाँ
इस प्रकार की त्रुटियाँ गलत उत्तरों को रेकार्ड करने से पैदा होती है। मान लीजिए, एक शिक्षक कक्षा के छात्रों से अध्यापक की मेज की लंबाई को मापने के लिए कहता है। छात्रों द्वारा लिए गए माप में अंतर हो सकते हैं। ये अंतर फीते में अंतर, छात्रों की लापरवाही, आदि के कारण हो सकते हैं। इसी प्रकार, मान लें कि हम संतरों की कीमत के बारे में आँकड़े एकत्र करना चाहते हैं। हम जानते हैं कि अलग-अलग दुकानों में तथा अलग-अलग बाजारों में संतरों की कीमत भिन्न-भिन्न हो सकती है। इसके साथ ही गुणवत्ता के आधार पर भी मूल्यों में अंतर हो सकता है। इसीलिए हम यहाँ पर केवल औसत कीमत को ही लेते हैं। रिकार्ड करने में त्रुटियों की संभावना रहती है, जब सर्वेक्षक या उत्तरदाता गलत आँकड़े रेकार्ड करता है या लिखता है। उदाहरण के लिए 31 को गलती से 13 लिखा जा सकता है।
अनुत्तर संबंधी त्रुटियाँ
अनुत्तर संबंधी त्रुटियों की संभावना तब होती है, जब साक्षात्कारकर्त्ता प्रतिदर्श सूची में सूचीबद्ध उत्तरदाता से संपर्क नहीं स्थापित कर पाता है या प्रतिदर्श सूची का कोई व्यक्ति उत्तर देने से मना कर देता है। एेसे मामलों में प्रतिदर्श प्रेक्षण को प्रतिनिधि प्रतिदर्श नहीं माना जा सकता है।
प्रतिदर्श अभिनति (Sampling Bias)
प्रतिदर्श अभिनति (पूर्वाग्रह) की संभावना तब होती है जब प्रतिचयन योजना एेसी हो कि उसके अंतर्गत समष्टि से कुछ एेसे सदस्यों के सम्मिलित होने की संभावना नहीं है, जिन्हें प्रतिदर्श में शामिल किया जाना चाहिए था।
6. भारत की जनगणना तथा राष्ट्रीय प्रतिदर्श सर्वेक्षण (NSS)
राष्ट्रीय एवं राज्य दोनों ही स्तरों पर एेसी संस्थाएँ होती हैं, जो सांख्यिकीय आँकड़ों को संगृहीत, संसाधित तथा सारणीकृत करती हैं। इनमें से राष्ट्रीय स्तर की कुछ प्रमुख संस्थाएँ हैं, सेन्सस अॉफ इंडिया, राष्ट्रीय प्रतिदर्श सर्वेक्षण (NSS), केंद्रीय सांख्यिकीय कार्यालय (CSO), भारत का महापंजीकार (RGI), वाणिज्यिक सतर्कता एवं सांख्यिकी महानिदेशालय (DGCIS) तथा श्रम ब्यूरो आदि।
केन्द्रीय सांख्यिकी संगठन जनसंख्या संबंधित सर्वाधिक पूर्ण एवं सतत जनसांख्यिकीय अभिलेख उपलब्ध कराती है। वर्ष 1881 के बाद से प्रत्येक 10 वर्ष के अंतराल पर नियमित जनगणना की जाती है। देश की आजादी के बाद पहली जनगणना वर्ष 1951 में हुई थी। इन जनगणनाओं के अंतर्गत जनसंख्या के विभिन्न पहलुओं के बारे में सूचनाएँ एकत्र की जाती हैं, जैसे आकार, घनत्व, लिंग-अनुपात, साक्षरता, स्थानांतरण तथा जनसंख्या का ग्रामीण-शहरी वितरण आदि। जनगणना आँकड़ों का निर्वचन एवं विश्लेषण भारत में अनेक आर्थिक और सामाजिक मुद्दों को समझने के लिए किया जाता है। राष्ट्रीय प्रतिदर्श सर्वेक्षण संगठन की स्थापना भारत सरकार द्वारा समाज-आर्थिक मुद्दों पर राष्ट्रीय स्तर के सर्वेक्षणों के लिए की गई थी। यह संगठन बारी-बारी से निरंतर सर्वेक्षण करता रहता है। इस संगठन के सर्वेक्षणों द्वारा संग्रह किए गए आँकड़े समय-समय पर विभिन्न रिपोर्टाें एवं इसकी त्रैमासिक पत्रिका ‘सर्वेक्षण’ में प्रकाशित किए जाते हैं। ये आँकड़े मूलतः सामाजिक-आर्थिक मुद्दों पर होते हैं। इसके साथ ही राष्ट्रीय प्रतिदर्श सर्वेक्षण संगठन साक्षरता, विद्यालयी नामांकन,
शैक्षिक सेवाओं का समुपयोजन, रोजगार, बेरोजगारी, विनिर्माण एवं सेवा क्षेत्रकों के उद्यमों, रुग्णता, मातृत्व, शिशु-देखभाल और सार्वजनिक वितरण प्रणाली के समुपयोजन आदि पर भी अनुमानित आँकड़े उपलब्ध कराता है। राष्ट्रीय प्रतिदर्श सर्वेक्षण (NSS) का 60वाँ क्रमिक सर्वेक्षण (जनवरी-जून, 2004) अस्वस्थता तथा स्वास्थय सेवाओं पर था। राष्ट्रीय प्रतिदर्श सर्वेक्षण (NSS) का 68वाँ क्रमिक सर्वेक्षण (2011-12) उपभोक्ता व्यय पर था। साथ ही राष्ट्रीय प्रतिदर्श सर्वेक्षण संगठन उद्योगों का वार्षिक सर्वेक्षण, फसल अनुमान सर्वेक्षण आदि
का भी आयोजन करता है। यह उपभोक्ता कीमत सूचकांक से संबंधित संख्याओं के संकलन के लिए ग्रामीण एवं शहरी खुदरा कीमतों का संग्रह आदि भी करता है।
7. सारांश
संख्याओं के रूप में व्यक्त किए गए आर्थिक तथ्य अाँकड़े कहलाते हैं। आँकड़ों के संग्रह का उद्देश्य किसी समस्या और उसके कारणों को समझ कर उसकी व्याख्या एवं विश्लेषण करना है। प्राथमिक आँकड़ों का संग्रह सर्वेक्षण आयोजित करके किया जाता है। सर्वेक्षणों के कई चरण होते हैं, जिन्हें सावधानी पूर्वक नियोजित करने की आवश्यकता होती है। एेसी अनेक संस्थाएँ हैं, जो इन सांख्यिकीय आँकड़ों का संग्रह, संसाधन, सारणीयन, तथा प्रकाशन करती हैं। इनका प्रयोग द्वितीयक आँकड़ों के रूप में किया जा सकता है। आँकड़ों के स्रोत का चुनाव एवं इनके संग्रह की विधा अध्ययन के उद्देश्य पर निर्भर करती है।
पुनरावर्तन
• आँकड़े एेसे साधन हैं, जो सूचनाएँ उपलब्ध कराकर किसी भी समस्या के विषय में ठोस निष्कर्ष पर पहुँचने में सहायता देती हैं।
• प्राथमिक आँकड़े व्यक्ति द्वारा स्वयं एकत्र की गई सूचनाओं पर निर्भर होते हैं।
• सर्वेक्षण वैयक्तिक साक्षात्कारों, डाक द्वारा प्रश्नावलियाँ भेजकर तथा टेलीफोन साक्षात्कार द्वारा किये जा सकते हैं।
• जनगणना के अंतर्गत समष्टि की सभी इकाइयों/व्यष्टियों को सम्मिलित किया जाता है।
• प्रतिदर्श, समष्टि से चयनित किया गया एक छोटा समूह होता है, जिसके द्वारा संबंधित सूचनाएँ प्राप्त की जा सकती हैं।
• यादृच्छिक प्रतिचयन के अंतर्गत प्रत्येक व्यक्ति को सूचना प्रदान करने हेतु चुने जाने के लिए समान अवसर दिया जाता है।
• प्रतिदर्श त्रुटियाँ वास्तविक समष्टि तथा इनके आकलन के बीच अंतर के कारण पैदा होती हैं।
• अप्रतिचयन त्रुटियाँ आँकड़ों के अर्जन के दौरान पैदा हो सकती हैं, जो उत्तर न देने के कारण, या चयन में पूर्वाग्रह के कारण हो सकती हैं।
• राष्ट्रीय स्तर पर ‘भारत की जनगणना’ तथा ‘राष्ट्रीय प्रतिदर्श सर्वेक्षण संगठन’ दो महत्वपूर्ण संस्थाएँ हैं, जो विभिन्न महत्वपूर्ण आर्थिक एवं सामाजिक मुद्दों पर आँकड़ों का संग्रहण, संसाधन तथा सारणीयन करती हैं।
अभ्यास
1. निम्नलिखित प्रश्नों के लिए कम से कम चार उपयुक्त बहु विकल्पी वाक्यों की रचना करेंः
(क) जब आप एक नई पोशाक खरीदें तो इनमें से किसे सबसे महत्वपूर्ण मानते है?
(ख) आप कम्प्यूटर का इस्तेमाल कितनी बार करते हैं?
(ग) निम्नलिखित में से आप किस समाचार पत्र को नियमित रूप से पढ़ते हैं?
(घ) पेट्रोल की कीमत में वृद्धि न्यायोचित है?
(ङ) आपके परिवार की मासिक आमदनी कितनी है?
2. पाँच द्विमार्गी प्रश्नों की रचना करें (हाँ / नहीं के साथ)।
3. सही विकल्प को चिह्नित करेंः
(क) आँकड़ों के अनेक स्रोत होते हैं (सही / गलत)।
(ख) आँकड़ा-संग्रह के लिए टेलीफोन सर्वेक्षण सर्वाधिक उपयुक्त विधि है, विशेष रूप से जहाँ पर जनता निरक्षर हो और दूर-दराज के काफी बड़े क्षेत्रों में फैली हो (सही / गलत)।
(ग) सर्वेक्षक/शोधकर्ता द्वारा संग्रह किए गए आँकड़े द्वितीयक आँकड़े कहलाते हैं (सही / गलत)।
(घ) प्रतिदर्श के अयादृच्छिक चयन में पूर्वाग्रह (अभिनति) की संभावना रहती है (सही / गलत)।
(ङ) अप्रतिचयन त्रुटियों को बड़ा प्रतिदर्श अपनाकर कम किया जा सकता है (सही / गलत)।
4. निम्नलिखित प्रश्नों के बारे में आप क्या सोचते हैं? क्या आपको इन प्रश्नों में कोई समस्या दीख रही है? यदि हाँ, तो कैसे?
(क) आप अपने सबसे नजदीक के बाजार से कितनी दूर रहते है?
(ख) यदि हमारे कूड़े में प्लास्टिक थैलियों की मात्रा 5 प्रतिशत है तो क्या इन्हें निषेधित किया जाना चाहिए?
(ग) क्या आप पेट्रोल की कीमत में वृεंद्ध का विरोध नहीं करेंगे?
(घ) क्या आप रासायनिक उर्वरक के उपयोग के पक्ष में हैं?
(ङ) क्या आप अपने खेतों में उर्वरक इस्तेमाल करते हैं?
(च) आपके खेत में प्रति हेक्टेयर कितनी उपज होती है?
5. आप बच्चों के बीच शाकाहारी आटा नूडल की लोकप्रियता का अनुसंधान करना चाहते हैं। इस उद्देश्य से सूचना-संग्रह करने के लिए एक उपयुक्त प्रश्नावली बनाएंँ?
6. 200 फार्म वाले एक गाँव में फसल उत्पादन के स्वरूप पर एक अध्ययन आयोजित किया गया। इनमें से 50 फार्माें का सर्वेक्षण किया गया, जिनमें से 50 प्रतिशत पर केवल गेहूँ उगाए जाते हैं। समष्टि एवं प्रतिदर्श के आकार क्या हैं?
7. प्रतिदर्श, समष्टि तथा चर के दो-दो उदाहरण दें।
8. इनमें से कौन सी विधि द्वारा बेहतर परिणाम प्राप्त होते हैं, और क्यों?
(क) गणना (जनगणना) (ख) प्रतिदर्श
9. इनमें कौन सी त्रुटि अधिक गंभीर है और क्यों?
(क) प्रतिचयन त्रुटि (ख) अप्रतिचयन त्रुटि
10. मान लीजिए आपकी कक्षा में 10 छात्र है। इनमें से आपको तीन को चुनने हैं, तो इसमें कितने प्रतिदर्श संभव हैं?
11. अपनी कक्षा के 10 छात्रों में से 3 को चुनने के लिए आप लाटरी विधि का उपयोग कैसे करेंगे? चर्चा करें।
12. क्या लाटरी विधि सदैव एक यादृच्छिक प्रतिदर्श देती है? बताएँ।
13. यादृच्छिक संख्या सारणी का उपयोग करते हुए, अपनी कक्षा के 10 छात्रों में से 3 छात्रों के चयन के लिए यादृच्छिक प्रतिदर्श की चयन प्रक्रिया की व्याख्या कीजिए।
14. क्या सर्वेक्षणों की अपेक्षा प्रतिदर्श बेहतर परिणाम देते हैं? अपने उत्तर की कारण सहित व्याख्या करें।