यथाप्राप्त आंकड़े
यथाप्राप्त आंकड़े, जिसे प्रायः स्रोत या प्राथमिक आंकड़े के रूप में संदर्भित किया जाता है, वह आंकड़े हैं जिसे अभी तक संसाधित, कोडित, स्वरूपित या विश्लेषण नहीं किया गया है। जबकि यथाप्राप्त आंकड़े एक मूल्यवान संसाधन है, इसके साथ काम करना या समझना चुनौतीपूर्ण हो सकता है क्योंकि यह दृष्टिगत रूप से अव्यवस्थित है और इसमें सामंजस्य की कमी हो सकती है। संगठन ग्राहकों, बिक्री, विपणन अभियानों की सफलता और अन्य उपयोगी लक्ष्यों के बारे में अधिक जानने के लिए यथाप्राप्त आंकड़े को एकत्र और उपयोग कर सकते हैं, लेकिन पहले उन्हें आंकड़ों को ऐसे रूप में संरचना और व्यवस्थित करने की आवश्यकता है जो पढ़ने और कल्पना करने में सुविधा हो।
जो उद्यम विश्लेषण, निर्णय लेने या रिपोर्टिंग के लिए सक्रिय रूप से आंकड़ों का उपयोग करते हैं, उन्हें यह समझना चाहिए कि यथाप्राप्त आंकड़े कैसे काम करता है और यह एक बड़ी यथाप्राप्त युक्ति में कैसे सही स्थिति में रखता है।
यथाप्राप्त आंकड़े का उपयोग कैसे किया जाता है?
यथाप्राप्त आंकड़े, एक या एकाधिक स्रोतों से एकत्र किए गए आंकड़े है जो अपनी अपरिवर्तित प्रारंभिक स्थिति में रहता है। इस बिंदु पर, आंकड़े में मानवीय, मशीन या वाद्य त्रुटियाँ हो सकती हैं - संग्रह विधि के आधार पर - या इसमें सत्यापन की कमी हो सकती है। एक बार जब आंकड़े की गुणवत्ता में सुधार के लिए किसी भी तरह से बदलाव किया जाता है, तो आंकड़े संसाधित हो जाते हैं और अब उसे यथाप्राप्त नहीं माना जाता है। एक संसाधन के रूप में यथाप्राप्त आंकड़े में असीमित क्षमता होती है, क्योंकि यह विभिन्न स्रोतों से विभिन्न रूपों में आता है। किसी जनसांख्यिकीय, प्रणाली, अवधारणा या पर्यावरण की अधिक गहन समझ प्राप्त करने की दिशा में यथाप्राप्त आंकड़े एकत्र करना पहला कदम है। बिजनेस इंटेलिजेंस विश्लेषक यथाप्राप्त आंकड़े से अपने व्यवसाय की स्थिति के बारे में उपयोगी और सटीक जानकारी निकाल सकते हैं - उदाहरण के लिए, दर्शकों की रुचि, बिक्री के आंकड़े, विपणन अभियान प्रदर्शन और यथाप्राप्त आंकड़े उत्पादकता।
यथाप्राप्त आंकड़ों का संग्रहण
यथाप्राप्त आंकड़े कैसे एकत्र किया जाता है यह इसकी गुणवत्ता और भविष्य की संभावनाओं में महत्वपूर्ण भूमिका निभाता है। सटीकता, विश्वसनीयता और वैधता का मतलब यथाप्राप्त आंकड़े के आँकड़ासंचय(डेटाबेस) के बीच अंतर हो सकता है जो जानकारी और अंतर्दृष्टि का खजाना है, और अप्राप्य आंकड़े जो बस जगह लेते हैं। निम्नलिखित चरण आंकड़ों के संग्रहण के लिए एक पथ तैयार करते हैं ताकि यह सुनिश्चित हो सके कि यह संगठन की आवश्यकताओं को पूरा करता है।
लक्ष्य परिभाषित करना
उस जानकारी को परिभाषित करें जिसे आप अपने यथाप्राप्त आंकड़े -एकत्रित लक्ष्यों के लिए आधार बनाने के लिए निकालना चाहते हैं। उदाहरण के लिए, यदि वांछित आंकड़े उपयोगकर्ता-आधार और ग्राहक जानकारी है, तो इसे एकत्रित करने के लिए एक विशिष्ट आयु और भौगोलिक जनसांख्यिकीय पर केंद्रित ऑनलाइन और व्यक्तिगत सर्वेक्षण का उपयोग किया जा सकता है।
अन्य प्रकार के यथाप्राप्त आंकड़े के लिए अग्रिम योजना की आवश्यकता हो सकती है। उदाहरण के लिए, लॉग रिकॉर्ड से आंकड़े एकत्र करने के लिए कुछ हफ्तों से लेकर एक साल तक के लिए एक निगरानी प्रणाली की आवश्यकता होगी ताकि आंकड़े एकत्र करने में सक्षम होने से पहले उसे एकत्र किया जा सके।
संग्रहण विधि का चयन
उचित यथाप्राप्त आंकड़े संग्रहण विधि चुनने से मानव या मशीन की त्रुटियों का प्रतिशत कम हो सकता है, जिन्हें आपको यथाप्राप्त डेटाबेस को साफ करते समय साफ़ करना होगा। साधारणतः, इलेक्ट्रॉनिक संग्रहण विधियों के परिणामस्वरूप त्रुटि दर कम होती है - मैन्युअल संग्रहण ऐसे चर प्रस्तुत कर सकता है जो व्याख्या के लिए जगह छोड़ते हैं, जैसे कि ऑडियो या वीडियो रिकॉर्डिंग में अस्पष्ट लिखावट या समझने में कठिन उच्चारण।
आँकड़े एकत्रित करना
यथाप्राप्त आंकड़े साधारणतः मात्रा में बड़ा और अत्यधिक जटिल होता है। संग्रहण प्रक्रिया के दौरान, आंकड़ों की कुल मात्रा मात्र एक अनुमान है - एक बार जब आप आंकड़े को त्रुटियों और अमान्य आंकड़े बिंदुओं से साफ़ करके संसाधित करते हैं, तो आपको दायरे की अधिक सटीक समझ होगी।
5 चरणों में यथाप्राप्त आंकड़ों को कैसे संसाधित किया जाता है
आँकड़े प्रवृत्तियों और पैटर्न में पारंगत विश्लेषक आधुनिक बिजनेस इंटेलिजेंस उपकरणों के साथ काम करते हैं और कभी-कभी, निम्नलिखित चरणों का उपयोग करके यथाप्राप्त आंकड़े को व्यावहारिक ज्ञान में बदलने के लिए कृत्रिम बुद्धिमत्ता (AI) अनुप्रयोगों को उपस्थित करते हैं:
1. आंकड़ों की तैयारी युक्ति
परिभाषा के अनुसार, यथाप्राप्त आंकड़े दोषपूर्ण होते हैं और इसमें त्रुटियाँ हो सकती हैं - इसमें संरचना और प्रारूप में भी स्थिरता की कमी हो सकती है, विशेषतः जब इसे विभिन्न स्रोतों से प्राप्त किया गया हो। आंकड़े तैयार करने के दौरान, उच्च-गुणवत्ता, सुसंगत परिणाम सुनिश्चित करने के लिए पूर्वनिर्धारित मानकों का पालन करते हुए आंकड़ों को पूरी तरह से साफ, क्रमबद्ध और फ़िल्टर किया जाता है।
2. आंकड़ों का निदेश
आंकड़ों का निदेश करना - जिसे कभी-कभी आंकड़ों का अनुवाद भी कहा जाता है - में यथाप्राप्त आंकड़े को मशीन-पठनीय रूप में परिवर्तित करना उपस्थित है। विश्लेषण के लिए उपयोग किए जाने वाले उपकरणों और सॉफ़्टवेयर के आधार पर विशिष्ट प्रक्रिया अलग-अलग होगी।
डिजिटल रूप से एकत्रित आंकड़े के स्थिति में, यह चरण न्यूनतम है—फ़ाइल प्रारूप में कुछ संरचना और परिवर्तन की आवश्यकता हो सकती है। लेकिन हस्तलिखित सर्वेक्षणों, ऑडियो रिकॉर्डिंग और वीडियो क्लिप के लिए, आंकड़े को मैन्युअल रूप से या डिजिटल रूप से ऐसे रूप में निकालने की आवश्यकता होगी जिसे प्रोसेसिंग सॉफ़्टवेयर समझने में सक्षम हो।
3. आंकड़ों का संसाधन और विश्लेषण
यथाप्राप्त आंकड़े को विभिन्न तत्वों के बीच रुझानों, पैटर्न, विसंगतियों और संबंधों की खोज करके अंतर्दृष्टि के लिए संसाधित और विश्लेषित किया जाता है। यह प्रक्रिया स्रोत के आधार पर भिन्न होती है, और इसे मैन्युअल रूप से या कृत्रिम बुद्धिमत्ता और मशीन लर्निंग का उपयोग करके किया जा सकता है।
4. आंकड़ों का निर्गम
एक बार जब यथाप्राप्त आंकड़े पूरी तरह से उपयोगी और व्यावहारिक डेटा में बदल जाते हैं, तो इसे मानव-अनुकूल रूप में अनुवादित किया जाता है - उदाहरण के लिए आरेख, ग्राफ़, टेबल, वेक्टर फ़ाइलें या सादा पाठ। यह चरण आंकड़े को प्रयोग करने योग्य और कार्रवाई योग्य बनाता है।
5. आंकड़ों का भंडारण
Data storage is essential, as the processed data may be subjected to future analysis for additional insights—but it becomes even more critical when dealing with sensitive corporate information or user data. Storage quality should be consistent with the overall standards of the company’s data and information, while also complying with any local data privacy and security legislation, such as the European Union’s General Data Protection Regulation (GDPR) and the California Consumer Protection Act (CCPA).
दो प्रकार के यथाप्राप्त आंकड़े और उनके उदाहरण
Raw data includes a wide range of data types, which are typically classified as either qualitative or quantitative. The most important condition for this categorization is that the data is not cleaned or processed in any way. Raw data allows unrivaled flexibility and control over the information collected from the database.
मात्रात्मक यथाप्राप्त आंकड़े
Quantitative data is raw data that consists of countable data, where each data point has a unique numerical value. This type of data is best used for mathematical calculations and technical statistical analysis. Here are some common examples:
| Customer information | Enables targeted results and demographic insights when combined with other data. |
| Sales records | Quantifiable data on number and frequency of goods and services sales. Identifies popular products and optimal sales times. Combined with customer info, provides insights into customer demographics and preferences. |
| Employee performance | Quantifiable data on working hours, productivity, quality, and compensation. Collected through surveys or internal monitoring software. Assists in calculating staff return on investment. |
| Revenue and expenses | Strictly quantitative data tracking financial activity, including revenue and expenses. Used to calculate net revenue and analyze return on investment in different areas of the company. |
गुणात्मक यथाप्राप्त आंकड़े
Qualitative data can be recorded and observed in a non-quantifiable and non-numerical nature. It rarely includes numbers and is usually extracted from answers that vary for each participant through audio and video recordings or one-on-one interviews. Here are some common examples:
| Open-ended response on a survey | Open-ended survey questions with unstructured responses provide real insights into respondents’ ideas and opinions. It cannot be easily aggregated like quantitative data, but it does give a true viewpoint. |
| Photographs and videos | Categorizing photos and videos is complex due to overlap, but raw data is crucial for training machine learning models in computer vision, especially for surveillance and visual scenario analysis. |
| Customer Reviews | Star ratings are quantitative, while reviews are qualitative, assessing responses on a positive to negative scale, and highlighting customer suggestions and pain points. |
| News reports and public opinion | The data from news reports and articles about your company provides valuable insights into public opinion but requires processing to distinguish positive and negative coverage. |