एबी इनिटियो साक्षात्कार प्रश्न और उत्तर
नीचे शीर्ष एबी इनिटियो साक्षात्कार प्रश्न हैं जिन्हें अक्सर एक साक्षात्कार में पूछा जाता है
1. एबी इनिटियो में उपलब्ध घटकों या कार्यों क्या हैं?
उत्तर:
एबी इनिटियो में मुख्य घटक नीचे हैं,
अंग | उद्देश्य |
डिडप | डुप्लिकेट को हटाने के लिए |
शामिल हों | एक सामान्य कुंजी मान के आधार पर एकाधिक इनपुट डेटासेट में शामिल होने के लिए। |
तरह | यह घटक डेटा की प्रतिबिंबित करता है। यह कॉलेशन ऑर्डर लेता है और डेटा को स्मृति में डंप करता है |
फ़िल्टर | डेटा के किसी भी सशर्त से संबंधित हटाने। |
दोहराने | यह घटक मुख्य रूप से समांतरता के लिए है क्योंकि डेटा की एक अतिरिक्त प्रति उपयोगी है जबकि कोई अन्य नोड अनुपलब्ध है। |
विलय | यह घटक एकाधिक इनपुट डेटा को गठबंधन करना है। |
2. समांतर प्रसंस्करण के प्रकार क्या हैं?
उत्तर:
समानांतर प्रसंस्करण के विभिन्न प्रकार हैं,
- घटक समांतरता
- डेटा समांतरता
- पाइपलाइन समांतरता
घटक समांतरता: एक ऐसा अनुप्रयोग जिसमें कई घटक सिस्टम पर एक साथ चल रहे हैं। लेकिन डेटा अलग हैं। यह घटक स्तर समानांतर प्रसंस्करण के माध्यम से हासिल किया जाता है।
डेटा समांतरता: डेटा को सेगमेंट में विभाजित किया जाता है और एक साथ संचालन चलाता है। इस तरह की प्रक्रिया डेटा समांतरता का उपयोग करके हासिल की जाती है
पाइपलाइन समांतरता: एक से अधिक घटकों के साथ एक आवेदन लेकिन एक ही डेटासेट पर चल रहा है। यह पाइपलाइन समांतरता का उपयोग करता है।
3. विभाजन प्राप्त करने का अलग तरीका क्या है?
उत्तर:
विभाजन करने के कई तरीके हैं।
विभाजन | विवरण |
अभिव्यक्ति | डेटा मैनिपुलेशन भाषा के अनुसार डेटा विभाजित। |
कुंजी | विशिष्ट कुंजी द्वारा डेटा को समूहीकृत करना |
भार संतुलन | गतिशील लोड संतुलन |
प्रतिशत | उस डेटा को अलग करें जहां आउटपुट आकार 100 के अंशों पर है |
रेंज | डेटा को समान रूप से एक कुंजी और नोड्स के बीच एक सीमा के आधार पर विभाजित करें |
राउंड रोबिन | आउटपुट विभाजनों में ब्लॉक करने में डेटा को समान रूप से वितरित करना। |
4. एक बहुआयामी प्रणाली क्या है?
उत्तर:
मल्टीफ़ाइल क्लस्टर में विभिन्न नोड्स पर निर्देशिकाओं का एक सेट है। उनके पास समान निर्देशिका संरचना है। मल्टीफाइल सिस्टम बेहतर प्रदर्शन की ओर जाता है क्योंकि यह समांतर प्रसंस्करण है जहां डेटा एकाधिक डिस्क पर रहता है।
यह प्रदर्शन को बेहतर बनाने के लिए प्रसंस्करण वितरित करने के लिए अन्य नोड्स पर एक नोड और डेटा विभाजन पर नियंत्रण विभाजन के साथ बनाया गया है।
5. हडूप और एबी इनिटियो के बीच अंतर?
उत्तर:
हडूप | ए कोल्ड स्वेट हॉट – हेयडेड बिलिवर |
खुला स्त्रोत | मालिकाना सॉफ्टवेयर |
मैपर और reducers के माध्यम से समानांतर प्रसंस्करण | समांतर प्रसंस्करण वास्तुकला |
किसी भी प्रकार का डेटा यहां सबसे उपयुक्त है | पारंपरिक ईडीडब्ल्यू कार्यान्वयन के लिए सर्वश्रेष्ठ |
गलती सहनशीलता हासिल की जाती है | गलती सहनशीलता हासिल नहीं की जाती है |
मॅपरेड्यूज़ किसी भी घटकों या कार्यों पर नियंत्रित है | शामिल हों, समूह, सॉर्ट जैसे घटक आसानी से हैंप्रदर्शन किया |
अपने ओपन सोर्स के रूप में सस्ता है और किसी भी व्यावसायिक उपयोग के मामलों को आजमा सकते हैं। | महंगी और लागत के कारण उच्च मूल्य व्यापार मामले पर लागू |
ढीले युग्मित घटक जहां कस्टम फ़ंक्शंस बनाए जाते हैं | घटकों के बीच कसकर जोड़ा गया क्योंकि व्यापार उपयोग के मामले के आधार पर उनकी अत्यधिक अनुशंसा की जाती है। |
6. एबी इनिटियो किस प्रकार के लेआउट का समर्थन करता है?
उत्तर:
- सीरियल और समांतर लेआउट का समर्थन करता है।
- एक ग्राफ लेआउट एक समय में धारावाहिक और समांतर लेआउट दोनों का समर्थन करता है।
- एक बहु-फ़ाइल प्रणाली एक 4-तरफा समांतर प्रणाली है
- ग्राफ़ सिस्टम में एक घटक 4-तरफा समांतर प्रणाली चला सकता है।
7. एंटरप्राइज़ मेटाडेटा पर्यावरण (ईएमई), ग्राफिकल डेवलपमेंट एनवायरनमेंट (जीडीई) और सह-ऑपरेटिंग सिस्टम के बीच संबंध क्या है?
उत्तर:
सह ऑपरेटिंग सिस्टम: यह ऑपरेटिंग सिस्टम के शीर्ष पर काम करता है और यह एबी इनिटियो द्वारा प्रदान किया जाता है और यह सभी एबी इनिटियो प्रक्रियाओं के लिए आधार है। वायु आदेश उन सुविधाओं में से एक हैं जिन्हें यूनिक्स , लिनक्स , आईबीएम इत्यादि जैसे विभिन्न ऑपरेटिंग सिस्टम पर स्थापित किया जा सकता है
ये निम्नलिखित विशेषताएं हैं जो यह प्रदान करती हैं,
– एबी इनिटियो ग्राफ का प्रबंधन और रन करती हैं और ईटीएल प्रक्रियाओं को नियंत्रित करती हैं
– एक्सटेंशन प्रदान करना
– ईटीएल प्रक्रियाओं की निगरानी और डिबगिंग
– मेटाडेटा प्रबंधन और ईएमई के साथ बातचीत
जीडीई: यह एक डिजाइनिंग घटक है और एबी इनिटियो ग्राफ चलाने के लिए उपयोग किया जाता है।
ग्राफ घटक (पूर्व परिभाषित या उपयोगकर्ता परिभाषित) और प्रवाह और पैरामीटर द्वारा गठित होते हैं। यह एबी इनिटियो में ईटीएल प्रक्रिया प्रदान करता है जिसे ग्राफ द्वारा दर्शाया जाता है।
चलाने की क्षमता, प्रक्रिया लॉग नौकरियों को डीबग करें और निष्पादन लॉग का पता लगाएं
एंटरप्राइज़ मेटा-एनवायरनमेंट (ईएमई): यह भंडारण और मेटाडेटा प्रबंधन (व्यवसाय और तकनीकी मेटाडाटा दोनों) के लिए एक पर्यावरण है। मेटाडेटा को ग्राफिकल विकास पर्यावरण और वेब ब्राउज़र या सहकारी कमांड लाइन से भी एक्सेस किया जाता है। यह किसी भी प्लेसहोल्डर के लिए एबी इनिटियो भंडार है।
8. डेटा कैसे संसाधित किया जाता है और इस दृष्टिकोण के मूलभूत सिद्धांत क्या हैं?
उत्तर:
ऐसी कुछ गतिविधियां हैं जिनके लिए डेटा के संग्रह की आवश्यकता होती है और सबसे अच्छी चीज प्रसंस्करण की प्रक्रिया काफी हद तक निर्भर करती है। डेटा को प्रोसेस करने से पहले इसे किसी प्लेसहोल्डर पर एक अच्छी तरह से परिभाषित स्टोरेज की तरह रहना होगा। यह कार्य कुछ प्रमुख कारकों पर निर्भर करता है
1. डेटा का संग्रह
2. प्रस्तुति
3. अंतिम परिणाम
4.विश्लेषण
5. सोर्सिंग
9. कुंजी और राउंड रॉबिन के साथ विभाजन के बीच क्या अंतर है?
उत्तर :
कुंजी द्वारा विभाजन
इस में, हमें उस कुंजी को निर्दिष्ट करना होगा जिस पर विभाजन होगा। यह कुंजी आधारित विभाजन के कारण अच्छी तरह से संतुलित डेटा में परिणाम देता है। यह मुख्य निर्भर
समानांतरता के लिए उपयोगी है ।
राउंड रॉबिन द्वारा विभाजन: इसमें, ब्लॉक आकार के हिस्सों में समान रूप से डेटा वितरित करना रिकॉर्ड आउटपुट विभाजन में अनुक्रमिक तरीके से विभाजित होते हैं। यह कुंजी
आधारित नहीं है और परिणाम अच्छी तरह से संतुलित डेटा हैं, विशेष रूप से 1 के ब्लॉक आकार के साथ। यह
रिकार्ड स्वतंत्र समांतरता के लिए उपयोगी है ।
10. आप ग्राफ के प्रदर्शन में सुधार कैसे करते हैं?
उत्तर :
ग्राफ के प्रदर्शन में कई तरीकों से सुधार किया जा सकता है।
1) कुछ चरणों पर एकाधिक घटकों के उपयोग को कम करें।
2) क्रमबद्ध करने के लिए अधिकतम कोर मानों के एक परिष्कृत और अच्छी तरह से परिभाषित मान का उपयोग करें और घटकों में शामिल हों
3) स्थानांतरण कार्यों में रे_सूची जैसे नियमित अभिव्यक्ति कार्यों के उपयोग को
कम करें 4) सॉर्ट किए गए घटक को छोटा करें और यदि संभव हो तो इन-मेमोरी में शामिल हों / हैश
5 में शामिल हों ) क्रमशः केवल आवश्यक फ़ील्ड का उपयोग करें, सुधार करें, घटकों में शामिल हों
6) विलय या सॉर्ट किए गए मामलों के दौरान चरण या प्रवाह बफरिंग का उपयोग करना
7) इनपुट के दो सेट छोटे से बेहतर चुनने के लिए हैश का उपयोग करें विशाल इनपुट आकार के लिए सॉर्ट किया गया
8) बड़े डेटासेट के लिए विभाजन के रूप में प्रसारण का बेहतर उपयोग नहीं करते
9) प्रसंस्करण के दौरान सॉर्ट घटकों की संख्या कम करें।
10) अनावश्यक रूप से डेटा की पुनरावृत्ति से बचें
अनुशंसित आलेख
यह एबी इनिटियो साक्षात्कार प्रश्न और उत्तर की सूची के लिए एक मार्गदर्शक रहा है ताकि उम्मीदवार इन एबी इनिटियो साक्षात्कार प्रश्न को आसानी से क्रैकडाउन कर सकें। यहां इस पोस्ट में, हमने शीर्ष एबी इनिटियो साक्षात्कार प्रश्न के बारे में अध्ययन किया है जिन्हें अक्सर साक्षात्कार में पूछा जाता है। आप और जानने के लिए निम्नलिखित लेख भी देख सकते हैं –
- एंड्रॉइड साक्षात्कार प्रश्न – शीर्ष 10 उपयोगी प्रश्न
- सांख्यिकी साक्षात्कार प्रश्न | उपयोगी और सबसे ज्यादा पूछे जाने वाले
- मिनीटाब साक्षात्कार प्रश्न – सीखने के लिए शीर्ष 7 उपयोगी प्रश्न
- स्प्लंक साक्षात्कार प्रश्न और उत्तर आपको पता होना चाहिए