एच बेस साक्षात्कार प्रश्न और उत्तर परिचय
एच बेस एक लोकप्रिय कॉलम उन्मुख, नोएसक्यूएल डेटाबेस प्रबंधन प्रणाली है जो हडूप वितरित फ़ाइल सिस्टम ( एचडीएफएस) के शीर्ष पर चलता है ) के । यह स्पैस डेटा सेट के लिए उपयुक्त है, जो कई बड़े डेटा उपयोग मामलों में आम हैं।
तो आपको अंततः एच बेस में अपना सपनों का काम मिल गया है, लेकिन यह सोच रहा है कि एच बेस साक्षात्कार को कैसे क्रैक करना है और संभवतः एच बेस साक्षात्कार प्रश्न क्या हो सकता है। प्रत्येक एच बेस साक्षात्कार प्रश्न अलग होता है और नौकरी का दायरा भी अलग होता है। इसे ध्यान में रखते हुए हमने आपके साक्षात्कार में सफलता प्राप्त करने में आपकी सहायता के लिए सबसे आम एच बेस साक्षात्कार प्रश्न और उत्तर तैयार किए हैं।
शीर्ष दस सबसे ज्यादा पूछे जाने वाले एच बेस साक्षात्कार प्रश्न और उत्तर यहां दिए गए हैं
1. आपको एच बेस का उपयोग कब करना चाहिए?
उत्तर:
एच बेस सभी उपयोग मामलों के लिए उपयुक्त नहीं है। निम्नलिखित चेक के साथ एक सर्वोत्तम उपयुक्त परिदृश्य की पहचान की जा सकती है –
i.डेटा वॉल्यूम: वितरित वातावरण में डेटा के पेटबाइट्स को संसाधित किया जाना चाहिए।
ii. आवेदन: एच बेस ओएलटीपी (ऑनलाइन लेनदेन प्रसंस्करण) प्रणालियों के लिए उपयुक्त नहीं है, जिसके लिए जटिल बहु-कथन लेनदेन की आवश्यकता होती है। इसमें जटिल एसक्यूएल समर्थन भी नहीं है जो संबंधपरक विश्लेषण के लिए आवश्यक है। यह तब पसंद किया जाता है जब आपके पास बड़ी मात्रा में डेटा हो थोड़ा अलग स्कीमा।
iii.क्लस्टर हार्डवेयर: एचबीएफएस एचडीएफएस के शीर्ष पर चलता है। और एचडीएफएस बड़ी संख्या में नोड्स (न्यूनतम 5) के साथ कुशलता से काम करता है। इसलिए एच बेस केवल अच्छे हार्डवेयर समर्थन के साथ एक अच्छा चयन हो सकता है।
iv.नोट पारंपरिक आरडीबीएमएस:एच बेस किसी भी उपयोग के मामले का समर्थन नहीं कर सकता है जिसके लिए पारंपरिक सुविधाओं की आवश्यकता होती है जैसे कि एकाधिक टेबल, कॉम्प्लेक्स एसक्यूएलएस नेस्टेड या विंडो फ़ंक्शंस इत्यादि।
V. डेटा के लिए त्वरित यादृच्छिक पहुंच: यदि आपको अपने डेटा में यादृच्छिक और रीयल-टाइम पहुंच की आवश्यकता है, तो एच बेस एक है उपयुक्त उम्मीदवार। यह बहु-संरचित डेटा के साथ बड़ी तालिकाओं को संग्रहित करने के लिए भी एकदम सही फिट है।
2. कैसंद्रा और एच बेस के बीच क्या अंतर है?
उत्तर:
एच बेस और कैसंद्रा दोनों ने हडूप पारिस्थितिक तंत्र से बिग डेटा के लिए नोएसक्यूएल डेटाबेस वितरित किया है। दोनों अलग-अलग उपयोग मामलों के लिए बनाया गया है। एच बेस के पास कई प्रकार के मास्टर-गुलाम आर्किटेक्चर हैं जैसे ज़ूकीपर, नामनोड, एचबेस मास्टर (हामास्टर), और डेटा नोड्स इत्यादि। कैसंद्रा सभी नोड्स को मास्टर्स के रूप में मानता है जिसका अर्थ है कि सभी नोड बराबर हैं और सभी कार्यों को निष्पादित करते हैं।एच बेस को पढ़ने के लिए अनुकूलित किया गया है, लिखना केवल मास्टर नोड के साथ हो रहा है और लिखने के बाद पढ़ने के लिए मजबूत स्थिरता है। कैसंड्रा में उत्कृष्ट एकल-पंक्ति पढ़ने का प्रदर्शन होता है यदि अंतिम स्थिरता का चयन किया जाता है।
एच बेस नकारात्मक रूप से माध्यमिक इंडेक्स का समर्थन नहीं करता है, कैसंड्रा कॉलम परिवारों पर द्वितीयक इंडेक्स का समर्थन करता है जहां कॉलम नाम ज्ञात है।
प्रारंभ में, गूगल में एच बेस बनाया गया है और उन्होंने इसे बिगटेबल नाम दिया है। अब भी बिगटेबल और एच बेस के एपीआई संगत हैं। कैसंद्रा का ऑरिजन डायनेमो डीबी के लिए एक पेपर से है जो एडब्ल्यूएस से नोएसक्यूएल डेटाबेस है ।
3. एच बेस के प्रमुख घटक क्या हैं?
उत्तर:
एच बेस ए में तीन महत्वपूर्ण घटक हैं- एचएमस्टर, क्षेत्र सर्वर, और चिड़ियाघर।
i.एच बेस मास्टर – एच बेस टेबल्स क्षेत्रों में विभाजित हैं। स्टार्टअप मास्टर तय करता है कि कौन सा क्षेत्र किस क्षेत्र को असाइन करना है (क्षेत्र सर्वर क्लस्टर में नोड होगा)। यह तालिका मेटाडेटा संचालन को भी बनाता है जैसे स्कीमा बनाना या बदलना । यह घटक विफलता वसूली
ii में भी एक महत्वपूर्ण भूमिका निभाता है । क्षेत्र सर्वर – जैसा ऊपर बताया गया है, यह वह जगह है जहां वास्तविक डेटा लिखना और पढ़ना होता है। ये वास्तविक क्लस्टर नोड्स हैं। इसमें कई तालिकाओं के क्षेत्र होंगे जिन्हें पंक्ति कुंजी शुरू करने और समाप्त करने का निर्णय लिया जाता है। एक सामान्य क्षेत्र सर्वर हजार क्षेत्रों तक सेवा कर सकता है
iii.ज़ू कीपर -ज़ू कीपर एक क्लस्टर समन्वय ढांचा है जो व्यापक रूप से हडूप पारिस्थितिक तंत्र में उपयोग किया जाता है। ज़ू कीपर क्लस्टर में मौजूद सभी सर्वर (मास्टर और क्षेत्र सर्वर) ट्रैक करता है एच मास्टर संपर्क ज़ू कीपर और त्रुटियों के मामले में सूचनाएं उत्पन्न होती हैं।
4. एच बेस ब्लूम फ़िल्टर क्या है?
उत्तर:
एक एच बेस ब्लूम फ़िल्टर यह जांचने के लिए एक कुशल तंत्र है कि एक स्टोर फ़ाइल (जब एच बेस को कुछ लिखा जाता है, तो यह पहली बार इन-मेमोरी स्टोर में लिखा जाता है, एक बार यह मेमस्टोर एक निश्चित आकार तक पहुंच जाता है, तो यह डिस्क में डिस्क हो जाता है स्टोर फ़ाइल) में एक विशिष्ट पंक्ति या पंक्ति-कक्ष सेल होता है। आम तौर पर, यह तय करने का एकमात्र तरीका है कि स्टोर फ़ाइल में पंक्ति कुंजी मौजूद है या नहीं, फ़ाइल की ब्लॉक इंडेक्स में जांच करना है, जिसमें स्टोर फ़ाइल में प्रत्येक ब्लॉक की प्रारंभ पंक्ति-कुंजी है। ब्लूम फ़िल्टर एक इन-मेमोरी डेटा स्ट्रक्चर के रूप में कार्य करता है जो कि डिस्क को कम करने में मदद करता है केवल उस पंक्ति को रखने की संभावना है – सभी स्टोर फाइलें नहीं। तो यह किसी विशेष स्टोर फ़ाइल में पंक्ति खोजने की संभावना को इंगित करने के लिए इन-मेमोरी इंडेक्स की तरह कार्य करता है।
5. कॉम्पैक्शन क्या है? इसके विभिन्न प्रकारों की व्याख्या करें।
उत्तर:
एच बेस सभी प्राप्त परिचालनों को अपने मेमस्टोर मेमोरी एरिया में स्टोर करता है। जब मेमोरी बफर भर जाता है, तो यह डिस्क पर फिसल जाता है। चूंकि यह समय-समय पर एचडीएफएस में कई छोटी फाइलें बना सकता है, एच बेस फाइलों को एक साथ कॉम्पैक्ट करने के लिए चुन सकता है एक बड़े में। एक कॉम्पैक्शन को माइनर कहा जाता है जब एच बेस केवल कुछ एचएफआईल्स को संकलित करने के लिए चुनता है लेकिन सभी नहीं। एक प्रमुख संयोजन में, सभी फाइलें एक साथ संकलित होने के लिए चुने जाते हैं। एक प्रमुख कॉम्पैक्शन एक नाबालिग की तरह काम करता है हटाए गए मार्करों को हटाया जा सकता है जब वे सभी संबंधित कोशिकाओं पर लागू होते हैं और उसी सेल के सभी अतिरिक्त संस्करण भी हटा दिए जाएंगे।
6. एच बेस संस्करण डेटा कैसे?
उत्तर:
जब डेटा का एक टुकड़ा डाला / अपडेट / हटा दिया जाता है तो एच बेस उस कॉलम के लिए एक नया संस्करण बनायेगा। वास्तविक विलोपन केवल संघनन के दौरान हो रहा है। अगर किसी विशेष सेल को कई संस्करणों को पार किया गया है, तो अतिरिक्त संस्करण संघनन के दौरान छोड़े जाएंगे
7. प्राप्त करने और स्कैन के बीच क्या अंतर है?
उत्तर:
दिए गए पंक्ति कुंजी के आधार पर एच बेस तालिका से एकमात्र एकल पंक्ति प्राप्त करें। दिए गए खोज स्थिति के आधार पर स्कैन कमांड पंक्तियों का सेट देता है। आम तौर पर स्कैन से तेज़ हो जाता है। इसलिए यदि संभव हो तो इसका उपयोग करना पसंद करना चाहिए।
8. पंक्ति को हटाने पर क्या होता है?
उत्तर:
हटाने के समय, कमांड डेटा को फाइल सिस्टम से भौतिक रूप से हटाया नहीं जाता है बल्कि मार्कर सेट करके अदृश्य बना दिया जाता है। भौतिक विलोपन एक कॉम्पैक्शन
कॉलम, वर्जन और फैमिली डिलीट मार्कर के दौरान होता है जो तीन अलग-अलग प्रकार के मार्कर होते हैं जो एक को हटाने का निशान देते हैं कॉलम, क्रमशः कॉलम और कॉलम परिवार का संस्करण।
9. एच बेस और हाइव के बीच अंतर का विस्तार करें।
उत्तर: डेटा प्रोसेसिंग के लिए
एच बेस और हाइव दोनों हडूप आधारित प्रौद्योगिकियां पूरी तरह अलग हैं। हाइव एक रिलेशनल-जैसे एसक्यूएल संगत वितरित स्टोरेज फ्रेमवर्क है जबकि एच बेस एक नोएसक्यूएल कुंजी-वैल्यू स्टोर है। हाइव एसक्यूएल समर्थन के साथ हडूप के शीर्ष पर एक अमूर्त परत के रूप में कार्य करता है। एच बेस डेटा एक्सेस पैटर्न दो प्राथमिक संचालन के साथ बहुत सीमित है-प्राप्त करें और स्कैन करें। एच बेस रीयल-टाइम डेटा प्रोसेसिंग के लिए आदर्श है जहां बैच बैच डेटा प्रोसेसिंग के लिए आदर्श विकल्प है।
10. एच लॉग और एच फाइल क्या हैं?
उत्तर:
एच लॉग लिखने वाली अगली लॉग फ़ाइल है, जिसे डब्ल्यूएएल और एच फाइल भी कहा जाता है, वास्तविक डाटा स्टोरेज फाइल है। डेटा को पहले लिखने वाली लॉग फ़ाइल में लिखा गया है और मेमस्टोर में भी लिखा गया है। एक बार मेमस्टोर भरने के बाद, सामग्री की सामग्री मेमस्टोर डिस्क पर एच फाइल में फंस गए हैं।