मॅप रेड्यूज़ साक्षात्कार प्रश्न और उत्तर के लिए परिचय
यदि आप मॅप रेड्यूज़ से संबंधित नौकरी की तलाश में हैं, तो आपको मॅप रेड्यूज़ साक्षात्कार प्रश्न के लिए तैयार करने की आवश्यकता है। हालांकि प्रत्येक मॅप रेड्यूज़ साक्षात्कार प्रश्न अलग है और नौकरी का दायरा भी अलग है, हम जवाब के साथ शीर्ष मॅप रेड्यूज़ साक्षात्कार प्रश्न के साथ आपकी मदद कर सकते हैं, जो आपको छलांग लगाने में मदद करेगा और आपको अपने साक्षात्कार में सफलता प्राप्त करेगा।
नीचे शीर्ष मॅप रेड्यूज़ साक्षात्कार प्रश्न की सूची दी गई है जिन्हें अक्सर एक साक्षात्कार में पूछा जाता है
1. मॅप रेड्यूज़ क्या है?
उत्तर:
मॅप रेड्यूज़ स्केलेबिलिटी और गलती सहनशीलता के लिए डिज़ाइन किया गया एक साधारण समांतर डेटा प्रोग्रामिंग मॉडल है। दूसरे शब्दों में, यह एक ढांचा है जो नोड्स (कंप्यूटर की संख्या) की अवधारणा का उपयोग करके बड़े डेटा सेट में समांतर समस्याओं को संसाधित करता है, जो बदले में क्लस्टर के रूप में वर्गीकृत होते हैं यदि यह स्थानीय नेटवर्क है और यदि वे हैं तो हार्डवेयर या ग्रिड का उपयोग करते हैं भौगोलिक रूप से वितरित और विभिन्न हार्डवेयर का उपयोग करें। मॅप रेड्यूज़ अनिवार्य रूप से एक मानचित्र () फ़ंक्शन और एक घटा () फ़ंक्शन शामिल है। यह गूगल द्वारा अग्रणी था और हर दिन डेटा के कई पेटबाइट्स को संसाधित करता है। इसे ओपन-सोर्स हडोप प्रोजेक्ट द्वारा लोकप्रिय बनाया गया था और इसका इस्तेमाल याहू, फेसबुक और अमेज़ॅन में कुछ नामों के लिए किया जाता है ।
2. कंपनी द्वारा उपयोग किए जाने वाले मॅप रेड्यूज़ क्या है?
उत्तर:
गूगल
• गूगल खोज के लिए इंडेक्स
का निर्माण एक स्थितित्मक या गैर-स्थिति सूचकांक बनाने की प्रक्रिया को इंडेक्स निर्माण या अनुक्रमण कहा जाता है। मॅप रेड्यूज़ की भूमिका इंडेक्स निर्माण है और बड़े कंप्यूटर क्लस्टर के लिए डिज़ाइन की गई है। क्लस्टर का उद्देश्य नोड्स या कंप्यूटर के लिए कम्प्यूटेशनल समस्याओं को हल करना है जो सुपरकंप्यूटर के बजाय मानक भागों के साथ बनाए जाते हैं।
• आलेख क्लस्टरिंग के लिए गूगल समाचार के
लिए अनुच्छेद क्लस्टरिंग, पृष्ठों को पहले वर्गीकृत किया जाता है कि क्या उन्हें क्लस्टरिंग के लिए आवश्यक है या नहीं। पन्ने में बहुत सारी जानकारी शामिल है जो क्लस्टरिंग के लिए आवश्यक नहीं है। फिर लेख को कीवर्ड और वेटेज के आधार पर अपने वेक्टर फॉर्म में लाया जाता है। फिर वे एल्गोरिदम का उपयोग कर क्लस्टर कर रहे हैं।
• सांख्यिकीय मशीन अनुवाद
विश्लेषण द्वारा द्विभाषी पाठ निगम का अनुवाद सांख्यिकीय मॉडल उत्पन्न करता है जो वजन का उपयोग करके एक भाषा को दूसरे भाषा में अनुवादित करते हैं और सबसे अधिक संभावित अनुवाद में कम हो जाते हैं।
याहू
• “वेब मानचित्र” याहू को सशक्त बनाना!
गूगल समाचार के लिए आलेख क्लस्टरिंग की तरह खोजें , मॅप रेड्यूज़ का उपयोग याहू पर क्लस्टरिंग खोज आउटपुट के लिए किया जाता है! मंच।
• याहू के लिए स्पैम डिटेक्शन! मेल
फेसबुक
• डेटा माइनिंग
डेटा विस्फोट की हालिया प्रवृत्ति के परिणामस्वरूप डेटा को खंडों में विभाजित करने के लिए परिष्कृत तरीकों की आवश्यकता हुई है जिसका विश्लेषण करने के अगले चरण के लिए आसानी से उपयोग किया जा सकता है।
• डी अनुकूलन
• स्पैम डिटेक्शन
3. मॅप रेड्यूज़ डिजाइन लक्ष्य क्या हैं
उत्तर:
• बड़े डेटा वॉल्यूम के लिए स्केलेबिलिटी
चूंकि मॅप रेड्यूज़ एक ढांचा है जिसका उद्देश्य नोड्स की अवधारणा का उपयोग करके समानांतर डेटा के साथ काम करना है, जो क्लस्टर या ग्रिड के रूप में कंप्यूटर की संख्या है, यह कंप्यूटर मशीनों की संख्या के लिए स्केलेबल है। तो मॅप रेड्यूज़ का एक प्रमुख डिजाइन लक्ष्य यह है कि यह 1000 मशीनों और 10,000 डिस्क के लिए स्केलेबल है।
• लागत–क्षमता
मॅप रेड्यूज़ नोड्स या कंप्यूटरों की संख्या पर समांतर डेटा के साथ काम करती है, निम्नलिखित कारण हैं जो इसे लागत प्रभावी बनाते हैं:
-एक सुपरकंप्यूटर की बजाय कमोडिटी मशीनों की जांच करें। हालांकि सस्ते वे अविश्वसनीय हैं।
– आवास नेटवर्क
– स्वचालित गलती-सहिष्णुता यानी कम प्रशासकों की आवश्यकता होती है।
इसका उपयोग करना आसान है यानी इसे कम प्रोग्रामर की आवश्यकता है।
4. मॅप रेड्यूज़ की चुनौतियों क्या हैं?
उत्तर:
मॅप रेड्यूज़ की मुख्य चुनौतियां निम्नानुसार हैं:
-चिप नोड विफल हो जाते हैं, खासकर यदि आपके पास कई हैं तो
1 नोड के लिए असफलताओं के बीच औसत समय 3 साल के बराबर है। 1000 नोड्स के लिए असफलताओं के बीच औसत समय 1 दिन के बराबर है। समाधान प्रणाली में गलती सहनशीलता का निर्माण करना है।
– कमोडिटी नेटवर्क कम बैंडविड्थ के बराबर या तात्पर्य है कम बैंडविड्थ
का समाधान डेटा पर गणना को धक्का देना है।
-प्रोग्रामिंग वितरित सिस्टम कठिन हैं
इसका समाधान यह है कि डेटा-समांतर प्रोग्रामिंग मॉडल के अनुसार, उपयोगकर्ता “मानचित्र” और “कम करें” फ़ंक्शन लिखते हैं। प्रणाली काम को वितरित करती है और दोषों को संभालती है।
5. मॅप रेड्यूज़ प्रोग्रामिंग मॉडल क्या है?
उत्तर:
मॅप रेड्यूज़ प्रोग्रामिंग मॉडल कुंजी-मान रिकॉर्ड नामक अवधारणा पर आधारित है। यह समांतर डेटा प्रोसेसिंग के लिए प्रतिमान भी प्रदान करता है। मॅप रेड्यूज़ में डेटा को प्रोसेस करने के लिए, इनपुट डेटा और आउटपुट दोनों को एकाधिक कुंजी-मूल्य जोड़े के प्रारूप में मैप किया जाना चाहिए। एकल कुंजी-मूल्य जोड़ी को रिकॉर्ड के रूप में भी जाना जाता है। मॅप रेड्यूज़ प्रोग्रामिंग मॉडल में एक मानचित्र () फ़ंक्शन और एक कम कार्य होता है। इनके लिए मॉडल निम्नानुसार है।
मानचित्र () फ़ंक्शन: (के इन, वी इन) àlist (के इंटर, वी इंटर)
कम करें () फ़ंक्शन: (के इंटर, सूची (वी इंटर)) àlist (के आउट, वी आउट)
6. मॅप रेड्यूज़ निष्पादन विवरण क्या हैं?
उत्तर:
मॅप रेड्यूज़ निष्पादन के मामले में, एक एकल मास्टर एकाधिक दासों पर नौकरी निष्पादन को नियंत्रित करता है। मैपर्स को उसी इनपुट नोड या उसी रैक पर उनके इनपुट ब्लॉक के रूप में रखा जाना पसंद किया जाता है ताकि यह नेटवर्क उपयोग को कम कर सके। साथ ही, मैपर्स रेड्यूसर को सेवा देने से पहले स्थानीय डिस्क पर आउटपुट को सहेजते हैं। यह वसूली की अनुमति देता है अगर एक रेड्यूज़ दुर्घटनाग्रस्त हो जाता है और नोड्स की तुलना में अधिक रेड्यूज़ की अनुमति देता है।
7. एक कॉंबाइनर क्या है?
उत्तर:
संयोजक जिसे सेमी-रेड्यूसर भी कहा जाता है, मैप क्लास से इनपुट स्वीकार करके और आउटपुट कुंजी-वैल्यू जोड़े को रेड्यूसर क्लास में पास करके संचालित होता है। एक संयोजक का मुख्य कार्य उसी कुंजी के साथ मानचित्र आउटपुट रिकॉर्ड को सारांशित करना है। दूसरे शब्दों में, एक कॉंबाइनर एक ही मानचित्र द्वारा उत्पादित दोहराई कुंजी के लिए एक स्थानीय एकत्रीकरण समारोह है। यह एसयूएम, गणना, और अधिकतम जैसे सहयोगी कार्यों के लिए काम करता है। यह मध्यवर्ती डेटा के आकार को कम करता है क्योंकि यह सभी दोहराव वाली कुंजी के लिए मानों के एकत्रीकरण का सारांश है।
8. क्यों पिग? मॅप रेड्यूज़ क्यों नहीं?
उत्तर:
• मॅप रेड्यूज़ प्रोग्रामर को एक कम फ़ंक्शन के बाद एक नक्शा फ़ंक्शन करने की अनुमति देता है, लेकिन इस पैटर्न में आपके डेटा प्रोसेसिंग को फिट करने के तरीके पर काम करने के लिए, जिसे अक्सर कई मैपराइडस चरणों की आवश्यकता होती है, एक चुनौती हो सकती है।
• पिग के साथ , डेटा संरचनाएं अधिक समृद्ध होती हैं, क्योंकि वे बहुविकल्पीय और घोंसले होते हैं, और डेटा पर लागू होने वाले परिवर्तनों का सेट अधिक शक्तिशाली होता है। उदाहरण के लिए, वे उन जोड़ों को शामिल करते हैं जो मॅप रेड्यूज़ में संभव नहीं हैं।
• इसके अलावा, पिग एक कार्यक्रम है जो रूपांतरण को मॅप रेड्यूज़ जॉब्स की एक श्रृंखला में बदल देता है।
9.मॅप रेड्यूज़ आलोचना
उत्तर:
मॅप रेड्यूज़ की एक प्रमुख आलोचना यह है कि विकास चक्र बहुत लंबा है। मैपर्स और रेड्यूकर्स लिखना, कोड संकलित करना और पैकेज करना, नौकरी जमा करना और परिणामों को पुनर्प्राप्त करना समय लेने वाला है। स्ट्रीमिंग के साथ भी, जो संकलन और पैकेज चरण को हटा देता है, अनुभव अभी भी काफी समय ले रहा है।
अनुशंसित आलेख
यह मॅप रेड्यूज़ साक्षात्कार प्रश्न और उत्तर की सूची के लिए एक गाइड रहा है ताकि उम्मीदवार इन मॅप रेड्यूज़ साक्षात्कार प्रश्न को आसानी से क्रैकडाउन कर सकें। आप और जानने के लिए निम्नलिखित लेख भी देख सकते हैं –
- महत्वपूर्ण डेटा एनालिटिक्स साक्षात्कार प्रश्न
- 10 सर्वश्रेष्ठ डिजाइन पैटर्न साक्षात्कार प्रश्न और उत्तर
- 5 सबसे महत्वपूर्ण एलास्टिक सर्च साक्षात्कार प्रश्न
- सबसे उपयोगी रूबी साक्षात्कार प्रश्न और उत्तर