मैपरेड्यूज़ और यार्न के बीच अंतर
यार्न एक और संसाधन वार्ताकार के लिए खड़ा है, संसाधनों (मेमोरी और सीपीयू) का प्रबंधन करने के लिए यह नया ढांचा है। यह हमें किसी भी तरह के वितरित आवेदन को विकसित करने में मदद करता है, यह हमें आवश्यक डिमन्स और एपीआई प्रदान करता है। यार्न की एक और महत्वपूर्ण विशेषता यह है कि यह एप्लिकेशन से संसाधन अनुरोध को संभालती है और शेड्यूल करती है और अनुरोध को निष्पादित करने में प्रक्रिया की सहायता करती है। यार्न किसी भी वितरित एप्लिकेशन को चलाने के लिए एक सामान्य मंच है, मैपरेड्यूज़ संस्करण 2 वितरित अनुप्रयोग है जो यार्न के शीर्ष पर चलता है, जबकि मैपरेड्यूज़ होडोप घटक की प्रोसेसिंग इकाई है, यह वितरित वातावरण में समानांतर डेटा को संसाधित करता है। इसलिए मूल रूप से विशाल डेटा घटक पर मैपरेड्यूज़ करें, यह एचडीएफएस में डेटा और स्टोर को इस तरह से संसाधित करता है कि परंपरागत भंडारण से पुनर्प्राप्ति आसान हो।
मैपरेड्यूज़ बनाम यार्न (इन्फोग्राफिक्स) के बीच हेड टू हेड तुलना
मैपरेड्यूज़ बनाम यार्न के बीच शीर्ष 10 तुलना नीचे है
मैपरेड्यूज़ बनाम यार्न के बीच महत्वपूर्ण अंतर
- में हडूप1 यह दो घटक पहले एक है एचडीएफएस (हडूप वितरित फ़ाइल सिस्टम) और दूसरे मैपरेड्यूज़ है। जबकि हडूप 2 में इसके दो घटक एचडीएफएस और यार्न / एमआरवी 2 भी हैं (हम आमतौर पर यार्न को वर्जन 2 के रूप में मैपरेड्यूज़ कहते हैं)।
- मैपरेड्यूज़, जब मैपरेड्यूज़ हो जाती है तो स्वचालित रूप से उसके सभी दास नोड काम करना बंद कर देंगे यह एक परिदृश्य है जहां नौकरी निष्पादन बाधित हो सकता है और इसे विफलता का एक बिंदु कहा जाता है।यार्न अपने वास्तुकला के कारण इस मुद्दे पर विजय प्राप्त करता है, यार्न में सक्रिय नाम नोड के साथ-साथ स्टैंडबाय नाम नोड की अवधारणा भी है। जब सक्रिय नोड कुछ समय के लिए काम करना बंद कर देता है निष्क्रिय नोड सक्रिय नोड के रूप में काम करना शुरू कर देता है और निष्पादन जारी रखता है।
- मैपरेड्यूज़ करने के लिए एक मास्टर और कई गुलामवास्तुकला है , यदि मास्टर-गुलाम नीचे चला जाता है तो पूरा दास काम करना बंद कर देगा, यह हैडूपी 1 में विफलता का एकमात्र बिंदु है, जबकि हैडूपी 2 जो यार्न वास्तुकला पर आधारित है, इसमें कई मास्टर और गुलाम की अवधारणा है, यदि एक मास्टर नीचे चला जाता है तो दूसरा मास्टर अपनी प्रक्रिया फिर से शुरू कर देगा और निष्पादन जारी रखेगा।
- जैसा कि हम नीचे आरेख में देख सकते हैं, पारिस्थितिक तंत्र हडूप1 और हडूप2 दोनों में अंतर।घटक के अनुसार यार्न संसाधन प्रबंधन मैपरेड्यूज़ और एचडीएफएस के साथ बातचीत करता है।
तो मूल रूप से यार्न संसाधन संसाधन प्रबंधन के लिए ज़िम्मेदार है जिसका अर्थ है कि कौन सी नौकरी यार्न द्वारा तय की जाएगी, जबकि मैपरेड्यूज़ करना प्रोग्रामिंग ढांचा है जो किसी विशेष नौकरी को निष्पादित करने के लिए ज़िम्मेदार है, इसलिए मूल रूप से मैपरेड्यूज़ में दो घटक मैपर और रेड्यूसर होते हैं एक कार्यक्रम के निष्पादन के लिए।
- मैपरेड्यूज़ में प्रत्येक डेटा नोड को व्यक्तिगत रूप से चलाएं जबकि यार्न में प्रत्येक डेटा नोड नोड प्रबंधक द्वारा चलाया जाता है।
- मैपरेड्यूज़ करने के लिए जॉब ट्रैकर का उपयोग कार्य ट्रैकर को टास्क ट्रैकर को कार्य बनाने और असाइन करने के लिए करता है, संसाधन के प्रबंधन के कारण प्रभावशाली नहीं होता है जिसके परिणामस्वरूप कुछ डेटा नोड निष्क्रिय रहेंगे और इसका कोई उपयोग नहीं होगा, जबकि यार्न में प्रत्येक के लिए संसाधन प्रबंधक हैक्लस्टर , और प्रत्येक डेटा नोड एक नोड प्रबंधक चलाता है। प्रत्येक नौकरी के लिए, एक गुलाम नोड आवेदन मास्टर के रूप में कार्य करेगा, संसाधनों / कार्यों की निगरानी करेगा।
मैपरेड्यूज़ बनाम यार्न तुलना तालिका
तुलना के लिए आधार | यार्न | मैपरेड्यूज़ |
अर्थ | यार्न एक और संसाधन वार्ताकार के लिए खड़ा है। | मैपरेड्यूज़ करना स्वयं परिभाषित है। |
संस्करण | हडूप 2.0 में परिचय | हडूप 1.0 में परिचय |
ज़िम्मेदारी | अब यार्न संसाधन प्रबंधन भाग के लिए ज़िम्मेदार है। | इससे पहले मैपरेड्यूज़ प्रबंधन संसाधन प्रबंधन के साथ-साथ डेटा प्रोसेसिंग के लिए ज़िम्मेदार था |
निष्पादन मॉडल | मैपरेड्यूज़ कम करने की तुलना में यार्न निष्पादन मॉडल अधिक सामान्य है | यार्न की तुलना में कम जेनेरिक। |
आवेदन निष्पादन | यार्न उन अनुप्रयोगों को भी निष्पादित कर सकता है जो मैपरेड्यूज़ करने के मॉडल का पालन नहीं करते हैं | मैपरेड्यूज़ करें अपने मॉडल आधारित आवेदन निष्पादित कर सकते हैं। |
आर्किटेक्चर | नौकरी ट्रैकर और टास्क ट्रैकर के शीर्ष पर एमआर 2 में यार्न पेश किया गया है। जॉब ट्रैकर और टास्क ट्रैकर एप्लिकेशन के स्थान पर, मास्टर तस्वीर में आता है। | एमआर 1 के पहले संस्करण में, यार्न नहीं है यार्न नौकरी ट्रैकर और कार्य ट्रैकर के स्थान पर मौजूद था जो आवेदन या नौकरियों के निष्पादन में मदद करता है |
लचीलापन | यार्न अधिक अलग और स्केलेबल है | यार्न की तुलना में कम स्केलेबल। |
डेमॉन | यार्न में नाम नोड, डेटा नोड, माध्यमिक नाम नोड, संसाधन प्रबंधक और नोड प्रबंधक है। | मैपरेड्यूज़ नाम नोड, डेटा नोड, माध्यमिक नाम नोड, नौकरी ट्रैकर और कार्य ट्रैकर है। |
सीमा | यार्न में विफलता के एक बिंदु की कोई अवधारणा नहीं है क्योंकि इसमें कई परास्नातक हैं इसलिए यदि कोई विफल हो गया तो कोई अन्य मास्टर इसे उठाएगा और निष्पादन को फिर से शुरू करेगा। | विफलता का एकल बिंदु, कम संसाधन उपयोग (याहू द्वारा 4200 क्लस्टर का अधिकतम) और यार्न की तुलना में कम स्केलेबिलिटी |
आकार | डिफ़ॉल्ट रूप से यार्न में डेटा नोड का आकार 128 एमबी है | डिफ़ॉल्ट रूप से मैपरेड्यूज़ में डेटा नोड का आकार 64 एमबी है। |
निष्कर्ष – मैपरेड्यूज़ बनाम यार्न
हडूप 1 में जो मैप कम करने पर आधारित है, में कई मुद्दे हैं जो यार्ड के साथ हडूप 2 में पराजित होते हैं। हडूप में 1 जॉब ट्रैकर संसाधन प्रबंधन के लिए ज़िम्मेदार है लेकिन यार्न में संसाधन प्रबंधक के साथ-साथ नोड मैनेजर की अवधारणा है जो संसाधन प्रबंधन का अधिग्रहण करेगी। मैपरेड्यूज़ करने में असफलता का एक बिंदु यानी नौकरी ट्रैकर है, यदि जॉब ट्रैकर काम करना बंद कर देता है तो हमें अपने पूरे क्लस्टर को पुनरारंभ करना होगा और फिर से शुरूआत से अपना काम निष्पादित करना होगा। एक वास्तविक परिदृश्य में, कोई भी संगठन इस प्रकार का जोखिम नहीं लेना चाहता, खासकर बैंक रक्षा क्षेत्र में। ऐसा संगठन जो डेटा को व्यवस्थित करने पर काम करता है, इस तरह के जोखिम को लेने के लिए तैयार नहीं होगा। कुछ मिनटों के लिए, वे अपना डेटा खोने जा रहे हैं और कुछ महत्वपूर्ण व्यावसायिक प्रभाव हो सकते हैं। तो यार्न के मैपरेड्यूज़ होने पर बेहतर परिणाम है।
अनुशंसित आलेख
यह मैपरेड्यूज़ बनाम यार्न, उनके अर्थ, हेड तुलना में प्रमुख, मुख्य मतभेद, तुलना तालिका, और निष्कर्ष के लिए एक मार्गदर्शक रहा है। आप और जानने के लिए निम्नलिखित लेख भी देख सकते हैं –