कंप्यूटर वैज्ञानिकों ने एमु विकसित किया है, एक एल्गोरिथ्म जो एक समुदाय में बैक्टीरिया की प्रजातियों की पहचान करने के लिए जीनोम के लंबे रीड्स का उपयोग करता है।
यह कार्यक्रम आंत में या कृषि और पर्यावरण जैसे माइक्रोबायोम में सहायक बैक्टीरिया से हानिकारक छँटाई को सरल बना सकता है।
एमु, उनका माइक्रोबियल समुदाय प्रोफाइलिंग सॉफ्टवेयर, अध्ययन के तहत जीन की पूरी लंबाई तक फैले लंबे डीएनए अनुक्रमों का लाभ उठाकर बैक्टीरिया की प्रजातियों की प्रभावी ढंग से पहचान करता है।
कंप्यूटर वैज्ञानिक टॉड ट्रेनगेन और राइस के जॉर्ज आर ब्राउन स्कूल ऑफ इंजीनियरिंग के स्नातक छात्र क्रिस्टन करी के नेतृत्व में एमु परियोजना एक प्रमुख जीन माइक्रोबायोम शोधकर्ताओं के विश्लेषण की सुविधा प्रदान करती है जो बैक्टीरिया की प्रजातियों को हल करने के लिए उपयोग करते हैं जो हानिकारक या सहायक हो सकते हैं। मनुष्य और पर्यावरण।
उनका लक्ष्य, 16S, rRNA (राइबोसोमल राइबोन्यूक्लिक एसिड) जीन का एक सबयूनिट है, जिसका उपयोग 1977 में कार्ल वोइस द्वारा किया गया था।
यह क्षेत्र बैक्टीरिया और आर्किया में अत्यधिक संरक्षित है और इसमें परिवर्तनशील क्षेत्र भी हैं जो अलग-अलग प्रजातियों और प्रजातियों को अलग करने के लिए महत्वपूर्ण हैं।
“यह आमतौर पर माइक्रोबायोम विश्लेषण के लिए उपयोग किया जाता है क्योंकि यह सभी बैक्टीरिया और अधिकांश आर्किया में मौजूद है,” करी ने ट्रेंजेन समूह में अपने तीसरे वर्ष में कहा।
“उसके कारण, ऐसे क्षेत्र हैं जिन्हें वर्षों से संरक्षित किया गया है जिससे लक्षित करना आसान हो जाता है।
डीएनए अनुक्रमण में, हमें सभी जीवाणुओं में इसके कुछ हिस्सों की आवश्यकता होती है ताकि हम जान सकें कि क्या देखना है, और फिर हमें अलग-अलग हिस्सों की आवश्यकता है ताकि हम बैक्टीरिया को अलग बता सकें।”
राइस टीम का अध्ययन, जर्मनी में सहयोगियों के साथ और ह्यूस्टन मेथोडिस्ट रिसर्च इंस्टीट्यूट, बायलर कॉलेज ऑफ मेडिसिन और टेक्सास चिल्ड्रन हॉस्पिटल में, नेचर मेथड्स पत्रिका में दिखाई देता है।
“साल पहले हम खराब बैक्टीरिया पर ध्यान केंद्रित करते थे – या जो हमने सोचा था वह बुरा था – और हम वास्तव में दूसरों की परवाह नहीं करते थे,” करी ने कहा।
“लेकिन पिछले 20 वर्षों में एक बदलाव आया है जहां हमें लगता है कि शायद उनमें से कुछ अन्य बैक्टीरिया लटकने का मतलब कुछ है।
“यही वह है जिसे हम माइक्रोबायोम के रूप में संदर्भित करते हैं, एक वातावरण में सभी सूक्ष्म जीव,” उसने कहा।
“आमतौर पर अध्ययन किए गए वातावरण में पानी, मिट्टी और आंत्र पथ शामिल हैं, और रोगाणुओं ने फसलों, कार्बन पृथक्करण और मानव स्वास्थ्य को प्रभावित करने के लिए दिखाया है।”
इमू, “उम्मीद-अधिकतमकरण” के अपने कार्य से लिया गया नाम, ऑक्सफोर्ड नैनोपोर मिनियन हैंडहेल्ड सीक्वेंसर द्वारा संसाधित बैक्टीरिया से पूर्ण-लंबाई वाले 16S अनुक्रमों का विश्लेषण करता है और नौ अलग-अलग “हाइपरवेरेबल क्षेत्रों” के आधार पर प्रजातियों की पहचान करने के लिए परिष्कृत त्रुटि सुधार का उपयोग करता है।
“पिछली तकनीक के साथ हम केवल 16S जीन का हिस्सा पढ़ सकते थे,” करी ने समझाया।
“इसमें लगभग 1,500 बेस जोड़े हैं, और शॉर्ट-रीड सीक्वेंसिंग के साथ आप इस जीन के केवल 25% -30% तक ही सीक्वेंस कर सकते हैं।
हालांकि, प्रजातियों के स्तर की सटीकता प्राप्त करने के लिए आपको वास्तव में पूर्ण लंबाई वाले जीन की आवश्यकता होती है।”
लेकिन यहां तक कि नवीनतम तकनीक भी सही नहीं है, जिससे त्रुटियों को अनुक्रमों में फिसलने की इजाजत मिलती है।
“हालांकि हाल के वर्षों में त्रुटि दर में गिरावट आई है, फिर भी वे एक व्यक्तिगत डीएनए अनुक्रम के अंदर 10% तक त्रुटि कर सकते हैं, जबकि प्रजातियों को उनके 16S जीन में कुछ हद तक अंतर से अलग किया जा सकता है” कंप्यूटर विज्ञान के सहायक प्रोफेसर ट्रेंजेन ने कहा, जो संक्रामक रोग पर नज़र रखने में माहिर हैं।
“सच्चे अंतर से अनुक्रमण त्रुटि को अलग करना इस शोध परियोजना की मुख्य कम्प्यूटेशनल चुनौती का प्रतिनिधित्व करता है।
“एक मुद्दा यह है कि बहुत सी त्रुटि गैर-यादृच्छिक है, जिसका अर्थ है कि यह विशिष्ट स्थितियों में बार-बार हो सकता है, और फिर अनुक्रमण त्रुटि के बजाय वास्तविक अंतर की तरह दिखना शुरू हो जाता है,” उन्होंने कहा।
“एक और मुद्दा यह है कि किसी दिए गए नमूने में हजारों जीवाणु प्रजातियां हो सकती हैं, जो सूक्ष्म जीवों का एक जटिल मिश्रण बनाती हैं जो अनुक्रमिक त्रुटि दर के नीचे बहुतायत में मौजूद हो सकती हैं, ” ट्रेंगेन ने कहा।
“इसका मतलब है कि हम सिग्नल को त्रुटि से अलग करने के लिए केवल तदर्थ कटऑफ पर भरोसा नहीं कर सकते।”
इसके बजाय, एमु लंबे अनुक्रमों की एक भीड़ की तुलना करके संकेत और त्रुटि के बीच अंतर करना सीखता है, पहले एक टेम्पलेट के खिलाफ और फिर एक दूसरे के खिलाफ, इसकी त्रुटि-सुधार को पुनरावृत्त रूप से परिष्कृत करता है क्योंकि यह माइक्रोबियल समुदायों को प्रोफाइल करता है।
प्रदर्शन किए गए प्रयोगों में, समान डेटा सेट का विश्लेषण करते समय अन्य दृष्टिकोणों की तुलना में एमु में झूठी सकारात्मकता काफी कम हो गई।
“लॉन्ग-रीड्स माइक्रोबायोम रिसर्च के लिए एक विघटनकारी तकनीक का प्रतिनिधित्व करते हैं, ” ट्रेंगेन ने कहा।
“एमु का लक्ष्य पूर्ण लंबाई वाले 16S जीन में निहित सभी सूचनाओं का लाभ उठाना था, बिना किसी मास्क के, यह देखने के लिए कि क्या हम अधिक सटीक जीनस- या प्रजाति-स्तरीय कॉल प्राप्त कर सकते हैं।
और ठीक यही हमने एमु के साथ पूरा किया, एक फलदायी, बहु-विषयक सहयोगात्मक प्रयास के लिए धन्यवाद।”
अलेक्जेंडर डिल्थे, हेनरिक हेन विश्वविद्यालय, डसेलडोर्फ, जर्मनी में जीनोमिक माइक्रोबायोलॉजी और प्रतिरक्षा के प्रोफेसर, पेपर के सह-संबंधित लेखक हैं।