जीनोम विश्लेषण की अहमियत
व्यक्तिगत स्वास्थ्य से जुड़े 30% मामलों में आनुवंशिकता ज़िम्मेदार होती है, लेकिन बीमारियों की रोकथाम और मरीज़ों की देखभाल के लिए इस जानकरी का इस्तेमाल न के बराबर होता है. हर व्यक्ति में 40-50 लाख जेनेटिक वैरिएंट होते हैं. इनमें से हर वैरिएंट का हमारे स्वास्थ्य से जुड़े लक्षणों पर अलग-अलग असर पड़ता है. पिछले कुछ सालों में, जीनोम का सीक्वेंस डेटा पाने के खर्च में भारी कमी आई है. साथ ही, अब संभावना बढ़ गई है कि इस डेटा का इस्तेमाल, हेल्थकेयर के क्षेत्र में किसी भी काम के लिए किया जा सकता है. हालांकि, इस डेटा को सही तरीके से पढ़ना, समझना, और इसका विश्लेषण करना अब भी एक चुनौती है. इसलिए, इस डेटा को बड़े स्तर पर इस्तेमाल करने में समस्या आ रही है.
जीनोम विश्लेषण को ज़्यादा सटीक बनाना
जीनोम का सीक्वेंस डेटा, हमें किसी व्यक्ति के डीएनए में मौजूद उन वैरिएंट की पहचान करने में मदद करता है जिनसे आनुवंशिक विकारों के बारे में पता चलता है. जैसे, स्तन कैंसर होने का जोखिम.
डीप न्यूरल नेटवर्क की मदद से जीनोम की सबसे सटीक तरीके से पहचान करना
सीक्वेंस डेटा पाने की टेक्नोलॉजी में तेज़ी से विकास होने के बावजूद, अरबों छोटे सीक्वेंस में से किसी एक जीनोम में मौजूद जेनेटिक वैरिएंट की सही तरीके से पहचान करना अब भी एक चुनौती भरा काम है. DeepVariant एक ओपन सोर्स वैरिएंट कॉलर है. Nature Biotechnology में पब्लिश हुए एक लेख के मुताबिक, डीएनए के नेक्स्ट-जनरेशन सीक्वेंस डेटा में जेनेटिक वैरिएंट की पहचान करने के लिए, DeepVariant एक डीप न्यूरल नेटवर्क का इस्तेमाल करता है. इससे, वैरिेएंट की जगह की जानकारी का बेहतर तरीके से पता लगाने में मदद मिलती है. साथ ही, गड़बड़ी की दर में 50% से ज़्यादा की कमी आती है. ज़्यादा जानें
PrecisionFDA V2 ट्रुथ चैलेंज का विजेता
DeepVariant ने PrecisionFDA V2 ट्रुथ चैलेंज के 4 में से 3 इंस्ट्रुमेंट कैटगरी में सबसे सटीक होने के पुरस्कार जीते. पिछले नए मॉडल की तुलना में, DeepVariant v1.0, इलूमिना और पैसिफिक बायोसाइंसेज़ सहित बड़े पैमाने पर इस्तेमाल किए जाने वाले सीक्वेंसिंग डेटा टाइप की गड़बड़ियों को काफ़ी घटा देता है. यह लेख पढ़ें
कैंसर के मरीज़ों में, बीमारी पैदा करने वाले वैरिएंट की पहचान करना
शोधकर्ता यह जानना चाहते थे कि ऑटोमेटेड डीप लर्निंग टेक्नोलॉजी को इस्तेमाल करने से कैंसर के मरीज़ों में, बीमारी पैदा करने वाले वैरिएंट का बेहतर तरीके से पता लगाने में मदद मिलेगी या नहीं. JAMA में पब्लिश की गई एक क्रॉस-सेक्शनल स्टडी के मुताबिक, DeepVariant ने मौजूदा आधुनिक तरीकों की तुलना में, ऐसे 14% ज़्यादा लोगों का पता लगाया जिनमें बीमारी पैदा करने वाले वैरिएंट थे. यह स्टडी, संयुक्त राज्य अमेरिका और यूरोप में प्रोस्टेट कैंसर और मेलेनोमा के 2,367 मरीज़ों पर की गई थी.
आनुवंशिक खोज अनुसंधान के लिए, इस क्षेत्र में काम करने वाले लोगों के बड़े ग्रुप बनाना
किसी बीमारी के साथ, नए जेनेटिक वैरिएंट के संबंधों का पता लगाने में, इस क्षेत्र में काम करने वाले लोगों के बड़े ग्रुप बहुत अहम भूमिका निभाते हैं. ऐसे ग्रुप बनाने के लिए, हमने बिलकुल नए और बेहतर तरीके डेवलप किए हैं. UK Biobank भी बड़े स्तर पर सीक्वेंस डेटा का विश्लेषण करने के लिए इन तरीकों का इस्तेमाल कर रहा है. यह लेख पढ़ें
मशीन लर्निंग की मदद से आनुवंशिकता से जुड़ी खोज में सुधार लाना
दिलचस्पी की खासियत वाले आनुवंशिक वैरिएंट का पता लगाने के लिए, आनुवंशिक और खासियत, दोनों तरह की जानकारी वाले व्यक्तियों के एक बड़े ग्रुप की ज़रूरत होती है. AJHG में पब्लिश लेख से हमें इस बात की जानकारी मिलती है कि मशीन लर्निंग मॉडल का इस्तेमाल करके, फ़ंडस इमेज से आंखों की बीमारी के लक्षणों का अनुमान लगाया जा सकता है. इससे, इन लक्षणों को प्रभावित करने वाले आनुवंशिक वैरिएंट की खोज में भी काफ़ी सुधार हुआ है.
जीनोम रिसर्च में हमारे पार्टनर
जीनोम डेटा बेहद व्यक्तिगत होता है. इसलिए, हम ज़्यादातर ऐसे डेटासेट का इस्तेमाल करते हैं जो पूरी तरह से सार्वजनिक होते हैं या रिसर्च करने वाले क्वालीफ़ाइड लोगों के लिए उपलब्ध होते हैं. हम उन भरोसेमंद संगठनों के साथ भी पार्टनरशिप करते हैं जो जीनोम विश्लेषण के स्टैंडर्ड और सीक्वेंसिंग डेटा की उपयोगिता को बेहतर बनाने के लिए, विज्ञान और टेक्नोलॉजी के विकास में योगदान करते हैं.
DeepVariant के precisionFDA Truth Challenge V2 सबमिशन के मुताबिक इसने PacBio HiFi की जांच सुविधा का इस्तेमाल करके, सटीक नतीजे देने वाली बेहतरीन सिंगल-टेक्नोलॉजी बनने की उपलब्धि हासिल की है. इसके बारे में, PacBio blog और Nature Biotechnology retrospective पर जानकारी दी गई है. इनके सहयोग से DeepConsensus सेवा को भी लॉन्च किया गया. यह सेवा, सहमति वाली मौजूदा बेसकॉलिंग विधियों की तुलना में HiFi ईल्ड और जांच की क्वालिटी को बेहतर बनाती है.
Regeneron Genetics Center दुनिया के सबसे बड़े मानव जीनोम रिसर्च सेंटर में से एक है. इसने अंदरूनी प्रोजेक्ट और 200,000 exomes to UKBiobank की डिलीवरी के लिए, DeepVariant को अपनाया और कई खास मॉडल को फिर से ट्रेनिंग दी.
Benedict Paten की यूसी सांता क्रूज वाली लैब ने PEPPER-Deepvariant पर, Google के साथ मिलकर काम किया है. इसने, PrecisionFDA की ऑक्सफ़र्ड नैनोपोर टेक्नोलॉजीज़ कैटगरी में सबसे सटीक नतीजे देने की उपलब्धि हासिल की है. यह पेपर Nature Methods में भी पब्लिश हुआ था.
NVIDIA का क्लारा पैराब्रिक्स पाइपलाइंस सॉफ़्टवेयर, जीपीयू पर चलने वाले डीएनए और आरएनए ऐप्लिकेशन पर काम करने के लिए, ऐक्सेलरेटेड बायोइन्फ़ॉर्मैटिक्स के टूल का सुइट देता है. यह सॉफ़्टवेयर, DeepVariant की मदद से अपने नए A100 जीपीयू का इस्तेमाल करके, 25 मिनट में कुलमानव जीनोम के 30 गुना तक की fastq फ़ाइल को vcf फ़ाइल में बदल देता है.
GenapSys ने custom DeepVariant model को ट्रेनिंग दी है, ताकि बेहद सटीक नतीजे, कम कीमत, और बेंचटॉप सीक्वेंसिंग इंस्ट्रुमेंट के लिए, बहुत ज़्यादा सटीक वैरिएंट कॉलर मुहैया कराए जा सकें.
ATGenomix एक Spark फ्रेमवर्क efficiently parallelizes DeepVariant बनाता है, ताकि एक से ज़्यादा क्लिनिकल पार्टनर के साथ काम किया जा सके.
DNAnexus, सुरक्षित और साथ मिलकर काम करने के मकसद से, DeepVariant जैसे नए टूल को इंटिग्रेट करने वाला बायोइन्फ़ॉर्मैटिक्स सिस्टम उपलब्ध कराती है. वैज्ञानिक समुदाय को समाधान मुहैया कराने के लिए, वह Google, FDA और UK Biobank जैसे इंडस्ट्री लीडर के साथ काम करती है.
DNAstack, रिसर्च करने वाले लोगों के लिए इस्तेमाल में आसान क्लाउड एनवायरमेंट में DeepVariant जैसे टूल का उपयोग करके, जीनोम और बायोमेडिकल डेटा को व्यवस्थित करने, शेयर करने, और उनका विश्लेषण करने की सुविधा देती है. DNAstack के सॉफ़्टवेयर प्रॉडक्ट, ग्लोबल अलायंस फॉर जीनोम एंड हेल्थ के बनाए गए ओपन स्टैंडर्ड का इस्तेमाल करते हैं.