चिकित्सा में बिग डेटा के स्रोत

by केविन ह्वांग, एमडी, एमपीएच; रिचर्ड एन फोगोरोस, एमडी द्वारा समीक्षा की गई

दवा में बड़े डेटा की एक सरल परिभाषा "रोगी स्वास्थ्य देखभाल और कल्याण से संबंधित डेटा की कुलता" (रघुपति 2014) है। लेकिन इन प्रकार के डेटा वास्तव में क्या हैं, और वे कहां से आते हैं?

निम्नलिखित स्वास्थ्य देखभाल प्रदाताओं, शोधकर्ताओं, दाताओं, नीति निर्माताओं और उद्योग के लिए ब्याज के बड़े डेटा के प्रकारों और स्रोतों का व्यापक अवलोकन है।

ये श्रेणियां पारस्परिक रूप से अनन्य नहीं हैं, क्योंकि एक ही डेटा विभिन्न स्रोतों से उत्पन्न हो सकता है।

न ही यह सूची संपूर्ण है, क्योंकि बड़े डेटा एनालिटिक्स का व्यावहारिक अनुप्रयोग निश्चित रूप से विस्तार करना जारी रखेगा।

नैदानिक सूचना प्रणाली

ये नैदानिक डेटा के पारंपरिक स्रोत हैं जो स्वास्थ्य देखभाल प्रदाताओं को देखने के आदी हैं।

इलेक्ट्रॉनिक स्वास्थ्य रिकॉर्ड (ईएचआर) जनसांख्यिकी, पिछले चिकित्सा इतिहास, सक्रिय चिकित्सा समस्याओं, टीकाकरण, एलर्जी, दवाओं, महत्वपूर्ण संकेतों, प्रयोगशाला और रेडियोलॉजी परीक्षणों से परिणाम, पैथोलॉजी रिपोर्ट, स्वास्थ्य देखभाल द्वारा बनाए गए प्रगति नोट्स जैसे सूचना एकत्रित, संग्रहित और प्रदर्शित करते हैं। प्रदाताओं, और प्रशासनिक और वित्तीय दस्तावेज
इलेक्ट्रॉनिक मेडिकल रिकॉर्ड (ईएमआर) ईएचआर के समान नहीं हैं और आमतौर पर किसी विशेष चिकित्सक के साथ संग्रहीत डेटा से संबंधित होते हैं।
स्वास्थ्य सूचना एक्सचेंज अलग नैदानिक सूचना प्रणाली के बीच केंद्र के रूप में कार्य करते हैं

अपने स्वयं के मरीजों पर स्वास्थ्य देखभाल संगठनों द्वारा बनाए गए रोगी पंजीकरण अक्सर ईएचआर से जुड़े होते हैं। अन्य रजिस्ट्रियां व्यापक भौगोलिक पैमाने पर टीकाकरण, कैंसर, आघात, और अन्य सार्वजनिक स्वास्थ्य मुद्दों को ट्रैक करती हैं।

रोगी पोर्टल रोगियों को स्वास्थ्य देखभाल संगठन के ईएचआर में संग्रहीत व्यक्तिगत स्वास्थ्य जानकारी तक पहुंचने की अनुमति देता है। कुछ रोगी पोर्टल भी उपयोगकर्ताओं को पर्चे के रिफिल का अनुरोध करने और स्वास्थ्य देखभाल टीम के साथ सुरक्षित इलेक्ट्रॉनिक संदेशों का आदान-प्रदान करने की अनुमति देते हैं।

नैदानिक डेटा वेयरहाउस कई नैदानिक सूचना प्रणाली से कुल रोगी-स्तर डेटा, जैसे ऊपर सूचीबद्ध ईएचआर और अन्य स्रोत

भुगतानकर्ताओं से डेटा का दावा करता है

सार्वजनिक भुगतानकर्ता (जैसे मेडिकेयर) और निजी भुगतानकर्ताओं के पास उनके लाभार्थियों पर दावा डेटा के बड़े भंडार होते हैं। कुछ स्वास्थ्य बीमा कंपनियां अब आपके स्वास्थ्य डेटा को साझा करने के लिए प्रोत्साहन भी प्रदान करती हैं।

अनुसंधान अध्ययन

शोध डेटाबेस में अध्ययन प्रतिभागियों, प्रयोगात्मक उपचार, और नैदानिक परिणामों के बारे में जानकारी शामिल है। बड़े अध्ययन आमतौर पर दवा कंपनियों या सरकारी एजेंसियों द्वारा प्रायोजित होते हैं। व्यक्तिगत दवा का एक आवेदन नैदानिक परीक्षण डेटा में पैटर्न के आधार पर प्रभावी उपचार के साथ व्यक्तिगत रोगियों से मेल खाना है।

यह दृष्टिकोण सबूत-आधारित दवा सिद्धांतों को लागू करने से आगे बढ़ता है, जिसके द्वारा एक स्वास्थ्य देखभाल प्रदाता यह निर्धारित करता है कि एक रोगी परीक्षण प्रतिभागियों के साथ व्यापक विशेषताओं (जैसे आयु, लिंग, जाति, नैदानिक स्थिति) साझा करता है या नहीं। बड़े डेटा एनालिटिक्स के साथ, अधिक मस्तिष्क संबंधी जानकारी के आधार पर उपचार का चयन करना संभव है, जैसे रोगी के कैंसर की आनुवंशिक प्रोफ़ाइल (नीचे देखें)।

नैदानिक निर्णय समर्थन प्रणाली (सीडीएसएस) भी तेजी से विकास कर रही है और अब दवा में कृत्रिम बुद्धि (एआई) के एक बड़े हिस्से का प्रतिनिधित्व करती है।

वे अपने निर्णय लेने के साथ चिकित्सकों की सहायता के लिए रोगी डेटा का उपयोग करते हैं और अक्सर ईएचआर के साथ संयुक्त होते हैं।

जेनेटिक डेटाबेस

मानव अनुवांशिक जानकारी का भंडार तेजी से जमा हो रहा है। चूंकि मानव जीनोम परियोजना 2003 में पूरी की गई थी, इसलिए मानव डीएनए अनुक्रमण की लागत दस लाख गुना कम हो गई है। हार्वर्ड मेडिकल स्कूल द्वारा 2005 में लॉन्च किया गया व्यक्तिगत जीनोम प्रोजेक्ट (पीजीपी), दुनिया भर से 100,000 स्वयंसेवकों के पूर्ण जीनोमों को अनुक्रमित और प्रचारित करना चाहता है। पीजीपी ही बड़ी मात्रा में डेटा और डेटा की विविधता के कारण बड़ी डेटा परियोजना का एक प्रमुख उदाहरण है।

एक व्यक्तिगत जीनोम में लगभग 100 गीगाबाइट डेटा होता है। जीनोम को अनुक्रमित करने के अलावा, पीजीपी ईएचआर, सर्वेक्षण, और माइक्रोबायम प्रोफाइल से भी डेटा एकत्र कर रहा है।

कई कंपनियां वाणिज्यिक आधार पर स्वास्थ्य, व्यक्तिगत लक्षण, और फार्माकोनेटिक्स के लिए प्रत्यक्ष-से-उपभोक्ता अनुवांशिक अनुक्रम प्रदान करती हैं।

इस व्यक्तिगत जानकारी को बड़े डेटा एनालिटिक्स में जोड़ा जा सकता है। उदाहरण के लिए, 23andMe ने 22 नवंबर, 2013 तक अमेरिकी खाद्य एवं औषधि प्रशासन का अनुपालन करने के लिए नए ग्राहकों को स्वास्थ्य से संबंधित अनुवांशिक रिपोर्ट की पेशकश बंद कर दी। हालांकि, 2015 में, कंपनी ने एफडीए की मंजूरी के साथ इस बार अपने आनुवांशिक लार परीक्षण के कुछ स्वास्थ्य घटकों की पेशकश शुरू कर दी।

सार्वजनिक रिकॉर्ड

सरकार स्वास्थ्य से संबंधित घटनाओं, जैसे आप्रवासन, विवाह, जन्म और मृत्यु के विस्तृत रिकॉर्ड रखती है। अमेरिकी जनगणना ने 17 9 0 के बाद से हर 10 वर्षों में बड़ी मात्रा में जानकारी एकत्र की है। जनगणना की आंकड़ों की वेबसाइट 2013 तक 370 बिलियन कोशिकाएं थीं, जिसमें सालाना लगभग 11 बिलियन अधिक जोड़े गए थे।

वेब खोज

Google और अन्य वेब खोज प्रदाताओं द्वारा एकत्र की गई वेब खोज जानकारी जनसंख्या के स्वास्थ्य से संबंधित वास्तविक समय अंतर्दृष्टि प्रदान कर सकती है। हालांकि, वेब खोज पैटर्न से बड़े डेटा का मूल्य स्वास्थ्य डेटा के पारंपरिक स्रोतों के साथ संयोजन करके इसे बेहतर किया जा सकता है।

सामाजिक मीडिया

फेसबुक, ट्विटर और अन्य सोशल मीडिया प्लेटफार्म घंटों के आसपास डेटा की एक समृद्ध विविधता उत्पन्न करते हैं, जिससे स्थानों, स्वास्थ्य व्यवहार, भावनाओं और उपयोगकर्ताओं के सामाजिक संपर्कों में विचार मिलता है। सार्वजनिक स्वास्थ्य के लिए सोशल मीडिया के बड़े डेटा को डिजिटल बीमारी का पता लगाने या डिजिटल महामारी विज्ञान के रूप में जाना जाता है। उदाहरण के लिए, ट्विटर का उपयोग आम जनसंख्या के बीच इन्फ्लूएंजा महामारी का विश्लेषण करने के लिए किया गया है।

पेंसिल्वेनिया विश्वविद्यालय में शुरू हुई विश्व कल्याण परियोजना लोगों के अनुभव और स्वास्थ्य को बेहतर ढंग से समझने के लिए सोशल मीडिया का अध्ययन करने का एक और उदाहरण है। यह परियोजना मनोवैज्ञानिक, सांख्यिकीविदों और कंप्यूटर वैज्ञानिकों को एक साथ लाती है जो ऑनलाइन बातचीत करते समय इस्तेमाल की जाने वाली भाषा का विश्लेषण करते हैं, उदाहरण के लिए, फेसबुक और ट्विटर पर स्टेटस अपडेट लिखते समय। वैज्ञानिक देख रहे हैं कि उपयोगकर्ता की भाषा उनके स्वास्थ्य और खुशी से कैसे संबंधित है। प्राकृतिक भाषा प्रसंस्करण और मशीन सीखने में अग्रिम उनके प्रयासों में मदद कर रहे हैं। पेंसिल्वेनिया विश्वविद्यालय के एक हालिया प्रकाशन ने सोशल मीडिया का विश्लेषण करके मानसिक बीमारी की भविष्यवाणी करने के तरीकों को देखा। ऐसा लगता है कि इंटरनेट के उपयोग का अध्ययन करके अवसाद और अन्य मानसिक स्वास्थ्य स्थितियों के लक्षणों का पता लगाया जा सकता है। वैज्ञानिक भविष्य में आशा करते हैं कि ये विधियां जोखिम वाले व्यक्तियों की बेहतर पहचान और सहायता करने में सक्षम होंगी।

चीजों का इंटरनेट (आईओटी)

स्वास्थ्य से संबंधित जानकारी के भारी दस्ताने भी मोबाइल और घरेलू उपकरणों पर एकत्र और संग्रहीत किए जाते हैं।

स्मार्टफ़ोन : हजारों एमएचल्थ ऐप्स उपयोगकर्ता की शारीरिक गतिविधि, पोषण का सेवन, नींद पैटर्न, भावनाओं और अन्य मानकों पर जानकारी प्राप्त करते हैं। मूल सेल फोन ऐप्स (जैसे जीपीएस, ईमेल, टेक्स्टिंग) किसी व्यक्ति की स्वास्थ्य स्थिति के बारे में सुराग भी दे सकते हैं।
पहनने योग्य मॉनीटर और डिवाइस: त्वचा के नीचे एम्बेडेड पैडोमीटर, एक्सेलेरोमीटर, चश्मा, घड़ियां और चिप्स भी स्वास्थ्य से संबंधित जानकारी इकट्ठा करते हैं और उन्हें क्लाउड में भी भेज सकते हैं।
टेलीमेडिसिन डिवाइस स्वास्थ्य देखभाल प्रदाताओं को रक्तचाप, हृदय गति, श्वसन दर, ऑक्सीजन, तापमान, ईसीजी ट्रेकिंग और वजन जैसे रोगियों के मानकों की निगरानी करने की अनुमति देते हैं।

वित्तीय लेन - देन

मरीजों के क्रेडिट कार्ड लेनदेन को कैरोलिनास हेल्थकेयर सिस्टम द्वारा उपयोग किए जाने वाले भविष्यवाणियों के मॉडल में शामिल किया गया है ताकि अस्पताल में पढ़े जाने के लिए उच्च जोखिम वाले मरीजों की पहचान हो सके। शार्लोट स्थित स्वास्थ्य देखभाल प्रदाता रोगियों को विभिन्न समूहों में विभाजित करने के लिए बड़े डेटा का उपयोग करता है, उदाहरण के लिए, रोग और भौगोलिक स्थान के आधार पर।

नैतिक और गोपनीयता प्रभाव

इसे हाइलाइट करने की जरूरत है कि, कुछ मामलों में, स्वास्थ्य देखभाल में डेटा इकट्ठा करने और पहुंचने पर महत्वपूर्ण नैतिक और गोपनीयता प्रभाव हो सकते हैं। बड़े डेटा के नए स्रोत व्यक्तियों और आबादी के स्वास्थ्य पर असर डालते हुए हमारी समझ में सुधार कर सकते हैं, हालांकि, विभिन्न जोखिमों पर ध्यान से विचार और निगरानी की आवश्यकता है। अब यह भी पहचाना गया है कि पहले अज्ञात समझा गया डेटा, फिर से पहचाना जा सकता है। उदाहरण के लिए, हार्वर्ड के डेटा प्राइवेसी लैब के प्रोफेसर लातान्या स्वीनी ने व्यक्तिगत जीनोम प्रोजेक्ट में शामिल 1,130 स्वयंसेवकों की समीक्षा की। वह और उनकी टीम ने साझा की गई जानकारी (ज़िप कोड, जन्म तिथि, लिंग) के आधार पर प्रतिभागियों का 42 प्रतिशत सही ढंग से नाम देने में सक्षम थे। यह ज्ञान संभावित जोखिमों के बारे में हमारी जागरूकता बढ़ा सकता है और बेहतर डेटा साझा करने के निर्णय लेने में हमारी सहायता कर सकता है।

> स्रोत:

> Conway एम, O'Connor डी। सोशल मीडिया, बड़ा डेटा, और मानसिक स्वास्थ्य: वर्तमान प्रगति और नैतिक प्रभाव। मनोविज्ञान 2016 में वर्तमान राय ; 9: 77-82।

> फर्नांडीस एल, ओ'कोनोर एम, वीवर वी। बड़ा डेटा, बड़ा परिणाम। अमेरिकी स्वास्थ्य सूचना प्रबंधन संघ 2012 की जर्नल ; 83 (10): 38-43

> गुंटुकु एस, याडन डी, कर्न एम, यूनगर एल, इचस्टेड जे। सोशल मीडिया पर अवसाद और मानसिक बीमारी का पता लगाना: एक एकीकृत समीक्षा । व्यवहारिक विज्ञान 2017 में वर्तमान राय ; 18: 43-49।

> Lazer डी, केनेडी आर, किंग जी, Vespignani ए Google फ़्लू का दृष्टांत: बिग डेटा विश्लेषण में जाल । विज्ञान 2014; 343 (6176): 1203-1205।

> रघुपति डब्ल्यू, रघुपति वी। स्वास्थ्य देखभाल में बिग डेटा एनालिटिक्स: वादा और potenti अल। स्वास्थ्य सूचना विज्ञान और सिस्टम 2014; 2: 3।

> स्वीनी एल, अबू ए, विन्न जे। नाम से व्यक्तिगत जीनोम परियोजना में प्रतिभागियों की पहचान । हार्वर्ड विश्वविद्यालय। डेटा गोपनीयता प्रयोगशाला। व्हाइट पेपर 1021-1। 24 अप्रैल, 2013।

नैदानिक ​​सूचना प्रणाली