新聞中心
PRESS CENTENR2013年,北大(da)人民醫院CDR上有(you)281萬(wan)患者的(de)(de)(de)6000多(duo)萬(wan)醫囑和1.9億條醫療(liao)文書,另有(you)30多(duo)個T的(de)(de)(de)影像數(shu)據,這些都是(shi)結(jie)構(gou)化好的(de)(de)(de)有(you)質(zhi)量的(de)(de)(de)數(shu)據,能(neng)否稱為(wei)(wei)?近日,一位以(yi)前在方正任職的(de)(de)(de)業內專家認為(wei)(wei),醫院內目前的(de)(de)(de)數(shu)據并不(bu)能(neng)稱之(zhi)大(da)數(shu)據。
那么到(dao)底醫(yi)院的(de)數據能否(fou)稱為大(da)數據?還是(shi)人們習(xi)慣性的(de)使用了(le)(le)“大(da)數據”這個(ge)詞,于(yu)是(shi)問題的(de)答(da)案(an)就不同了(le)(le)。下面(mian)是(shi)大(da)數據以及(ji)醫(yi)院內大(da)數據的(de)一些(xie)思考(kao)!
首先,我不同(tong)意北京(jing)人(ren)民(min)醫(yi)(yi)(yi)院(yuan)xx關(guan)于(yu)“醫(yi)(yi)(yi)院(yuan)內沒(mei)(mei)有(you)(you)大數(shu)(shu)據”的(de)(de)論斷(雖然(ran)(ran)我不確(que)定這(zhe)是劉帆的(de)(de)觀點),為什么沒(mei)(mei)有(you)(you)?小(xiao)到一(yi)只螞(ma)蟻(yi)、一(yi)個病(bing)毒的(de)(de)信息(xi)(xi),都可以(yi)(yi)是一(yi)個大數(shu)(shu)據(例(li)如:螞(ma)蟻(yi)的(de)(de)DNA信息(xi)(xi)、群體社會(hui)信息(xi)(xi),個體識別信息(xi)(xi)等。病(bing)毒感(gan)染信息(xi)(xi)、傳播信息(xi)(xi)、變異(yi)信息(xi)(xi)等),而每天人(ren)山人(ren)海擁擠得水泄(xie)不通(tong)的(de)(de)人(ren)民(min)醫(yi)(yi)(yi)院(yuan)卻(que)沒(mei)(mei)有(you)(you)大數(shu)(shu)據,這(zhe)顯(xian)然(ran)(ran)不對(dui)。所以(yi)(yi),這(zhe)句話可以(yi)(yi)也許理(li)(li)解(jie)為“人(ren)民(min)醫(yi)(yi)(yi)院(yuan)內目(mu)前(qian)沒(mei)(mei)有(you)(you)大數(shu)(shu)據應用”或者“人(ren)民(min)醫(yi)(yi)(yi)院(yuan)目(mu)前(qian)收集(ji)的(de)(de)信息(xi)(xi)不能稱為大數(shu)(shu)據”。文(wen)字上的(de)(de)歧(qi)義反映出的(de)(de)得是行業本身對(dui)大數(shu)(shu)據理(li)(li)解(jie)的(de)(de)混(hun)亂。
其次,“北大人民醫院CDR上(shang)的數(shu)(shu)據(ju)稱不上(shang)大數(shu)(shu)據(ju)”!導致這(zhe)個(ge)結論的依據(ju)也許是(shi)來自“這(zhe)些都是(shi)結構(gou)化(hua)好的有質(zhi)量(liang)的數(shu)(shu)據(ju)”這(zhe)個(ge)判斷,言(yan)外之意就是(shi)說,大數(shu)(shu)據(ju)代(dai)表的是(shi)結構(gou)混(hun)亂、質(zhi)量(liang)低下的數(shu)(shu)據(ju),人民醫院CDR中(zhong)的有質(zhi)量(liang)的數(shu)(shu)據(ju)不是(shi)大數(shu)(shu)據(ju)。
那(nei)么,什么才(cai)是(shi)(shi)結(jie)(jie)構化好的(de)(de)有(you)質量(liang)(liang)(liang)的(de)(de)數(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)呢?比如(ru)我(wo)做一個LIS系(xi)統(tong),我(wo)在內部(bu)顯然(ran)要(yao)考(kao)慮(lv)我(wo)存(cun)(cun)儲(chu)的(de)(de)數(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)結(jie)(jie)構清晰有(you)效,同時也會考(kao)慮(lv)數(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)存(cun)(cun)儲(chu)的(de)(de)質量(liang)(liang)(liang)(長(chang)期存(cun)(cun)儲(chu)和(he)再利用等)。如(ru)果(guo)我(wo)這個LIS接入到人民醫院(yuan)CDR中(zhong),LIS中(zhong)的(de)(de)數(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)和(he)存(cun)(cun)儲(chu)在CDR中(zhong)的(de)(de)LIS數(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)是(shi)(shi)相(xiang)同的(de)(de)結(jie)(jie)構嗎?是(shi)(shi)相(xiang)同的(de)(de)質量(liang)(liang)(liang)嗎?由(you)于(yu)結(jie)(jie)構變化等因素必然(ran)導(dao)致CDR中(zhong)數(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)質量(liang)(liang)(liang)(至少在完(wan)整(zheng)性上)低于(yu)原(yuan)始數(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)。因此,CDR數(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)相(xiang)對于(yu)原(yuan)始數(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)有(you)質量(liang)(liang)(liang)只(zhi)能體(ti)現在它與其他數(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)的(de)(de)關(guan)系(xi)上,例如(ru)LIS與電(dian)子病歷、與住院(yuan)病案或(huo)RIS等的(de)(de)相(xiang)互參照引用上。按照這個觀(guan)點,實現CDR時,如(ru)果(guo)我(wo)們(men)將進(jin)入的(de)(de)數(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)進(jin)行(xing)必要(yao)的(de)(de)處理,按照精心(xin)設計(ji)的(de)(de)數(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)結(jie)(jie)構存(cun)(cun)儲(chu)、維護好數(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)間的(de)(de)邏輯關(guan)系(xi),我(wo)們(men)管理的(de)(de)數(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)無論多(duo)大,也是(shi)(shi)傳統(tong)數(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)處理的(de)(de)范疇,與大數(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)無關(guan)。
對(dui)(dui)于以上問(wen)題(ti)的(de)以及推演出的(de)結論,與我個人對(dui)(dui)醫療大(da)數據的(de)思考存在(zai)一些差異,借著對(dui)(dui)這些問(wen)題(ti)的(de)探(tan)討,將個人觀點表述出來,共大(da)家(jia)參考。
首先(xian),我(wo)認(ren)為數(shu)(shu)據(ju)(ju)質量和格(ge)(ge)式并不(bu)是區分是否大數(shu)(shu)據(ju)(ju)的(de)(de)標準。面對一組數(shu)(shu)據(ju)(ju),數(shu)(shu)據(ju)(ju)質量的(de)(de)好壞(huai)相(xiang)對于應用(yong)、工(gong)具以及分析方法是有(you)不(bu)同(tong)評判標準的(de)(de)。例如,假設(she)我(wo)們存儲在CDR中的(de)(de)數(shu)(shu)據(ju)(ju)是XML格(ge)(ge)式,不(bu)管我(wo)們將該格(ge)(ge)式定義(yi)得多完美(mei)、存儲的(de)(de)數(shu)(shu)據(ju)(ju)多萬(wan)善,采(cai)用(yong)傳統BI工(gong)具的(de)(de)開發人員(yuan)都會認(ren)為這些數(shu)(shu)據(ju)(ju)是垃圾(真實場景),所謂吾(wu)之蜜(mi)糖、汝之毒藥(yao)也(ye)。
其(qi)次,為(wei)什么(me)要(yao)區分(fen)大(da)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)或者非大(da)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)呢?我(wo)們(men)保存(cun)(cun)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)是因為(wei)這(zhe)些數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)存(cun)(cun)在(zai)對(dui)(dui)今后(hou)有(you)再利用的(de)(de)(de)(de)(de)(de)價(jia)值。傳統(tong)(tong)(tong)上,我(wo)們(men)設計的(de)(de)(de)(de)(de)(de)信息(xi)系(xi)(xi)統(tong)(tong)(tong)時(shi),在(zai)考慮存(cun)(cun)儲(chu)(chu)信息(xi)的(de)(de)(de)(de)(de)(de)同(tong)時(shi)也會(hui)將利用信息(xi)的(de)(de)(de)(de)(de)(de)方(fang)式(shi)考慮進來,作為(wei)信息(xi)系(xi)(xi)統(tong)(tong)(tong)的(de)(de)(de)(de)(de)(de)一(yi)部分(fen),這(zhe)樣(yang)實現的(de)(de)(de)(de)(de)(de)系(xi)(xi)統(tong)(tong)(tong)會(hui)對(dui)(dui)存(cun)(cun)儲(chu)(chu)的(de)(de)(de)(de)(de)(de)內容提出(chu)各種要(yao)求,讓存(cun)(cun)儲(chu)(chu)符(fu)(fu)合(he)應(ying)(ying)用需(xu)要(yao)。而符(fu)(fu)合(he)某(mou)一(yi)系(xi)(xi)統(tong)(tong)(tong)需(xu)要(yao)的(de)(de)(de)(de)(de)(de)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)卻很難符(fu)(fu)合(he)其(qi)他應(ying)(ying)用的(de)(de)(de)(de)(de)(de)需(xu)要(yao),這(zhe)就導致所(suo)謂數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)質(zhi)量(liang)的(de)(de)(de)(de)(de)(de)低(di)下。于是有(you)人提出(chu)用CDR將各個(ge)系(xi)(xi)統(tong)(tong)(tong)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)抽(chou)取到CDR中,經過清洗、標準化等方(fang)式(shi)處(chu)理(li)后(hou),統(tong)(tong)(tong)一(yi)存(cun)(cun)儲(chu)(chu)并加以(yi)利用,人民醫院CDR也許(xu)就是這(zhe)種思想的(de)(de)(de)(de)(de)(de)產物。如果對(dui)(dui)于這(zhe)種CDR中存(cun)(cun)儲(chu)(chu)的(de)(de)(de)(de)(de)(de)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju),我(wo)們(men)不(bu)(bu)(bu)(bu)再有(you)任何(he)其(qi)他利用的(de)(de)(de)(de)(de)(de)需(xu)求,那么(me),我(wo)可以(yi)接受它不(bu)(bu)(bu)(bu)是大(da)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)這(zhe)個(ge)觀點。然而,只要(yao)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)在(zai)這(zhe)里,會(hui)不(bu)(bu)(bu)(bu)再利用嗎(ma)?會(hui)沒有(you)新的(de)(de)(de)(de)(de)(de)、顛(dian)覆性的(de)(de)(de)(de)(de)(de)應(ying)(ying)用需(xu)要(yao)嗎(ma)?今天(tian)我(wo)們(men)習以(yi)為(wei)常的(de)(de)(de)(de)(de)(de)東西在(zai)昨(zuo)天(tian)還不(bu)(bu)(bu)(bu)曾出(chu)現,明天(tian)的(de)(de)(de)(de)(de)(de)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)分(fen)析(xi)方(fang)式(shi)會(hui)受制于你今天(tian)設計的(de)(de)(de)(de)(de)(de)所(suo)謂優(you)秀的(de)(de)(de)(de)(de)(de)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)結構嗎(ma)?是不(bu)(bu)(bu)(bu)是大(da)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju),與數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)無關、與系(xi)(xi)統(tong)(tong)(tong)無關、與數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)的(de)(de)(de)(de)(de)(de)生成(cheng)方(fang)式(shi)無關。區分(fen)大(da)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)和非大(da)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)其(qi)實反映(ying)的(de)(de)(de)(de)(de)(de)是利用數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)能(neng)力與方(fang)法。
大數(shu)據(ju)作為(wei)一個(ge)名詞代表(biao)的(de)(de)內(nei)容及(ji)(ji)其豐富(fu)廣(guang)泛,它既包(bao)含宏觀(guan)層面的(de)(de)趨勢、政策(ce)等內(nei)容,同時也包(bao)含具體的(de)(de)技(ji)術、方法以及(ji)(ji)觀(guan)念的(de)(de)創新。行業內(nei)的(de)(de)討論多(duo)集(ji)中在(zai)趨勢、政策(ce)和對未來應用模式的(de)(de)憧憬上,很少就具體技(ji)術、實(shi)現、方法進(jin)行有深度(du)的(de)(de)探(tan)討,對業內(nei)有影(ying)響的(de)(de)案例缺乏又深度(du)的(de)(de)分析,例如(ru),圍繞人民醫院數(shu)據(ju)中心實(shi)現,在(zai)技(ji)術上有哪些成功的(de)(de)創造(zao)性(xing)方法?有哪些不足(zu)可(ke)以改進(jin)?甚至具體技(ji)術細節、遇(yu)到(dao)的(de)(de)問題等等。
上一篇: 移動醫療變革未來醫療服務模式