“大数据”“机器学习”“深度学习”“人工智能”……近几年这些“高科技”词汇遍布互联网。
大数据,顾名思义,数据很多。多少算多?在统计学上的意义,超过1000条数据就可以算大数据。 IBM公司的5V理论:Volume(数据量大)、Velocity(数据产生速度快)、Variety(数据类型多样)、Value(数据价值高但是密度低)、Veracity(数据真实性)。[1] 用简单的话说就是,单条数据看不出来是什么意思。但是将很多真实的不同类型的数据放在一起,经过分析处理之后,能够得到一些更高价值的信息。比如,一个贫血患者的血液检查,在没有任何标准的情况下,我们看不出来任何的问题。但是把这位患者的数据和非常多的健康人的数据、其他有贫血症状的患者的数据放在一起。经过统计学分析,我们就会发现,所有贫血患者的血红蛋白数和同龄同性别的健康人群比较,偏低了。然后我们就把血红蛋白数这个血液指标和贫血联系在了一起。 有学者认为医疗大数据主要包含4个方面:(1)以电子病历(electronic medical record, EMR)、医学影像信息为主的临床大数据;(2)可穿戴设备或社交媒体采集健康相关行为产生的健康大数据;(3)临床试验、基础医学实验产生的生物大数据;(4)医疗机构、医疗保险机构等产生的运营大数据 [2] 。简单来说,所有能采集到的,和人相关的数据都可以用来做肿瘤研究的大数据。比如:性别,年龄,身高体重,家族遗传病,生活饮食习惯,居住环境,血压,睡眠情况……再专业一些的数据:血常规,基因数据,蛋白质数据,由各种影像数据(彩超、核磁共振、CT等)得到的肿瘤的大小、位置等数据…… 现在我们看病,医生一般会让我们进行各种检查。其实就是在收集我们身体的数据,然后对病进行诊断。什么指标代表什么病,这些标准都是经过医学发展这么多年的积累,由大数据得出的。虽然原来没有计算机的帮助,但是每个医生都通过自己的经验,在脑子里潜移默化的对这些数据进行归类。中医也是一样,什么样的脉象、舌苔、症状代表什么体质,需要用什么药材。 现代医疗的发展越来越重视病人的医疗档案,这些数据不仅能够帮助医生诊断和治疗,还都是非常宝贵的科研资料。专业的数据分析人员可以利用这些数据,寻找性价比更高更合适的诊断疾病的指标,找到缓解症状的新药物,发现治疗疾病的新方法。总之,大数据分析能够让更多疾病被及时的发现,及时的治疗,恢复期更短,使用更少医疗的成本。 每个病人都有自己的病历,化验单,这些数据常年累月的积累,都是宝贵的健康大数据。有些人会特意记录自己的各种生活指标,比如身高体重,喝水,饮食,心情,睡眠,运动,心率,血压,排便,用药,生理期……这些数据积累起来都是非常有价值的数据。当身体出现问题,回看自己前段时间的生活情况,基本上是有迹可循的,自己就可以得出一些结论。及时调整不良的习惯,对个人的健康状况是非常有益的。有些人觉得记录这些数据很麻烦,即使记录了,自己也不会分析。其实我们可以依靠智能手机、智能手表,来帮助我们对自己的健康进行管理。目前最前沿的智能手表可以实时监测我们的心率、血氧、血压、运动情况,及时提醒我们喝水,运动,不要久坐等等。现在有很多手机app也可以帮助我们记录自己的各种习惯,让我们更好的了解自己身体的数据。一些比较专业的app还可以帮助我们统计分析数据,给我们一些生活上的建议,可以算的上是智能的家庭健康管家了。
未来 大数据肯定是会深入生活的方方面面 希望所有人都能受益于这项新技术 拥有健康的身体 不再经受疾病的折磨
参考文献: