人命关天 医疗大数据吹不得

简介:

大数据行业中,最不允许吹牛的一定是医疗大数据。大数据行业在近两年迎来了爆发,由于发展时间较短,因而可能出现靠吹牛发展客户等衍生问题。考虑到医疗行业本身具有的严谨性和复杂性,医疗大数据内忧外患之下更不容吹。

人命关天 医疗大数据吹不得

  医疗大数据很特殊

医疗大数据是大数据的一种。第三方机构预计到2020年医疗数据量将达到40万亿GB,是2010年的30倍,数据生成和增长速度还将不断加快。相应的,市场竞争的激烈可能产生靠放卫星而竞争的现象,这是医疗大数据最忌讳的情况。

一般认为无法使用传统工具统计、存储或者处理的大量数据集被称为大数据。大数据的价值并不在数据本身,而是通过处理分析后得出的新的理论。通常来讲,大数据可视化之前的一系列采集、传输、分析和处理过程都不会被展示,单纯以大数据成果的方式进行展现会引发用户对数据理解的不够彻底,从而产生误读。

人命关天 医疗大数据吹不得

  医疗行业的大数据必须务实

这种误读在其他行业或许并不会产生太大的实质性影响,可是在医疗行业是绝对不允许存在的。由于生命的神圣性所在,医疗大数据必须务实。例如不久前所一滴血可以鉴定癌症的传言,消息一出多少人认为人类大敌有望攻克,可当谣言被揭穿能剩下的就只有信任的离去。

医疗数据方面,可获取的健康医疗数据很多,数据规模也很大,部分数据存在描述不规范或者展现方式特殊等问题。一些数据交由计算机很难进行相应的预测分析,甚至连统计工作都难以完成,这种难以用于计算的数据价值低且不易处理。只有将文本数据转换为数据库表、关系图以及数值型向量时才可以方便于大数据计算。

真假医疗大数据

医疗大数据经常会出现采集样本重复、存储数据过时以及个体偏差影响分析结果等问题,而这就会使得数据的准确性出现问题。除此之外,医疗大数据的采集一般来自于实际医疗案例之中。大数据想要发挥其优势需要保障数据量的大,而医疗活动中一个部门的医治手段往往趋于单一化,而从中获取医疗突破的可能性大幅下降。而解决这一问题的最佳方案应当采用多源同类数据,寻求不同治疗方案以及不同效果。

人命关天 医疗大数据吹不得

  医疗数据去伪存真是个大工程

由于医疗行业的特殊性,医疗领域可划分的范围较广,甚至对病人的看法也可以从多个角度不同方向进行剖析,就像中国本土的中西医之争对病情的解决手段就有着不同方式,而人体具有的特殊性进一步加深了这种差异化问题。不同人群对同一种方式的治疗却可能产生不同结果,使得医疗行业很难达成统一标准。

因此,医疗数据面临执行标准不统一以及医生对于病症描述程度不同的问题,想要解决同一病症需要先进行大量个性化语句的统一梳理以达到最终归一化的目标,才可能完成医疗数据的去伪存真而获得真正的医疗大数据。

人命关天 医疗大数据吹不得

  IBM Watson的医疗应用初见成效

医疗大数据在后续的数据分析之中也会存在一些问题,比如部分数据尽管可以获取治疗方案、治疗效果等来制造模型,可是当应用于机器学习后,医疗数据的标准不一可能会引发偏差。就算是目前已经进入商用阶段的IBM Watson,在最初阶段也是通过与医院紧密合作,用了几年时间来帮助Watson去除数据杂质,训练分析能力。尽管目前Watson已开始在全球很多医院中开始使用,但在收集、存储、统计到分析处理还面临诸多挑战,医疗大数据的应用和研发依然渴望新的突破。

医疗大数据需稳中求进

云计算和大数据行业的技术革新速度十分惊人,在医疗大数据领域也是如此,尽管最近几年有了诸多突破,但在火热的背后依然需要强调的是安全至上。

众所周知,大数据从采集到分析再到呈现结果这一过程需要需要解决一系列的问题,比如利用统计分析、知识推理、机器学习等建立模型,而医疗大数据时还需要应对知识图谱的建立以及碎片化问题。只有将图谱和深度学习完美结合才能形成靠谱的决策模型。

人命关天 医疗大数据吹不得

  医疗大数据还面临诸多挑战

在这一复杂的过程之中,医疗大数据面临的压力与挑战远远超过其他行业。因为医疗是关乎生命的话题,生命的重量注定让医疗大数据不可能大跃进式的发展,而是只能一稳再稳。医疗大数据需要回归其工具的本质,成为医生的助手,而不是成为一种营销的噱头。

我国的医疗在不断进步,可是近年来所暴露出的问题多少对医患双方造成了影响。医疗大数据作为我国医疗改革的重头戏之一,一定要严谨而行。医疗大数据,容不得吹牛。

本文转自d1net(转载)

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
存储 关系型数据库 测试技术
印尼医疗龙头企业Halodoc的数据平台转型之Lakehouse架构
印尼医疗龙头企业Halodoc的数据平台转型之Lakehouse架构
35 4
|
3月前
|
大数据
大数据在医疗领域的应用有哪些?请举例说明。
大数据在医疗领域的应用有哪些?请举例说明。
49 0
|
大数据
《从数据治理看医疗大数据的发展》电子版地址
从数据治理看医疗大数据的发展
90 0
《从数据治理看医疗大数据的发展》电子版地址
|
SQL 存储 分布式计算
Apache Hudi在医疗大数据中的应用
本篇文章主要介绍Hudi在医疗大数据中的应用,主要分为5个部分进行介绍:1. 建设背景,2. 为什么选择Hudi,3. Hudi数据同步,4. 存储类型选择及查询优化,5. 未来发展与思考。
304 0
Apache Hudi在医疗大数据中的应用
|
机器学习/深度学习 存储 人工智能
后疫情时代的城市医疗大数据,需要怎样的建设“方法论”?
找准自身定位,医疗大数据产业的上下游企业将大有可为。城市级健康医疗大数据体系建设,是一个很宏大的命题。
|
数据采集 数据可视化 大数据
智慧医疗大数据解决方案
随着医院信息化建设不断发展,医疗数据规模日益增长,医疗服务全面进入“大数据时代”。
2884 0
智慧医疗大数据解决方案
|
人工智能 安全 大数据
医疗行业正从大数据中汲取回报的六个途径
科技总是源源不断地改变着世界,人工智能和大数据正在结合起来,为人们提供各种好处,其中应用最广泛的可能要数医疗行业了。
|
存储 分布式计算 大数据
湖北Hadoop,基于大数据的医疗行业发展,解析大数据技术在医疗领域的应用及使用方法
健康医疗大数据作为国家重要的基础性战略资源,也受到了政企、医院等行业相关人员的高度重视。如何让医疗行业及领域去便捷管理和使用海量的大数据?
1381 0