AI在医学上的七大应用领域
众所周知,高质量的数据是AI引擎的宝贵助力。而医疗健康行业则是一座数据的金矿。
在我们亮剑会中就有有心人花费几年时间建立了北美所有保健营养品的数据资料。
据麦肯锡估计,制药和医疗方面的大数据和机器学习每年可以产生高达1000亿美元的价值。
这些价值来源于:更好的决策,优化创新,提高研究/临床试验的效率,以及为医生,病人和医疗机构创造新的诊疗手段等等。
医疗数据的来源形形色色,比如研发机构,医师,诊所,病人等等; 如何能从这些不同来源的数据中提炼出真正能用于改进医疗手段的有用信息极为重要。
因此,当今医疗AI的核心问题是通过有效收集和运用大量不同类型数据,进而找到更好的个性化分析,预防和治疗方案。
机器学习目前在制药和医疗领域突飞猛进。本文简要介绍七个开创性的应用领域以抛砖引玉。
1 - 疾病诊断
疾病的识别诊断一直是医学研究的前沿。根据美国药物研究与制造商发布的2015年报告,有800多种药物和疫苗用于治疗癌症。
奈特(Knight)研究所研究员杰夫·特纳(Jeff Tyner)在接受彭博科技(Bloomberg)采访时表示,虽然这令人兴奋,但还是不容易找到行之有效的方法来处理所有数据结果。
Tyner表示:“生物学家与计算机专家合作非常重要。”
毫不奇怪,一些大公司已经开始这方面的研究布局,特别是在像癌症识别和治疗这样的重要领域。
2011年10月,IBM沃森健康公司(Watson Health)宣布与沃森基因组学公司(IBM Watson Genomics)合作,该计划旨在通过集成认知计算和基因组肿瘤测序,推动精密医学领域发展。
总部位于波士顿的生物制药公司Berg正在使用AI来研究包括肿瘤学在内的多个领域的诊断和治疗。
目前正在进行的研究项目包括静脉内肿瘤治疗的剂量试验和前列腺癌检测和后续管理。
其他主要的例子包括谷歌的DeepMind Health,去年宣布与英国的多家合作伙伴关系,包括伦敦的Moorfields眼科医院,他们正在开发技术来解决老化眼睛黄斑变性的问题。
图片来源:Google DeepMind Health - 对团队成员之一进行OCT扫描
在脑部疾病如抑郁症等领域,牛津的“抑郁症预防及应对”(PReDicT)项目正在使用预测分析来帮助诊断并提供治疗,他们的总体目标是研发一组情绪测试问卷调查用于临床。
2 - 个性化医学
个性化医学或基于个人健康数据的预测分析也是当前一个热点研究领域。
该领域目前大多采用监督学习(Supervised Learning),这让医生们可以从更有限的诊断集中进行选择,或者基于症状和遗传信息来估计患者风险。
IBM沃森研究中心肿瘤学部门和斯隆凯特林纪念医院目前在该领域处于领先地位。他们致力于使用患者医疗信息和诊疗历史来选择最优治疗方案。
在接下来的十年中,我们将会看到微生物传感设备以及具有更复杂的健康测量和远程监控功能的移动APP的广泛使用,这将带来可用于帮助促进研发和治疗功效的大量数据。
这种个性化治疗有益于帮助提高健康,并最终降低总体医疗成本。
3 - 药物研究/制造
在初步(早期)药物设计中使用机器学习具有巨大潜力,从药物化合物的初步筛选到基于个体因素的药物有效性预测,以及一系列新技术,如下一代测序等。
精准药物医学是这一领域的前沿。这涉及确定“多因素”疾病的机制,或者寻找替代治疗等等。
很多这方面研究涉及无监督的学习,目前很大程度上我们仍然局限于识别数据模式(而非预测)。
A:监督和无监督学习问题的矩阵表示
B:决策树将特征映射到结果
C:神经网络基于特征的变换来预测结果
D:最近邻算法 - 基于最相似训练样本值的分类器
该领域的主要开拓者包括MIT临床机器学习小组。
其精密医学研究侧重于开发算法,以更好地了解疾病过程并设计有效治疗2型糖尿病等疾病。
微软的汉诺威项目正在多个计划中使用ML技术,其中包括与奈特癌症研究所合作开发用于癌症精准治疗的AI技术,目前着眼于开发治疗个性化急性骨髓性白血病(AML)的药物组合。
英国皇家学会还指出,药物研究中运用ML已经成熟。
来自实验或制造过程的数据有可能帮助制药厂商减少生产药物所需的时间,从而降低成本并提高重复率。
4 - 临床试验研究
机器学习可以用来指导临床试验研究。应用高级预测分析,我们可以利用比目前更广泛的数据,例如社会媒体和医生门诊记录,以及在针对特定人群时的遗传信息来确定临床试验候选人; 这一切将使得临床实验更小,更快,更便宜。
ML还可用于远程监控,例如,监测患者体征以发现任何人身伤害或死亡的迹象。
据麦肯锡称,ML可以帮助提高临床试验效率,包括找到最佳样本大小; 适应患者个体差异; 以及使用电子医疗记录来减少数据错误(例如重复输入)。
5 - 放射学和放射治疗
在2016年10月的“统计新闻”采访中,哈佛医学院助理教授Ziad Obermeyer博士说:“20年后,放射科医生将不复存在。他们可能看起来更像是人和机器的混合体:应用ML算法每分钟他们可以读取数千个病例。”
目前,Google的DeepMind Health正在与伦敦大学学院(UCLH)合作开发能够检测健康和癌组织差异的ML算法帮助改善放射治疗。
图片来源:Google DeepMind健康 - 放射治疗计划
DeepMind和UCLH正在努力应用ML,以加快癌组织分割过程(确保没有健康的结构受损)并提高放射治疗的准确性。
6 - 智能电子健康记录
使用支持向量机(SVM)进行文本分类(例如通过电子邮件来对患者查询进行排序)以及光学字符识别(或OCR,将草图手写转换为数字化字符)都是成熟的ML应用。
这将有助于推动电子健康的收集和数字化。 这方面的工作包括MATLAB的ML手写识别技术和Google用于OCR的Cloud Vision API。
图片:MATLAB - 手写字符识别
MIT临床机器学习小组正在推动下一代智能电子健康记录的发展,他们使用内置的ML算法来帮助诊断,临床决策和提供个性化治疗建议。
MIT在其网站上写道:“我们需要强大,安全及可解释的ML算法。它可以从小规模的标注训练集中学习,并支持自然语言交互,从而可推广至大量医疗机构。
7 - 疫情爆发预测
根据从卫星收集的数据,网络上的历史信息,实时社交媒体更新等等,ML和AI技术也被应用于监测并预测世界各地的疫情爆发。
目前已有基于支持向量机(SVM)和人工神经网络(ANN)的模型来预测疟疾疫情。
采用的数据包括温度,月平均降雨量,阳性病例总数等等。
疫情预测在第三世界国家尤其迫切。这些国家往往缺乏医疗基础设施,教育途径和及时治疗机会。
ProMED是一个基于互联网的邮件系统以用于监测新出现的疾病并实时提供疫情报告:
图片来源:Going International
利用ProMED报告和其他开采的媒体数据,HealthMap组织使用自动分类和可视化来帮助监控和提供任何国家的疾病爆发警报。
图片来源:CDC - HealthMap报告用于跟踪和预测登革热病毒爆发
有待克服的障碍
在将ML技术应用于制药和医疗的这场竞赛中,还有如下待解决的挑战:
- 数据整合是目前最为紧迫的问题之一。医疗数据仍然是敏感的个人隐私。一向以来我们认为大多数公众会担心医疗数据中的隐私问题。有趣的是,2016年3月份的Wellcome基金会对英国公众的调查发现,只有17%的受访者明确表示不同意将他们的匿名数据提供给第三方进行研究。为满足严格的药物开发规定我们需要算法更透明;人们需要能够透过“黑盒”来理解算法结论背后的推理过程。
- 招聘数据科学人才,建立健全的数据科学流程。
- 打破“数据孤岛”并真正建立以数据为中心的观点。横跨部门领域至关重要,我们需要以积极推动行业的心态,看到大数据机器学习这一趋势的长期价值。
- 作为实现这一切的第一步,我们需要对目前数据库中分散凌乱的电子记录进行整合。