Business School
商学院
手机:13521943680
电话:010-62904558
你想知道 在每个行业中,公司都在投资资源以收集越来越多的数据。我们将传感器放置在所有物体上仅仅是因为我们可以并且坦率地说,它并不是全部必需或有用的。----莫森•巴亚提(Mohsen Bayati)
在卫生保健或企业中获得更多信息并不一定会更好。
数十年来,心脏病和糖尿病等慢性病一直在上升。它们是当今美国导致死亡和残疾的第一大原因,也是医疗保健费用无法控制的原因之一。
因此,在患病之前确定患有慢性病风险的人很有意义。至少,早期干预通常可以减慢疾病的发展速度并改善患者的生活质量,从而有可能节省数十亿美元的医疗费用。
这就是为什么许多雇主(根据RAND报告的数据,约50%)赞助商为其员工制定健康计划的原因。除体育馆折扣外,这些计划通常还包括以实验室测试形式进行的健康风险评估,用于计算每个人常见疾病的危险因素。然后为处于危险中的人提供额外的预防保健和监督。
斯坦福大学商学院运营,信息与技术副教授Mohsen Bayati说,不幸的是,预期的收益并不总是能实现。几项研究发现,这样的程序最终会花费比所节省的更多的钱。他说,一个可能的原因是风险评估本身并不十分准确。
巴亚蒂说:“如果您错误地将某人认定为高风险,即所谓的“误报”,则您将为不必要的服务付费。“而且,如果您想念一个真正处于危险之中的人-一个假阴性,那么将来您仍然会受到巨额医疗费用的打击。”
他说,一种解决方案是运行更复杂的测试小组。但这也会增加成本。“实验室测试很昂贵。公司正在为很多员工做这件事,因此他们只考虑了相当少的一组标准生物标志物。然后,检测能力不是很强。”
巴亚蒂说,相反,使这些预防计划起作用的关键是改善生物标志物的选择。但是,你是怎么做的?更严格地说:如何选择最少的标记物,以最大程度地诊断各种疾病?
这是Bayati在最近的一篇论文中解决的难题,他与斯坦福大学的两位同事合着了该书:前斯坦福大学研究助理,现任Netflix数据科学家的Sonia Bhaskar博士,以及统计学和电气工程学教授Andrea Montanari。他们使用机器学习领域的一些技术柔术,开发了一种可用于任何目标疾病或计划预算水平的方法。
当他们在大约75,000名患者的病历上对其进行测试时,他们发现它可以预测出九种严重疾病,且出乎意料的准确性。“我们感到惊讶,”巴亚蒂说。与对生物标志物数量没有限制的假想的凯迪拉克护理评估相比,它们的成本要低得多,但具有几乎相同的预测能力。
在这个大数据时代,也许这里有一个一般的教训。“你一定想知道,” Bayati沉思。“在每个行业中,公司都在投入资源来收集越来越多的数据。我们在所有事物上都安装了传感器,只是因为我们可以并且坦率地说,它并不是全部必要或有用。”
太多的信息
传统上,通过单独找出每种疾病的最佳标记并将其添加到列表中来设计健康风险评估。Bayati说:“医院通过先进的统计数据和现在的AI在如何识别生物标志物方面变得越来越复杂。” “但是一次都病了。”
他说,您可能可以通过这种方式建立有效的测试小组,但是这将需要太多的生物标记物。因此,在实践中会做出妥协,而准确性会下降。相反,Bayati和他的同事在分析中增加了第二步:“我们说,让我们从完整的清单开始,然后看看我们是否可以通过更好的方式简化它,以最大程度地减少诊断能力的损失。”
为此,他们借鉴了机器学习中使用的高维统计中的一些技术。“基本问题是,如果您有太多信息,如何将其缩小为最有用的较小信息集?您如何缩小数据集的尺寸?”
涉及数学,但基本上,解决“ TMI”问题的关键是共同优化生物标志物的选择。与其分别找到每种疾病的最佳选择,不如先确定想要多少种生物标记物(研究人员确定30种),然后一次对所有疾病组合的所有可能组合最大化预测能力。
该模型之所以有效,是因为许多生物标记物发出了不止一种疾病的信号。例如,高血糖可能是糖尿病的征兆,但也可能是肾脏疾病,肝脏疾病或心脏病的征兆。碱性磷酸酶水平异常与心脏病,肝病和癌症有关。“如果您的选择过程没有考虑到这些重叠部分,那么您将丢掉信息,” Bayati说。
目标无极限
Bayati和他的同事们概述的方法的强大之处在于,它可以被用来一次实现多个目标。在健康风险评估中,更重要的是:准确性或成本?两者都可以。我们要预测阿尔茨海默氏病或动脉疾病吗?是的。
“目标数量没有限制,” Bayati说。“您可以列出要优化的20、30、100个目标。然后您可以缩小需要收集的信息的范围,因为在某些时候,添加目标不需要额外的数据。”
如果它有助于兑现公司健康计划的承诺,那么这对医疗保健来说意义重大。但是,这种方法也可以用于改善一系列业务和公共政策运营。巴亚蒂说,至关重要的是要明确目标。计算机可以进行分析,但是人类必须告诉他们要优化什么。
他认为,这是迈出的一步,公司常常掩饰不住。“有时候,似乎公司只是在急于积累数据并在以后提出问题。但是更多的信息并不一定会更好。重要的是知道要看什么。我们的论文是朝这个方向迈出的一步。”