下载PDF
Pachyderm > 实例探究 > 顶级医疗保健提供商利用 Pachyderm 可扩展的数据驱动机器学习管道,从海量临床数据中获取切实可行的医疗见解
Pachyderm Logo

Top Healthcare Provider Derives Actionable Medical Insights from Terabytes of Clinical Data Using Pachyderm’s Scalable, Data-Driven Machine Learning Pipelines

技术
  • 分析与建模 - 机器学习
  • 分析与建模 - 大数据分析
适用行业
  • 医疗保健和医院
适用功能
  • 产品研发
用例
  • 预测性维护
  • 远程资产管理
服务
  • 数据科学服务
挑战
美国顶级营利性托管医疗服务提供商之一,其附属计划覆盖八分之一的美国人,希望利用人工智能 (AI) 获取长期洞察,并从索赔和电子健康记录数据中做出更详细的健康预测。其数据存储量非常庞大,超过 50 TB 的数据覆盖了该公司在全美数千万会员。他们正在挖掘这些数据,以根据特定患者特征的过往结果确定治疗效果。但是,将这些潜在的洞察交到医疗服务提供商手中是一项挑战。在实验室中进行小规模实施是一回事,大规模提供机器学习则是另一回事。当工程主管加入 AI 团队时,他们拥有一个基于 Apache Airflow 的非常复杂的数据传输管道。虽然它可以运行,但它一次只能扩展到一个管道或容器实例之外。
关于客户
该客户是美国顶级营利性医疗管理提供商之一,其附属计划覆盖了八分之一的美国人的医疗服务。他们的使命是成为医疗福利领域最具创新性、最有价值和最具包容性的合作伙伴。该公司拥有一支专门的人工智能团队,他们希望利用尖端人工智能来获取长期见解,并从索赔和电子健康记录数据中做出更详细的健康预测。数据存储库非常庞大,拥有超过 50 TB 的数据,涵盖了该公司在美国各地的数千万会员。他们正在挖掘这些数据,根据特定患者特征的过去结果来确定治疗效果。
解决方案
该医疗保健提供商转向了 Pachyderm,这是一个数据层,它允许机器学习团队将其 ML 生命周期投入生产并进行扩展。借助 Pachyderm 业界领先的数据版本控制、管道和谱系,团队可以获得数据驱动的自动化、PB 级可扩展性和端到端可重复性。Pachyderm 提供了高效扩展 AI 团队的 ML 处理所需的并行性和数据处理能力。重要的是,虽然该公司拥有数百万条患者记录,但在任何给定时间只有一小部分是相关的,而 Pachyderm 的增量性通过仅处理发生变化的数据子集而不是整个患者群体,节省了大量的时间、金钱和资源。借助 Pachyderm,团队能够任意划分表数据以仅捕获单个成员的事件 - 有效地创建封装特定成员所有事件的单个成员对象。Pachyderm 不仅并行处理这些记录,还自动仅处理包含新信息的记录,从而在降低成本的同时提高规模和速度。
运营影响
  • Shrinks processing and storage requirements 90% by only processing new or changed data
  • Increases scalability and speed by processing individual files in parallel
  • Simplifies reproducibility through data versioning and immutable data lineage
数量效益
  • Significant improvement in processing efficiency
  • Reduced costs due to efficient data processing
  • Increased speed of data processing

相关案例.

联系我们

欢迎与我们交流!

* Required
* Required
* Required
* Invalid email address
提交此表单,即表示您同意 IoT ONE 可以与您联系并分享洞察和营销信息。
不,谢谢,我不想收到来自 IoT ONE 的任何营销电子邮件。
提交

Thank you for your message!
We will contact you soon.