在海量数据集上训练的大型语言模型可以加速基因组学研究、简化临床文档、改进实时诊断、支持临床决策、加速药物发现,甚至生成合成数据来推进实验。
但他们改变生物医学研究的承诺常常遇到瓶颈:除了医疗保健所依赖的结构化数据之外,这些模型在罕见疾病和异常情况等边缘情况下举步维艰,因为这些情况下可靠的、有代表性的数据稀缺。
总部位于纽约的 Mantis Biotech 声称正在开发解决方案来填补这一数据可用性缺口。
该公司的平台集成了不同的数据源来制作合成数据集,可用于构建所谓的人体“数字双胞胎”:基于物理学的解剖学、生理学和行为的预测模型。
该公司正在推销这些数字孪生用于数据聚合和分析。
为了构建这些双胞胎,Mantis 的平台首先从各种来源获取数据,例如教科书、动作捕捉相机、生物识别传感器、训练日志和医学成像。
来源:TechCrunch











