研究者提出的科学问题:
研究者提供的数据:
来自9个国家的医院电子医疗记录(EHR)数据,数据格式和处理情况各不相同。
我们的服务:采用自动化LytiX系统,我们完成了以下工作:
注: 在最新的LytiX系统中,我们在报告撰写功能中加入了背景大纲、简要讨论和写作建议,为研究者提供更全面的指导,帮助他们更好地完成论文写作。
交付成果:
各国医院的病历系统差异巨大,原始数据集高度复杂。尽管研究者已请求各地医院的数据中心协助清洗数据,但受限于人力时间等,大部分医院仅将粗略处理甚至是原始数据发送过来。
首先需要根据研究设计,对不同医院的原始数据进行清洗,整理,并中提取出有用的信息。这项工作极其繁琐,人工无法胜任。即使经验丰富、编码能力强的数据科学家,也需要2-3周才能完成。再加上后续的统计分析和论文撰写,从获取数据到完成论文初稿,保守估计需要2个月。而我们的系统可快速解析数据,1-3天内(包含完善时间)即可完成分析报告。在此基础上,完成论文初稿仅用不到2周,极大地节省了时间和人力成本。
我们交付分析结果,分析报告,全部分析代码(包括数据预处理和分析代码),以确保结果准确,透明,可重复。
研究者在人工抽查核实数据清洗结果并复现分析结果后,自主撰写了研究论文,并成功发表于儿科学顶刊《JAMA Pediatrics》。