医学统计学与软件实现
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第四节 数据质量控制技术

质量控制(quality control)就是运用先进的科学技术和统计方法控制科学实验及其过程,使获得的结果符合事先设计的标准,同时实验数据真实可靠。质量控制包括两个阶段,即实验前条件控制和实验过程中状态监测。实验前条件控制是指在实验开始之前,要确保可能影响实验结果的各种实验条件符合要求,它是质量控制的基本要求,主要有四个方面:①受试者的入选标准和排除标准;②实验操作人员技术能力的合格要求;③仪器设备、实验材料和试剂等规格统一并合格;④良好的实验室操作和测量操作规范。实验过程中状态的控制是指在实验过程中,定期或随机地抽查样品,测量其观察数据,考查其真实性、准确性和可靠性,以及其变化是否超过允许的差异波动范围。要确保良好的实验数据质量,一方面对参加研究人员必须进行培训,使他们能够掌握并应用统一的诊断标准、测量方法和实验操作技术,使得不同操作者对同一个样品观察结果一致等,另一方面要明确规定对测量指标的要求,如数据的分布类型、变化范围、数据间的逻辑关系、数据的可靠性与稳定性。此外,还需要考虑是否存在偏倚、混杂因素、数据缺失等。

在医学研究中,要得到高质量的数据,必须在人力与物力上得到保证,整个研究涉及四方面的人员:临床研究人员、质量监察员、数据管理员和数据分析人员,不同的人员有各自的职责与分工。临床研究人员确保研究数据获取的真实性和准确性,质量监察员监控整个研究中的各个环节,记录研究过程中发生的各种情况,防止数据丢失、遗漏、失真等,质量监察员还要搜集、核对、传递数据,是研究者和数据管理员信息交流的桥梁。数据管理员负责将原始数据录入计算机中,并进行加工,整理成统计人员可以分析的数据。数据分析人员将得到的数据进行统计分析,得到科学的结果。

数据检查很重要,可以采用计算机技术和人工两种方式。在录入数据后,便可进行数据检查及确认,这一工作通常建立在详细分析观测记录表及录入指南的基础之上。首先,需建立有关细节的确认计划,然后编写相应的程序,得到需确认问题的清单,以此清单为基础,必要时结合原始记录的核查,整理产生关于数据的疑问表。疑问表将由临床监察员交研究者进行核查、确认或更正,然后仍由临床监察员返回给数据管理员,根据数据确认的结果对数据库进行修改与更新。此过程循环往复,直至所有疑问均得到明确的答复。

在先进的数据库软件平台上,以上过程还可得到简化,如将可预见的问题设计到录入程序中,这样在录入的同时即可产生疑问表,这种情况在网络背景下由研究者直接录入数据时具有更加明显的优势。当数据确认与数据库修正工作完成后,即基本排除了数据录入错误及逻辑错误。但正如前面所述,这些工作并不能完全保证数据的准确性,进行进一步的质控检查仍然很有必要。每个医学研究项目均应有专职监察员,负责核对数据收集数量和质量,及时补漏纠错,记录负责人和资料管理人员应积极配合监察员,共同对数据收集者的工作定期进行监督和检查。质控检查通常以书面形式,在预先设定的质量标准指导下进行。质控检查并不仅仅是数据管理部门的任务与责任,同样也有申办方的任务与责任。数据质量控制技术包括如下几个方面:

(1)观念上重视实验质量:

主要负责人必须高度重视数据质量,树立过程质量管理的概念,制定严格的操作规程。同时,对科研课题验收也必须考查其实验质量问题。

(2)人员培训与组织:

对于一项大型科研课题,应有专门负责的质量监查员、数据管理员、数据录入人员,并对他们进行相应的培训;在正式开始之前,要在小范围内做预实验,预实验的方式应与正式实验的方式相同,目的在于检验实验的实用性和可行性,并通过预实验反馈的信息作必要的修改。只有当预实验成功后,才能进行正式实验。研究的组织计划包括:组织领导、宣传动员、时间进度、人员培训、任务分工与联系、经费预算、质量控制方案以及宣传资料的准备等。

(3)观察过程控制:

数据收集前要求对每个被观察对象建立观察时间表;明确观测记录表格的填写方式,在观察的同时进行;要求做到全部观察项目都获取数据;临床观测记录表数据全部收集后,应由数据管理人员对观测记录表格数据的一般情况、相关项目的一般逻辑关系和资料完整性进行检查。如有错漏,应及时与监察员或临床观察医生或数据收集者联系,返回修正或补填。

(4)数据的核查:

对重要的指标要进行普查,其他数据进行抽样调查。临床观测记录表格数据的录入要遵守数据独立双份录入原则及修正原则,录入方式主要有二次录入、校对录入和自动扫描录入。然后存入数据库的过程,需采用特制的观测记录表格收集数据,表格填写也有一定的规定。

(5)校对与质疑:

录入的数据应进行复查以了解全面的录入质量,尽量防止录入错误。双份独立录入,编写程序对数据库中的数据进行一致性检查,生成核查表,校对、修改直至两个库完全相同;利用专业知识对各变量的可能取值范围及他们之间的逻辑关系进行核查;做简单的描述性统计,分析变量的频数分布表、最大值、最小值、百分位数、茎叶图、盒形图等以发现异常值;列出存在问题的观测记录表格清单,如属于原始数据的问题应返回给临床医师或数据收集者进行查对;根据返回的核查表进行相应的修改,及时清理数据疑问。

(6)数据锁定与保存:

在完成核查后,监察员应将填写完整、准确的观测记录表及时送交数据管理员。数据收集过程与数据整理及核查是互动的过程,应边收集、边整理、边核查、边录入,但目前多数医学研究无法做到真正的动态管理,大都在数据收集完毕后,再实现将纸张资料转为数字资料。数据管理工作体现在几个方面,一是纸张性资料的最后整理与核查,二是纸张性资料的编码和录入,三是录入计算机后数据的管理与核查,工作主要由监察员、数据管理员、录入员完成。在数据质控检查通过后,可基本确认数据准确可用,将在此基础上进行数据审核与锁定,这两项工作均直接为统计分析服务。数据审核的任务是对数据进行最后的检查,一方面确认数据管理的可靠性,另一方面,也是更重要的一方面,是对数据中存在的一些可能影响统计分析结果的数据作出决定。如临床试验中,判断哪些病例符合方案要求,进入符合方案(per-protocol,PP)数据集进行分析,哪些进入意向(intention to treat,ITT)数据集进行分析。数据审核通常需召开一次会议,由申办方研究负责人、主要研究者、负责研究项目的统计学家或统计学人员、数据管理员、临床监察员共同参加,所形成的结论也由以上人员共同负责。数据审核过程中,当然还有可能提出一些事先未考虑到的问题,要针对这些问题给出处理意见,如再次发出疑问表、进行约定或根据已有信息作出判断等。在数据审核会议上,还有另外一项重要的工作,就是讨论并最终确定统计分析计划。因为在此之前制定的统计分析计划中可能有部分内容不能被很好地实现,此时必须进行调整。当所有疑问均已解决、对数据的判断全部完成、统计分析计划也已签署后,数据即可锁定,锁定后的数据交统计分析者进行编程分析。原则上,锁定后的数据将不再更改,除非一些非常明确的证据表明数据中存在错误而且将明显影响分析结果。即使如此,锁定后的开锁也应遵循非常严格的认可程序,以防引入人为的偏差,这一点在盲法试验中更为重要。