第一节 医学实验室质量管理要求
一、基本概念
1、临床实验室
临床实验室又称“医学实验室”。对从人体获得的各种标本进行生物学的微生物学的免疫学的化学的免疫血液学的血液学的生物物理学的细胞学的病理学的检验,或其他的检验,为疾病的诊断、预防和治疗,或对健康状况评估提供信息。这些检验包括测定、测量,或者说明有无各类物质或微生物。实验室也提供检验涉及的各方面的咨询服务,包括对检验结果的解释和作进一步相应检查的建议。
2、临床实验室的质量目标
检验结果最好地符合病人实际情况;及时发出检验报告;依据检验结果结合病人临床状况,主动为临床诊断提供咨询。这是当今国际标准化(ISO)对质量广义定义“满足需求和期望”在实验室中的体现。
3、质量管理体系
建立质量方针和质量目标,并达到这些目标的体系为质量管理体系(ISO9000定义)。在医院内按照院长提出的质量目标组织和实施全院质量管理体系,实验室和医院其他科室、部门都是全院质量管理体系的一个分支。
4、质量管理
用于质量管理体系的一组完整的过程为质量管理(ISO 9000定义)。在临床检验质量管理体系中,质量管理涉及检验过程的每一阶段。
按照ISO 9000文件,定义质量管理中致力于实现质量要求的措施、方法等称为质量控 制。质量管理中致力于提供实现质量要求信任的证实的活动称为质量保证。但是从2000年 起,ISO 9000文件不再使用“质量保证”一词,在临床检验中多以“质量评估”表示。
二、医学实验室管理技术的主要内容
1、选择和评估检测系统
任何一次检验都有误差。检验的测定值与理想的真值的差异即为误差。无论是选择和评估检测系统,还是在日常工作中进行质量控制,关心的都是误差。
从质量管理意义上可以将误差分为检测系统的稳定状态(固有)误差和检测系统对病人标本日常检验的不稳定状态(外加)误差。要使检验结果符合质量要求,除了有质量控制外,还必须要对使用的检测系统(即方法学,包括:仪器、试剂、方法、原理、校准品、检测程
序等一体。以往也成为实验方法学)作严格的选择和评价,确定它的不精密度、不准确度、病人结果可报告范围、分析灵敏度、分析干扰和参考范围等分析性能。这些性能反映了检测系统的稳定状态误差水平。在检测系统正式用于实际检测病人标本前,必须了解在检测系统最佳稳定状态下使用时的总(固有)误差水平。实验室只有使用总误差水平在临床上可接受的低水平的检测系统,才能真正使检验结果符合临床要求。
2、统计质量控制
实验室期望所有病人检验结果的误差一直处于评估检测系统时所具有的总误差水平,也即最佳水平,又称“稳定状态水平”。
临床检验工作和其他分析领域工作最突出的差异,是临床检验对每份病人标本只做一次检验就发出报告。使每份报告引入的误差,较之取多份样品,做多次检验取均值报告结果内含有较大误差,特别是随机误差。因此,必须强调做检验一定要有质量控制。将控制品和病人样品一起做检验分析,以控制品检验结果(控制值)了解分析过程的质量情况称之为“分析过程质量控制”。分析过程质量控制使用了统计方法对控制值进行归纳分析,便于了解质量状况,所以分析过程质量控制亦称为统计质量控制。
近几年来,结合行政分析允许误差限值以及临床允许误差限值要求,提出花最少的钱作最有效的控制的高效率质量控制是当今第三代控制技术,引人注目。
3、重视分析前和分析后检验的质量管理
随着检测系统和质量控制方法的发展,分析中的质量已有了极其
显著的改进。近几年,将改进实验室质量的努力已逐渐置于分析前和分析后阶段。没有好标本,检测系统无法获得可靠结果,质量控制方法也无能为力。因此从病人被临床要求进行检验起,直至取样品作检测前,必须重视分析前病人准备和识别,标本采集、运送、处理、保存等每一环节,确保病人标本的质量。分析后对检验结果的数据运送、计算、打印检验报告单中,任一疏忽出现的问题,都应属于差错,不是分析误差。差错不是要控制而是要消除。应充分重视分析前、后的检验过程的质量管理,尽早改变目前国内这一方面的落后状况。
4、检验项目在临床运用中的价值
加强检验与临床的联系和交流,让临床了解各个检验项目在诊断和治疗、随访中的价值,了解诊断和体检中检验结果应用的不同。使临床医生在申请检验时,可以有目的地选择有关项目,并使每个检验结果都在临床上发挥作用。
第二章 检测系统的发展和完善
第一节 检测系统及其基本性能
一、什么是检测系统
完成一个项目检测涉及的仪器、试剂、校准品、操作程序、质量控制、保养计划等的组合为检测系统。若是手工操作,则还必须包括具体操作人员。
二、检验管理对开展检验项目的要求
1、在美国1988年国会通过的临床实验室修正法规(CLIA’88)中,明确指出:实验室收取病人标本,进行检验、发出报告的项目必须要有具体数据和资料,说明如下:
(1)开展该项目检验使用什么牌号、型号的仪器;使用什么公司
的试剂(包括产品号);什么校准品(来源,产品号);具体操作程序(另有详细规定);质量控制(另有详细规定);仪器保养计划等。
(2)项目的操作分析性能。在上述检测系统下,经具体实验说明
它的① 不精密度(总不精密度);② 不准确度(方法学比较结果);③ 病人结果可报告范围;④ 分析灵敏度(检测限);⑤ 分析特异性;⑥ 参考范围;⑦ 其他须说明的性能。
(3)经有关行政管理部门核实,认可该检验科开展的一些项目在性能上符合要求,行政同意该检验科可对认可的项目开展收费检验。
(4)在开展检验期间,实验室不可对上报内容所属范围作任意变动或修改。
2、面对众多项目,检验科单靠自己的努力,无法完成所有项目的性能评估实验,希望有专家帮忙。
3、生产厂商从只提供仪器或试剂,进而为保证检验质量,提供了配套试剂和校准品,也规定了操作程序。对这系列服务具有的性能作了完整的评价。在向美国联邦药品和食品管理局(FDA)申报产品许可时,并不是一台仪器的被认可,而是对整个系统的认可。
4、在美国,按CLIA’ 88规定,实验室使用的检测系统若得到FDA认可,用户若完全按照厂商要求,使用相应配套试剂、校准品,按操作程序作检验,开展质量控制,定期保养,则该系统各项目的操作分析性能完全由厂商提供,承担责任。行政部门对这些项目在检验科中的使用属“免检”项目。
5、但是,若用户换用其他型号、牌号的试剂和(或)校准品,更换操作程序等,原被认可性能无效。行政部门要求实验室必须重作评估,上报材料。
6、最近,欧共体的诊断产品认证机构对厂商明确要求,在今后的推广和服务中,厂商必须做到:告诉用户,只有使用公司提供的系列产品,方能保证得到审批认可的可靠结果。
三、重视检测系统的原因
1、追求质量。让检验结果最好地符合病人实际情况,并能及时地发出检验报告;依据检验结果,检验科还能主动地为临床或病人提供咨询,建议再做什么检验项目,有助于临床对病人的诊断和治疗。
2、检验结果在对病人的诊断和治疗中应有可比性。不管病人在世界上什么地方,同一病人同一项目的检验结果是一样的。
3、所有的仪器、试剂、方法的发明和研究,都是用来作病人新鲜标本检验的。因此各个检测系统对同一份标本的同一项目结果,相互间应具有可比性。这是所有生产厂商为之努力的方向。
4、长期实践说明,只有形成一个固定组合的检测系统,才能在世界上任何地方,所有 检验结果间具有可比性。否则就没有可比性。
5、大量资料证明,数千套同一检测系统(同一公司,同一型号)遍布世界,它们的室 间评估成绩变异系数可以很小。这充分说明检测系统的必要性、可行性和有效性。
四、检测系统性能的证实和评价
刚添置的检测系统在正式用来检测病人标本、发出检验报告前,实验室要对系统的操作分析性能作实验予以证实。证实实验性能主要是精密度、病人结果可报告范围和准确度;肿瘤标志物类的检验还需做分析灵敏度。实验室自行研究或开发了一个检测方法,为了使方法的检测结果符合临床要求,必须对方法的性能作详细而全面的实验,这时的实验是对性能的评价。只对他人或厂商的评价资料中几个主要性能做实验予以确认。实验室如使用的检测系统是公司的系列产品,只要做性能的证实。但是,实验室对原检测系统作任意变换,仪器不变,换用各种试剂盒和校准品,有的还改动操作程序等,在以上任一情况出现时,为了保证病人检验结果的可靠性,实验室必须对新组合的各项目检测系统性能作全面的评价,用数据证明新组合系统可靠,方能据此检测病人标本,发出报告。
第二节 医学实验中的基体效应
为了使实验结果符合质量要求,实验人员必须充分了解检测系统的分析性能。在进行这些性能评价实验时,尽可能采用病人标本,避免基体效应。所有的检测系统都是用来作患者
标本检测的,只有对病人标本实验结果具可靠性才有价值。基体(Matrix)也被称为介质或基质。近三十年来,实验室质量不断提高,揭示产生误差的原因也随之深入。对基体也逐渐有了更多的理解。
一、基体效应和回收实验
1、几个基本概念
(1)基体:分析样品中,除了分析物以外的所有其它物质及组分称为该分析物的基体。
(2)基体效应:检测系统检测病人标本中的分析物时,处于分析物周围的所有非分析物质(基体)对分析物在检测中的影响,称为基体效应。
(3)回收:分析方法对于样品中分析物的适当增量能实际检出的能力。用于该目的的实验为回收实验。它可以对分析方法使用纯标准液为标准,检测样品为病人标本时,实验结果受基体效应的影响作估计。
2、对回收理解及克服基体效应方法
(1)回收率对基体效应的估计:回收率接近100%,说明分析方法对于分析物无论在纯溶液中还是在复杂的基体环境中,反应能力是一致的,即分析不受基体影响。若回收率明显偏离100%,说明分析方法对于分析物处于的基体环境不同,反应能力有明显差别。因此回收实验可以对分析方法受基体效应的影响作出估计。
(2)克服基体效应的方法:使测定标准和标本处于相同的基体环境。即标准亦应使用和被测标本相同的基体配制。测定的是血清,则配制标准的也应是血清,以抵销基体效应的影响。尽管将纯的分析物配制于混合血清只是一种模拟方式,并不能适用于所有不同疾病的病人标本,但只也是目前的唯一方式。
(3)基体效应并不就是干扰作用:它包括了总的干扰作用。干扰和特异性评价中的一些非分析物的作用方式或原因是很清楚的,而基体效应只是对现象的分析和归纳的一种概括,尚无完整的解释。
二、控制品、校准品等引入的基体效应
各种室间调查用的控制品、室内控制用的控制品和校准品都经过加工处理,都不是日常实验的新鲜病人标本。可以认为,所有各种测定方法、仪器、试剂、检测系统等都是设计用来作新鲜病人标本检测的,对患者病人检测具有可靠性,但是不一定对各种处理过的样品的检测提供可靠数据。在平时,检测新鲜病人标本时不常见的偏倚(Bias),在检测处理过样品时却常见,因为在处理过材料中有新鲜样品所没有的基体变化。这是新鲜标本和处理过样品间的基体差异产生新的基体效应。这些基体效应决定了校准品专用性和室间质量评估方法复
杂性。
三、回收实验示例
手工碱性苦味酸法测定肌酐是常用的方法,多以肌酐标准水溶液为标准。这样的做法对病人标本的检测结果有多大的影响?为此,设计回收实验了解标准和病人血清间明显基体差异产生的基体效应。
1、绘制标准曲线 在进行回收实验前,应该先用浓的肌酐标准液绘制标准曲线,了解苦味酸方法对纯肌酐显色反应的线性范围。
2、收集样品 收集混合血清,离心、过滤备用。另外,将肌酐储存标准液用0.1 mol/L硫酸稀释成:10000、6000、4000、2000、和1000 μmol/L肌酐标准液。配制系列回收样品, 各管混匀后用苦味酸方法检测显色,读取吸光度。从标准曲线上查得肌酐浓度。
3、测定结果和计算
肌酐在医学决定水平150μmol/L处,由于基体效应的影响引入的比例误差为:
(1)以百分值表达:PE(%)=-100%=87.74-100%=12.26%,
(2)以计量单位表达:
PE=-100⨯XC=87.74-100⨯150=18.5μmol/L。
(式中XC为医学决定水平符号)
回收率=回收量⨯100%。 加入量
如1号管回收样品,回收量为85μmol/L,加入量为
100μmol/L,回收率(R)为R = 85/100 =85%。
本例说明,用肌酐的水标准液做肌酐苦味酸的标准,会引入约12%的负偏差。这是由于标准和病人标本间具有基体差异所致。
将此误差和允许误差比较,如果PE小于允许误差,认为尽管有基体效应,但不会影响临床的应用,意即肌酐的水标准液仍然可用。现今,判断误差是否可接受的允许误差指标都以美国临床实验室管理法规(1988)CLIA’88为准。肌酐的允许误差为T ± 15%,现PE(%)为12.3%,小于15%;或者算成肌酐浓度,在XC为150μmol/L处的允许误差为EA= 150× 15 % = 22.5μmol/L, 18.5μmol/L<22.5μmol/L,二者都认为属可接受。
需注意的是,这个指标是室间质量评价的最低标准,包含了标本检测时可能出现的所有
误差,所以作出可接受的判断要谨慎。在条件许可下,还是采用血清的校准品替代水的标准液,克服这12%的比例误差,使病人标本的检验结果更为可靠。
第三节 标准品和校准品
传统的临床检验,要使检验结果可靠或有依据,往往有一个标准品(Standard)。
为了克服纯标准液和病人样品间的基体差异,20年前开始引用具有与病人样品基体相似的校准品替代标准品,用于日常工作。
一、标准液的定值
一般而言,检验工作使用的标准品属应用标准。配制或供应这类标准品的实验室或厂商具有符合质量标准的纯品。称取一定量的纯品,然后将其溶解,在容量瓶内用溶剂稀释至容积刻度,混匀,标准液配制完成。由称量法获得的称量值和容量法配制的容积,计算出该标准品浓度。检定部门抽样测定,结果在规定范围内属合格。即使测定检定结果在范围的上、下限,也不能将实测值作为标准值。因为测定值的可靠性取决于检定方法,一般的分析方法的可靠性不如分析化学公认的称量法和容量法。所以标准品的定值由称量和容积计算确定。检定不合格即报废,决不可将实测值替代修正。
二、校准品的定值
1、校准值随方法而异
校准品的大多来源为人的样品混合物,如混合血清。本身内含被检分析物,制备时可添加某些分析物增加含量。校准品中被检分析物的含量无法由称量法和容量法确定,只能倚赖于分析方法。校准品的校准值必须取决于分析方法或检测系列。
2、新鲜病人标本是最佳校准品
由于所有校准品都是处理过的样品,和新鲜病人标本有着基体差异。若使用公认的参考 方法去标化测定校准品,测定程序是严密的,测定值是可靠的。但使用该测定值去校准常规的检测系列时,校准品中被检分析物参与反应时的表现明显不同于新鲜病人标本,不能将参考方法系列的准确度通过校准品传递给病人标本。所有用于检验中的检测方法、仪器、试剂等都是用来检测病人新鲜标本的,不是用来检测校准品这样的处理过样品。如果先用公认的参考方法检测病人标本,再以具有参考值的病人标本去校准某检测系列(包括方法、试剂、仪器),此时该检测系列再检测其他新鲜病人标本时,这些病人标本结果的溯源性可上溯至公认的参考方法。也即用新鲜病人标本是校准检测系列的最佳校准品。用这种方式校准,能
使同一个检测系列在不同实验室检测新鲜病人标本时,检验结果在实验室间具可比性。一些大公司正是按照这样的认识为校准品定值。
3、校准值不是测定值,是纠正的调整值 (Corrected Value)
制备的校准品,专用于指定的某公司型号的仪器、试剂、方法和检测程序组成的检测系统。因此校准品只能为这样的系统服务,起校准作用,不能对其他系统作校准。
4、具多个校准值的校准品
专门供应试剂盒的厂商,为了使他们的试剂盒用于各种类型、型号的仪器和方法,也同 时为客户提供校准品。同一个校准品适用于不同系统必须有不同的校准值,这样的做法充分说明校准值的专用特性。决不能一个校准品、一个校准值、一种试剂盒用于各种不同的仪器;也不能一个校准品、一个校准值,用于不同的、已具有原试剂配套的仪器系列;无论哪一种方式均使病人样品的检测结果不可靠,也不具有溯源性。
第三章 分析性能的评估
第一节 分析误差
分析性能的评估是对检测系统作病人标本检测时可能具有的误差。实验室一定要使用可靠的检测系统,它的稳定状态误差较小,在临床上属可接受低水平之内,方可用于常规工作。这是保障检验结果质量的前提。
从误差的性质上,可以将误差分为随机误差和系统误差。性能评估实验也相应设计为了解不同性质的误差。最后,还需综合起来反映总的误差水平。
一、随机误差(Random Error,RE)或不精密度 (Imprecision)
这类误差可正可负,亦无一定的大小,称为随机误差。若将某标本作多次检测,用均值()表示这组检测值的平均水平,标准差(s)为各检测值对于均值的离散程度的指标。检验的特点是每个标本只做一次就发出检验报告,因此检验结果Xi是对标本作多次检测的一个抽样。所有重复检验的Xi值以值为中心,它们和的差异有大有小,方向各异;这即是随机误差的表现。临床希望同一标本的各次检测值Xi重复性好,这是人们对精密度的追求。精密度的定义是重复检测值间的一致性。度量精密度好坏是不精密度。重复检测值的s大小反映在均值下的精密度水平,也可以变异系数(CV)表示相对变异大小。检验结果报告内具有的随机误差,常以95 % 可能性出现的最大随机误差量表示。也即发出的报告
都认为是均值,但是实际报告值Xi和具有的最大差异(95 % 可能性)为1.96s,以这样大小的差异量表示标本只做一次检验发出的报告中具有的随机误差估计量。写作RE=1.96s(在时)。
须注意的是,实际报告结果中的随机误差(相对于而言),有大有小。有的和均值很接近,真正达到1.96s误差的并不多。若这样的随机误差小于临床允许误差,是实验室认为该检测系统可用来检测病人标本的前提。
二、系统误差(Systematic Error,SE)或不准确度(Inaccuracy)
这类误差有一定的方向和大小,称为系统误差。有系统误差的结果是不准确的。准确度的广义定义是:检测值和真值的一致性。但是它们之间的差异既有随机误差,也有系统误差。检验中为了确切表示准确度常以相对准确度表示,即:检测均值和真值的一致性。它们的差异称为偏倚,亦即系统误差。它使检测结果偏高或偏低,有一定的大小。度量准确度亦以不准确度即偏倚来表示。
造成检测系统不准确的因素大致上有两方面:一是检测系统自身的,如方法特异性差或严重的基体效应等;二是检测系统和某一认可的检测系统或方法,同时对一批病人标本作对比检测,检测结果的差异是两个检测系统间的系统误差。后一种系统误差更被大家重视。现今,在表达检测系统或方法的准确度时,直接指的是检测系统间或方法学比较的系统误差。
两个检测系统对同批标本检测后,以公认的检测系统或方法(亦称为比较方法,Comparative method)为X,被评价的检测系统或方法(Test method)为Y。度量系统误差(SE)的方式有两种,。在标本的检测值都比较集中时,两个系统检测病人标本的结果均值间
SE=- 的差,表示在X方法的均值时两方法间具有的系统误差。写作:(在时)。
在标本检测值分布较宽、有较大的范围,如果各标本的成对结果在坐标纸上具有直线趋势时,可以用直线回归统计归纳。这个方式可以了解两方法在检测过的浓度范围的任一处的系统误
ˆc,则差。若某医学决定水平浓度为Xc;在回归式上,相对与Xc的被评价方法的估计值为Y
ˆc-Xc=(b-1)⋅Xc+a。 SE=三、总误差(Total Error,TE)
病人检测结果内含的误差应包括随机误差和系统误差。所以反映检测系统稳定状态总误差是随机误差和系统误差的加成,为TE=RE+SE。因为病人标本的每个项目只做一次检测,结果中的误差的“最坏”表现即为TE。
实验室人员习惯将误差分别看成不精密度(随机误差)和不准确度(偏倚),而医生和病人关心的是总误差有多大。总误差反映了客户和消费者对检测性能的估计,这也是判断检测系统可接受性中最重要的参数。
第二节 不精密度的估计
医院实验室对病人标本检测时,由于该行业的沿袭特点,一直是对每份标本只作一次检测发出报告。这也是为什么国际上将不精密度性能列为实验方法、仪器或试剂盒分析性能的第一位的原因。检测结果必须具重现性,也即有良好的精密度。
对某样品作多次重复测定,均值是这组测定值的平均水平。标准差s是各重复测定值对于均值的离散程度指标。标准差大小反映了该检测系统的不精密度水平。影响标准差大小的因素很多。因此表示检测系统的不精密度时,应在使用什么样品,在什么分析物浓度下,作精密度估计的实验周期多长等的条件下才具有意义。现今应使用真正的病人标本,其内含分析物含量浓度在医学决定水平时,并且综合各类测定周期条件去评估检测系统的不精密度。 长期来,国内往往将不精密度分为批内、批间和天间的水平。在实际使用中临床只关心的是检测系统总的不精密度。
自20世纪90年代起,国际上推荐使用总不精密度,并且为了更好地检出不稳定的误 差,已明确提出检测系统的批内标准差s或变异系数CV应为美国的临床实验室室间质量评估允许误差(CLIA’88)的四分之一,天间标准差s或变异系数CV应为该允许误差的三分之一。达到这样要求的检测系统,可认为它的随机误差属于可接受的低水平。
一、重复性实验基本要求 精密度评价最普及的是对稳定的样品作多次测定,求这些重复测定值的均值和标准差s,以及变异系数CV。重复次数一般要求20次。若在一批内的重复测定,这是批内不精密度;若每天做1次,连做1个月,这是对检测系统天间不精密度的观察。进行精密度实验要注意以下几点:
1.样品基本要求 做重复检测的样品一定要稳定;它的基体组成应尽可能相似于实际检测的患者标本;样品中的分析物含量应在该项目的医学决定水平处。有可能的话,做2个水平的精密度实验。
2.样品稳定 采用冰冻保存的样品一定要注意内含分析物的稳定,要严格控制冻融、混匀的操作。
3.冻干控制品的使用 若每天复溶冻干控制品作实验,要注意选择产品的稳定性和瓶间差。要严格控制每次复溶冻干品时使用的复溶液的质量、开瓶的小心谨慎、加液的准确性、使冻干块浸润并复溶的时间、以及混匀的操作手法等等。
4.收集实验数据 计算均值和标准差,变异系数。从允许误差表中查阅评价的该项目
允许误差范围。小于或等于判断限的,检测系统的不精密度属可接受;大于判断限的表示不精密度不符要求。
二、精密度实验示例
统计归纳表
2、双份检测差异的标准差:有些检验项目平时送检的标本很少,或者标本很难保存;也没有合适的控制品。无法按照上例的模式进行精密度评价。双份检测差异的方法可以大致上了解它们的精密度性能。
第三节 分析灵敏度
一、分析灵敏度(检测限)
可检测的最低分析物浓度为检测系统的分析灵敏度或称检测限。确定检测系统的可报告低限是重要的分析性能。
二、检测低限 (Lower Limit of Detection, LLD)
检测低限定义为样品单次检测可以达到的、确实为非空白检测响应量对应的分析物量。检测系统或方法对小于或等于检测低限的分析物量只能报告“无分析物检出”。通常估计95%或99.7%的两种可能性:
95%可能性:LLD=空白+2⋅S空白
99.7%可能性:LLD=空白+3⋅S空白
要注意的是,直接读出浓度单位的检测系统对低于零的检测将报告零,其分布不是正态的,因此计算的均值和标准差不能如实表达检测低限的真实情况。若检测响应可以初始值表示,如:吸光度、荧光、等,此时S空白是有效的。所以应使用初始值来计算均值和标准差,
然后再转换成浓度单位。
三、生物检测限(Biological Limit of Detection, BLD)
生物检测限定义为:以检测低限加2或3倍检测限样品标准差的方式,确定检测系统或方法可定量报告分析物的最低浓度或其他量值的限值。
生物检测限(BLD)的具体度量方式为:
95%的可能性:BLD=LLD+2⋅S检测限样品
99.7%的可能性:BLD=LLD+3⋅S检测限样品
四、功能灵敏度(Functional Sensitivity, FS)
功能灵敏度定义为:以天间重复CV为20%时对应检测限样品具有的平均浓度,确定检测系统或方法可定量报告分析物的最低浓度或其他量值的限值。为了估计FS,须用多个检测限浓度来确定在低浓度处的精密度表现,从中选择具20% CV的浓度。在证实厂商的 FS的说明时,使用的检测限样品浓度应和厂商的说明相同。
第四节 病人结果可报告范围评价实验
一、病人结果可报告范围
病人标本未经任何预处理,由检测方法得到可靠结果范围为病人结果可报告范围(简称为可报告范围)。也即在此范围内不同病人标本报告结果值间的比值反映各标本内含有的分析物确实有这样的比例关系。
近年来,具计算机的自动分析仪已经普及。仪器可对实验响应呈不同表现的结果作适当的处理,直接以最终计量单位方式报告检测结果,符合临床要求。在此情况下,评价检测结果可报告范围时,不必再去评价响应结果的真实曲线状态,只要将样品作不同程度稀释或配制后,将预期值和实际检测值作比较,绘制在座标纸上应呈一条通过原点、斜率为1的直线。直线所达的限值即为该方法的检测结果可报告范围。
二、评价实验要求
1、进行可报告范围实验的样品必须和真实标本尽可能相似,即要和真实标本具相同的基体状态。
2、最好有5个或以上的系列浓度的实验样品,浓度范围遍布整个预期可报告范围。最高浓度的样品应达到可报告范围的上限。各实验样品内含分析物浓度呈等比例关系,不要呈倍比关系。
3、若能收集到含低浓度分析物的患者样品(如血清),将外观澄清的混合样品离心或过
滤后,一分为二。在一份混合样品中加入高浓度分析物贮存液,加入体积不得超过混合样品体积的1/10,但又可使样品中分析物浓度达到高限,充分混匀后为高值(H)样品。在另一份混合样品中加入配制分析物贮存液的溶剂,加入量等于前一份样品中加入的贮存液体积,充分混匀后为低值(L)样品。将H和L样品按:5L、4L+1H、3L+2H、2L+3H、1L+4H、5H关系各自配制混合,形成系列评价样品。
4、难以收集到低限样品,可以只收集高值样品,用生理盐水作系列不同程度稀释,形成系列评价样品。如进行载脂蛋白A1或B测定的可报告范围评价时,国际上将高值血清用生理盐水稀释成内含载脂蛋白量为原血清中量的30%、40%、50%、60%、70%、80%、90%、100%。由于载脂蛋白实验的方法学的特点,过低的载脂蛋白测不准,所以才只稀释到约30%的水平。一般可报告范围的实验尽可能低一些。
5、评价实验时要综合注意检测系统或方法的批间重现性。建议从低浓度到高浓度,每个实验样品做3次重复测定。
三、判断可报告范围的统计处理
ˆ=bX+a。理想状态下,预期值和实测用直线回归统计对数据作处理,得直线回归Y
值间呈通过原点、斜率为1的回归线,即斜率b为1,截距a为0。实际统计结果b不会正好等于1,a不会为0。若b很接近1(例如b 在1.00±0.03范围内),a近于0,则可直接判断该测定方法可报告范围为实验已涉及浓度范围。
所有实验点在坐标纸上呈曲线趋势的,按曲线规律处理。在实际使用时每次或定期绘制标准曲线,从曲线上查阅结果。在自动化仪器上将由数据处理软件进行检测信号和分析物量的转换。为了便于理解线性或可报告范围的内容,这里用实际工作中的例子逐一说明。
第五节 分析干扰
一、分析的干扰
分析的干扰广义上是指某一物质对某分析物的浓度或催化活力测定中任何一步骤的影响作用称为分析干扰。分析物是标本中准备测定的组分。干扰物也是标本中的一个组分,它不是被分析物,但它改变最后的结果。干扰作用可看成是绝对的或相对的,绝对干扰作用是:一般病人标本中不含有某物质,一旦它的存在即会引起干扰。相对干扰作用:一般病人标本中含有某物质,其含量相当于混合样品中的平均浓度,不同病人样品中含该物质的浓度变化引起干扰作用的变化。从实用考虑:相对的内容在临床实验中更有意义。
干扰不涉及在分析前就使分析物浓度发生真实变化的作用,这些作用可以是:①体内药物作用(如:因使用药物后的生理响应使激素浓度变化)。②标本处理(由于蒸发、溶血或者血清和凝块过长的不分离使电解质、蛋白、水含量的改变)。③标本收集[例如:在静脉滴注时(内含分析物)取样]。
这些作用可能会影响实验结果的临床应用,但不能视作“分析干扰”。因为不管分析物原来如何,一个检测系统或分析方法应检测标本中所有的分析物。分析干扰所引起最终结果是人为的增加(阳性干扰)或减少(阴性干扰)。
二、干扰物质的来源
在标本中的干扰物可分成内源性和外源性。
1、体内某些病理条件下产生的(例如:胆红素、脂肪、蛋白质、血红蛋白等)。
2、在病人治疗时摄入的(例如:药物、非肠道维生素、血浆增溶剂、抗凝剂等)。
3、自我摄入(营养补充、饥饿过度、酒精或药品中毒)。
4、由于标本被污染(抗凝剂、防腐剂、血清分离器、收集、容器、塞子等)。
三、干扰的机理
存在于标本中各种干扰物以多种方式影响分析过程。
1、物理作用 干扰物具有的物理性质,使它和分析物一样被检测和测定出来。
2、化学作用 干扰物可能会影响酶活力;干扰物也可破坏或阻止反应。干扰物也可改变分析物的形式。
3、非特异性 干扰物可能和分析物以同样的方式参与反应,在免疫化学方法中干扰物可能和抗体发生交叉反应,干扰物可能催化某一反应,反应结果中和了底物。
四、临床重要性
1、干扰对于总分析误差有时是一个主要因素,每个病人结果和真值间的偏离可能有三个原因:①系统偏差;②不精密度;③干扰。
干扰实验评价主要估计偏倚和不精密度的作用,干扰试验通常受标本条件所限,对实验室技术人员而言通常是溶血、黄疸和脂血。
2、干扰可视作系统的和随机的。①对一个特别监测的病人而言,如干扰物总是以同一浓度存在的话,偏倚将是恒定的,偏倚随干扰物浓度而改变。这种干扰是系统的。②对于一给定病人人群,由于干扰物浓度各异,由干扰物所形成的偏倚将是随机的,而且显著地作用于总随机误差,影响病人结果。
无论何种情况,由一个干扰物引起的未预料作用可导致对实验室结果解释的严重误差。
3、实验室是克服这些问题的主要角色,可由:①只使用对干扰物的敏感度不高和确定的方法。②获取资料,确定是否有干扰物质存在于样品。③告诉医生,由于有干扰存在,结果可能是不可靠的。
厂商可提供给实验室完整的有关干扰评价的结果文件,这是很好的资料来源。
第六节 准确度性能评价
实验室准备用一个新的检测系统或测定方法(或新的试剂盒、新仪器)进行病人标本测定前,应和原有的检测系统或者公认的参考方法一起检测一批病人标本,从测定结果间的差异了解新检测系统或方法引入后的偏倚。如果偏倚不大,或者偏倚量在允许误差范围内,说明两检测系统或方法对病人标本测定结果基本相符,新检测系统或方法替代原有检测系统或方法不会对临床引入明显偏倚。这样的实验成为方法学比较实验。
一、方法学比较实验要点
在方法学比较中,常将新方法称为实验方法;与之比较的方法称为比较方法。作方法学比较实验时,有下列几点应予以考虑。
1、实验人员有足够的时间熟悉检测系统各环节(仪器、试剂、校准品及操作程序等),熟悉评价方案。
2、在整个实验中,保持实验方法和比较方法都处于完全质量控制下,始终对实验结果有校准措施。
3、实验时间至少做5天,时间长一些更好,可以客观反映实际情况。
4、至少做40份病人标本,多一点更好。实验的可靠性和有效性随时间延长及更多的标本量而增加。
5、标本事先应做选择,尽可能使50%的实验标本内分析物含量不在参考区间内,各个标本内分析物含量分布越宽越好。不要使用对任一方法已知会干扰的标本(如溶血)。
6、每份标本应有足够量,以便使实验方法和比较方法都能做双份测定。
7、应在2小时内2个方法对同批标本分别开始实验。最好使用当天采集的标本,若需 保存标本,应确保它们的稳定性。只使用一种保存条件,能符合2个方法的要求,以免条件不一引出新的变异。
二、实验数据的收集和处理
1、不采用已明确有人为误差的结果。
2、将所有无明显误差的实验结果记录下来。但是,若2方法结果差值大于任一方法的批内不精密度,应查对标本,并重新实验。若找不出原因,应保留数据备考。
3、整个实验一定要有内部质量控制,失控时结果必须重做。
4、对实验数据的初步检查:将实验结果点于x、y坐标纸上。若所有实验点均匀分布斜率为1通过零点的理想直线附近。而且点子和理想直线间的离散较小;说明方法比较实验反映的系统误差不大。若实验点分布呈非线性趋势,它常常在浓度高值处表现明显,说明实验比较的2个方法中有一个方法的可报告有问题。应该寻找出问题后重做实验。或者,观察是否有部分呈线性关系。若确实如此,寻找修正点,使余下的部分具线性趋势。但须考虑这部分是否包括了临床上有用的范围。若可以,再多做一些在此范围的标本结果,继续数据处理。如去掉非线性部分后,范围过小,无应用价值,停止评价。
5、X、Y关系实验点有无离群表现。即有一个或几个实验点与众不同;点子偏离大多 点子分布的走向。出现离群点表现的数据不能随意取舍。应该及时重做实验,以数据证明属于实验的偶然误差,方可将原离群表现的结果用正确的结果取代。凡有剔除的,应另用标本补做。
6、标本内分析物含量分布是否适当的检验。相关系数r常用来表示2个变量间互相关 系密切的程度。一般要求r大于或等于0.975 (或r2大于或等于0.95),认为X范围是适合的。若r小于0.975,应再多做实验,扩大数据范围。
7、线性回归统计 可用直线回归分析来估计斜率和截距。对上述n个标本,n对(xij、yij )
ˆ=bX+a 表示这些数据的直线趋势。这是以X方法为准,Y 方法与之配合数据以回归式Y
的关系式。式中b为斜率,a为截距。如果2方法表示的某分析物量具相同的计量单位时,
ˆ=X,即b=1,a=0。b≠1,a≠0表示两方法间在测定标本时的系统理想状态的回归式应为Y
误差。根据临床使用要求,可在方法学比较实验检测到的浓度范围内,各个医学决定水平浓度Xc处,了解Y方法引入后相对于X方法的系统误差(SE)。
以计量单位表示的系统误差为:SE=(b-1)⋅XC+a,
或以百分值表示的系统误差为:SE(%)=(b-1)+a⨯100% XC
8、以美国临床实验室修正法规对室间评估的允许误差为判断依据,由方法学比较评估 的系统误差(SE)不大于允许误差,认为系统稳定状态的系统误差属可接受的低水平。
三、方法学比较数据统计应用的意义
如果相关系数≥0.975,说明方法学比较实验标本选择恰当,分析物浓度分布符合要求;回归统计的斜率b和截距a可靠,可以用它们去估计引用新方法后带来的系统误差;并以医学决定水平处估计的系统误差量判断新方法可否替代老方法。如果相关系数<0.975,说明回归统计的斜率和截距不能用来估计新方法带来的系统误差。
在方法比较实验中,每份标本同时被2个比较的方法测定,对所有标本数据归纳处理时, 形成了配对的资料。因此,对方法学比较数据作t检验统计的只是配对t-检验。
t-检验是对2组比较数据的均值间在统计上有无显著性差异作出判断。千万不要将有显 著性差异看作均值间数值相差很大;t-值只说明2个均值代表的2组数据的分布有无倾向性的表现。
第六节 检验项目的参考值和参考区间
实验室应为检验项目提供可靠的参考区间(Reference Interval),才能使临床对健康普查者的检验结果作出判断,对病人检验结果有大致的了解,发挥检验报告的作用。因此获得检验项目的可靠的参考区间是实验室的重要任务。
一、几个基本概念
1、参考个体(Reference Individual)
依据临床对某检验项目的使用要求确定选择原则,以此选择的测定参考值的个体。所有参考个体的集合为参考总体。
2、参考抽样组(Reference Sample Group)
从统计意义上,一定数量的参考个体是从参考总体中的一个抽样。在现今的参考值建立中,都是对参考抽样组作具体研究,在一定的可信限条件下,成为某项目的参考值和参考区间。
3、参考值(Refarence Value)
对一个参考个体进行某项目测定得到的的值为该个体的参考值,所有参考抽样组的各个参考值合起来即为参考值范围。
4、参考区间和参考限(Reference Interval or Reference Limit)
依据所有参考值的分布特性以及临床使用要求,选择合适的统计方法进行归纳分析后, 确定参考值范围中的一部分为参考区间,区间的两端为参考区间的限值,分为低参考限和高
参考限。
一般情况下,常选择95%分布范围的大小表示参考值区间。例如 从2.5%位数到97.5%位数所在的区间。亦可从0%~95%位数;或者选择99%的上限值。
5、“正常值”、“正常范围”及“参考范围”,“参考值”常被称为“正常值”。“正常”理解为健康,若测定值不在参考区间内,意即检查对象有病或不是良好健康状态,亦即“不正 常”。其实无法判断谁是正常人,健康只是相对的,因此“正常”词义不清。另外,“正常”亦理解为所有数据呈高斯(正态)分布。但生物数据大多不呈高斯分布。为使精确而少混淆,应不用“正常值”一词,而用“参考值”,自然亦不再用“正常范围”。
很多地方用“参考范围”表示“参考区间”。“范围”常定作实际的最小和最大测定值的一组值(即:参考值组的整个范围)。因此“参考范围”应是参考抽样组内所有参考值集合,以最小的和最大的参考值为界限。显然“参考区间”只是“参考范围”的一部分,而不是全体,两者不能混淆。
二、对新项目建立参考值范围和参考区间计划
1、根据文献及实验研究,总结对该项目测定结果产生的生物变异和分析干扰的因素,供选择参考个体时用。
2、确定参考个体的选择原则(或排除非参考个体的原则),编写与之对应的调查表。
3、依据调查表和其他有关记录,挑选候选的参考个体。
4、依据排除原则,剔去不符要求详细告诉各个受检参考个体,做好准备。
5、将采集标本前和采集时对受检查的要求详细告诉各个受检参考个体,做好准备。
6、完善地采集标本,做好分析前的标本预处理。
7、在良好的控制条件下,用事先指定的分析方法对处理好的标本作检测,获得参考值结果。
8、检查有无明显的误差或离群点。若有,按事先约定原则,剔去不符要求的数据后,再补上必需的数据。
9、绘制分布图,了解数据的分布特性。选择合适统计方法,估计参考限和参考区间(包括:如合适的话,将数据分成几组,分别求参考区间)。
10、将上述工作,详细叙述成文备查。
第七节 判断检测系统性能的可接受性
检测系统性能评估实验的最终目的:
设计各种实验,了解检测系统或方法的性能,也即了解系统在最佳或稳定状态下具有的误差。方法性能评价实验的目的最终要对这些误差作出判断,决定检测系统或方法可否用于常规。判断取决于估计的误差的大小,将出现在病人标本的实验报告中,它们是否会影响临床的诊断和治疗效果的观察。以临床允许误差为准,和观察到的误差作比较;观察到的误差小于允许误差,检测系统性能属可接受;观察到的误差大于允许误差,检测系统性能属不可接受。
总误差的组成和判断方式:
检测系统性能最重要的是不精密度和不准确度。由重复实验对方法的随机误差作出估计;用方法比较实验得到被评价方法和比较方法结果的均值间偏倚,或者由回归统计计算某特定医学决定水平处的偏倚估计系统误差。这些误差的估计值应结合起来估计总误差的大小。医生和病人不关心实验结果的误差是不精密的还是不准确的,重要的是它造成的后果有多大。因为总误差包括了不精密度和不准确度二者,所以判断检测系统或方法性能可否接受,是看总误差的水平。
有3种计算总误差的方式,以TE表示总误差;TEa为允许总误差;s为标准差:
1)TE = 偏倚 + 2s < TEa;或%TE = %偏倚 + 2CV < %TEa
2)TE = 偏倚 + 3s < TEa;或%TE = %偏倚 + 3CV < %TEa
3)TE = 偏倚 + 4s < TEa。或%TE = %偏倚 + 4CV < %TEa
TE或%TE水平= 偏倚 + 2s 或= %偏倚 + 2CV>允许误差TEa或%TEa,检测系统性能属不可接受。
TE或%TE水平= 偏倚 + 2s 或= %偏倚 + 2CV<允许误差TEa或%TEa,检测系统性能属于可接受。
TE或%TE水平= 偏倚 + 3s 或= %偏倚 + 3CV<允许误差TEa或%TEa,检测系统性能属于良好。
TE或%TE水平= 偏倚 + 4s 或= %偏倚 + 4CV<允许误差TEa或%TEa,检测系统性能属于优秀。
计算总误差例子:
用Merck检测系统作血清肌酐测定,
总不精密度为天间重复性:n=20,=203.6 μmol/L,s=6.0 μmol/L
方法学比较(和HPLC法比较):
ˆ=0.801X+20.02 检测范围为:200~1200 μmol/L Y
r=0.998,n=30
CLIA‘88允许误差为 ±15%
需要判断:在200 μmol/L 肌酐处由Merck检测系统引入的总误差是否属可接受的低水 平。
1、对总随机误差的估计
RE = 1.96s =1.96⨯6.0 = 11.8 μmol/L < 30 μmol/L (200×15%)
或:CV =(6.0/203.6)×100%=2.95%,
RE%=1.96×CV=5.8%<15%
说明由重复性实验估计的总随机误差在可接受的低水平。
2、对总系统误差的估计:
由方法学比较的回归式求200μmol/L 的总系统误差
SE = | (b-1)Xc + a | = | (0.801-1) ⨯ 200 + 20.02 |
=|-39.8 + 20.02 | = 19.8 μmol/L< 30 μmol/L (200×15%)
或SE%=SE / Xc = 19.8 / 200 =9.9%<15%
说明由方法学比较实验估计的总系统误差在可接受的低水平。
3、对总误差的估计: 天间重复性实验的样品均值为=203.6 μmol/L,和现在需要了解总误差的分析物浓度 200μmol/L很接近,因此可以用该重复实验的结果估计总误差。
TE = RE + SE = 11.8 + 19.8 = 31.6μmol/L> 30 μmol/L
或TE%=RE% + SE%=5.8%+9.9%=15.7%>15%
所以,TE > TEa (31.6μmol/L >30μmol/L)。或TE%>TEa%
结论:Merck检测系统对肌酐测定的结果,引入的总误差在不可接受的高水平。该系统 不能用于常规检测。
第四章 质量控制
第一节 分析前质量管理
为了提高检验质量,应对分析前阶段的工作可能出现的误差予以充分重视。这是分析
过程中的质量控制手段顾及不到的。要使检验结果符合临床要求,必须强调分析前的质量管理。
分析前阶段工作可分成两部分:病人准备和标本收集处理。为了使实验室结果有效地用于临床,应了解在收集标本前和收集标本时,所有影响实验室结果的非病人疾病因素。对病人采集标本前以及采集时提出要求,采取各种措施,称之为病人准备。
一、病人准备
以采集血液标本为例:
1、血液标本采集前,病人必须空腹
2、记录采集病人标本时间 若对同一病人作多次测定,最好每次在同一时间收集标本,便于比较,以减少人体内各分析物昼夜变化的影响。
3、 固定采集血液标本的姿势 一般以正坐姿势采集为多。
4、采集血液标本时动作宜迅速 扎脉带使用时间要有控制,不能过长。
5、采集血液前要限制病人进行体育锻炼 特别是激烈体育活动。
6、要求病人在采集血液标本前应停止饮用咖啡、浓茶类饮料,不准喝酒。
7、严格控制病人用药 几乎所有药品都对各种分析物结果有影响,有的是分析干扰,有的是药物治疗作用。
尽早通知病人,做好解释工作 尤其对精神容易紧张的病人更要耐心仔细地说明一切,让病人解脱担忧。
二、标本收集和处理
1、严格执行病人、检验申请单及标本收集盛器的核对制度,保证无差错。
2、按照采集要求做好各项检查和记录,严格执行。
3、熟练采样技术,保证采集标本符合要求。
4、及时做好标本预处理。
5、正确使用抗凝剂。
三、实验室分析前的质量管理
1、在行政的协调和支持下,要使医院各部门都认识到,为了得到符合临床要求的实验报告,必须互相配合,共同努力。
2、临床和实验室应确定一般门诊、急诊及住院病人在不同情况下的必须检测项目范围。便于实验室工作安排,既避免浪费财力、物力,又保证实验质量。
3、抽血取样前后,护士及实验人员应做好病人姓名、性别、住院号、门诊号、申请单
受检项目、标本管等之间的核对工作,防止差错。
4、防止申请单、标本和实验结果的遗失。做好每一环节的时间记录,记录随标本一起传送。
5、明确在标本采集前对病人的要求,保证收集符合要求的标本。
6、拒收不符要求的标本。
7、做好标本的分离和保存。。
8、做好分析前标本的核对和分类。。
9、建立差错登记制度,予以充分重视。
10、经常保持和临床的联系、交流和查询。
第三节 统计质量控制基础
医学实验室面对的是各个病人的标本,事先不知道内含的分析物有没有?是多少?都是未知数。而且,医学实验室的特点是只对每个标本做一次检测就出报告。因此,针对实验室的特点如何使实验结果有质量,在20世纪的后50年内做了许多探索和努力,形成了现今的医学实验室统计质量控制的理论和实践。
一、医学实验室质量控制发展简要
1、Levey-Jennings控制图 1950年Levey-Jennings将统计控制引入临床实验室。在质量控制上,使用参考样品、将各单一检测值点直接点在图上的做法即为当今所说的Levey-Jennings控制图。
2、医学实验室质量控制发展迅速 在1960年以后,临床实验室的质量控制发展飞速,具体表现在:
(1)厂商发展了相似于病人标本的稳定控制品。这样的控制品已广泛地用于实验室工作中。
(2)对质量控制方法的性能特性有了更深的理解,并且精心设计了诸如多规则方法去评估和解释控制数据。
(3)提出了高效率的质量控制的概念。以往的Levey –Jennings的控制技术和Westgad的多规则控制技术,都是以实验室实际操作具有的误差水平为控制目标。与手工操作技术配合的控制技术是Levey-Jennings控制图,这是第一代的临床实验室质量控制技术。进入自动
化时代后,实验室操作质量有了极其显著的进步;实验操作速度和技术水平是以往无法比拟的。此时,希望有效地提高实验效率的同时,还必须保证实验结果的可靠,要求质量控制技术对失控误差的检出具有高特异性和高灵敏度。Westgard的多规则技术在1979年诞生,这是高效率质量控制的第一步,是第二代的临床实验室质量控制技术。1990年以后,出现了第三代的质量控制技术,它以临床允许误差为质量目标,由实验室选择合适的控制规则和确定每批做几个控制样品,建立自己的控制方法,使实验室的质量真正符合临床要求。
(4)计算机的广泛应用推动了质量控制技术的发展。现在几乎所有自动分析仪上都有计算机,它们在实施统计控制方法时进行必要的计算,绘制控制图,运用合适控制规则自动作出判断,对确属失控的问题提出警告等。
二、统计质量控制的含义
1、统计过程控制 将控制品随同病人标本一起,由检测系统作检测,控制品检测得到的结果为控制值。这些控制值的大小和变化反映了检测系统在检测分析过程中的质量表现。为了便于分析和及早发现检验分析过程的问题,使用了统计技术对控制值作归纳和整理。因此,这样的质量控制内容称为统计过程质量控制,简称为统计质量控制,或统计过程控制,或分析过程控制。
2、质量控制方法 统计过程控制有2个必要组成内容:每批检测中使用控制品的数量;使用什么控制规则判断控制值可否接受。在医学实验室中,通常对稳定的控制品检测,将控制值点在具有特定控制限的控制图上;运用设定的判断限或控制规则对控制值评估。
3、控制图 显示控制结果,判断本次控制值是否在控的制图方法。控制值按检测时间或检测批顺序数点于图上;将各点按顺序连接,便于观察有无倾向、系统性偏倚、和随机波动。
4、控制限 绘制于控制图上的临界线,便于判断有无失控。这些控制限通常由某控制品重复检测控制值的均值和标准差确定。
5、控制规则 判断某批结果是否在控的临界规则。可以简单地理解为失控规则。随着Westgard多规则的推出,将 2s为限制的规则用作警告规则,控制规则的含义扩充了。但是仍然可以理解为:如果没有特别指出,一般的控制规则用于判断是否失控。常以符号AL表示。A为某统计量或代表控制值的观察个数;L为确定的控制限,常由此规定均值()加减几个标准差(s),有时规定了假性拒绝的概率(Pfr)。
6、批,分析批 一段时间的区间,或是一组病人标本量的大小;统计过程控制确定控制状态的对象。CLIA’88规定,临床化学检测的最大批量的时间为24小时;血液学分析为8小时。
第四节 控制品的选用
为了做好统计过程控制,必须选择合适的控制品。说明控制品性能的有:稳定
性,,瓶间差,定值和非定值,分析物水平,预处理的要求等
一、控制品的定义
国际临床化学学会(IFCC)对控制品的定义为:专门用于质量控制目的的标本或溶液;不能用作校准。。
二、基体差异
1、基体效应 制备控制品所用的基础材料一般为来自人或动物的血清或其他体液。经过处理,又添加了其他外加的材料,在对某一分析物进行检测时,处于该分析物周围的其他成分的组合,是该分析物的基体。由于这些组合成分的存在,对分析物在检测时的影响称为基体效应。
2、控制品的基础来源 理想状态下,控制品应和检测的病人标本具有相同的基体状态;这样,控制品将和病人标本具有相同的表现。
3、控制品制备的问题 无论怎样选用制备材料,控制品生产加工处理还继续改变基体的性质。
4、实验方法的影响 某些实验方法学影响了对控制品的选择。
三、稳定性
稳定性是控制品的重要指标。好的控制品可以在规定的保存条件下,至少稳定1~2年。实验室最好购买够用1年的1个批号的控制品,可以在较长的时间内观察控制过程的检验质量变化。
四、瓶间差
临床实验室开展统计过程控制的主要目的是控制实验结果的重复性。在日常控制中,控制品实验结果的变异是检测不精密度和更换的各瓶控制品间差异的综合。只有将瓶间差异控制到最小,才能使检测结果间的变异真正反映日常实验操作的不精密度。
五、定值和不定值控制品
控制品分为定值和不定值。必须注意的是:公司的定值预期范围只是告诉用户,只要你的测定值在预期范围内,说明它的控制品是好的。千万不能将预期制范围认为是控制的允许
范围。
不定值的控制品的质量其实和定值的控制品是一样的。不论定值还是不定值的控制品,用户在使用时,必须用自己的检测系统确定自己的均值和标准差,用于日常工作的过程控制中。
六、分析物水平
临床最关心各项目(分析物)的医学决定水平浓度的检验结果的质量;实验室更关心检测系统(方法)性能的在临界限值处的质量表现。若能同时做2个或更多水平的控制品检测,反映的质量是一个范围的表现,质量控制的效果更好。因此在选择控制品时,应该有几个浓度的、浓度分布较宽的、最好是医学决定水平的、有可报告范围的上下限值的控制品。依据实验室和临床的要求作出选择。
七、控制品使用前的预准备
无论那种医学实验、什么类型的控制品都有使用前的预准备要求。实验人员在使用前必须认真阅读控制品的使用说明书,明确要求后再开始使用。
第六节 绘制Levey-Jennings控制图
一、绘制控制图的准备
如前述,按照分析过程控制的要求,已经完成了以下工作:
1、选择了合适的控制品。
2、至少在10天内对控制品作了至少20次的测定,由这些数据
初步说明了检测系统在检测该控制品的分析性能
3、计算这些数据的均值和标准差。
4、选择每批控制品检测的次数。
5、选择应用的控制规则。
二、每批控制品检测次数和控制规则
1、13S规则 设定+3s和-3s为控制限值的规则。任何控制值超出3s限值的,确定该批结果为失控。
2、12S规则 设定+2s和-2s为控制限值的规则。任何控制值超出2s限值的,确定该批结果为失控。
3、确定每批使用2个水平的控制品,每个水平各做1次检测。
第七节 正确理解和应用Westgard多规则控制程序
一、Westgard多规则是第二代的质量控制方法
和自动化技术适应的,由计算机自动检索的Westgard多规则程序是第二代质量控制方法,应运而生。从20世纪70年代中期起,Westgard对临床实验室的质量控制作出了卓越的贡献。
1、理论上,提出误差分为检测系统(方法学)稳定状态(固有)误差及除此之外的不稳定状态(外加)误差,统计质量控制只能控制不稳定误差。
2、Westgard以概率理论发展了各种控制规则的误差检出特性曲线。由曲线反映规则对不稳定误差检出的灵敏度;以及把稳定状态误差误作假失控报告的可能性,即误差检出的特异性。
3、将各种控制规则以特定方式表示。例如12S ,13S ,22S ,R4S ,41S ,10等,至今已为大家接受。
4、发展了多规则程序,由计算机自动检索,大大提高了质量控制效率。使失控误差检出率大大提高,又极大地减少了假性报警的概率。
5、要使检验结果真正符合临床要求,必须对检验方法作严格的评价。
Westgard从理论和实践上提出了完整的方法学评价实验及总误差概念。
二、Westgard多规则控制方法
1、Westgard多规则控制方法(简称多规则)的构思 前述±3s和±2s的控制方法二者在误差检出灵敏度和对失控误差识别特异性上有着明显的差异,Westgard将它们巧妙地结合起来,并且引进其它控制规则,组成了多规则控制方法。目的是提高控制效率,既对误差检出具较好的灵敏度,又对失控误差的识别具较好的特异性。
(1)在多规则控制方法中,Westgard建议使用2个控制品,浓度一高一低,形成一个范围的控制(没有条件也可只用1个控制品,但有很多局限性)。
(2)在控制图上绘7条平行线。即:,-1s,+1s,-2s,+2s,-3s,+3s。
(3)将所有规则以符号表示,便于使用。如±2s规则写成12S,±3s规则写成13S等,具体含义见下介绍。
(4)在Westgard多规则控制方法中,将12S仅作为警告规则,不是失控规则。充分利用它对误差检出灵敏度高的特点,但又限制了它对误差识别特异性差的弱点。它只指出可能有问题,最后判别要经过系列顺序检查,由其它规则判断。
(5)经过选择,将13S,22S,R4S,41S,10等列为失控规则,内中既有对随机误差敏感的,也有对系统误差敏感的。结合在一起,大大提高了多规则的控制效率。
(6)将各规则合在一起,形成逻辑判断检索程序。
2、各规则的含义
(1)12S警告规则: 在某水平的控制值超出±2s限值时,为符合12S规则。须注意的是:这里将符合该规则的结果定为是有问题,发出警告;不是失控。
(2)13S失控规则:控制值超出X±3s限值,是失控的标志。
(3)22S失控规则:22S有两种表现,同一个水平的控制品的连续2次控制值同方向超出+2s或-2s限值,是失控的表现。在1批检测中,2个水平的控制值同方向超出+2s或-2s限值,是失控的表现。
(4)R4S失控规则:在一批检测中,1个控制品的控制值超出+2s限值;另1个控制品的控制值超出-2s限值。表现为失控。在Westgard多规则的组合中,一定是同批检测中具有上述表现。如果发生在2批检测中,就不是该多规则的R4S。
(5)41S失控规则:有连续4次的控制值超出了+1s或-1s的限值。是系统误差的表现。本规则有2种表现:一是1个水平的控制品的连续4次控制值超出了+1s或-1s的限值,另一种是2个水平控制品同时连续2次的控制值同方向+1s或-1s的限值。
(6)10X失控规则:有连续10次控制值在均值的一侧,是系统误差的表现。本规则也
有2种表现:一是1个水平的控制品的连续10次控制值在均值的同一侧;另一种是2个水平的控制品同时连续各有5次的控制值在均值的同一侧。
3、多规则的误差检索程序 Westgard多则的误差检索程序。
注:“不符合”表示控制值没有符合字符左侧的失控规则。
“符合”表示控制值符合字符左侧的失控规则。
Westgard多规则误差检索程序
这是经典的Westgard多规则方法。按照图示的程序,计算机每天对你的控制值做自动检索(没有这个检索软件,每天自己动手检查)。确定控制值是否符合12s警告规则。如果没有,说明检验结果在控,可以报告病人结果;如果符合,说明检验结果可能有问题;继续检索,看控制值是否符合13s失控规则、符合22s失控规则、符合R4s失控规则等等,只要符合其中一个,说明确实失控,拒发病人报告;如果不符合任何一个失控规则,说明仍然在控,可以发出检验报告。
在日常使用时,需注意的是:
(1)12S为警告规则,不是失控规则:若本批检验没有出现控制结果超出±2s限值线,表示本批结果没有问题在控,可以发出报告。若本批检验有1个控制结果超出(不包括正好在±2s限值线上的结果)±2s限值线,表示本批结果可能有问题,符合12S规则。要检查一下,是一个警告,但不是失控。按多规则程序去检查是否确实有上述的5种失控表现。
(2)出现失控时必然已经有了12S表现:失控规则中的各种表现必然已经有了12S表现,并且连同这个12S表现一起,形成了各个规则的表现,此时才列为失控。上述各图示的失控
规则都表示了这个含义。
没有出现12S表现,但控制结果已出现倾向性表现,如已有多次结果偏于一侧,甚而偏于+1s或-1s以外,这些都不属失控。检验人员看到这样的表现,主动寻找原因予以纠正,这是努力减小误差,但不作为失控后的措施。
出现12S表现后,经顺序检查,没有出现其它各失控规则的表现,表示这次12S出现也许是属正常的波动,不是失控,不要作任何失控处理。可发出检验报告。
(3)几种不恰当的做法
1)控制结果落在±2s线上就认为失控,这是错误的理解。请注意前面每一点讲“超出”的含义,凡未超出±2s,即使在线上都不属有问题,不必作任何处理,更不是失控。
2)控制结果超出±2s,马上就重做。并且将原来的结果抹去,点上新的接近的结果。①12S是警告规则,不是失控规则。出现超出±2s限值,不应马上重做,应检查是否发生真正失控的表现。②即使失控,也不要将超出±2s的结果或失控结果抹去。因为将这些点子都去掉,使控制值结果分布范围变小,下个月控制图的s变小;控制范围变得不真实,加大了控制难度。③出现12S表现较好的做法,应先检查是否有失控。确实失控,不仅控制品重做,更应检查失控原因,纠正误差后,连同病人标本一起重做。将失控结果和纠正后结果均点于图上,做好失控记录。若不是失控,既不要重测控制品,也不必作其它处理,照发报告。符合要求的控制图,应该是所有控制结果均匀分布于±2s范围,而不只是在±1s范围。
3)直接使用厂商的定值及允许范围作为控制图上的均值和标准差。每个实验室必须自己通过测定,累积控制值来计算自己的均值和标准差,用于自己的控制图上。严格讲各实验室的检测方法(检测系统)一定不同于厂商定值的检测方法。厂商提供的允许范围是他们的“保险”范围,不是应控制范围,一般都很大。它只是告诉用户,您的测定值在此范围内,说明控制品没问题,不说明其它。
三、应用Westgard多规则的示例
第六节 检验项目临床使用价值的评述
如何以最少的费用做必要的检验,达到最佳的诊断和治疗效果是当前共同关心的问题。 在众多的检验项目中,能提供临床具有某种疾病的直接证据的确诊项目不多。绝大多数检验项目,它们的检验结果在病人和非病人间分布呈交叉状。(为叙述方便,以下对具某种
疾病的受检者称为病人;不具某种疾病的受检者,包括健康人及具有其他种类疾病的病人称为非病人)。若以某检验值为判断限(可以是参考区间上、下限值,或者是某判断限值),可以将检验结果分成四类:是病人,检验结果达到或超过判断限,称为真阳性;是病人,检验结果未达到判断限,称为假阴性;是非病人,检验结果未达到判断限,称为真阴性;是非病人,检验结果却达到或超过判断限,称为假阳性。理想的检验项目对某种疾病的诊断价值直观地是假阴性和假阴性越少越好。
一、表示检验项目临床使用价值的公式
1、诊断灵敏度(Diagnostic Sensitivity)
指某检验项目对某种疾病具有鉴别、确认的能力。
设:P为阳性,N为阴性,T为真,F为假;则真阳性数为TP,假阳性数为FP,真阴性 数TN,假阴性数为FN。诊断灵敏度的数学式为所有病人(TP+FN)中获得真阳性(TP)结果的百分数。写作:
诊断灵敏度=TP⨯100% TP+FN
2、诊断特异性(Diagnostic Specificity)
指某检验项目确认无某种疾病的能力,它的数学式为所有非病人(TN+FP)中获得真阴 性(TN)结果的百分数。写作: 诊断特异性=
另外亦可使用(1-诊断特异性)表示诊断特异性大小。
3、诊断准确度(Diagnostic Accuracy)
指某检验项目在实际使用中,所有检验结果中诊断准确(真阳性和真阴性)结果的百分数。写作: 诊断准确性=TN⨯100% TN+FPTP+TN⨯100% TP+FN+TN+FP
以上几项指标和疾病流行率无关。在实际使用中,检验项目用于过筛或确诊目的不同,以及检验的病人群体不同(实际上是某疾病在不同人群中的流行率不同),对阳性结果中具准确诊断阳性结果的比例亦会不同,这是临床最为直接关心的。因此,还有两个指标表示这样的目的。
4、阳性结果预期值(Positive Predictive Value,PV+)指所有阳性结果中准确阳性的百分数。写作:
PV(+)=TP⨯100% TP+FP
5、阴性结果预期值(Negative Predictive Value,PV-)指所有阴性结果中准确阴性的百分数。写作:
PV(-)=TN⨯100% TN+FN
二、进行检验项目的临床评价前须确认检测系统的分析性能
开始临床评价前必须确认该项目的检测系统的分析性能,一定要使系统很好地设计并达最佳化。若检测系统是厂商的产品,实验室应完全按照厂商的要求,齐备所需物品材料,熟练操作,使检测结果具可靠性。若检测系统是实验室自行开发的,应在完成研究开发过程后,保持系统各部分供应充分,分析性能恒定。并且对它的分析性能作严格的评价,符合临床要求后,方可用于临床评价。
关于检测系统分析方法的分析特性主要因素概述如下:
1、检测用主要材料特性恒定。
2、明确可用的标本类型,并详细说明病人准备,标本收集,处理和保存要求。
3、确定测定操作方法。
4、建立相应的质量控制方法。
5、辅助设备的要求。
6、掌握检测系统的培训要求等。
三、临床评价计划和设计
1、进行临床评价要明确评价的目的,也即检验项目要解决的是什么临床问题。同一个项目在临床应用中,对于不同的疾病诊断使用价值不同。即使是同一个项目,应用于同种疾病的诊断,因各医院的评价群体差异也会有所不同。常常是有两种疾病的病人在临床表现上很相似,临床期望某一或几个检验项目的检验,能作出鉴别诊断,将病人分成不同组别,由临床作不同的治疗和处理。对于这样的临床要求,这个或这些检验项目有怎样的使用价值,这是评价的根本目的。
另外,某检验项目对某种疾病病人诊断时,被诊断的病人所处的病人群体具有对应的判断限(Cutoff),这也就是临床评价的结果,即在肯定某检验项目对某疾病具诊断价值后,依据不同限值作出诊断反映的诊断灵敏度和诊断特异性系列估计,从中选出最佳诊断准确度点,确定判断限。
2、确定选择哪些病人群体为评价时的对象 明确了诊断目的后,作评价时选择的病人 31
群体应和目的一致,从中抽样成为抽样研究组。抽样对象不应包括健康志愿者、供血者、学生或实验室工作人员等,因为他们都不是病人,不具有和欲诊断的疾病病人具有相似的临床表现,他们不是鉴别诊断的排除对象。另外,在选择的病人群体中应随机抽样,使抽样结果一定能代表整个临床关心的病人群体。并且应在开展评价前就选择好抽样对象,不要让被评价项目的检验结果或检验过程所影响,至于抽样大小取决于评价费用、所需时间、选择抽样对象的易难,更实际的是按诊断灵敏度和特异性所要求的可信限去确定。
3、确定每个抽样对象的“真正”临床诊断 这是评价中的关键所在,亦是最困难的。本来是想依靠某新项目作出鉴别诊断,本身就说明除此之外,能作出明确诊断的手段不多甚而缺少。因此不能单凭常规诊断手段,应以诸如:活组织检查、外科病理检查、血管造影、专家会诊、长期随访等,并结合临床病程及临床后果甚至尸体解剖等作出准确诊断,使每个抽样对象的诊断越准越好。所有诊断手段应在开始评价前就予以明确形成诊断标准。还有,一定要做到所有抽样对象的诊断过程和被评价项目无关。
四、进行临床评价
1、培训所有参与评价人员是保证评价顺利进行的重要方面 参与评价的临床医师要明确诊断标准,统一表格填写方式、询问和记录病史的要求,注意保护受检者(抽样对象)利益等。参与检验的检验室工作人员要熟悉检测系统,熟练掌握操作规程,认真进行质量控制,保证检验结果可靠。所有参与人员一定要做到严守评价纪律,注意资料真实完整。
1、 抽样对象作评价项目的检验时,应在不知道抽样对象的临床诊断分类前提下进行。 若进行多项检验项目比较时,应在同一时间点上对所有抽样对象的标本进行所有的检验,防止标本存放条件和时间的差异造成误差。
3、所有评价资料和数据必须记录完整,评价负责人须妥善保存备查。评价资料要随时输入于数据库,对出现丢失数据、离群点的处理、警告信号等应及时判断和处理,防止对今后评价结论的影响。
32
第一节 医学实验室质量管理要求
一、基本概念
1、临床实验室
临床实验室又称“医学实验室”。对从人体获得的各种标本进行生物学的微生物学的免疫学的化学的免疫血液学的血液学的生物物理学的细胞学的病理学的检验,或其他的检验,为疾病的诊断、预防和治疗,或对健康状况评估提供信息。这些检验包括测定、测量,或者说明有无各类物质或微生物。实验室也提供检验涉及的各方面的咨询服务,包括对检验结果的解释和作进一步相应检查的建议。
2、临床实验室的质量目标
检验结果最好地符合病人实际情况;及时发出检验报告;依据检验结果结合病人临床状况,主动为临床诊断提供咨询。这是当今国际标准化(ISO)对质量广义定义“满足需求和期望”在实验室中的体现。
3、质量管理体系
建立质量方针和质量目标,并达到这些目标的体系为质量管理体系(ISO9000定义)。在医院内按照院长提出的质量目标组织和实施全院质量管理体系,实验室和医院其他科室、部门都是全院质量管理体系的一个分支。
4、质量管理
用于质量管理体系的一组完整的过程为质量管理(ISO 9000定义)。在临床检验质量管理体系中,质量管理涉及检验过程的每一阶段。
按照ISO 9000文件,定义质量管理中致力于实现质量要求的措施、方法等称为质量控 制。质量管理中致力于提供实现质量要求信任的证实的活动称为质量保证。但是从2000年 起,ISO 9000文件不再使用“质量保证”一词,在临床检验中多以“质量评估”表示。
二、医学实验室管理技术的主要内容
1、选择和评估检测系统
任何一次检验都有误差。检验的测定值与理想的真值的差异即为误差。无论是选择和评估检测系统,还是在日常工作中进行质量控制,关心的都是误差。
从质量管理意义上可以将误差分为检测系统的稳定状态(固有)误差和检测系统对病人标本日常检验的不稳定状态(外加)误差。要使检验结果符合质量要求,除了有质量控制外,还必须要对使用的检测系统(即方法学,包括:仪器、试剂、方法、原理、校准品、检测程
序等一体。以往也成为实验方法学)作严格的选择和评价,确定它的不精密度、不准确度、病人结果可报告范围、分析灵敏度、分析干扰和参考范围等分析性能。这些性能反映了检测系统的稳定状态误差水平。在检测系统正式用于实际检测病人标本前,必须了解在检测系统最佳稳定状态下使用时的总(固有)误差水平。实验室只有使用总误差水平在临床上可接受的低水平的检测系统,才能真正使检验结果符合临床要求。
2、统计质量控制
实验室期望所有病人检验结果的误差一直处于评估检测系统时所具有的总误差水平,也即最佳水平,又称“稳定状态水平”。
临床检验工作和其他分析领域工作最突出的差异,是临床检验对每份病人标本只做一次检验就发出报告。使每份报告引入的误差,较之取多份样品,做多次检验取均值报告结果内含有较大误差,特别是随机误差。因此,必须强调做检验一定要有质量控制。将控制品和病人样品一起做检验分析,以控制品检验结果(控制值)了解分析过程的质量情况称之为“分析过程质量控制”。分析过程质量控制使用了统计方法对控制值进行归纳分析,便于了解质量状况,所以分析过程质量控制亦称为统计质量控制。
近几年来,结合行政分析允许误差限值以及临床允许误差限值要求,提出花最少的钱作最有效的控制的高效率质量控制是当今第三代控制技术,引人注目。
3、重视分析前和分析后检验的质量管理
随着检测系统和质量控制方法的发展,分析中的质量已有了极其
显著的改进。近几年,将改进实验室质量的努力已逐渐置于分析前和分析后阶段。没有好标本,检测系统无法获得可靠结果,质量控制方法也无能为力。因此从病人被临床要求进行检验起,直至取样品作检测前,必须重视分析前病人准备和识别,标本采集、运送、处理、保存等每一环节,确保病人标本的质量。分析后对检验结果的数据运送、计算、打印检验报告单中,任一疏忽出现的问题,都应属于差错,不是分析误差。差错不是要控制而是要消除。应充分重视分析前、后的检验过程的质量管理,尽早改变目前国内这一方面的落后状况。
4、检验项目在临床运用中的价值
加强检验与临床的联系和交流,让临床了解各个检验项目在诊断和治疗、随访中的价值,了解诊断和体检中检验结果应用的不同。使临床医生在申请检验时,可以有目的地选择有关项目,并使每个检验结果都在临床上发挥作用。
第二章 检测系统的发展和完善
第一节 检测系统及其基本性能
一、什么是检测系统
完成一个项目检测涉及的仪器、试剂、校准品、操作程序、质量控制、保养计划等的组合为检测系统。若是手工操作,则还必须包括具体操作人员。
二、检验管理对开展检验项目的要求
1、在美国1988年国会通过的临床实验室修正法规(CLIA’88)中,明确指出:实验室收取病人标本,进行检验、发出报告的项目必须要有具体数据和资料,说明如下:
(1)开展该项目检验使用什么牌号、型号的仪器;使用什么公司
的试剂(包括产品号);什么校准品(来源,产品号);具体操作程序(另有详细规定);质量控制(另有详细规定);仪器保养计划等。
(2)项目的操作分析性能。在上述检测系统下,经具体实验说明
它的① 不精密度(总不精密度);② 不准确度(方法学比较结果);③ 病人结果可报告范围;④ 分析灵敏度(检测限);⑤ 分析特异性;⑥ 参考范围;⑦ 其他须说明的性能。
(3)经有关行政管理部门核实,认可该检验科开展的一些项目在性能上符合要求,行政同意该检验科可对认可的项目开展收费检验。
(4)在开展检验期间,实验室不可对上报内容所属范围作任意变动或修改。
2、面对众多项目,检验科单靠自己的努力,无法完成所有项目的性能评估实验,希望有专家帮忙。
3、生产厂商从只提供仪器或试剂,进而为保证检验质量,提供了配套试剂和校准品,也规定了操作程序。对这系列服务具有的性能作了完整的评价。在向美国联邦药品和食品管理局(FDA)申报产品许可时,并不是一台仪器的被认可,而是对整个系统的认可。
4、在美国,按CLIA’ 88规定,实验室使用的检测系统若得到FDA认可,用户若完全按照厂商要求,使用相应配套试剂、校准品,按操作程序作检验,开展质量控制,定期保养,则该系统各项目的操作分析性能完全由厂商提供,承担责任。行政部门对这些项目在检验科中的使用属“免检”项目。
5、但是,若用户换用其他型号、牌号的试剂和(或)校准品,更换操作程序等,原被认可性能无效。行政部门要求实验室必须重作评估,上报材料。
6、最近,欧共体的诊断产品认证机构对厂商明确要求,在今后的推广和服务中,厂商必须做到:告诉用户,只有使用公司提供的系列产品,方能保证得到审批认可的可靠结果。
三、重视检测系统的原因
1、追求质量。让检验结果最好地符合病人实际情况,并能及时地发出检验报告;依据检验结果,检验科还能主动地为临床或病人提供咨询,建议再做什么检验项目,有助于临床对病人的诊断和治疗。
2、检验结果在对病人的诊断和治疗中应有可比性。不管病人在世界上什么地方,同一病人同一项目的检验结果是一样的。
3、所有的仪器、试剂、方法的发明和研究,都是用来作病人新鲜标本检验的。因此各个检测系统对同一份标本的同一项目结果,相互间应具有可比性。这是所有生产厂商为之努力的方向。
4、长期实践说明,只有形成一个固定组合的检测系统,才能在世界上任何地方,所有 检验结果间具有可比性。否则就没有可比性。
5、大量资料证明,数千套同一检测系统(同一公司,同一型号)遍布世界,它们的室 间评估成绩变异系数可以很小。这充分说明检测系统的必要性、可行性和有效性。
四、检测系统性能的证实和评价
刚添置的检测系统在正式用来检测病人标本、发出检验报告前,实验室要对系统的操作分析性能作实验予以证实。证实实验性能主要是精密度、病人结果可报告范围和准确度;肿瘤标志物类的检验还需做分析灵敏度。实验室自行研究或开发了一个检测方法,为了使方法的检测结果符合临床要求,必须对方法的性能作详细而全面的实验,这时的实验是对性能的评价。只对他人或厂商的评价资料中几个主要性能做实验予以确认。实验室如使用的检测系统是公司的系列产品,只要做性能的证实。但是,实验室对原检测系统作任意变换,仪器不变,换用各种试剂盒和校准品,有的还改动操作程序等,在以上任一情况出现时,为了保证病人检验结果的可靠性,实验室必须对新组合的各项目检测系统性能作全面的评价,用数据证明新组合系统可靠,方能据此检测病人标本,发出报告。
第二节 医学实验中的基体效应
为了使实验结果符合质量要求,实验人员必须充分了解检测系统的分析性能。在进行这些性能评价实验时,尽可能采用病人标本,避免基体效应。所有的检测系统都是用来作患者
标本检测的,只有对病人标本实验结果具可靠性才有价值。基体(Matrix)也被称为介质或基质。近三十年来,实验室质量不断提高,揭示产生误差的原因也随之深入。对基体也逐渐有了更多的理解。
一、基体效应和回收实验
1、几个基本概念
(1)基体:分析样品中,除了分析物以外的所有其它物质及组分称为该分析物的基体。
(2)基体效应:检测系统检测病人标本中的分析物时,处于分析物周围的所有非分析物质(基体)对分析物在检测中的影响,称为基体效应。
(3)回收:分析方法对于样品中分析物的适当增量能实际检出的能力。用于该目的的实验为回收实验。它可以对分析方法使用纯标准液为标准,检测样品为病人标本时,实验结果受基体效应的影响作估计。
2、对回收理解及克服基体效应方法
(1)回收率对基体效应的估计:回收率接近100%,说明分析方法对于分析物无论在纯溶液中还是在复杂的基体环境中,反应能力是一致的,即分析不受基体影响。若回收率明显偏离100%,说明分析方法对于分析物处于的基体环境不同,反应能力有明显差别。因此回收实验可以对分析方法受基体效应的影响作出估计。
(2)克服基体效应的方法:使测定标准和标本处于相同的基体环境。即标准亦应使用和被测标本相同的基体配制。测定的是血清,则配制标准的也应是血清,以抵销基体效应的影响。尽管将纯的分析物配制于混合血清只是一种模拟方式,并不能适用于所有不同疾病的病人标本,但只也是目前的唯一方式。
(3)基体效应并不就是干扰作用:它包括了总的干扰作用。干扰和特异性评价中的一些非分析物的作用方式或原因是很清楚的,而基体效应只是对现象的分析和归纳的一种概括,尚无完整的解释。
二、控制品、校准品等引入的基体效应
各种室间调查用的控制品、室内控制用的控制品和校准品都经过加工处理,都不是日常实验的新鲜病人标本。可以认为,所有各种测定方法、仪器、试剂、检测系统等都是设计用来作新鲜病人标本检测的,对患者病人检测具有可靠性,但是不一定对各种处理过的样品的检测提供可靠数据。在平时,检测新鲜病人标本时不常见的偏倚(Bias),在检测处理过样品时却常见,因为在处理过材料中有新鲜样品所没有的基体变化。这是新鲜标本和处理过样品间的基体差异产生新的基体效应。这些基体效应决定了校准品专用性和室间质量评估方法复
杂性。
三、回收实验示例
手工碱性苦味酸法测定肌酐是常用的方法,多以肌酐标准水溶液为标准。这样的做法对病人标本的检测结果有多大的影响?为此,设计回收实验了解标准和病人血清间明显基体差异产生的基体效应。
1、绘制标准曲线 在进行回收实验前,应该先用浓的肌酐标准液绘制标准曲线,了解苦味酸方法对纯肌酐显色反应的线性范围。
2、收集样品 收集混合血清,离心、过滤备用。另外,将肌酐储存标准液用0.1 mol/L硫酸稀释成:10000、6000、4000、2000、和1000 μmol/L肌酐标准液。配制系列回收样品, 各管混匀后用苦味酸方法检测显色,读取吸光度。从标准曲线上查得肌酐浓度。
3、测定结果和计算
肌酐在医学决定水平150μmol/L处,由于基体效应的影响引入的比例误差为:
(1)以百分值表达:PE(%)=-100%=87.74-100%=12.26%,
(2)以计量单位表达:
PE=-100⨯XC=87.74-100⨯150=18.5μmol/L。
(式中XC为医学决定水平符号)
回收率=回收量⨯100%。 加入量
如1号管回收样品,回收量为85μmol/L,加入量为
100μmol/L,回收率(R)为R = 85/100 =85%。
本例说明,用肌酐的水标准液做肌酐苦味酸的标准,会引入约12%的负偏差。这是由于标准和病人标本间具有基体差异所致。
将此误差和允许误差比较,如果PE小于允许误差,认为尽管有基体效应,但不会影响临床的应用,意即肌酐的水标准液仍然可用。现今,判断误差是否可接受的允许误差指标都以美国临床实验室管理法规(1988)CLIA’88为准。肌酐的允许误差为T ± 15%,现PE(%)为12.3%,小于15%;或者算成肌酐浓度,在XC为150μmol/L处的允许误差为EA= 150× 15 % = 22.5μmol/L, 18.5μmol/L<22.5μmol/L,二者都认为属可接受。
需注意的是,这个指标是室间质量评价的最低标准,包含了标本检测时可能出现的所有
误差,所以作出可接受的判断要谨慎。在条件许可下,还是采用血清的校准品替代水的标准液,克服这12%的比例误差,使病人标本的检验结果更为可靠。
第三节 标准品和校准品
传统的临床检验,要使检验结果可靠或有依据,往往有一个标准品(Standard)。
为了克服纯标准液和病人样品间的基体差异,20年前开始引用具有与病人样品基体相似的校准品替代标准品,用于日常工作。
一、标准液的定值
一般而言,检验工作使用的标准品属应用标准。配制或供应这类标准品的实验室或厂商具有符合质量标准的纯品。称取一定量的纯品,然后将其溶解,在容量瓶内用溶剂稀释至容积刻度,混匀,标准液配制完成。由称量法获得的称量值和容量法配制的容积,计算出该标准品浓度。检定部门抽样测定,结果在规定范围内属合格。即使测定检定结果在范围的上、下限,也不能将实测值作为标准值。因为测定值的可靠性取决于检定方法,一般的分析方法的可靠性不如分析化学公认的称量法和容量法。所以标准品的定值由称量和容积计算确定。检定不合格即报废,决不可将实测值替代修正。
二、校准品的定值
1、校准值随方法而异
校准品的大多来源为人的样品混合物,如混合血清。本身内含被检分析物,制备时可添加某些分析物增加含量。校准品中被检分析物的含量无法由称量法和容量法确定,只能倚赖于分析方法。校准品的校准值必须取决于分析方法或检测系列。
2、新鲜病人标本是最佳校准品
由于所有校准品都是处理过的样品,和新鲜病人标本有着基体差异。若使用公认的参考 方法去标化测定校准品,测定程序是严密的,测定值是可靠的。但使用该测定值去校准常规的检测系列时,校准品中被检分析物参与反应时的表现明显不同于新鲜病人标本,不能将参考方法系列的准确度通过校准品传递给病人标本。所有用于检验中的检测方法、仪器、试剂等都是用来检测病人新鲜标本的,不是用来检测校准品这样的处理过样品。如果先用公认的参考方法检测病人标本,再以具有参考值的病人标本去校准某检测系列(包括方法、试剂、仪器),此时该检测系列再检测其他新鲜病人标本时,这些病人标本结果的溯源性可上溯至公认的参考方法。也即用新鲜病人标本是校准检测系列的最佳校准品。用这种方式校准,能
使同一个检测系列在不同实验室检测新鲜病人标本时,检验结果在实验室间具可比性。一些大公司正是按照这样的认识为校准品定值。
3、校准值不是测定值,是纠正的调整值 (Corrected Value)
制备的校准品,专用于指定的某公司型号的仪器、试剂、方法和检测程序组成的检测系统。因此校准品只能为这样的系统服务,起校准作用,不能对其他系统作校准。
4、具多个校准值的校准品
专门供应试剂盒的厂商,为了使他们的试剂盒用于各种类型、型号的仪器和方法,也同 时为客户提供校准品。同一个校准品适用于不同系统必须有不同的校准值,这样的做法充分说明校准值的专用特性。决不能一个校准品、一个校准值、一种试剂盒用于各种不同的仪器;也不能一个校准品、一个校准值,用于不同的、已具有原试剂配套的仪器系列;无论哪一种方式均使病人样品的检测结果不可靠,也不具有溯源性。
第三章 分析性能的评估
第一节 分析误差
分析性能的评估是对检测系统作病人标本检测时可能具有的误差。实验室一定要使用可靠的检测系统,它的稳定状态误差较小,在临床上属可接受低水平之内,方可用于常规工作。这是保障检验结果质量的前提。
从误差的性质上,可以将误差分为随机误差和系统误差。性能评估实验也相应设计为了解不同性质的误差。最后,还需综合起来反映总的误差水平。
一、随机误差(Random Error,RE)或不精密度 (Imprecision)
这类误差可正可负,亦无一定的大小,称为随机误差。若将某标本作多次检测,用均值()表示这组检测值的平均水平,标准差(s)为各检测值对于均值的离散程度的指标。检验的特点是每个标本只做一次就发出检验报告,因此检验结果Xi是对标本作多次检测的一个抽样。所有重复检验的Xi值以值为中心,它们和的差异有大有小,方向各异;这即是随机误差的表现。临床希望同一标本的各次检测值Xi重复性好,这是人们对精密度的追求。精密度的定义是重复检测值间的一致性。度量精密度好坏是不精密度。重复检测值的s大小反映在均值下的精密度水平,也可以变异系数(CV)表示相对变异大小。检验结果报告内具有的随机误差,常以95 % 可能性出现的最大随机误差量表示。也即发出的报告
都认为是均值,但是实际报告值Xi和具有的最大差异(95 % 可能性)为1.96s,以这样大小的差异量表示标本只做一次检验发出的报告中具有的随机误差估计量。写作RE=1.96s(在时)。
须注意的是,实际报告结果中的随机误差(相对于而言),有大有小。有的和均值很接近,真正达到1.96s误差的并不多。若这样的随机误差小于临床允许误差,是实验室认为该检测系统可用来检测病人标本的前提。
二、系统误差(Systematic Error,SE)或不准确度(Inaccuracy)
这类误差有一定的方向和大小,称为系统误差。有系统误差的结果是不准确的。准确度的广义定义是:检测值和真值的一致性。但是它们之间的差异既有随机误差,也有系统误差。检验中为了确切表示准确度常以相对准确度表示,即:检测均值和真值的一致性。它们的差异称为偏倚,亦即系统误差。它使检测结果偏高或偏低,有一定的大小。度量准确度亦以不准确度即偏倚来表示。
造成检测系统不准确的因素大致上有两方面:一是检测系统自身的,如方法特异性差或严重的基体效应等;二是检测系统和某一认可的检测系统或方法,同时对一批病人标本作对比检测,检测结果的差异是两个检测系统间的系统误差。后一种系统误差更被大家重视。现今,在表达检测系统或方法的准确度时,直接指的是检测系统间或方法学比较的系统误差。
两个检测系统对同批标本检测后,以公认的检测系统或方法(亦称为比较方法,Comparative method)为X,被评价的检测系统或方法(Test method)为Y。度量系统误差(SE)的方式有两种,。在标本的检测值都比较集中时,两个系统检测病人标本的结果均值间
SE=- 的差,表示在X方法的均值时两方法间具有的系统误差。写作:(在时)。
在标本检测值分布较宽、有较大的范围,如果各标本的成对结果在坐标纸上具有直线趋势时,可以用直线回归统计归纳。这个方式可以了解两方法在检测过的浓度范围的任一处的系统误
ˆc,则差。若某医学决定水平浓度为Xc;在回归式上,相对与Xc的被评价方法的估计值为Y
ˆc-Xc=(b-1)⋅Xc+a。 SE=三、总误差(Total Error,TE)
病人检测结果内含的误差应包括随机误差和系统误差。所以反映检测系统稳定状态总误差是随机误差和系统误差的加成,为TE=RE+SE。因为病人标本的每个项目只做一次检测,结果中的误差的“最坏”表现即为TE。
实验室人员习惯将误差分别看成不精密度(随机误差)和不准确度(偏倚),而医生和病人关心的是总误差有多大。总误差反映了客户和消费者对检测性能的估计,这也是判断检测系统可接受性中最重要的参数。
第二节 不精密度的估计
医院实验室对病人标本检测时,由于该行业的沿袭特点,一直是对每份标本只作一次检测发出报告。这也是为什么国际上将不精密度性能列为实验方法、仪器或试剂盒分析性能的第一位的原因。检测结果必须具重现性,也即有良好的精密度。
对某样品作多次重复测定,均值是这组测定值的平均水平。标准差s是各重复测定值对于均值的离散程度指标。标准差大小反映了该检测系统的不精密度水平。影响标准差大小的因素很多。因此表示检测系统的不精密度时,应在使用什么样品,在什么分析物浓度下,作精密度估计的实验周期多长等的条件下才具有意义。现今应使用真正的病人标本,其内含分析物含量浓度在医学决定水平时,并且综合各类测定周期条件去评估检测系统的不精密度。 长期来,国内往往将不精密度分为批内、批间和天间的水平。在实际使用中临床只关心的是检测系统总的不精密度。
自20世纪90年代起,国际上推荐使用总不精密度,并且为了更好地检出不稳定的误 差,已明确提出检测系统的批内标准差s或变异系数CV应为美国的临床实验室室间质量评估允许误差(CLIA’88)的四分之一,天间标准差s或变异系数CV应为该允许误差的三分之一。达到这样要求的检测系统,可认为它的随机误差属于可接受的低水平。
一、重复性实验基本要求 精密度评价最普及的是对稳定的样品作多次测定,求这些重复测定值的均值和标准差s,以及变异系数CV。重复次数一般要求20次。若在一批内的重复测定,这是批内不精密度;若每天做1次,连做1个月,这是对检测系统天间不精密度的观察。进行精密度实验要注意以下几点:
1.样品基本要求 做重复检测的样品一定要稳定;它的基体组成应尽可能相似于实际检测的患者标本;样品中的分析物含量应在该项目的医学决定水平处。有可能的话,做2个水平的精密度实验。
2.样品稳定 采用冰冻保存的样品一定要注意内含分析物的稳定,要严格控制冻融、混匀的操作。
3.冻干控制品的使用 若每天复溶冻干控制品作实验,要注意选择产品的稳定性和瓶间差。要严格控制每次复溶冻干品时使用的复溶液的质量、开瓶的小心谨慎、加液的准确性、使冻干块浸润并复溶的时间、以及混匀的操作手法等等。
4.收集实验数据 计算均值和标准差,变异系数。从允许误差表中查阅评价的该项目
允许误差范围。小于或等于判断限的,检测系统的不精密度属可接受;大于判断限的表示不精密度不符要求。
二、精密度实验示例
统计归纳表
2、双份检测差异的标准差:有些检验项目平时送检的标本很少,或者标本很难保存;也没有合适的控制品。无法按照上例的模式进行精密度评价。双份检测差异的方法可以大致上了解它们的精密度性能。
第三节 分析灵敏度
一、分析灵敏度(检测限)
可检测的最低分析物浓度为检测系统的分析灵敏度或称检测限。确定检测系统的可报告低限是重要的分析性能。
二、检测低限 (Lower Limit of Detection, LLD)
检测低限定义为样品单次检测可以达到的、确实为非空白检测响应量对应的分析物量。检测系统或方法对小于或等于检测低限的分析物量只能报告“无分析物检出”。通常估计95%或99.7%的两种可能性:
95%可能性:LLD=空白+2⋅S空白
99.7%可能性:LLD=空白+3⋅S空白
要注意的是,直接读出浓度单位的检测系统对低于零的检测将报告零,其分布不是正态的,因此计算的均值和标准差不能如实表达检测低限的真实情况。若检测响应可以初始值表示,如:吸光度、荧光、等,此时S空白是有效的。所以应使用初始值来计算均值和标准差,
然后再转换成浓度单位。
三、生物检测限(Biological Limit of Detection, BLD)
生物检测限定义为:以检测低限加2或3倍检测限样品标准差的方式,确定检测系统或方法可定量报告分析物的最低浓度或其他量值的限值。
生物检测限(BLD)的具体度量方式为:
95%的可能性:BLD=LLD+2⋅S检测限样品
99.7%的可能性:BLD=LLD+3⋅S检测限样品
四、功能灵敏度(Functional Sensitivity, FS)
功能灵敏度定义为:以天间重复CV为20%时对应检测限样品具有的平均浓度,确定检测系统或方法可定量报告分析物的最低浓度或其他量值的限值。为了估计FS,须用多个检测限浓度来确定在低浓度处的精密度表现,从中选择具20% CV的浓度。在证实厂商的 FS的说明时,使用的检测限样品浓度应和厂商的说明相同。
第四节 病人结果可报告范围评价实验
一、病人结果可报告范围
病人标本未经任何预处理,由检测方法得到可靠结果范围为病人结果可报告范围(简称为可报告范围)。也即在此范围内不同病人标本报告结果值间的比值反映各标本内含有的分析物确实有这样的比例关系。
近年来,具计算机的自动分析仪已经普及。仪器可对实验响应呈不同表现的结果作适当的处理,直接以最终计量单位方式报告检测结果,符合临床要求。在此情况下,评价检测结果可报告范围时,不必再去评价响应结果的真实曲线状态,只要将样品作不同程度稀释或配制后,将预期值和实际检测值作比较,绘制在座标纸上应呈一条通过原点、斜率为1的直线。直线所达的限值即为该方法的检测结果可报告范围。
二、评价实验要求
1、进行可报告范围实验的样品必须和真实标本尽可能相似,即要和真实标本具相同的基体状态。
2、最好有5个或以上的系列浓度的实验样品,浓度范围遍布整个预期可报告范围。最高浓度的样品应达到可报告范围的上限。各实验样品内含分析物浓度呈等比例关系,不要呈倍比关系。
3、若能收集到含低浓度分析物的患者样品(如血清),将外观澄清的混合样品离心或过
滤后,一分为二。在一份混合样品中加入高浓度分析物贮存液,加入体积不得超过混合样品体积的1/10,但又可使样品中分析物浓度达到高限,充分混匀后为高值(H)样品。在另一份混合样品中加入配制分析物贮存液的溶剂,加入量等于前一份样品中加入的贮存液体积,充分混匀后为低值(L)样品。将H和L样品按:5L、4L+1H、3L+2H、2L+3H、1L+4H、5H关系各自配制混合,形成系列评价样品。
4、难以收集到低限样品,可以只收集高值样品,用生理盐水作系列不同程度稀释,形成系列评价样品。如进行载脂蛋白A1或B测定的可报告范围评价时,国际上将高值血清用生理盐水稀释成内含载脂蛋白量为原血清中量的30%、40%、50%、60%、70%、80%、90%、100%。由于载脂蛋白实验的方法学的特点,过低的载脂蛋白测不准,所以才只稀释到约30%的水平。一般可报告范围的实验尽可能低一些。
5、评价实验时要综合注意检测系统或方法的批间重现性。建议从低浓度到高浓度,每个实验样品做3次重复测定。
三、判断可报告范围的统计处理
ˆ=bX+a。理想状态下,预期值和实测用直线回归统计对数据作处理,得直线回归Y
值间呈通过原点、斜率为1的回归线,即斜率b为1,截距a为0。实际统计结果b不会正好等于1,a不会为0。若b很接近1(例如b 在1.00±0.03范围内),a近于0,则可直接判断该测定方法可报告范围为实验已涉及浓度范围。
所有实验点在坐标纸上呈曲线趋势的,按曲线规律处理。在实际使用时每次或定期绘制标准曲线,从曲线上查阅结果。在自动化仪器上将由数据处理软件进行检测信号和分析物量的转换。为了便于理解线性或可报告范围的内容,这里用实际工作中的例子逐一说明。
第五节 分析干扰
一、分析的干扰
分析的干扰广义上是指某一物质对某分析物的浓度或催化活力测定中任何一步骤的影响作用称为分析干扰。分析物是标本中准备测定的组分。干扰物也是标本中的一个组分,它不是被分析物,但它改变最后的结果。干扰作用可看成是绝对的或相对的,绝对干扰作用是:一般病人标本中不含有某物质,一旦它的存在即会引起干扰。相对干扰作用:一般病人标本中含有某物质,其含量相当于混合样品中的平均浓度,不同病人样品中含该物质的浓度变化引起干扰作用的变化。从实用考虑:相对的内容在临床实验中更有意义。
干扰不涉及在分析前就使分析物浓度发生真实变化的作用,这些作用可以是:①体内药物作用(如:因使用药物后的生理响应使激素浓度变化)。②标本处理(由于蒸发、溶血或者血清和凝块过长的不分离使电解质、蛋白、水含量的改变)。③标本收集[例如:在静脉滴注时(内含分析物)取样]。
这些作用可能会影响实验结果的临床应用,但不能视作“分析干扰”。因为不管分析物原来如何,一个检测系统或分析方法应检测标本中所有的分析物。分析干扰所引起最终结果是人为的增加(阳性干扰)或减少(阴性干扰)。
二、干扰物质的来源
在标本中的干扰物可分成内源性和外源性。
1、体内某些病理条件下产生的(例如:胆红素、脂肪、蛋白质、血红蛋白等)。
2、在病人治疗时摄入的(例如:药物、非肠道维生素、血浆增溶剂、抗凝剂等)。
3、自我摄入(营养补充、饥饿过度、酒精或药品中毒)。
4、由于标本被污染(抗凝剂、防腐剂、血清分离器、收集、容器、塞子等)。
三、干扰的机理
存在于标本中各种干扰物以多种方式影响分析过程。
1、物理作用 干扰物具有的物理性质,使它和分析物一样被检测和测定出来。
2、化学作用 干扰物可能会影响酶活力;干扰物也可破坏或阻止反应。干扰物也可改变分析物的形式。
3、非特异性 干扰物可能和分析物以同样的方式参与反应,在免疫化学方法中干扰物可能和抗体发生交叉反应,干扰物可能催化某一反应,反应结果中和了底物。
四、临床重要性
1、干扰对于总分析误差有时是一个主要因素,每个病人结果和真值间的偏离可能有三个原因:①系统偏差;②不精密度;③干扰。
干扰实验评价主要估计偏倚和不精密度的作用,干扰试验通常受标本条件所限,对实验室技术人员而言通常是溶血、黄疸和脂血。
2、干扰可视作系统的和随机的。①对一个特别监测的病人而言,如干扰物总是以同一浓度存在的话,偏倚将是恒定的,偏倚随干扰物浓度而改变。这种干扰是系统的。②对于一给定病人人群,由于干扰物浓度各异,由干扰物所形成的偏倚将是随机的,而且显著地作用于总随机误差,影响病人结果。
无论何种情况,由一个干扰物引起的未预料作用可导致对实验室结果解释的严重误差。
3、实验室是克服这些问题的主要角色,可由:①只使用对干扰物的敏感度不高和确定的方法。②获取资料,确定是否有干扰物质存在于样品。③告诉医生,由于有干扰存在,结果可能是不可靠的。
厂商可提供给实验室完整的有关干扰评价的结果文件,这是很好的资料来源。
第六节 准确度性能评价
实验室准备用一个新的检测系统或测定方法(或新的试剂盒、新仪器)进行病人标本测定前,应和原有的检测系统或者公认的参考方法一起检测一批病人标本,从测定结果间的差异了解新检测系统或方法引入后的偏倚。如果偏倚不大,或者偏倚量在允许误差范围内,说明两检测系统或方法对病人标本测定结果基本相符,新检测系统或方法替代原有检测系统或方法不会对临床引入明显偏倚。这样的实验成为方法学比较实验。
一、方法学比较实验要点
在方法学比较中,常将新方法称为实验方法;与之比较的方法称为比较方法。作方法学比较实验时,有下列几点应予以考虑。
1、实验人员有足够的时间熟悉检测系统各环节(仪器、试剂、校准品及操作程序等),熟悉评价方案。
2、在整个实验中,保持实验方法和比较方法都处于完全质量控制下,始终对实验结果有校准措施。
3、实验时间至少做5天,时间长一些更好,可以客观反映实际情况。
4、至少做40份病人标本,多一点更好。实验的可靠性和有效性随时间延长及更多的标本量而增加。
5、标本事先应做选择,尽可能使50%的实验标本内分析物含量不在参考区间内,各个标本内分析物含量分布越宽越好。不要使用对任一方法已知会干扰的标本(如溶血)。
6、每份标本应有足够量,以便使实验方法和比较方法都能做双份测定。
7、应在2小时内2个方法对同批标本分别开始实验。最好使用当天采集的标本,若需 保存标本,应确保它们的稳定性。只使用一种保存条件,能符合2个方法的要求,以免条件不一引出新的变异。
二、实验数据的收集和处理
1、不采用已明确有人为误差的结果。
2、将所有无明显误差的实验结果记录下来。但是,若2方法结果差值大于任一方法的批内不精密度,应查对标本,并重新实验。若找不出原因,应保留数据备考。
3、整个实验一定要有内部质量控制,失控时结果必须重做。
4、对实验数据的初步检查:将实验结果点于x、y坐标纸上。若所有实验点均匀分布斜率为1通过零点的理想直线附近。而且点子和理想直线间的离散较小;说明方法比较实验反映的系统误差不大。若实验点分布呈非线性趋势,它常常在浓度高值处表现明显,说明实验比较的2个方法中有一个方法的可报告有问题。应该寻找出问题后重做实验。或者,观察是否有部分呈线性关系。若确实如此,寻找修正点,使余下的部分具线性趋势。但须考虑这部分是否包括了临床上有用的范围。若可以,再多做一些在此范围的标本结果,继续数据处理。如去掉非线性部分后,范围过小,无应用价值,停止评价。
5、X、Y关系实验点有无离群表现。即有一个或几个实验点与众不同;点子偏离大多 点子分布的走向。出现离群点表现的数据不能随意取舍。应该及时重做实验,以数据证明属于实验的偶然误差,方可将原离群表现的结果用正确的结果取代。凡有剔除的,应另用标本补做。
6、标本内分析物含量分布是否适当的检验。相关系数r常用来表示2个变量间互相关 系密切的程度。一般要求r大于或等于0.975 (或r2大于或等于0.95),认为X范围是适合的。若r小于0.975,应再多做实验,扩大数据范围。
7、线性回归统计 可用直线回归分析来估计斜率和截距。对上述n个标本,n对(xij、yij )
ˆ=bX+a 表示这些数据的直线趋势。这是以X方法为准,Y 方法与之配合数据以回归式Y
的关系式。式中b为斜率,a为截距。如果2方法表示的某分析物量具相同的计量单位时,
ˆ=X,即b=1,a=0。b≠1,a≠0表示两方法间在测定标本时的系统理想状态的回归式应为Y
误差。根据临床使用要求,可在方法学比较实验检测到的浓度范围内,各个医学决定水平浓度Xc处,了解Y方法引入后相对于X方法的系统误差(SE)。
以计量单位表示的系统误差为:SE=(b-1)⋅XC+a,
或以百分值表示的系统误差为:SE(%)=(b-1)+a⨯100% XC
8、以美国临床实验室修正法规对室间评估的允许误差为判断依据,由方法学比较评估 的系统误差(SE)不大于允许误差,认为系统稳定状态的系统误差属可接受的低水平。
三、方法学比较数据统计应用的意义
如果相关系数≥0.975,说明方法学比较实验标本选择恰当,分析物浓度分布符合要求;回归统计的斜率b和截距a可靠,可以用它们去估计引用新方法后带来的系统误差;并以医学决定水平处估计的系统误差量判断新方法可否替代老方法。如果相关系数<0.975,说明回归统计的斜率和截距不能用来估计新方法带来的系统误差。
在方法比较实验中,每份标本同时被2个比较的方法测定,对所有标本数据归纳处理时, 形成了配对的资料。因此,对方法学比较数据作t检验统计的只是配对t-检验。
t-检验是对2组比较数据的均值间在统计上有无显著性差异作出判断。千万不要将有显 著性差异看作均值间数值相差很大;t-值只说明2个均值代表的2组数据的分布有无倾向性的表现。
第六节 检验项目的参考值和参考区间
实验室应为检验项目提供可靠的参考区间(Reference Interval),才能使临床对健康普查者的检验结果作出判断,对病人检验结果有大致的了解,发挥检验报告的作用。因此获得检验项目的可靠的参考区间是实验室的重要任务。
一、几个基本概念
1、参考个体(Reference Individual)
依据临床对某检验项目的使用要求确定选择原则,以此选择的测定参考值的个体。所有参考个体的集合为参考总体。
2、参考抽样组(Reference Sample Group)
从统计意义上,一定数量的参考个体是从参考总体中的一个抽样。在现今的参考值建立中,都是对参考抽样组作具体研究,在一定的可信限条件下,成为某项目的参考值和参考区间。
3、参考值(Refarence Value)
对一个参考个体进行某项目测定得到的的值为该个体的参考值,所有参考抽样组的各个参考值合起来即为参考值范围。
4、参考区间和参考限(Reference Interval or Reference Limit)
依据所有参考值的分布特性以及临床使用要求,选择合适的统计方法进行归纳分析后, 确定参考值范围中的一部分为参考区间,区间的两端为参考区间的限值,分为低参考限和高
参考限。
一般情况下,常选择95%分布范围的大小表示参考值区间。例如 从2.5%位数到97.5%位数所在的区间。亦可从0%~95%位数;或者选择99%的上限值。
5、“正常值”、“正常范围”及“参考范围”,“参考值”常被称为“正常值”。“正常”理解为健康,若测定值不在参考区间内,意即检查对象有病或不是良好健康状态,亦即“不正 常”。其实无法判断谁是正常人,健康只是相对的,因此“正常”词义不清。另外,“正常”亦理解为所有数据呈高斯(正态)分布。但生物数据大多不呈高斯分布。为使精确而少混淆,应不用“正常值”一词,而用“参考值”,自然亦不再用“正常范围”。
很多地方用“参考范围”表示“参考区间”。“范围”常定作实际的最小和最大测定值的一组值(即:参考值组的整个范围)。因此“参考范围”应是参考抽样组内所有参考值集合,以最小的和最大的参考值为界限。显然“参考区间”只是“参考范围”的一部分,而不是全体,两者不能混淆。
二、对新项目建立参考值范围和参考区间计划
1、根据文献及实验研究,总结对该项目测定结果产生的生物变异和分析干扰的因素,供选择参考个体时用。
2、确定参考个体的选择原则(或排除非参考个体的原则),编写与之对应的调查表。
3、依据调查表和其他有关记录,挑选候选的参考个体。
4、依据排除原则,剔去不符要求详细告诉各个受检参考个体,做好准备。
5、将采集标本前和采集时对受检查的要求详细告诉各个受检参考个体,做好准备。
6、完善地采集标本,做好分析前的标本预处理。
7、在良好的控制条件下,用事先指定的分析方法对处理好的标本作检测,获得参考值结果。
8、检查有无明显的误差或离群点。若有,按事先约定原则,剔去不符要求的数据后,再补上必需的数据。
9、绘制分布图,了解数据的分布特性。选择合适统计方法,估计参考限和参考区间(包括:如合适的话,将数据分成几组,分别求参考区间)。
10、将上述工作,详细叙述成文备查。
第七节 判断检测系统性能的可接受性
检测系统性能评估实验的最终目的:
设计各种实验,了解检测系统或方法的性能,也即了解系统在最佳或稳定状态下具有的误差。方法性能评价实验的目的最终要对这些误差作出判断,决定检测系统或方法可否用于常规。判断取决于估计的误差的大小,将出现在病人标本的实验报告中,它们是否会影响临床的诊断和治疗效果的观察。以临床允许误差为准,和观察到的误差作比较;观察到的误差小于允许误差,检测系统性能属可接受;观察到的误差大于允许误差,检测系统性能属不可接受。
总误差的组成和判断方式:
检测系统性能最重要的是不精密度和不准确度。由重复实验对方法的随机误差作出估计;用方法比较实验得到被评价方法和比较方法结果的均值间偏倚,或者由回归统计计算某特定医学决定水平处的偏倚估计系统误差。这些误差的估计值应结合起来估计总误差的大小。医生和病人不关心实验结果的误差是不精密的还是不准确的,重要的是它造成的后果有多大。因为总误差包括了不精密度和不准确度二者,所以判断检测系统或方法性能可否接受,是看总误差的水平。
有3种计算总误差的方式,以TE表示总误差;TEa为允许总误差;s为标准差:
1)TE = 偏倚 + 2s < TEa;或%TE = %偏倚 + 2CV < %TEa
2)TE = 偏倚 + 3s < TEa;或%TE = %偏倚 + 3CV < %TEa
3)TE = 偏倚 + 4s < TEa。或%TE = %偏倚 + 4CV < %TEa
TE或%TE水平= 偏倚 + 2s 或= %偏倚 + 2CV>允许误差TEa或%TEa,检测系统性能属不可接受。
TE或%TE水平= 偏倚 + 2s 或= %偏倚 + 2CV<允许误差TEa或%TEa,检测系统性能属于可接受。
TE或%TE水平= 偏倚 + 3s 或= %偏倚 + 3CV<允许误差TEa或%TEa,检测系统性能属于良好。
TE或%TE水平= 偏倚 + 4s 或= %偏倚 + 4CV<允许误差TEa或%TEa,检测系统性能属于优秀。
计算总误差例子:
用Merck检测系统作血清肌酐测定,
总不精密度为天间重复性:n=20,=203.6 μmol/L,s=6.0 μmol/L
方法学比较(和HPLC法比较):
ˆ=0.801X+20.02 检测范围为:200~1200 μmol/L Y
r=0.998,n=30
CLIA‘88允许误差为 ±15%
需要判断:在200 μmol/L 肌酐处由Merck检测系统引入的总误差是否属可接受的低水 平。
1、对总随机误差的估计
RE = 1.96s =1.96⨯6.0 = 11.8 μmol/L < 30 μmol/L (200×15%)
或:CV =(6.0/203.6)×100%=2.95%,
RE%=1.96×CV=5.8%<15%
说明由重复性实验估计的总随机误差在可接受的低水平。
2、对总系统误差的估计:
由方法学比较的回归式求200μmol/L 的总系统误差
SE = | (b-1)Xc + a | = | (0.801-1) ⨯ 200 + 20.02 |
=|-39.8 + 20.02 | = 19.8 μmol/L< 30 μmol/L (200×15%)
或SE%=SE / Xc = 19.8 / 200 =9.9%<15%
说明由方法学比较实验估计的总系统误差在可接受的低水平。
3、对总误差的估计: 天间重复性实验的样品均值为=203.6 μmol/L,和现在需要了解总误差的分析物浓度 200μmol/L很接近,因此可以用该重复实验的结果估计总误差。
TE = RE + SE = 11.8 + 19.8 = 31.6μmol/L> 30 μmol/L
或TE%=RE% + SE%=5.8%+9.9%=15.7%>15%
所以,TE > TEa (31.6μmol/L >30μmol/L)。或TE%>TEa%
结论:Merck检测系统对肌酐测定的结果,引入的总误差在不可接受的高水平。该系统 不能用于常规检测。
第四章 质量控制
第一节 分析前质量管理
为了提高检验质量,应对分析前阶段的工作可能出现的误差予以充分重视。这是分析
过程中的质量控制手段顾及不到的。要使检验结果符合临床要求,必须强调分析前的质量管理。
分析前阶段工作可分成两部分:病人准备和标本收集处理。为了使实验室结果有效地用于临床,应了解在收集标本前和收集标本时,所有影响实验室结果的非病人疾病因素。对病人采集标本前以及采集时提出要求,采取各种措施,称之为病人准备。
一、病人准备
以采集血液标本为例:
1、血液标本采集前,病人必须空腹
2、记录采集病人标本时间 若对同一病人作多次测定,最好每次在同一时间收集标本,便于比较,以减少人体内各分析物昼夜变化的影响。
3、 固定采集血液标本的姿势 一般以正坐姿势采集为多。
4、采集血液标本时动作宜迅速 扎脉带使用时间要有控制,不能过长。
5、采集血液前要限制病人进行体育锻炼 特别是激烈体育活动。
6、要求病人在采集血液标本前应停止饮用咖啡、浓茶类饮料,不准喝酒。
7、严格控制病人用药 几乎所有药品都对各种分析物结果有影响,有的是分析干扰,有的是药物治疗作用。
尽早通知病人,做好解释工作 尤其对精神容易紧张的病人更要耐心仔细地说明一切,让病人解脱担忧。
二、标本收集和处理
1、严格执行病人、检验申请单及标本收集盛器的核对制度,保证无差错。
2、按照采集要求做好各项检查和记录,严格执行。
3、熟练采样技术,保证采集标本符合要求。
4、及时做好标本预处理。
5、正确使用抗凝剂。
三、实验室分析前的质量管理
1、在行政的协调和支持下,要使医院各部门都认识到,为了得到符合临床要求的实验报告,必须互相配合,共同努力。
2、临床和实验室应确定一般门诊、急诊及住院病人在不同情况下的必须检测项目范围。便于实验室工作安排,既避免浪费财力、物力,又保证实验质量。
3、抽血取样前后,护士及实验人员应做好病人姓名、性别、住院号、门诊号、申请单
受检项目、标本管等之间的核对工作,防止差错。
4、防止申请单、标本和实验结果的遗失。做好每一环节的时间记录,记录随标本一起传送。
5、明确在标本采集前对病人的要求,保证收集符合要求的标本。
6、拒收不符要求的标本。
7、做好标本的分离和保存。。
8、做好分析前标本的核对和分类。。
9、建立差错登记制度,予以充分重视。
10、经常保持和临床的联系、交流和查询。
第三节 统计质量控制基础
医学实验室面对的是各个病人的标本,事先不知道内含的分析物有没有?是多少?都是未知数。而且,医学实验室的特点是只对每个标本做一次检测就出报告。因此,针对实验室的特点如何使实验结果有质量,在20世纪的后50年内做了许多探索和努力,形成了现今的医学实验室统计质量控制的理论和实践。
一、医学实验室质量控制发展简要
1、Levey-Jennings控制图 1950年Levey-Jennings将统计控制引入临床实验室。在质量控制上,使用参考样品、将各单一检测值点直接点在图上的做法即为当今所说的Levey-Jennings控制图。
2、医学实验室质量控制发展迅速 在1960年以后,临床实验室的质量控制发展飞速,具体表现在:
(1)厂商发展了相似于病人标本的稳定控制品。这样的控制品已广泛地用于实验室工作中。
(2)对质量控制方法的性能特性有了更深的理解,并且精心设计了诸如多规则方法去评估和解释控制数据。
(3)提出了高效率的质量控制的概念。以往的Levey –Jennings的控制技术和Westgad的多规则控制技术,都是以实验室实际操作具有的误差水平为控制目标。与手工操作技术配合的控制技术是Levey-Jennings控制图,这是第一代的临床实验室质量控制技术。进入自动
化时代后,实验室操作质量有了极其显著的进步;实验操作速度和技术水平是以往无法比拟的。此时,希望有效地提高实验效率的同时,还必须保证实验结果的可靠,要求质量控制技术对失控误差的检出具有高特异性和高灵敏度。Westgard的多规则技术在1979年诞生,这是高效率质量控制的第一步,是第二代的临床实验室质量控制技术。1990年以后,出现了第三代的质量控制技术,它以临床允许误差为质量目标,由实验室选择合适的控制规则和确定每批做几个控制样品,建立自己的控制方法,使实验室的质量真正符合临床要求。
(4)计算机的广泛应用推动了质量控制技术的发展。现在几乎所有自动分析仪上都有计算机,它们在实施统计控制方法时进行必要的计算,绘制控制图,运用合适控制规则自动作出判断,对确属失控的问题提出警告等。
二、统计质量控制的含义
1、统计过程控制 将控制品随同病人标本一起,由检测系统作检测,控制品检测得到的结果为控制值。这些控制值的大小和变化反映了检测系统在检测分析过程中的质量表现。为了便于分析和及早发现检验分析过程的问题,使用了统计技术对控制值作归纳和整理。因此,这样的质量控制内容称为统计过程质量控制,简称为统计质量控制,或统计过程控制,或分析过程控制。
2、质量控制方法 统计过程控制有2个必要组成内容:每批检测中使用控制品的数量;使用什么控制规则判断控制值可否接受。在医学实验室中,通常对稳定的控制品检测,将控制值点在具有特定控制限的控制图上;运用设定的判断限或控制规则对控制值评估。
3、控制图 显示控制结果,判断本次控制值是否在控的制图方法。控制值按检测时间或检测批顺序数点于图上;将各点按顺序连接,便于观察有无倾向、系统性偏倚、和随机波动。
4、控制限 绘制于控制图上的临界线,便于判断有无失控。这些控制限通常由某控制品重复检测控制值的均值和标准差确定。
5、控制规则 判断某批结果是否在控的临界规则。可以简单地理解为失控规则。随着Westgard多规则的推出,将 2s为限制的规则用作警告规则,控制规则的含义扩充了。但是仍然可以理解为:如果没有特别指出,一般的控制规则用于判断是否失控。常以符号AL表示。A为某统计量或代表控制值的观察个数;L为确定的控制限,常由此规定均值()加减几个标准差(s),有时规定了假性拒绝的概率(Pfr)。
6、批,分析批 一段时间的区间,或是一组病人标本量的大小;统计过程控制确定控制状态的对象。CLIA’88规定,临床化学检测的最大批量的时间为24小时;血液学分析为8小时。
第四节 控制品的选用
为了做好统计过程控制,必须选择合适的控制品。说明控制品性能的有:稳定
性,,瓶间差,定值和非定值,分析物水平,预处理的要求等
一、控制品的定义
国际临床化学学会(IFCC)对控制品的定义为:专门用于质量控制目的的标本或溶液;不能用作校准。。
二、基体差异
1、基体效应 制备控制品所用的基础材料一般为来自人或动物的血清或其他体液。经过处理,又添加了其他外加的材料,在对某一分析物进行检测时,处于该分析物周围的其他成分的组合,是该分析物的基体。由于这些组合成分的存在,对分析物在检测时的影响称为基体效应。
2、控制品的基础来源 理想状态下,控制品应和检测的病人标本具有相同的基体状态;这样,控制品将和病人标本具有相同的表现。
3、控制品制备的问题 无论怎样选用制备材料,控制品生产加工处理还继续改变基体的性质。
4、实验方法的影响 某些实验方法学影响了对控制品的选择。
三、稳定性
稳定性是控制品的重要指标。好的控制品可以在规定的保存条件下,至少稳定1~2年。实验室最好购买够用1年的1个批号的控制品,可以在较长的时间内观察控制过程的检验质量变化。
四、瓶间差
临床实验室开展统计过程控制的主要目的是控制实验结果的重复性。在日常控制中,控制品实验结果的变异是检测不精密度和更换的各瓶控制品间差异的综合。只有将瓶间差异控制到最小,才能使检测结果间的变异真正反映日常实验操作的不精密度。
五、定值和不定值控制品
控制品分为定值和不定值。必须注意的是:公司的定值预期范围只是告诉用户,只要你的测定值在预期范围内,说明它的控制品是好的。千万不能将预期制范围认为是控制的允许
范围。
不定值的控制品的质量其实和定值的控制品是一样的。不论定值还是不定值的控制品,用户在使用时,必须用自己的检测系统确定自己的均值和标准差,用于日常工作的过程控制中。
六、分析物水平
临床最关心各项目(分析物)的医学决定水平浓度的检验结果的质量;实验室更关心检测系统(方法)性能的在临界限值处的质量表现。若能同时做2个或更多水平的控制品检测,反映的质量是一个范围的表现,质量控制的效果更好。因此在选择控制品时,应该有几个浓度的、浓度分布较宽的、最好是医学决定水平的、有可报告范围的上下限值的控制品。依据实验室和临床的要求作出选择。
七、控制品使用前的预准备
无论那种医学实验、什么类型的控制品都有使用前的预准备要求。实验人员在使用前必须认真阅读控制品的使用说明书,明确要求后再开始使用。
第六节 绘制Levey-Jennings控制图
一、绘制控制图的准备
如前述,按照分析过程控制的要求,已经完成了以下工作:
1、选择了合适的控制品。
2、至少在10天内对控制品作了至少20次的测定,由这些数据
初步说明了检测系统在检测该控制品的分析性能
3、计算这些数据的均值和标准差。
4、选择每批控制品检测的次数。
5、选择应用的控制规则。
二、每批控制品检测次数和控制规则
1、13S规则 设定+3s和-3s为控制限值的规则。任何控制值超出3s限值的,确定该批结果为失控。
2、12S规则 设定+2s和-2s为控制限值的规则。任何控制值超出2s限值的,确定该批结果为失控。
3、确定每批使用2个水平的控制品,每个水平各做1次检测。
第七节 正确理解和应用Westgard多规则控制程序
一、Westgard多规则是第二代的质量控制方法
和自动化技术适应的,由计算机自动检索的Westgard多规则程序是第二代质量控制方法,应运而生。从20世纪70年代中期起,Westgard对临床实验室的质量控制作出了卓越的贡献。
1、理论上,提出误差分为检测系统(方法学)稳定状态(固有)误差及除此之外的不稳定状态(外加)误差,统计质量控制只能控制不稳定误差。
2、Westgard以概率理论发展了各种控制规则的误差检出特性曲线。由曲线反映规则对不稳定误差检出的灵敏度;以及把稳定状态误差误作假失控报告的可能性,即误差检出的特异性。
3、将各种控制规则以特定方式表示。例如12S ,13S ,22S ,R4S ,41S ,10等,至今已为大家接受。
4、发展了多规则程序,由计算机自动检索,大大提高了质量控制效率。使失控误差检出率大大提高,又极大地减少了假性报警的概率。
5、要使检验结果真正符合临床要求,必须对检验方法作严格的评价。
Westgard从理论和实践上提出了完整的方法学评价实验及总误差概念。
二、Westgard多规则控制方法
1、Westgard多规则控制方法(简称多规则)的构思 前述±3s和±2s的控制方法二者在误差检出灵敏度和对失控误差识别特异性上有着明显的差异,Westgard将它们巧妙地结合起来,并且引进其它控制规则,组成了多规则控制方法。目的是提高控制效率,既对误差检出具较好的灵敏度,又对失控误差的识别具较好的特异性。
(1)在多规则控制方法中,Westgard建议使用2个控制品,浓度一高一低,形成一个范围的控制(没有条件也可只用1个控制品,但有很多局限性)。
(2)在控制图上绘7条平行线。即:,-1s,+1s,-2s,+2s,-3s,+3s。
(3)将所有规则以符号表示,便于使用。如±2s规则写成12S,±3s规则写成13S等,具体含义见下介绍。
(4)在Westgard多规则控制方法中,将12S仅作为警告规则,不是失控规则。充分利用它对误差检出灵敏度高的特点,但又限制了它对误差识别特异性差的弱点。它只指出可能有问题,最后判别要经过系列顺序检查,由其它规则判断。
(5)经过选择,将13S,22S,R4S,41S,10等列为失控规则,内中既有对随机误差敏感的,也有对系统误差敏感的。结合在一起,大大提高了多规则的控制效率。
(6)将各规则合在一起,形成逻辑判断检索程序。
2、各规则的含义
(1)12S警告规则: 在某水平的控制值超出±2s限值时,为符合12S规则。须注意的是:这里将符合该规则的结果定为是有问题,发出警告;不是失控。
(2)13S失控规则:控制值超出X±3s限值,是失控的标志。
(3)22S失控规则:22S有两种表现,同一个水平的控制品的连续2次控制值同方向超出+2s或-2s限值,是失控的表现。在1批检测中,2个水平的控制值同方向超出+2s或-2s限值,是失控的表现。
(4)R4S失控规则:在一批检测中,1个控制品的控制值超出+2s限值;另1个控制品的控制值超出-2s限值。表现为失控。在Westgard多规则的组合中,一定是同批检测中具有上述表现。如果发生在2批检测中,就不是该多规则的R4S。
(5)41S失控规则:有连续4次的控制值超出了+1s或-1s的限值。是系统误差的表现。本规则有2种表现:一是1个水平的控制品的连续4次控制值超出了+1s或-1s的限值,另一种是2个水平控制品同时连续2次的控制值同方向+1s或-1s的限值。
(6)10X失控规则:有连续10次控制值在均值的一侧,是系统误差的表现。本规则也
有2种表现:一是1个水平的控制品的连续10次控制值在均值的同一侧;另一种是2个水平的控制品同时连续各有5次的控制值在均值的同一侧。
3、多规则的误差检索程序 Westgard多则的误差检索程序。
注:“不符合”表示控制值没有符合字符左侧的失控规则。
“符合”表示控制值符合字符左侧的失控规则。
Westgard多规则误差检索程序
这是经典的Westgard多规则方法。按照图示的程序,计算机每天对你的控制值做自动检索(没有这个检索软件,每天自己动手检查)。确定控制值是否符合12s警告规则。如果没有,说明检验结果在控,可以报告病人结果;如果符合,说明检验结果可能有问题;继续检索,看控制值是否符合13s失控规则、符合22s失控规则、符合R4s失控规则等等,只要符合其中一个,说明确实失控,拒发病人报告;如果不符合任何一个失控规则,说明仍然在控,可以发出检验报告。
在日常使用时,需注意的是:
(1)12S为警告规则,不是失控规则:若本批检验没有出现控制结果超出±2s限值线,表示本批结果没有问题在控,可以发出报告。若本批检验有1个控制结果超出(不包括正好在±2s限值线上的结果)±2s限值线,表示本批结果可能有问题,符合12S规则。要检查一下,是一个警告,但不是失控。按多规则程序去检查是否确实有上述的5种失控表现。
(2)出现失控时必然已经有了12S表现:失控规则中的各种表现必然已经有了12S表现,并且连同这个12S表现一起,形成了各个规则的表现,此时才列为失控。上述各图示的失控
规则都表示了这个含义。
没有出现12S表现,但控制结果已出现倾向性表现,如已有多次结果偏于一侧,甚而偏于+1s或-1s以外,这些都不属失控。检验人员看到这样的表现,主动寻找原因予以纠正,这是努力减小误差,但不作为失控后的措施。
出现12S表现后,经顺序检查,没有出现其它各失控规则的表现,表示这次12S出现也许是属正常的波动,不是失控,不要作任何失控处理。可发出检验报告。
(3)几种不恰当的做法
1)控制结果落在±2s线上就认为失控,这是错误的理解。请注意前面每一点讲“超出”的含义,凡未超出±2s,即使在线上都不属有问题,不必作任何处理,更不是失控。
2)控制结果超出±2s,马上就重做。并且将原来的结果抹去,点上新的接近的结果。①12S是警告规则,不是失控规则。出现超出±2s限值,不应马上重做,应检查是否发生真正失控的表现。②即使失控,也不要将超出±2s的结果或失控结果抹去。因为将这些点子都去掉,使控制值结果分布范围变小,下个月控制图的s变小;控制范围变得不真实,加大了控制难度。③出现12S表现较好的做法,应先检查是否有失控。确实失控,不仅控制品重做,更应检查失控原因,纠正误差后,连同病人标本一起重做。将失控结果和纠正后结果均点于图上,做好失控记录。若不是失控,既不要重测控制品,也不必作其它处理,照发报告。符合要求的控制图,应该是所有控制结果均匀分布于±2s范围,而不只是在±1s范围。
3)直接使用厂商的定值及允许范围作为控制图上的均值和标准差。每个实验室必须自己通过测定,累积控制值来计算自己的均值和标准差,用于自己的控制图上。严格讲各实验室的检测方法(检测系统)一定不同于厂商定值的检测方法。厂商提供的允许范围是他们的“保险”范围,不是应控制范围,一般都很大。它只是告诉用户,您的测定值在此范围内,说明控制品没问题,不说明其它。
三、应用Westgard多规则的示例
第六节 检验项目临床使用价值的评述
如何以最少的费用做必要的检验,达到最佳的诊断和治疗效果是当前共同关心的问题。 在众多的检验项目中,能提供临床具有某种疾病的直接证据的确诊项目不多。绝大多数检验项目,它们的检验结果在病人和非病人间分布呈交叉状。(为叙述方便,以下对具某种
疾病的受检者称为病人;不具某种疾病的受检者,包括健康人及具有其他种类疾病的病人称为非病人)。若以某检验值为判断限(可以是参考区间上、下限值,或者是某判断限值),可以将检验结果分成四类:是病人,检验结果达到或超过判断限,称为真阳性;是病人,检验结果未达到判断限,称为假阴性;是非病人,检验结果未达到判断限,称为真阴性;是非病人,检验结果却达到或超过判断限,称为假阳性。理想的检验项目对某种疾病的诊断价值直观地是假阴性和假阴性越少越好。
一、表示检验项目临床使用价值的公式
1、诊断灵敏度(Diagnostic Sensitivity)
指某检验项目对某种疾病具有鉴别、确认的能力。
设:P为阳性,N为阴性,T为真,F为假;则真阳性数为TP,假阳性数为FP,真阴性 数TN,假阴性数为FN。诊断灵敏度的数学式为所有病人(TP+FN)中获得真阳性(TP)结果的百分数。写作:
诊断灵敏度=TP⨯100% TP+FN
2、诊断特异性(Diagnostic Specificity)
指某检验项目确认无某种疾病的能力,它的数学式为所有非病人(TN+FP)中获得真阴 性(TN)结果的百分数。写作: 诊断特异性=
另外亦可使用(1-诊断特异性)表示诊断特异性大小。
3、诊断准确度(Diagnostic Accuracy)
指某检验项目在实际使用中,所有检验结果中诊断准确(真阳性和真阴性)结果的百分数。写作: 诊断准确性=TN⨯100% TN+FPTP+TN⨯100% TP+FN+TN+FP
以上几项指标和疾病流行率无关。在实际使用中,检验项目用于过筛或确诊目的不同,以及检验的病人群体不同(实际上是某疾病在不同人群中的流行率不同),对阳性结果中具准确诊断阳性结果的比例亦会不同,这是临床最为直接关心的。因此,还有两个指标表示这样的目的。
4、阳性结果预期值(Positive Predictive Value,PV+)指所有阳性结果中准确阳性的百分数。写作:
PV(+)=TP⨯100% TP+FP
5、阴性结果预期值(Negative Predictive Value,PV-)指所有阴性结果中准确阴性的百分数。写作:
PV(-)=TN⨯100% TN+FN
二、进行检验项目的临床评价前须确认检测系统的分析性能
开始临床评价前必须确认该项目的检测系统的分析性能,一定要使系统很好地设计并达最佳化。若检测系统是厂商的产品,实验室应完全按照厂商的要求,齐备所需物品材料,熟练操作,使检测结果具可靠性。若检测系统是实验室自行开发的,应在完成研究开发过程后,保持系统各部分供应充分,分析性能恒定。并且对它的分析性能作严格的评价,符合临床要求后,方可用于临床评价。
关于检测系统分析方法的分析特性主要因素概述如下:
1、检测用主要材料特性恒定。
2、明确可用的标本类型,并详细说明病人准备,标本收集,处理和保存要求。
3、确定测定操作方法。
4、建立相应的质量控制方法。
5、辅助设备的要求。
6、掌握检测系统的培训要求等。
三、临床评价计划和设计
1、进行临床评价要明确评价的目的,也即检验项目要解决的是什么临床问题。同一个项目在临床应用中,对于不同的疾病诊断使用价值不同。即使是同一个项目,应用于同种疾病的诊断,因各医院的评价群体差异也会有所不同。常常是有两种疾病的病人在临床表现上很相似,临床期望某一或几个检验项目的检验,能作出鉴别诊断,将病人分成不同组别,由临床作不同的治疗和处理。对于这样的临床要求,这个或这些检验项目有怎样的使用价值,这是评价的根本目的。
另外,某检验项目对某种疾病病人诊断时,被诊断的病人所处的病人群体具有对应的判断限(Cutoff),这也就是临床评价的结果,即在肯定某检验项目对某疾病具诊断价值后,依据不同限值作出诊断反映的诊断灵敏度和诊断特异性系列估计,从中选出最佳诊断准确度点,确定判断限。
2、确定选择哪些病人群体为评价时的对象 明确了诊断目的后,作评价时选择的病人 31
群体应和目的一致,从中抽样成为抽样研究组。抽样对象不应包括健康志愿者、供血者、学生或实验室工作人员等,因为他们都不是病人,不具有和欲诊断的疾病病人具有相似的临床表现,他们不是鉴别诊断的排除对象。另外,在选择的病人群体中应随机抽样,使抽样结果一定能代表整个临床关心的病人群体。并且应在开展评价前就选择好抽样对象,不要让被评价项目的检验结果或检验过程所影响,至于抽样大小取决于评价费用、所需时间、选择抽样对象的易难,更实际的是按诊断灵敏度和特异性所要求的可信限去确定。
3、确定每个抽样对象的“真正”临床诊断 这是评价中的关键所在,亦是最困难的。本来是想依靠某新项目作出鉴别诊断,本身就说明除此之外,能作出明确诊断的手段不多甚而缺少。因此不能单凭常规诊断手段,应以诸如:活组织检查、外科病理检查、血管造影、专家会诊、长期随访等,并结合临床病程及临床后果甚至尸体解剖等作出准确诊断,使每个抽样对象的诊断越准越好。所有诊断手段应在开始评价前就予以明确形成诊断标准。还有,一定要做到所有抽样对象的诊断过程和被评价项目无关。
四、进行临床评价
1、培训所有参与评价人员是保证评价顺利进行的重要方面 参与评价的临床医师要明确诊断标准,统一表格填写方式、询问和记录病史的要求,注意保护受检者(抽样对象)利益等。参与检验的检验室工作人员要熟悉检测系统,熟练掌握操作规程,认真进行质量控制,保证检验结果可靠。所有参与人员一定要做到严守评价纪律,注意资料真实完整。
1、 抽样对象作评价项目的检验时,应在不知道抽样对象的临床诊断分类前提下进行。 若进行多项检验项目比较时,应在同一时间点上对所有抽样对象的标本进行所有的检验,防止标本存放条件和时间的差异造成误差。
3、所有评价资料和数据必须记录完整,评价负责人须妥善保存备查。评价资料要随时输入于数据库,对出现丢失数据、离群点的处理、警告信号等应及时判断和处理,防止对今后评价结论的影响。
32