统计分析在制药领域的应用

这是21世纪10年代的最后一个冬天,一年一度的质量回顾,总结报告正在在紧张备战中,然而任何的回顾总结,如果没有统计分析都是低层次的报告,或者没有选择恰当的统计分析工具同样也会误导决策者。统计分析的前提:1、所有样本数据的来源是可靠真实;2、获得样本数据的测试方法经过了验证,其方法专属性、准确度、精密度良好;3、对样本对象进行统计分析,期望得到结果对临床药效、生产工艺、质量改进是有指导意义的。制药法规、指南对运用统计的指导内容:事项统计方法法规政策法规/指南摘要处方和工艺开发多因子实验设计(DOE )曲面响应单因子分析全因素设计…FDA《工艺分析技术———创新药品开发、生产和质量保证的框架》对于配方和工艺的知识应来自于对多因子关系的科学理解,可以得益于运用多变量的数学方法,如试验设计、响应曲面法。数学关系和模型知识的适用性、可靠性可通过对模型预测能力的全面统计学评估得到…处方和工艺开发实验设计(DOE )曲面响应ICH Q8 R2《药物开发》申请者应当要在物性(如:粒径分布、水分、流动性),操作选项和工艺参数等的某一范围内对产品性能进行更高层次的论述。可以通过实行规范的实验设计或工艺分析技术(PAT)来获得这些知识…一个结构化的有组织的方法,用于确定工艺影响因素(Xs)和工艺产物(Y)之间的关系。也被称为“实验设计”。处方和工艺开发ICH  Q11《原料药开发与制造》设计并开展研究(例如,机理,和/或动力学评价、多变量试验设计、模拟试验、建立模型)来辨识与确认物料属性以及工艺参数与原料药关键质量属性之间的关系;稳定性研究单因子分析全因素设计线性回归时间序列分析假设检验方差分析括弧法矩阵法ICH  Q1A新原料药和制剂的稳定性试验ICH  Q1E 稳定性数据评价Q5C  生物技术-生物产品的稳定性试验为评估复检期或有效期,对可以定量的稳定性数据进行分析,回归分析是一种合适的方法,并建议以显著水平为0.25进行批次合并可行性检验….Q1A中不够详细并没有涵盖完全设计和简单设计,本指导原则是对A1a评价部分的补充…采用单因子或多因子,进行完全设计或简单设计进行研究。…方法验证线性回归标准差相对标准偏差置信区间ICH  Q2 b方法学上报资料中应含相关系数、y 轴上的截距、回归线的斜率、剩余方差,还应包括数据图表。另外,分析真值与回归线的偏差也有助于对线性作评价。…………下图为PDA指南对产品统计分析工具的应用列表,在实际质量回顾,日常质量和工艺控制监测具有重要指导意义。

下面就对一些常用的统计图有缺陷进行简述,同行在使用时根据分析对象、统计的预期目的进行选择恰当的工具,但是如前文所说,样本具有统计学意义是定量统计的基本前提。1、控制图&正态检测图

优点:创建简单,简单明了的显示历史数据的变化趋势;几乎不考虑对样本的甄别处理,如正态性判断。缺点:波动的原因无法表示,波动可能是多因素的结果也无法体现。用途:生产质量参数监控、公用系统监测、设备性能等的运行质量监控。类别名称控制图符号适用场合计量值控制图平均值与极差控制图XBar-R适用于产品批量较大的工序平均值与标准偏差控制图XBar-S适用于样本容量n>10时,产品批量大的工序中位数与极差控制图Z-MR适用于产品批量较大的工序单值与移动极差控制图I-MR因各种原因每次只能得到一个数据计数值控制图不合格品数控制图np样本容量相等不合格品率控制图p样本容量不等不合格品数控制图c样本容量相等单位产品不合格数控制图u样本容量不等备注:1、累积和控制图(Cumulative Sum,CuSum) 和指数加权移动平均控制图(Exponentially-WeightedMoving Average,EWMA) 用于监测微小工艺漂移(< 1. 5σ)。其中,日常使用最多的就是XBar-R控制图。2、对于单向合格标准值,控制图的LCL可以不标注,特别是计数值控制图,如产品不合格数量控制图。2、 工序过程能力分析在说过程能力指数前先要清楚工艺目前的控制水平,在确认现有工序能力处于统计控制状态后,再计算工序能力指数,否则需先完成整改,或者通过控制图剔除部分特殊原因导致的离群值,再计算Cpk值。此处不是说一定要将样本中的不合格值剔除掉,如果是正常的原因则应该保留,因为这是正常工序能力的一部分。

下面以某工艺中pH值的质量参数为例进行作图分析,

Cpk值计算前先对样本进行正态性检验,如下P>0.05,样本正态分布,受控情况良好,样本的正态性不是非常理想,这个在直方图中已经体现的很明显了。工序能力分析图

工序能力指数,常用Cp和Cpk两种。Cp衡量质量标准限宽度相对工艺自然波动的大小,计算公式为:

其中,LSL 和USL 分别是标准下限( Lower Specification Limit,LSL) 和质量标准上限( Upper Specification Limit,USL)。σ 是工艺自然波动的标准差。 T:公差范围,PC:过程能力,σ:总体表准差估计值,s:样本标准差,M:规格中心值,u:分布中心值。以上图表建议用minitab软件进行制作,最简单的统计软件了。优点:可以数字化的对工序能力进行评判,并得出这个工序的不合格率和进一步的改进空间。缺点:如果发生轻微的不良趋势,则不容易被识别,必须控制图+Cpk才能有意义;对样本量要求高,样本量<200时,则工序能力指数的判断可信度下降。用途:几乎所有可数字化的生产工序都可使用。3、Pareto 图更多的时候被管理层用于战略决策、资源调配。如上图距离中可以发现,如果将审计缺陷中现场规范、管理流程和设备验证的缺陷整改完成,则70%以上的问题都解决了。优点:一目了然的展示了问题的比例、叠加比例,需要投入的资源、问题最多和最少的方向。缺点:问题的重要性无法显示,即占比虽小,但重要性更高的事项无法凸显。Pareto 图

4、线性回归这个在分析方法验证的线性项目中必须要使用,对95置信区间线的制作,Excel就很难了,建议采用GraphPad Prism,分分钟实现你想要的图标。

5、时间序列图在这个统计工具中常用的是“时间序列-分解”这个工具,此工具能很好的根据历史数据趋势进行预测,如随季节变化的周期性往复预测,未知原因的周期性趋势、产品稳定性研究中有效期的判断等。

优点:有一定的预见性。缺点:样本量要求大,对于离散数据适用性差。6、DOE这个比较复杂,以细胞培养过程中pH、电导率、搅拌速度、溶氧水平对细胞生长情况的影响进行4因子两水平的实验设计,同时采用折叠设计,减少混杂。

本例中以细胞生长密度(OD值)作为响应量进行考察,实验条件随机化见下表:

上表中结果为随意输入后进行全因子设计分析,结果如下:

Pareto图是将各效应的t检验的t值的绝对值作为纵坐标,按照绝对值的大小排列起来,根据选定的显著性水平,给出t值的临界值,绝对值超过临界值的效应将被选中,说明这些效应是显著的。Pareto图说明溶氧和搅拌速度有显著影响因素。

等值线图说明溶氧水平与pH值两个因素,溶氧对细胞密度的影响更为显著,pH的耐受空间相对更宽。

DOE的实验设计和分析是研发团队的核心内容,具体分析要基于对工艺的充分理解和科学的根据。再此仅仅说明该工具的用法,具体解析还是研发团队更专业。7、EXCEL其它用Excel中的几个常用统计工具就不再赘述,图表用途一目了然,仅仅举例如下:树形图

瀑布图

直方图

(0)

相关推荐