universidad nacional mayor de san marcos facultad de ciencias

Las Directrices sobre Validación de la OIE aportan información detallada y ejemplos que respaldan
la norma de validación de la OIE publicada como Capítulo 1.1.5 del Manual Terrestre, o como
Capítulo 1.1.2 del Manual Acuático. El Término “Norma de Validación de la OIE” de esta Directriz
hace referencia a estos capítulos.
Los tipos y grupos de muestras de referencia son fundamentales desde el estudio inicial de
viabilidad en el laboratorio de desarrollo hasta el mantenimiento y seguimiento del rendimiento de
la prueba en el laboratorio de diagnóstico, así como en todas las etapas intermedias. La
importancia crucial que tienen los tipos y grupos de muestras de referencia nunca se recalca lo
suficiente. Si se elige un material de referencia equivocado, se puede generar sesgo y llegar a
conclusiones indebidas desde que la prueba apenas se empieza a desarrollar hasta que se valida
y se utiliza. Por lo tanto, es importante proceder con cuidado al escoger las muestras de referencia
y al diseñar los grupos de muestras.
Grupo A
Grupo B
Grupo D
Estudio de viabilidad
A.2.1
ASp
B.1.2.
Comparación con el método
estándar
B.2.6.
Intervalo de funcionamiento
A.2.2.
Exactitud analítica
B.1.4.
Reconocimiento provisional
B.2.6.
Optimización
A.2.3.
Tipos y grupos de muestras
de referencia
Robustez
A.2.5.
Modificaciones biológicas
B.5.2.2.
Calibración
A.2.6.
Grupo C
Grupo E
Control del proceso
A.2.6.
Repetibilidad
B.1.1.
DSp y DSe
Patrón de referencia perfecto
B.2.1.
ASe
B.1.3.
Reproducibilidad preliminar
B.2.6.
Modificaciones técnicas
B.5.2.1.
Reproducibilidad
B.3.
Grupo F
Reposición de reactivos
B.5.2.3.
Prueba de competencia
B.5.1.
DSp y DSe
No existe un patrón de referencia
perfecto
B.2.2.
ASp = Especificidad analítica; ASe = Sensibilidad analítica;
DSp = Especificidad diagnóstica; DSe = Sensibilidad diagnóstica
Como se observa en la Figura 1, los tipos y/o grupos de muestras de referencia se mencionan a lo
largo de toda la Norma de Validación de la OIE. Según se define en el glosario de la Norma de
Validación y en las Directrices de la OIE para Laboratorios Veterinarios: Enfermedades Infecciosas,
“los materiales de referencia son sustancias cuyas propiedades son suficientemente homogéneas
y están lo suficientemente bien caracterizadas como para poder utilizarlas para la calibración de un
aparato, la evaluación de un método de medición o para evaluar un valor respecto a dichos
materiales”. En el contexto de la validación de los métodos analíticos, los materiales o muestras de
referencia contienen el analito de interés a distintas concentraciones o actividades, y se utilizan en
el desarrollo y evaluación de las características de rendimiento diagnóstico y analítico de la prueba.
En nuestro caso, el analito es el componente específico de una muestra problema que se detecta o
mide mediante el método analítico, por ejemplo, un anticuerpo, un antígeno o ácido nucleico. Estas
muestras de referencia pueden ser muestras de sueros, líquidos, tejidos, excreciones, alimento
para animales o muestras del entorno que contienen el analito de interés y que suelen obtenerse
de animales infectados y sus entornos. No obstante, en algunos casos, pueden prepararse en el
laboratorio a partir de un material de partida original (por ejemplo, una dilución de un suero
fuertemente positivo en suero negativo) o, en ocasiones, añadiendo a la matriz en cuestión un
analito derivado (por ejemplo, un cultivo bacteriano o vírico, una proteína recombinante/expresada
o un constructo genómico). Tanto las muestras naturales como las preparadas, se utilizan en
estudios a lo largo de todo el proceso de desarrollo, se mantienen en la fase de validación y
pueden utilizarse para seguir el rendimiento a lo largo de toda la vida útil de la prueba.
En la Figura 1, se agrupan tipos y muestras de referencia en función de las características y de la
composición, y estas agrupaciones constituirán la base para las siguientes descripciones. A modo
de referencia cruzada, se indica la Sección correspondiente de la Norma de Validación de la OIE
en cada aplicación concreta del tipo o grupo de muestras de referencia.
Las muestras de referencia se pueden utilizar para varios propósitos, desde las primeras fases del
desarrollo y la optimización, a lo largo de la Fase 1, hasta el seguimiento y mantenimiento continuo
de la prueba. Siempre que sea posible, deben obtenerse o prepararse cantidades grandes de
estas muestras de referencia, y conservarse para su uso a largo plazo. Cuando se cambia de
muestras de referencia durante el proceso de validación, se introduce una variable intratable que
puede minar gravemente la interpretación de los datos experimentales y, por lo tanto, la integridad
del proceso de desarrollo y validación. En el caso de pruebas que puedan aplicarse a varias
especies, las muestras deben ser representativas de la principal especie de interés. Es
fundamental que estas muestras reflejen tanto el analito en cuestión como la matriz en la que se
halla en la población a la que va destinada la prueba. Los materiales de referencia deben
representar de forma adecuada todo el intervalo de concentraciones del analito que la prueba
deberá detectar.
Es importante destacar que, independientemente de que las muestras de referencia se obtengan
de forma natural o se preparen en el laboratorio, todos los criterios de elección y los
procedimientos de preparación, así como los requisitos de análisis, tienen que quedar descritos de
forma detallada e incluirse en un control documentado. Ello no solo es una buena práctica de
gestión de la calidad, sino que proporcionará una mejora en el nivel de continuidad y de confianza
a lo largo de toda la vida útil de la prueba.
A menudo se duda acerca de si crear una muestra de referencia a partir de varias muestras combinadas. Si el
material de referencia se obtiene de un solo animal, es importante asegurarse de si es o no representativo de un
curso y estadio clásicos de la infección en el contexto de la población estudiada. Si no lo es, ello podría generar
sesgo y conclusiones incorrectas en cuanto a la validación. La combinación de varias muestras es una buena
alternativa pero es indispensable que procedan de animales que se encuentren en una fase similar de la
infección. Ello es especialmente importante en el caso de los sistemas de detección de anticuerpos. La
combinación también comporta el problema de tener que almacenar cantidades mayores de material de
referencia para su uso a largo plazo, sobre todo cuando se trata de las especies hospedadoras más pequeñas.
Antes de combinar muestras, es preferible que se analicen individualmente para comprobar si son similares en
cuanto a la concentración y/o reactividad del analito. Debe realizarse una evaluación tras la combinación para
asegurarse de que no se hayan introducido interferencias imprevistas al combinar múltiples muestras; por
ejemplo, el hecho de que cada muestra fuera de un tipo sanguíneo o que tuvieran composiciones de anticuerpos
distintas podría generar reacción cruzada en la muestra combinada, lo cual haría que la muestra combinada se
comportara de forma distinta en la prueba en cuestión a como lo haría cada una de las muestras originales
cuando se analizaran individualmente.
A menudo es difícil obtener muestras individuales que representen verdaderamente las concentraciones o
reactividades del analito en todo el intervalo esperado. Dada la dinámica de muchas infecciones o respuestas a
agentes patógenos, a menudo los intervalos intermedios son muy transitorios. En el caso de las respuestas de
anticuerpos, las primeras fases de la infección en animales sueltos a menudo dan lugar a poblaciones muy
variables y heterogéneas de isotipos y avideces de los anticuerpos. En general, no constituyen buenas muestras
de referencia para evaluar las características analíticas de una prueba. Sin embargo, son importantes para
distintos tipos de grupos de muestras de referencia, como se explica más adelante. En la mayoría de
aplicaciones del Grupo A, es aceptable utilizar muestras preparadas a las que se añaden concentraciones
conocidas del analito o una serie de diluciones de una muestra fuertemente positiva en una matriz negativa para
crear un intervalo de concentraciones.
Tanto si son naturales como preparadas, las muestras de referencia deben representar el intervalo previsto de
concentraciones del analito, desde débilmente positiva a fuertemente positiva, que sería esperable durante un
curso clásico de la infección. Debe incluirse una muestra de referencia negativa como control de fondo. Si se
utiliza una muestra negativa (matriz) como diluyente para preparar una muestra de referencia positiva (por
ejemplo, un suero negativo que se utiliza para diluir un suero fuertemente positivo o un tejido al que se añade un
constructo), decididamente esa muestra negativa debe incluirse como muestra de referencia negativa.
Como se ha mencionado anteriormente, todas las muestras de referencia deben estar bien caracterizadas. Ello
incluye documentación tanto acerca del agente patógeno como del hospedador donante. En el caso de los
agentes patógenos, puede incluir detalles relativos a la cepa, el serotipo, el genotipo, el linaje, etc. La
procedencia del material del hospedador también debe detallarse bien en cuanto a especie, raza, edad, sexo,
estado reproductivo, historial de vacunaciones, antecedentes del rebaño, etc. Siempre que sea posible, debe
indicarse la fase de la infección, lo cual podría incluir detalles relativos a los signos clínicos, los perfiles de
anticuerpos, la carga o excreción de agente patógeno, etc. Es igualmente importante que las pruebas que se
utilicen para determinar el estado respecto a la enfermedad o infección estén bien documentadas (véase la
Sección 5 de esta Directriz sobre Validación para más detalles). En algunos casos, es posible que la infección o
exposición experimental sea la única opción viable para producir el material de referencia. En tal caso, deben
detallarse todos los aspectos anteriores más el protocolo experimental.
Pero por encima de todo, el material de referencia, ya sea natural o preparado, debe ser inequívoco respecto a si
representa una muestra verdaderamente positiva o verdaderamente negativa. Tal vez ello tenga que confirmarse
mediante otra prueba o batería de pruebas. Por ejemplo, muchos sueros de referencia con anticuerpos se
caracterizan empleando múltiples pruebas serológicas. Ello proporciona no solo confianza sino también
características documentadas añadidas que podrían ser necesarias si en el futuro se debe sustituir o duplicar
este material de
Las recomendaciones relativas a la estabilidad y almacenamiento de los materiales de referencia se encuentran
en: http://www.oie.int/fileadmin/Home/eng/Our_scientific_expertise/docs/pdf/GUIDELINE_3_REF_STANDARDS_ANG.pdf
La Norma de Validación de la OIE establece que los métodos analíticos y procedimientos relacionados
deben ser adecuados para aplicaciones diagnósticas específicas con el fin de que los resultados de
las pruebas sean relevantes. En otras palabras, la prueba debe ser “idónea para el propósito previsto”.
Muchas pruebas se desarrollan con buena intención pero sin una aplicación específica en mente. Es
fundamental que desde el principio ese/os propósito/s diagnóstico/s esté/n definido/s respecto a la/s
población/es que se analizarán. Los propósitos más frecuentes se indican a grandes rasgos en la
Sección A de la Norma de Validación de la OIE. Como tales, incluyen aplicaciones más acotadas y
específicas. Sin embargo, este/os propósito/s específico/s tienen que estar claramente definidos desde
el principio y tienen una importancia crucial en el contexto de una prueba totalmente validada. Como
se verá más adelante, el hecho de definir claramente la aplicación de la prueba repercutirá en la
elección de los tipos y grupos de muestras de referencia y en el diseño de las evaluaciones analíticas
y diagnósticas.
El intervalo de funcionamiento de la prueba es el intervalo de concentraciones (cantidades) del
analito a lo largo del cual el método proporciona una exactitud y una precisión adecuadas.
También define los límites de detección inferior y superior de la prueba. Para establecer este
intervalo, se escoge una muestra de referencia fuertemente positiva. Esta muestra fuertemente
positiva, natural o preparada, se somete a una dilución seriada hasta la extinción en una matriz
negativa que coincida con la matriz en la que se encontrarán las muestras que se obtengan de
los animales de la población de destino de la prueba. Ello incluye pruebas de anticuerpos en
que un suero de referencia fuertemente positivo debe diluirse en un suero de referencia
negativo para crear la serie de diluciones. La sensibilidad analítica (ASe) se mide según el
límite de detección (LOD) inferior de un analito en una prueba. Puede utilizarse la misma
muestra de referencia fuertemente positiva para determinar tanto el intervalo de funcionamiento
como el LOD analítico.
Si el propósito es detectar niveles bajos de analito o infecciones subclínicas, puede ser difícil
obtener los materiales de referencia apropiados de fases tempranas de la infección. En algunos
casos, puede ser útil determinar una ASe comparativa analizando un grupo de muestras con la
prueba candidata y con otra prueba independiente. Lo ideal es que este grupo de muestras se
obtenga de forma seriada de animales infectados natural o artificialmente y debe representar
animales infectados al principio de la infección, y a medida que avanza el desarrollo de la
enfermedad clínica o fulminante, si es posible. Ello proporcionaría una comparación entre la
ASe de las distintas pruebas, así como una comparación temporal del punto más temprano
posible de detección teniendo en cuenta la patogenia de la enfermedad.
Un estudio como el que se describe arriba proporciona una oportunidad única de obtener
muestras de referencia que representen un intervalo natural de concentraciones que sería útil
para otros fines de validación. Es importante no utilizar estas muestras para cuando no se
apropiado (consúltese la Sección 4. Grupo D, abajo). Siempre que sea posible, deben
obtenerse muestras seriadas de al menos cinco animales a lo largo de todo el curso de la
infección. En los casos en que el muestreo resulte letal (por ejemplo, cuando se requiera
obtener tejidos de órganos internos), el número de animales necesarios sería al menos cinco
por cada episodio de muestreo. En el caso de especies hospedadoras más pequeñas, tal vez
este número tenga que incrementarse para obtener suficiente material de referencia. Dado que
este tipo de estudios comportan un compromiso importante de los recursos, sería aconsejable
maximizar la obtención no solo de las muestras de referencia que interesan en ese momento
sino también de otros materiales (como múltiples tejidos, líquidos, etc.) que pudieran resultar
útiles como materiales de referencia en el futuro.
La optimización es el proceso mediante el cual se evalúan y ajustan los parámetros físicos, químicos y
biológicos más importantes de una prueba para asegurarse de que las características de rendimiento
de dicha prueba se ajusten lo mejor posible a la aplicación prevista. Pueden escogerse al menos tres
muestras de referencia que representen el resultado negativo, el débilmente positivo y el fuertemente
positivo de entre muestras de referencia naturales o preparadas. Los estudios de optimización son
bastante exhaustivos sobre todo cuando se trata de pruebas con múltiples pasos de preparación y
análisis. Es muy importante que se disponga de una cantidad suficiente de cada muestra de referencia
como para terminar todos los estudios de optimización. No se recomienda cambiar de muestras de
referencia a lo largo del curso de la optimización, puesto que ello añade una variable incontrolada y
una perturbación de la continuidad de los datos de optimización.
La evaluación de la repetibilidad debe empezar durante las fases de desarrollo y optimización de la
prueba. La repetibilidad se vuelve a verificar durante la Etapa 1 de la validación de la prueba (Sección
B.1.1). Deben utilizarse para ambos procesos las mismas muestras de referencia, también en este
caso para proporcionar una continuidad en los datos.
Los reactivos de referencia internacionales están altamente caracterizados, contienen
concentraciones definidas del analito y normalmente se preparan y mantienen en laboratorio de
referencia internacional. Son los reactivos respecto a los cuales deben estandarizarse todas las
pruebas y/u otros materiales de referencia. Los patrones de referencia nacional se calibran por
comparación con un reactivo patrón internacional siempre que sea posible. En ausencia de un
patrón internacional, puede escogerse o prepararse un patrón de referencia nacional, que a
continuación se convierte en el patrón de comparación para la prueba candidata. En ausencia
de ambos, la organización responsable del laboratorio donde se desarrolle la prueba debe
escoger o preparar un patrón interno. Todos los reactivos patrón, tanto naturales como
preparados, deben haber sido altamente caracterizados mediante análisis exhaustivos, y los
métodos para su caracterización, preparación y almacenamiento preferiblemente deben estar
publicados en publicaciones revisadas por expertos. Estos patrones de referencia también
deben ser estables e inocuos.
Los patrones de referencia, sobre todo en el caso de los anticuerpos, suelen suministrarse en
uno de dos posibles formatos. Pueden suministrarse como reactivo positivo único de un título
determinado con la expectativa de que la prueba candidata se estandarizará respecto a un
título equivalente. Esta estrategia analítica es directa, pero muchos de estos patrones “únicos”
se han preparado a partir de muestras fuertemente positivas como pre-dilución en una matriz
negativa para maximizar el número de alícuotas. El inconveniente en este caso es que no hay
justificación para ningún posible efecto de la matriz en la prueba candidata y no se suministra
matriz control. La otra estrategia es suministrar un conjunto negativo, uno débilmente positivo y
uno fuertemente positivo de patrones de referencia de concentraciones o reactividades
conocidas y que se sitúen en el intervalo de funcionamiento del método estándar que se utilizó
para prepararlos. Ello compensa todo posible efecto escondido de la matriz. Además, estos tres
conjuntos actúan como molde para escoger y/o preparar los controles del proceso (se explica
más adelante).
Clásicamente, los patrones anteriores han sido patrones de anticuerpos policlonales y, en
menor medida, patrones de antígeno convencionales que se han empleado para calibrar
pruebas serológicas. No obstante, hoy en día los patrones de referencia también podrían ser
anticuerpos monoclonales o proteínas recombinantes/expresadas o constructos genómicos, si
se utilizan para calibrar pruebas respecto a un solo patrón de rendimiento.
El/los reactivo/s que constituyen patrones de trabajo, normalmente conocidos como controles
de calidad o del proceso, se calibran respecto a patrones internacionales, nacionales o
internos. Se escogen o preparan en la matriz local que se halla en la población para la cual está
pensada la prueba. Teóricamente, deben escogerse o prepararse patrones de trabajo
negativos, débilmente positivos y fuertemente positivos. Las concentraciones y/o reactividades
deben situarse en el intervalo de funcionamiento normal de la prueba. Deben prepararse
cantidades grandes, dividirse en alícuotas y almacenarse para utilizarlas de forma rutinaria en
cada ejecución de la prueba diagnóstica. El objetivo es que estos controles imiten, de la forma
más fiel posible, las muestras de campo, y deben manipularse y analizarse como las muestras
reales. Se utilizan para establecer los límites control superior e inferior de rendimiento de la
prueba y para realizar un seguimiento de la variabilidad aleatoria y/o sistemática utilizando
distintos métodos de representación gráfica del control. Su rendimiento diario determinará si la
prueba cumple o no con el control y si pueden aceptarse ejecuciones individuales. Así pues,
estas muestras de referencia de trabajo tienen una importancia crucial desde el punto de vista
de la gestión de calidad.
Las modificaciones técnicas en una prueba validada, como los cambios en la instrumentación o en los
protocolos de extracción, o la conversión de una prueba en un sistema semi-automático o totalmente
automático aplicando la robótica, no suelen requerir una revalidación completa de la prueba. En lugar
de ello, puede llevarse a cabo un estudio de comparación de métodos para determinar si estos
pequeños cambios en el protocolo de la prueba afectarán a los resultados de la misma. En la Directriz
sobre Validación 3.6.81 de la OIE Comparabilidad entre pruebas tras pequeños cambios en un método
analítico validado se explican los enfoques estadísticos de la precisión de la prueba ante
modificaciones técnicas.
En general, estos enfoques requieren utilizar tres muestras de referencia, una negativa, una
débilmente positiva y una fuertemente positiva. De nuevo, estas muestras pueden ser naturales o
preparadas. Lo importante a recalcar en este caso es que las muestras de referencia que se utilizaron
en las fases de desarrollo de la prueba pueden utilizarse también para evaluar modificaciones una vez
el método se ha empezado a utilizar rutinariamente para el diagnóstico. Ello proporciona un nivel más
alto de confianza porque se evalúan las posibles consecuencias, dado que las características de
rendimiento de estas muestras de referencia se han caracterizado bien. Si deben utilizarse nuevas
1
Nota para el lector: Una vez finalizada la Directriz sobre Validación 3.6.8 de la OIE Comparabilidad entre pruebas tras
pequeños cambios en un método analítico validado se publicará en la página web de la OIE.
muestras de referencia, por lo menos deben escogerse o prepararse aplicando los mismos criterios o
procedimientos de preparación que para los materiales previos. También en este caso, ello mejora la
continuidad de los datos.
Cuando un reactive, como por ejemplo una muestra para el control del proceso, está a punto de
agotarse, es fundamental preparar y analizar repetidamente una de reposición, antes de que dicho
control se termine del todo. La muestra control de reposición deberá incluirse en varias ejecuciones de
la prueba paralelamente al control original para establecer su relación de proporcionalidad. Es
importante cambiar solo un reactivo control cada vez, para evitar el problema de tener que evaluar
más de una variable.
También en este caso, es importantísimo destacar que todo reactivo de referencia de reposición
deberá escogerse o prepararse empleando los mismos criterios o procedimientos de preparación que
se hayan aplicado a los materiales previos. Una vez más, ello mejora la continuidad de los datos y la
confianza en la prueba.
La Especificidad analítica (ASp) es la capacidad de la prueba de distinguir entre el analito de interés y
otros componentes que podría también detectar. Es una definición relativamente amplia que a menudo
no se comprende bien. La ASp se puede desglosar en distintos elementos, que se describen abajo.
La elección de las muestras de referencia necesarias para evaluar la ASp depende en gran medida del
propósito o aplicación específicos que se previeron inicialmente en la fase de desarrollo de la prueba.
La evaluación de la ASp es un elemento crucial en los estudios de viabilidad y en la verificación de la
idoneidad de la prueba para el propósito previsto.
Un elemento importante es el punto hasta el cual un método puede detectar con exactitud y/o
cuantificar el analito de interés en un medio en que hay ácidos nucleicos, proteínas y/o anticuerpos,
como es la matriz de la prueba. A veces, esto se denomina “selectividad”. Un ejemplo es el uso de
muestras de referencia para pruebas que están diseñadas para diferenciar entre animales infectados y
animales vacunados (pruebas DIVA).
Las muestras de referencia tienen que escogerse y comprobarse a partir de animales i) no
infectados/no vacunados, ii) no infectados/vacunados, iii) infectados/no vacunados y iv)
infectados/vacunados. Estas muestras se pueden obtener en condiciones de campo, pero es
importante conocer los antecedentes exactos, si puede ser de los animales concretos con los que se
trabaja, pero como mínimo de los rebaños involucrados, incluida la vacunación y las enfermedades
que hayan tenido lugar. Como alternativa, podría ser necesario producir este material en estudios
como los que se describen en la Sección 1.2.2 de esta Directriz sobre Validación, pero incluyendo una
combinación de animales vacunados y animales expuestos, en ambos casos experimentalmente. Es
importante evitar el uso de la vacuna como antígeno de captura para la prueba (por ejemplo, en un
enzimoinmunoanálisis indirecto [I-ELISA]), porque las proteínas portadoras de la vacuna podrían
estimular respuestas de anticuerpos inespecíficas en los animales vacunados que podrían ser
detectadas en el ELISA, dando así lugar a falsos positivos en la prueba. De forma similar al enfoque
comparativo descrito arriba respecto a la ASe, deben utilizarse al menos cinco animales en cada
grupo. En el caso de especies hospedadoras más pequeñas, este número tal vez tenga que
incrementarse para obtener suficiente material de referencia. En función de la prueba DIVA, podría
diseñarse un solo estudio que sirviera para evaluar aspectos tanto de la ASe como de la ASp.
Un segundo elemento, que a veces se denomina “exclusividad”, es la capacidad de la prueba de
detectar un analito o una secuencia genómica que sean exclusivos del microorganismo en cuestión, lo
cual excluye todos los demás microorganismos conocidos que puedan generar reacción cruzada. Esto
es especialmente cierto en las pruebas serológicas, en que hay muchos ejemplos de antígenos
expresados por otros microorganismos que son capaces de desencadenar anticuerpos que reaccionan
de forma cruzada. En función del tipo de prueba, estos materiales de referencia puede representar el
microorganismo en sí, muestras derivadas del hospedador o secuencias genómicas. Debe
establecerse un perfil de la exclusividad de la prueba, y ampliarse continuamente a medida que surgen
microorganismos que puedan generar reacción cruzada.
En tercer lugar, un aspecto crítico del diseño es el relativo a la capacidad de una prueba de detectar
una o varias cepas o serotipos de una especie, varias especies de un género o una agrupación similar
de microorganismos o anticuerpos estrechamente relacionados. Esto define el ámbito de detección y,
por lo tanto, la idoneidad de la prueba para el propósito previsto. Se requieren muestras de referencia
para definir el ámbito de la prueba. Si, por ejemplo, una prueba se ha desarrollado como prueba de
cribado para detectar todos los genotipos o serotipos conocidos de un virus, deben analizarse
muestras de referencia de cada tipo representativo. A medida que surgen nuevas variantes de linajes
o serotipos, también deben analizarse como parte del perfil de la prueba, que deberá actualizarse
continuamente.
Ciertos métodos o procedimientos de análisis son únicamente herramientas analíticas y suelen
aplicarse para caracterizar mejor un analito que se ha detectado en una prueba primaria, como por
ejemplo, las pruebas como la neutralización vírica, que se utilizan para tipificar un virus aislado o
caracterizar una respuesta de anticuerpos. Estas pruebas adjuntas deben validarse en cuanto a
características de rendimiento analítico, pero difieren de las pruebas diagnósticas rutinarias porque no
requieren que se validen sus características de rendimiento diagnóstico. La exactitud analítica de
estas pruebas a menudo depende del uso de reactivos de referencia. Estos reactivos, tanto si son
anticuerpos para tipificar cepas de microorganismos como cepas de referencia del microorganismo,
etc., deben documentarse exhaustivamente, como se exigiría a cualquier otro material de referencia,
respecto a su procedencia, identidad y características de rendimiento.
Las muestras de referencia del Grupo C pueden utilizarse para varios propósitos. En las fases iniciales del
desarrollo, pueden utilizarse en la evaluación de la repetibilidad de la prueba y para la evaluación preliminar de la
reproducibilidad de la Etapa 1 y en la más exhaustiva de la Etapa 3 de la Fase de Validación. No obstante, estas
muestras tienen otros posibles usos una vez la prueba se ha transferido al laboratorio de diagnóstico. Pueden
utilizarse como grupos de muestras para formar y cualificar al personal experto en análisis, y para evaluar la
competencia del laboratorio en programas de evaluación externa. Teóricamente, deben prepararse 20 o más
muestras individuales en grandes volúmenes. Alrededor de una cuarta parte (25%) deben ser muestras
negativas y el resto (75%) deben constituir un conjunto de muestras positivas que representen todo el intervalo
de funcionamiento de la prueba. Deben dividirse en alícuotas que se introducirán en tubos individuales en
volúmenes suficientes como para un solo uso, y que se almacenarán para ser utilizadas a largo plazo. El número
necesario de alícuotas de cada tipo dependerá de cuántos laboratorios vayan a utilizar la prueba para el
diagnóstico de rutina y de la frecuencia con que se prevea que se realizarán pruebas de competencia. Lo ideal es
prepararlas en una cantidad inexhaustible, pero esto casi nunca es viable. Como mínimo, deben prepararse
varios cientos de alícuotas o más de cada en cada ocasión si la prueba va destinada a ser utilizada en múltiples
laboratorios. Ello permite evaluar la competencia del laboratorio analizando la misma muestra en muchos
intervalos de análisis – un medio útil de detectar los errores sistemáticos (sesgos) que podrían introducirse
sigilosamente cuando una prueba se utiliza a largo plazo.
Estas muestras pueden ser naturales o bien se pueden preparar con material de partida individual o combinado.
El objetivo es que imiten al máximo una muestra problema real. Dado que el almacenamiento masivo siempre es
problemático, puede ser necesario almacenar estos materiales a granel y preparar alícuotas de trabajo de vez en
cuando. No obstante, si se dispone de espacio de almacenaje, es preferible preparar y almacenar grandes
cantidades de alícuotas de una sola vez porque guardar el analito a granel y someterlo a ciclos de congelacióndescongelación para preparar unas pocas alícuotas cada vez puede comportar degradación. Dado que este tipo
de material de referencia se consume bastante rápido, tendrá que sustituirse o reponerse continuamente. Dado
que existe la posibilidad de tener que reponer material tanto en el uso rutinario como durante un brote, es
aconsejable trabajar con homólogos de campo para obtener material de referencia a granel y almacenarlo para
utilizarlo en el futuro. Como alternativa, puede ser necesario producir este material en estudios como los que se
describen en la Sección 1.2.2 de esta Directriz sobre Validación. De forma similar al enfoque comparativo que se
describe arriba respecto a la ASe, deben utilizarse al menos cinco animales en cada grupo. En el caso de
especies hospedadoras más pequeñas, este número podría tener que incrementarse para obtener suficiente
material de referencia.
La repetibilidad es el grado de acuerdo entre los resultados de réplicas de una muestra tanto para una
misma ejecución como entre distintas ejecuciones del mismo método analítico en un laboratorio dado.
La repetibilidad se estima evaluando la variación entre los resultados de réplicas de un mínimo de tres
(preferiblemente cinco) muestras que sean representativas de la actividad del analito dentro del
intervalo de funcionamiento de la prueba. Consúltese la Directriz sobre Validación de la OIE
Incertidumbre de la medición para conocer los enfoques estadísticos de las mediciones de la
incertidumbre en las evaluaciones de la repetibilidad.
La reproducibilidad es la capacidad de un método analítico de proporcionar resultados constantes,
determinada mediante estimaciones de la precisión, cuando se aplica a alícuotas de las mismas
muestras analizadas en distintos laboratorios. No obstante, deben realizarse estimaciones
preliminares de la reproducibilidad de la prueba candidata durante las etapas de desarrollo. Un grupo
pequeño de tres (aunque preferiblemente cinco) muestras que representen el valor negativo y los
valores débilmente y fuertemente positivo, como se ha descrito anteriormente, sería suficiente. Este
tipo de grupo de muestras también se podría utilizar para una evaluación limitada de la
reproducibilidad para aumentar la aceptación provisional de la prueba. El método analítico suele
evaluarse en uno o más laboratorios con un nivel alto de experiencia y competencia en pruebas
similares a la prueba candidata. El grupo de muestras “ciegas” se evalúa utilizando la prueba
candidata en cada uno de estos laboratorios, empleando el mismo protocolo, los mismos reactivos y
un equipo comparable. Es una versión a escala reducida de la Etapa 3 de la validación de la prueba.
Consúltese la Directriz sobre Validación 3.6.4 de la OIE para una explicación más detallada sobre este
tema y su aplicación.
La reproducibilidad es una medida importante de la precisión de una prueba cuando se utiliza en
varios laboratorios situados en regiones claramente diferenciadas o en diferentes regiones o países
aplicando exactamente la misma prueba (protocolo, reactivos y controles idénticos). A medida que
aumenta el número de laboratorios, aumenta el número de variables respecto a los entornos de
laboratorio, diferencias de equipo y conocimientos técnicos. Estos estudios miden la capacidad de una
prueba de mantenerse inalterada ante cambios considerables o sustituciones en las condiciones de la
prueba que puedan preverse cuando si la prueba se utiliza en múltiples laboratorios (por ejemplo, las
condiciones de envío, la transferencia de tecnología, los lotes de reactivos, el equipo o las plataformas
y/o entornos de análisis). En al menos tres laboratorios se deberá analizar el mismo grupo de
muestras “ciegas”; cada grupo contendrá al menos 20 muestra, entre las que se incluirán negativas y
positivas, estas últimas a distintas concentraciones. Si el grupo incluye muestras negativas y/o
positivas duplicadas, pueden realizarse más estimaciones de la repetibilidad intra-laboratorio
analizando réplicas de estas muestras cuando se utilicen en los estudios de reproducibilidad.
Una prueba validada en el uso rutinario en múltiples laboratorios debe someterse a un seguimiento
continuo para asegurar un rendimiento uniforme y proporcionar confianza global en los resultados
analíticos. Ello se evalúa mediante programas externos de garantía de calidad. Las pruebas de
competencia constituyen una de las posibles medidas de la competencia del laboratorio, que se llevan
a cabo mediante una comparación inter-laboratorio; se sobrentiende que los laboratorios participantes
están utilizando los mismos (o similares) métodos, reactivos y controles de la prueba. Los resultados
se suelen expresar cualitativamente, es decir, como negativos o positivos para determinar criterios de
superación/fracaso. No obstante, en el caso de las pruebas de una sola dilución, los resultados semicuantitativos proporcionan datos adicionales para evaluar el error no aleatorio entre los laboratorios
participantes.
Los programas de pruebas de competencia varían en función del tipo de prueba en cuestión. En el
caso de las pruebas de dilución única, los tamaños de los grupos de muestra también varían, pero
sería suficiente con un mínimo de cinco muestras, que representen el negativo y tanto el fuertemente
positivo como el débilmente positivo, como los que se han descrito anteriormente. Las pruebas de
competencia no son más que una forma continua de evaluar la reproducibilidad. No obstante, la
reproducibilidad, por definición, es una medida del rendimiento de la prueba en múltiples laboratorios,
mientras que las pruebas de competencia son una evaluación de la competencia del laboratorio en
cuanto al rendimiento de una prueba establecida y validada. Pueden estimarse mediciones de la
precisión tanto para datos de reproducibilidad como de repetibilidad si se incluyen réplicas de la misma
muestra de referencia en este grupo de muestras “ciegas”. Consúltese la Directriz sobre Validación
3.6.4 para una explicación más detallada de este tema y su aplicación.
Las muestras de referencia del grupo D difieren de las de los Grupos previos en que cada muestra del grupo
debe proceder de un solo animal. Como se indica en la Directriz sobre Validación 3.6.8 de la OIE (véase la nota 1
a pie de página), los estudios de exposición experimental a menudo incluyen un muestreo repetido de animales
determinados para conocer cómo progresa la enfermedad, pero este es un objetivo distinto del de comparar las
características de rendimiento que se asociarían a la sensibilidad diagnóstica (DSe) y a la especificidad
diagnóstica (DSp) de un método analítico. No pueden utilizarse muestras obtenidas de forma seriada, tomadas
en días distintos del mismo animal, como representativas de animales específicos de las poblaciones a las que
va dirigida la prueba, porque estas muestras no cumplen la norma de independencia de muestras que se exige
en estos estudios.
Hay que proceder con cautela al elegir las muestras de referencia y el método estándar (independiente) que se
utilizará en este tipo de comparación para asegurarse de que los analitos que se pretende detectar (si son
distintos) muestran el mismo tipo de perfil patógeno en cuanto a tiempo necesario para que aparezcan los signos
clínicos tras la exposición al agente infeccioso y a proporción de abundancia en las muestras problema
escogidas.
Existen situaciones en que no es posible o no es deseable completar la Etapa 2 de la Fase de
Validación porque se dispone de muy pocas muestras apropiadas de la población de destino y es
difícil acceder a los animales (como en el caso de enfermedades exóticas). No obstante, debe
analizarse, mediante la prueba candidata, un grupo pequeño pero escogido de muestras problema
altamente caracterizadas que sean representativas del intervalo de concentraciones de analito, de
forma paralela al análisis que se realice con un método estándar de la OIE, según se publica en los
Manuales de la OIE. Si ambos métodos se consideran comparables (Directriz sobre Validación 3.6.8
de la OIE: véase la nota 1 a pie de página), y en función de la aplicación prevista de la prueba, puede
optarse por no exigir otra validación diagnóstica. Por ejemplo, si la aplicación prevista es el cribado de
animales importados o de productos animales en cuanto a agentes patógenos exóticos o la
confirmación de casos clínicos, es posible que no sea factible o no esté justificada una validación
completa tras comparar el método analítico.
Por experiencia se sabe que el principal obstáculo para seguir adelante con la Etapa 2 de la Fase de
Validación es el número de muestras definidas que se exige para estimar los parámetros de
rendimiento diagnóstico con un grado alto de certidumbre (Norma de Validación de la OIE, Sección
B.2). En algunos casos, puede estar justificado que las autoridades internacionales, nacionales o
locales otorguen un reconocimiento provisional a una prueba que no ha sido completamente evaluada
tras las etapas analíticas. Los distintos motivos de aceptación provisional se describen con detalle en
la Norma de Validación de la OIE. No obstante, en todos los casos deben existir pruebas irrefutables
de comparabilidad de las estimaciones de la DSp y la DSp que se basen en un grupo pequeño y
escogido de muestras bien caracterizadas que contengan el analito de interés.
Teóricamente, tanto para la comparación con un método de referencia como para el reconocimiento
provisional, podría reunirse un grupo de, por ejemplo, 60 muestras para asegurar un tamaño muestral
suficiente para el análisis estadístico de los datos obtenidos. Este grupo incluiría 30 negativos
“verdaderos” y 30 positivos “verdaderos”. Siempre que sea posible, los positivos deben reflejar el
intervalo de concentraciones o actividades del analito esperable en la población de destino. Como se
ha mencionado anteriormente, cada muestra de este grupo debe proceder de un solo animal.
Consúltese la Directriz sobre Validación 3.6.5 de la OIE para conocer los enfoques estadísticos de la
comparabilidad de métodos cuando se utilizan muestras diagnósticas.
Puede haber situaciones en que se resulten necesarios y/o estén justificados ciertos cambios en
algunas de las sustancias biológicas que se utilizan en la prueba. Ello puede incluir cambios en los
reactivos en sí o bien pasar a otro tipo de muestra que también contenga el analito que se detectaba
con la prueba validada original (por ejemplo, pasar de suero a saliva). Antes de seguir utilizando la
prueba, como mínimo deberán volver a evaluarse todos los criterios analíticos de la fase de validación.
Si se cumplen los requisitos analíticos, lo que faltará será averiguar si es necesario proceder a una
validación diagnóstica completa. Puede plantearse un enfoque similar al anterior, utilizando un grupo
de 60 muestras de referencia individuales. No obstante, en este caso el método analítico original se
consideraría la prueba estándar (independiente) y el método modificado se consideraría la prueba
candidata. Consúltese la Directriz sobre Validación 3.6.5 de la OIE para conocer los enfoques
estadísticos de la comparabilidad de métodos cuando se utilizan muestras diagnósticas
Los animales de referencia y las muestras de referencia de este Grupo E se describen con detalle en la Norma
de Validación de la OIE, Sección B.2.1. No obstante, merece la pena volver a insistir aquí en algunos aspectos.
En el caso de las estimaciones convencionales de la DSp, las muestras de referencia negativas son
muestras verdaderamente negativas, procedentes de animales en los que no ha sido posible ni la
infección ni la exposición al agente patógeno. En algunas situaciones, cuando en un país nunca se ha
declarado la enfermedad o bien se ha limitado a ciertas regiones, hallar muestras de referencia
verdaderamente negativas no suele ser difícil. No obstante, cuando la enfermedad es endémica, este
tipo de muestras pueden ser difíciles de localizar. A menudo es posible obtener estas muestras de
ciertas regiones de un país grande o tal vez de otros países que hayan erradicado o nunca hayan
tenido la enfermedad en cuestión.
También en este caso, para realizar una estimación convencional de la DSe, las muestras de
referencia positivas serán verdaderos positivos. Es importante asegurarse de que la población
estudiada sea representativa de la población a la que irá destinada la prueba una vez validada. En
general, es difícil hallar cantidades suficientes de animales de referencia verdaderamente positivos,
diagnosticados por aislamiento del microorganismo. Puede ser necesario recurrir a muestras de
animales que hayan sido analizados mediante una combinación de varios métodos que
inequívocamente clasifiquen a los animales como infectados/expuestos, como se explica en la Norma
de Validación de la OIE.
Lo importante en esta situación es que todas las muestras, sea cual sea su procedencia, deben
documentarse como se haría con cualquier otra muestra de referencia, de forma que los animales se
clasifiquen inequívocamente como infectados o expuestos, en función de la idoneidad para el
propósito y el uso previsto de la prueba. Como se ha mencionado en la Sección 1 de esta Directriz
sobre Validación, todas las muestras de referencia deben caracterizarse bien. Ello implica documentar
tanto el agente patógeno como sobre el hospedador donante. Respecto a los agentes patógenos,
pueden ser datos sobre la cepa, el serotipo, el genotipo, el linaje, etc. La procedencia del material del
hospedador debe estar bien descrita respecto a la especie, la raza, la edad, el sexo, el estado
reproductivo, el historial de vacunaciones, los antecedentes del rebaño, etc. Siempre que sea posible,
debe registrarse la fase de infección, lo cual podría incluir datos relacionados con los signos clínicos,
los perfiles de anticuerpos, la carga o excreción de agente patógeno, etc. En algunos casos, la
infección/exposición experimental podría ser la única opción viable para producir material de referencia
(véase la Norma de Validación de la OIE, Sección B.2.3). En este caso, deberá detallarse todo lo
anterior más el protocolo experimental.
Un aspecto especialmente relevante de estas muestras de referencia es que las muestras que se
utilizan para determinar su denominado estado “verdadero” respecto a la enfermedad/infección tienen
que estar bien documentadas, con el fin de evaluar posibles errores en las estimaciones que podrían
arrastrarse en las estimaciones relativas a la prueba candidata. De hecho, cuando se utilizan pruebas
estándar imperfectas para definir el estado de un animal o una muestra respecto a la enfermedad, es
posible que las estimaciones de rendimiento de DSe y DSp de la prueba candidata sea incorrectas y, a
menudo, que se sobreestimen. Consúltese la Directriz sobre Validación 3.6.5 de la OIE para conocer
los aspectos estadísticos.
En la Norma de Validación de la OIE se proporciona una introducción a los modelos de clase latente.
Estos modelos no se basan en la suposición de una prueba de referencia (estándar o independiente)
perfecta, sino que estiman la exactitud de la prueba candidata y del patrón de referencia con los
resultados analíticos combinados. Dado que estos modelos estadísticos son complejos y requieren
suposiciones críticas, debe buscarse ayuda estadística para que contribuya a orientar el análisis y a
describir el muestreo de la/s población/es de destino, las características de otras pruebas incluidas en
el análisis, la elección apropiada del modelo y los métodos de estimación en base a publicaciones
2
El patrón de referencia perfecto se menciona en la Norma de Validación de la OIE, Sección B.2.1.2, y en la Directriz
sobre Validación 3.6.5 de la OIE, Introducción y Figura 1.
revisadas por expertos. Consúltese la Directriz sobre Validación 3.6.5 de la OIE para conocer los
aspectos estadísticos.
Las muestras de las poblaciones de referencia, no las muestras referencia individuales, que se utilizan
en los estudios de clase latente deben estar bien descritas. Ello incluye documentación tanto sobre el
agente patógeno como sobre el hospedador donante. En el caso de los agentes patógenos, pueden
ser datos sobre la cepa, el serotipo, el genotipo, el linaje, etc. que podrían estará circulando en la
población. La procedencia del material del hospedador debe estar bien descrita respecto a la especie,
la raza, la edad, el sexo, el estado reproductivo, el historial de vacunaciones, los antecedentes del
rebaño, etc. Siempre que sea posible, debe registrarse la fase de infección en que se encuentran las
poblaciones teniendo en cuenta las tasas de morbilidad o mortalidad, la recuperación, etc.
Es importante destacar que si van a utilizarse modelos de clase latente para atribuir estimaciones de la
DSe y la DSp para incluir múltiples laboratorios en el diseño, es posible incorporar una evaluación de
la reproducibilidad. Como se ha explicado anteriormente, debe buscarse consejo estadístico a este
respecto.
*
* *