Las Directrices sobre Validación de la OIE aportan información detallada y ejemplos que respaldan la norma de validación de la OIE publicada como Capítulo 1.1.5 del Manual Terrestre, o como Capítulo 1.1.2 del Manual Acuático. El Término “Norma de Validación de la OIE” de esta Directriz hace referencia a estos capítulos. Los tipos y grupos de muestras de referencia son fundamentales desde el estudio inicial de viabilidad en el laboratorio de desarrollo hasta el mantenimiento y seguimiento del rendimiento de la prueba en el laboratorio de diagnóstico, así como en todas las etapas intermedias. La importancia crucial que tienen los tipos y grupos de muestras de referencia nunca se recalca lo suficiente. Si se elige un material de referencia equivocado, se puede generar sesgo y llegar a conclusiones indebidas desde que la prueba apenas se empieza a desarrollar hasta que se valida y se utiliza. Por lo tanto, es importante proceder con cuidado al escoger las muestras de referencia y al diseñar los grupos de muestras. Grupo A Grupo B Grupo D Estudio de viabilidad A.2.1 ASp B.1.2. Comparación con el método estándar B.2.6. Intervalo de funcionamiento A.2.2. Exactitud analítica B.1.4. Reconocimiento provisional B.2.6. Optimización A.2.3. Tipos y grupos de muestras de referencia Robustez A.2.5. Modificaciones biológicas B.5.2.2. Calibración A.2.6. Grupo C Grupo E Control del proceso A.2.6. Repetibilidad B.1.1. DSp y DSe Patrón de referencia perfecto B.2.1. ASe B.1.3. Reproducibilidad preliminar B.2.6. Modificaciones técnicas B.5.2.1. Reproducibilidad B.3. Grupo F Reposición de reactivos B.5.2.3. Prueba de competencia B.5.1. DSp y DSe No existe un patrón de referencia perfecto B.2.2. ASp = Especificidad analítica; ASe = Sensibilidad analítica; DSp = Especificidad diagnóstica; DSe = Sensibilidad diagnóstica Como se observa en la Figura 1, los tipos y/o grupos de muestras de referencia se mencionan a lo largo de toda la Norma de Validación de la OIE. Según se define en el glosario de la Norma de Validación y en las Directrices de la OIE para Laboratorios Veterinarios: Enfermedades Infecciosas, “los materiales de referencia son sustancias cuyas propiedades son suficientemente homogéneas y están lo suficientemente bien caracterizadas como para poder utilizarlas para la calibración de un aparato, la evaluación de un método de medición o para evaluar un valor respecto a dichos materiales”. En el contexto de la validación de los métodos analíticos, los materiales o muestras de referencia contienen el analito de interés a distintas concentraciones o actividades, y se utilizan en el desarrollo y evaluación de las características de rendimiento diagnóstico y analítico de la prueba. En nuestro caso, el analito es el componente específico de una muestra problema que se detecta o mide mediante el método analítico, por ejemplo, un anticuerpo, un antígeno o ácido nucleico. Estas muestras de referencia pueden ser muestras de sueros, líquidos, tejidos, excreciones, alimento para animales o muestras del entorno que contienen el analito de interés y que suelen obtenerse de animales infectados y sus entornos. No obstante, en algunos casos, pueden prepararse en el laboratorio a partir de un material de partida original (por ejemplo, una dilución de un suero fuertemente positivo en suero negativo) o, en ocasiones, añadiendo a la matriz en cuestión un analito derivado (por ejemplo, un cultivo bacteriano o vírico, una proteína recombinante/expresada o un constructo genómico). Tanto las muestras naturales como las preparadas, se utilizan en estudios a lo largo de todo el proceso de desarrollo, se mantienen en la fase de validación y pueden utilizarse para seguir el rendimiento a lo largo de toda la vida útil de la prueba. En la Figura 1, se agrupan tipos y muestras de referencia en función de las características y de la composición, y estas agrupaciones constituirán la base para las siguientes descripciones. A modo de referencia cruzada, se indica la Sección correspondiente de la Norma de Validación de la OIE en cada aplicación concreta del tipo o grupo de muestras de referencia. Las muestras de referencia se pueden utilizar para varios propósitos, desde las primeras fases del desarrollo y la optimización, a lo largo de la Fase 1, hasta el seguimiento y mantenimiento continuo de la prueba. Siempre que sea posible, deben obtenerse o prepararse cantidades grandes de estas muestras de referencia, y conservarse para su uso a largo plazo. Cuando se cambia de muestras de referencia durante el proceso de validación, se introduce una variable intratable que puede minar gravemente la interpretación de los datos experimentales y, por lo tanto, la integridad del proceso de desarrollo y validación. En el caso de pruebas que puedan aplicarse a varias especies, las muestras deben ser representativas de la principal especie de interés. Es fundamental que estas muestras reflejen tanto el analito en cuestión como la matriz en la que se halla en la población a la que va destinada la prueba. Los materiales de referencia deben representar de forma adecuada todo el intervalo de concentraciones del analito que la prueba deberá detectar. Es importante destacar que, independientemente de que las muestras de referencia se obtengan de forma natural o se preparen en el laboratorio, todos los criterios de elección y los procedimientos de preparación, así como los requisitos de análisis, tienen que quedar descritos de forma detallada e incluirse en un control documentado. Ello no solo es una buena práctica de gestión de la calidad, sino que proporcionará una mejora en el nivel de continuidad y de confianza a lo largo de toda la vida útil de la prueba. A menudo se duda acerca de si crear una muestra de referencia a partir de varias muestras combinadas. Si el material de referencia se obtiene de un solo animal, es importante asegurarse de si es o no representativo de un curso y estadio clásicos de la infección en el contexto de la población estudiada. Si no lo es, ello podría generar sesgo y conclusiones incorrectas en cuanto a la validación. La combinación de varias muestras es una buena alternativa pero es indispensable que procedan de animales que se encuentren en una fase similar de la infección. Ello es especialmente importante en el caso de los sistemas de detección de anticuerpos. La combinación también comporta el problema de tener que almacenar cantidades mayores de material de referencia para su uso a largo plazo, sobre todo cuando se trata de las especies hospedadoras más pequeñas. Antes de combinar muestras, es preferible que se analicen individualmente para comprobar si son similares en cuanto a la concentración y/o reactividad del analito. Debe realizarse una evaluación tras la combinación para asegurarse de que no se hayan introducido interferencias imprevistas al combinar múltiples muestras; por ejemplo, el hecho de que cada muestra fuera de un tipo sanguíneo o que tuvieran composiciones de anticuerpos distintas podría generar reacción cruzada en la muestra combinada, lo cual haría que la muestra combinada se comportara de forma distinta en la prueba en cuestión a como lo haría cada una de las muestras originales cuando se analizaran individualmente. A menudo es difícil obtener muestras individuales que representen verdaderamente las concentraciones o reactividades del analito en todo el intervalo esperado. Dada la dinámica de muchas infecciones o respuestas a agentes patógenos, a menudo los intervalos intermedios son muy transitorios. En el caso de las respuestas de anticuerpos, las primeras fases de la infección en animales sueltos a menudo dan lugar a poblaciones muy variables y heterogéneas de isotipos y avideces de los anticuerpos. En general, no constituyen buenas muestras de referencia para evaluar las características analíticas de una prueba. Sin embargo, son importantes para distintos tipos de grupos de muestras de referencia, como se explica más adelante. En la mayoría de aplicaciones del Grupo A, es aceptable utilizar muestras preparadas a las que se añaden concentraciones conocidas del analito o una serie de diluciones de una muestra fuertemente positiva en una matriz negativa para crear un intervalo de concentraciones. Tanto si son naturales como preparadas, las muestras de referencia deben representar el intervalo previsto de concentraciones del analito, desde débilmente positiva a fuertemente positiva, que sería esperable durante un curso clásico de la infección. Debe incluirse una muestra de referencia negativa como control de fondo. Si se utiliza una muestra negativa (matriz) como diluyente para preparar una muestra de referencia positiva (por ejemplo, un suero negativo que se utiliza para diluir un suero fuertemente positivo o un tejido al que se añade un constructo), decididamente esa muestra negativa debe incluirse como muestra de referencia negativa. Como se ha mencionado anteriormente, todas las muestras de referencia deben estar bien caracterizadas. Ello incluye documentación tanto acerca del agente patógeno como del hospedador donante. En el caso de los agentes patógenos, puede incluir detalles relativos a la cepa, el serotipo, el genotipo, el linaje, etc. La procedencia del material del hospedador también debe detallarse bien en cuanto a especie, raza, edad, sexo, estado reproductivo, historial de vacunaciones, antecedentes del rebaño, etc. Siempre que sea posible, debe indicarse la fase de la infección, lo cual podría incluir detalles relativos a los signos clínicos, los perfiles de anticuerpos, la carga o excreción de agente patógeno, etc. Es igualmente importante que las pruebas que se utilicen para determinar el estado respecto a la enfermedad o infección estén bien documentadas (véase la Sección 5 de esta Directriz sobre Validación para más detalles). En algunos casos, es posible que la infección o exposición experimental sea la única opción viable para producir el material de referencia. En tal caso, deben detallarse todos los aspectos anteriores más el protocolo experimental. Pero por encima de todo, el material de referencia, ya sea natural o preparado, debe ser inequívoco respecto a si representa una muestra verdaderamente positiva o verdaderamente negativa. Tal vez ello tenga que confirmarse mediante otra prueba o batería de pruebas. Por ejemplo, muchos sueros de referencia con anticuerpos se caracterizan empleando múltiples pruebas serológicas. Ello proporciona no solo confianza sino también características documentadas añadidas que podrían ser necesarias si en el futuro se debe sustituir o duplicar este material de Las recomendaciones relativas a la estabilidad y almacenamiento de los materiales de referencia se encuentran en: http://www.oie.int/fileadmin/Home/eng/Our_scientific_expertise/docs/pdf/GUIDELINE_3_REF_STANDARDS_ANG.pdf La Norma de Validación de la OIE establece que los métodos analíticos y procedimientos relacionados deben ser adecuados para aplicaciones diagnósticas específicas con el fin de que los resultados de las pruebas sean relevantes. En otras palabras, la prueba debe ser “idónea para el propósito previsto”. Muchas pruebas se desarrollan con buena intención pero sin una aplicación específica en mente. Es fundamental que desde el principio ese/os propósito/s diagnóstico/s esté/n definido/s respecto a la/s población/es que se analizarán. Los propósitos más frecuentes se indican a grandes rasgos en la Sección A de la Norma de Validación de la OIE. Como tales, incluyen aplicaciones más acotadas y específicas. Sin embargo, este/os propósito/s específico/s tienen que estar claramente definidos desde el principio y tienen una importancia crucial en el contexto de una prueba totalmente validada. Como se verá más adelante, el hecho de definir claramente la aplicación de la prueba repercutirá en la elección de los tipos y grupos de muestras de referencia y en el diseño de las evaluaciones analíticas y diagnósticas. El intervalo de funcionamiento de la prueba es el intervalo de concentraciones (cantidades) del analito a lo largo del cual el método proporciona una exactitud y una precisión adecuadas. También define los límites de detección inferior y superior de la prueba. Para establecer este intervalo, se escoge una muestra de referencia fuertemente positiva. Esta muestra fuertemente positiva, natural o preparada, se somete a una dilución seriada hasta la extinción en una matriz negativa que coincida con la matriz en la que se encontrarán las muestras que se obtengan de los animales de la población de destino de la prueba. Ello incluye pruebas de anticuerpos en que un suero de referencia fuertemente positivo debe diluirse en un suero de referencia negativo para crear la serie de diluciones. La sensibilidad analítica (ASe) se mide según el límite de detección (LOD) inferior de un analito en una prueba. Puede utilizarse la misma muestra de referencia fuertemente positiva para determinar tanto el intervalo de funcionamiento como el LOD analítico. Si el propósito es detectar niveles bajos de analito o infecciones subclínicas, puede ser difícil obtener los materiales de referencia apropiados de fases tempranas de la infección. En algunos casos, puede ser útil determinar una ASe comparativa analizando un grupo de muestras con la prueba candidata y con otra prueba independiente. Lo ideal es que este grupo de muestras se obtenga de forma seriada de animales infectados natural o artificialmente y debe representar animales infectados al principio de la infección, y a medida que avanza el desarrollo de la enfermedad clínica o fulminante, si es posible. Ello proporcionaría una comparación entre la ASe de las distintas pruebas, así como una comparación temporal del punto más temprano posible de detección teniendo en cuenta la patogenia de la enfermedad. Un estudio como el que se describe arriba proporciona una oportunidad única de obtener muestras de referencia que representen un intervalo natural de concentraciones que sería útil para otros fines de validación. Es importante no utilizar estas muestras para cuando no se apropiado (consúltese la Sección 4. Grupo D, abajo). Siempre que sea posible, deben obtenerse muestras seriadas de al menos cinco animales a lo largo de todo el curso de la infección. En los casos en que el muestreo resulte letal (por ejemplo, cuando se requiera obtener tejidos de órganos internos), el número de animales necesarios sería al menos cinco por cada episodio de muestreo. En el caso de especies hospedadoras más pequeñas, tal vez este número tenga que incrementarse para obtener suficiente material de referencia. Dado que este tipo de estudios comportan un compromiso importante de los recursos, sería aconsejable maximizar la obtención no solo de las muestras de referencia que interesan en ese momento sino también de otros materiales (como múltiples tejidos, líquidos, etc.) que pudieran resultar útiles como materiales de referencia en el futuro. La optimización es el proceso mediante el cual se evalúan y ajustan los parámetros físicos, químicos y biológicos más importantes de una prueba para asegurarse de que las características de rendimiento de dicha prueba se ajusten lo mejor posible a la aplicación prevista. Pueden escogerse al menos tres muestras de referencia que representen el resultado negativo, el débilmente positivo y el fuertemente positivo de entre muestras de referencia naturales o preparadas. Los estudios de optimización son bastante exhaustivos sobre todo cuando se trata de pruebas con múltiples pasos de preparación y análisis. Es muy importante que se disponga de una cantidad suficiente de cada muestra de referencia como para terminar todos los estudios de optimización. No se recomienda cambiar de muestras de referencia a lo largo del curso de la optimización, puesto que ello añade una variable incontrolada y una perturbación de la continuidad de los datos de optimización. La evaluación de la repetibilidad debe empezar durante las fases de desarrollo y optimización de la prueba. La repetibilidad se vuelve a verificar durante la Etapa 1 de la validación de la prueba (Sección B.1.1). Deben utilizarse para ambos procesos las mismas muestras de referencia, también en este caso para proporcionar una continuidad en los datos. Los reactivos de referencia internacionales están altamente caracterizados, contienen concentraciones definidas del analito y normalmente se preparan y mantienen en laboratorio de referencia internacional. Son los reactivos respecto a los cuales deben estandarizarse todas las pruebas y/u otros materiales de referencia. Los patrones de referencia nacional se calibran por comparación con un reactivo patrón internacional siempre que sea posible. En ausencia de un patrón internacional, puede escogerse o prepararse un patrón de referencia nacional, que a continuación se convierte en el patrón de comparación para la prueba candidata. En ausencia de ambos, la organización responsable del laboratorio donde se desarrolle la prueba debe escoger o preparar un patrón interno. Todos los reactivos patrón, tanto naturales como preparados, deben haber sido altamente caracterizados mediante análisis exhaustivos, y los métodos para su caracterización, preparación y almacenamiento preferiblemente deben estar publicados en publicaciones revisadas por expertos. Estos patrones de referencia también deben ser estables e inocuos. Los patrones de referencia, sobre todo en el caso de los anticuerpos, suelen suministrarse en uno de dos posibles formatos. Pueden suministrarse como reactivo positivo único de un título determinado con la expectativa de que la prueba candidata se estandarizará respecto a un título equivalente. Esta estrategia analítica es directa, pero muchos de estos patrones “únicos” se han preparado a partir de muestras fuertemente positivas como pre-dilución en una matriz negativa para maximizar el número de alícuotas. El inconveniente en este caso es que no hay justificación para ningún posible efecto de la matriz en la prueba candidata y no se suministra matriz control. La otra estrategia es suministrar un conjunto negativo, uno débilmente positivo y uno fuertemente positivo de patrones de referencia de concentraciones o reactividades conocidas y que se sitúen en el intervalo de funcionamiento del método estándar que se utilizó para prepararlos. Ello compensa todo posible efecto escondido de la matriz. Además, estos tres conjuntos actúan como molde para escoger y/o preparar los controles del proceso (se explica más adelante). Clásicamente, los patrones anteriores han sido patrones de anticuerpos policlonales y, en menor medida, patrones de antígeno convencionales que se han empleado para calibrar pruebas serológicas. No obstante, hoy en día los patrones de referencia también podrían ser anticuerpos monoclonales o proteínas recombinantes/expresadas o constructos genómicos, si se utilizan para calibrar pruebas respecto a un solo patrón de rendimiento. El/los reactivo/s que constituyen patrones de trabajo, normalmente conocidos como controles de calidad o del proceso, se calibran respecto a patrones internacionales, nacionales o internos. Se escogen o preparan en la matriz local que se halla en la población para la cual está pensada la prueba. Teóricamente, deben escogerse o prepararse patrones de trabajo negativos, débilmente positivos y fuertemente positivos. Las concentraciones y/o reactividades deben situarse en el intervalo de funcionamiento normal de la prueba. Deben prepararse cantidades grandes, dividirse en alícuotas y almacenarse para utilizarlas de forma rutinaria en cada ejecución de la prueba diagnóstica. El objetivo es que estos controles imiten, de la forma más fiel posible, las muestras de campo, y deben manipularse y analizarse como las muestras reales. Se utilizan para establecer los límites control superior e inferior de rendimiento de la prueba y para realizar un seguimiento de la variabilidad aleatoria y/o sistemática utilizando distintos métodos de representación gráfica del control. Su rendimiento diario determinará si la prueba cumple o no con el control y si pueden aceptarse ejecuciones individuales. Así pues, estas muestras de referencia de trabajo tienen una importancia crucial desde el punto de vista de la gestión de calidad. Las modificaciones técnicas en una prueba validada, como los cambios en la instrumentación o en los protocolos de extracción, o la conversión de una prueba en un sistema semi-automático o totalmente automático aplicando la robótica, no suelen requerir una revalidación completa de la prueba. En lugar de ello, puede llevarse a cabo un estudio de comparación de métodos para determinar si estos pequeños cambios en el protocolo de la prueba afectarán a los resultados de la misma. En la Directriz sobre Validación 3.6.81 de la OIE Comparabilidad entre pruebas tras pequeños cambios en un método analítico validado se explican los enfoques estadísticos de la precisión de la prueba ante modificaciones técnicas. En general, estos enfoques requieren utilizar tres muestras de referencia, una negativa, una débilmente positiva y una fuertemente positiva. De nuevo, estas muestras pueden ser naturales o preparadas. Lo importante a recalcar en este caso es que las muestras de referencia que se utilizaron en las fases de desarrollo de la prueba pueden utilizarse también para evaluar modificaciones una vez el método se ha empezado a utilizar rutinariamente para el diagnóstico. Ello proporciona un nivel más alto de confianza porque se evalúan las posibles consecuencias, dado que las características de rendimiento de estas muestras de referencia se han caracterizado bien. Si deben utilizarse nuevas 1 Nota para el lector: Una vez finalizada la Directriz sobre Validación 3.6.8 de la OIE Comparabilidad entre pruebas tras pequeños cambios en un método analítico validado se publicará en la página web de la OIE. muestras de referencia, por lo menos deben escogerse o prepararse aplicando los mismos criterios o procedimientos de preparación que para los materiales previos. También en este caso, ello mejora la continuidad de los datos. Cuando un reactive, como por ejemplo una muestra para el control del proceso, está a punto de agotarse, es fundamental preparar y analizar repetidamente una de reposición, antes de que dicho control se termine del todo. La muestra control de reposición deberá incluirse en varias ejecuciones de la prueba paralelamente al control original para establecer su relación de proporcionalidad. Es importante cambiar solo un reactivo control cada vez, para evitar el problema de tener que evaluar más de una variable. También en este caso, es importantísimo destacar que todo reactivo de referencia de reposición deberá escogerse o prepararse empleando los mismos criterios o procedimientos de preparación que se hayan aplicado a los materiales previos. Una vez más, ello mejora la continuidad de los datos y la confianza en la prueba. La Especificidad analítica (ASp) es la capacidad de la prueba de distinguir entre el analito de interés y otros componentes que podría también detectar. Es una definición relativamente amplia que a menudo no se comprende bien. La ASp se puede desglosar en distintos elementos, que se describen abajo. La elección de las muestras de referencia necesarias para evaluar la ASp depende en gran medida del propósito o aplicación específicos que se previeron inicialmente en la fase de desarrollo de la prueba. La evaluación de la ASp es un elemento crucial en los estudios de viabilidad y en la verificación de la idoneidad de la prueba para el propósito previsto. Un elemento importante es el punto hasta el cual un método puede detectar con exactitud y/o cuantificar el analito de interés en un medio en que hay ácidos nucleicos, proteínas y/o anticuerpos, como es la matriz de la prueba. A veces, esto se denomina “selectividad”. Un ejemplo es el uso de muestras de referencia para pruebas que están diseñadas para diferenciar entre animales infectados y animales vacunados (pruebas DIVA). Las muestras de referencia tienen que escogerse y comprobarse a partir de animales i) no infectados/no vacunados, ii) no infectados/vacunados, iii) infectados/no vacunados y iv) infectados/vacunados. Estas muestras se pueden obtener en condiciones de campo, pero es importante conocer los antecedentes exactos, si puede ser de los animales concretos con los que se trabaja, pero como mínimo de los rebaños involucrados, incluida la vacunación y las enfermedades que hayan tenido lugar. Como alternativa, podría ser necesario producir este material en estudios como los que se describen en la Sección 1.2.2 de esta Directriz sobre Validación, pero incluyendo una combinación de animales vacunados y animales expuestos, en ambos casos experimentalmente. Es importante evitar el uso de la vacuna como antígeno de captura para la prueba (por ejemplo, en un enzimoinmunoanálisis indirecto [I-ELISA]), porque las proteínas portadoras de la vacuna podrían estimular respuestas de anticuerpos inespecíficas en los animales vacunados que podrían ser detectadas en el ELISA, dando así lugar a falsos positivos en la prueba. De forma similar al enfoque comparativo descrito arriba respecto a la ASe, deben utilizarse al menos cinco animales en cada grupo. En el caso de especies hospedadoras más pequeñas, este número tal vez tenga que incrementarse para obtener suficiente material de referencia. En función de la prueba DIVA, podría diseñarse un solo estudio que sirviera para evaluar aspectos tanto de la ASe como de la ASp. Un segundo elemento, que a veces se denomina “exclusividad”, es la capacidad de la prueba de detectar un analito o una secuencia genómica que sean exclusivos del microorganismo en cuestión, lo cual excluye todos los demás microorganismos conocidos que puedan generar reacción cruzada. Esto es especialmente cierto en las pruebas serológicas, en que hay muchos ejemplos de antígenos expresados por otros microorganismos que son capaces de desencadenar anticuerpos que reaccionan de forma cruzada. En función del tipo de prueba, estos materiales de referencia puede representar el microorganismo en sí, muestras derivadas del hospedador o secuencias genómicas. Debe establecerse un perfil de la exclusividad de la prueba, y ampliarse continuamente a medida que surgen microorganismos que puedan generar reacción cruzada. En tercer lugar, un aspecto crítico del diseño es el relativo a la capacidad de una prueba de detectar una o varias cepas o serotipos de una especie, varias especies de un género o una agrupación similar de microorganismos o anticuerpos estrechamente relacionados. Esto define el ámbito de detección y, por lo tanto, la idoneidad de la prueba para el propósito previsto. Se requieren muestras de referencia para definir el ámbito de la prueba. Si, por ejemplo, una prueba se ha desarrollado como prueba de cribado para detectar todos los genotipos o serotipos conocidos de un virus, deben analizarse muestras de referencia de cada tipo representativo. A medida que surgen nuevas variantes de linajes o serotipos, también deben analizarse como parte del perfil de la prueba, que deberá actualizarse continuamente. Ciertos métodos o procedimientos de análisis son únicamente herramientas analíticas y suelen aplicarse para caracterizar mejor un analito que se ha detectado en una prueba primaria, como por ejemplo, las pruebas como la neutralización vírica, que se utilizan para tipificar un virus aislado o caracterizar una respuesta de anticuerpos. Estas pruebas adjuntas deben validarse en cuanto a características de rendimiento analítico, pero difieren de las pruebas diagnósticas rutinarias porque no requieren que se validen sus características de rendimiento diagnóstico. La exactitud analítica de estas pruebas a menudo depende del uso de reactivos de referencia. Estos reactivos, tanto si son anticuerpos para tipificar cepas de microorganismos como cepas de referencia del microorganismo, etc., deben documentarse exhaustivamente, como se exigiría a cualquier otro material de referencia, respecto a su procedencia, identidad y características de rendimiento. Las muestras de referencia del Grupo C pueden utilizarse para varios propósitos. En las fases iniciales del desarrollo, pueden utilizarse en la evaluación de la repetibilidad de la prueba y para la evaluación preliminar de la reproducibilidad de la Etapa 1 y en la más exhaustiva de la Etapa 3 de la Fase de Validación. No obstante, estas muestras tienen otros posibles usos una vez la prueba se ha transferido al laboratorio de diagnóstico. Pueden utilizarse como grupos de muestras para formar y cualificar al personal experto en análisis, y para evaluar la competencia del laboratorio en programas de evaluación externa. Teóricamente, deben prepararse 20 o más muestras individuales en grandes volúmenes. Alrededor de una cuarta parte (25%) deben ser muestras negativas y el resto (75%) deben constituir un conjunto de muestras positivas que representen todo el intervalo de funcionamiento de la prueba. Deben dividirse en alícuotas que se introducirán en tubos individuales en volúmenes suficientes como para un solo uso, y que se almacenarán para ser utilizadas a largo plazo. El número necesario de alícuotas de cada tipo dependerá de cuántos laboratorios vayan a utilizar la prueba para el diagnóstico de rutina y de la frecuencia con que se prevea que se realizarán pruebas de competencia. Lo ideal es prepararlas en una cantidad inexhaustible, pero esto casi nunca es viable. Como mínimo, deben prepararse varios cientos de alícuotas o más de cada en cada ocasión si la prueba va destinada a ser utilizada en múltiples laboratorios. Ello permite evaluar la competencia del laboratorio analizando la misma muestra en muchos intervalos de análisis – un medio útil de detectar los errores sistemáticos (sesgos) que podrían introducirse sigilosamente cuando una prueba se utiliza a largo plazo. Estas muestras pueden ser naturales o bien se pueden preparar con material de partida individual o combinado. El objetivo es que imiten al máximo una muestra problema real. Dado que el almacenamiento masivo siempre es problemático, puede ser necesario almacenar estos materiales a granel y preparar alícuotas de trabajo de vez en cuando. No obstante, si se dispone de espacio de almacenaje, es preferible preparar y almacenar grandes cantidades de alícuotas de una sola vez porque guardar el analito a granel y someterlo a ciclos de congelacióndescongelación para preparar unas pocas alícuotas cada vez puede comportar degradación. Dado que este tipo de material de referencia se consume bastante rápido, tendrá que sustituirse o reponerse continuamente. Dado que existe la posibilidad de tener que reponer material tanto en el uso rutinario como durante un brote, es aconsejable trabajar con homólogos de campo para obtener material de referencia a granel y almacenarlo para utilizarlo en el futuro. Como alternativa, puede ser necesario producir este material en estudios como los que se describen en la Sección 1.2.2 de esta Directriz sobre Validación. De forma similar al enfoque comparativo que se describe arriba respecto a la ASe, deben utilizarse al menos cinco animales en cada grupo. En el caso de especies hospedadoras más pequeñas, este número podría tener que incrementarse para obtener suficiente material de referencia. La repetibilidad es el grado de acuerdo entre los resultados de réplicas de una muestra tanto para una misma ejecución como entre distintas ejecuciones del mismo método analítico en un laboratorio dado. La repetibilidad se estima evaluando la variación entre los resultados de réplicas de un mínimo de tres (preferiblemente cinco) muestras que sean representativas de la actividad del analito dentro del intervalo de funcionamiento de la prueba. Consúltese la Directriz sobre Validación de la OIE Incertidumbre de la medición para conocer los enfoques estadísticos de las mediciones de la incertidumbre en las evaluaciones de la repetibilidad. La reproducibilidad es la capacidad de un método analítico de proporcionar resultados constantes, determinada mediante estimaciones de la precisión, cuando se aplica a alícuotas de las mismas muestras analizadas en distintos laboratorios. No obstante, deben realizarse estimaciones preliminares de la reproducibilidad de la prueba candidata durante las etapas de desarrollo. Un grupo pequeño de tres (aunque preferiblemente cinco) muestras que representen el valor negativo y los valores débilmente y fuertemente positivo, como se ha descrito anteriormente, sería suficiente. Este tipo de grupo de muestras también se podría utilizar para una evaluación limitada de la reproducibilidad para aumentar la aceptación provisional de la prueba. El método analítico suele evaluarse en uno o más laboratorios con un nivel alto de experiencia y competencia en pruebas similares a la prueba candidata. El grupo de muestras “ciegas” se evalúa utilizando la prueba candidata en cada uno de estos laboratorios, empleando el mismo protocolo, los mismos reactivos y un equipo comparable. Es una versión a escala reducida de la Etapa 3 de la validación de la prueba. Consúltese la Directriz sobre Validación 3.6.4 de la OIE para una explicación más detallada sobre este tema y su aplicación. La reproducibilidad es una medida importante de la precisión de una prueba cuando se utiliza en varios laboratorios situados en regiones claramente diferenciadas o en diferentes regiones o países aplicando exactamente la misma prueba (protocolo, reactivos y controles idénticos). A medida que aumenta el número de laboratorios, aumenta el número de variables respecto a los entornos de laboratorio, diferencias de equipo y conocimientos técnicos. Estos estudios miden la capacidad de una prueba de mantenerse inalterada ante cambios considerables o sustituciones en las condiciones de la prueba que puedan preverse cuando si la prueba se utiliza en múltiples laboratorios (por ejemplo, las condiciones de envío, la transferencia de tecnología, los lotes de reactivos, el equipo o las plataformas y/o entornos de análisis). En al menos tres laboratorios se deberá analizar el mismo grupo de muestras “ciegas”; cada grupo contendrá al menos 20 muestra, entre las que se incluirán negativas y positivas, estas últimas a distintas concentraciones. Si el grupo incluye muestras negativas y/o positivas duplicadas, pueden realizarse más estimaciones de la repetibilidad intra-laboratorio analizando réplicas de estas muestras cuando se utilicen en los estudios de reproducibilidad. Una prueba validada en el uso rutinario en múltiples laboratorios debe someterse a un seguimiento continuo para asegurar un rendimiento uniforme y proporcionar confianza global en los resultados analíticos. Ello se evalúa mediante programas externos de garantía de calidad. Las pruebas de competencia constituyen una de las posibles medidas de la competencia del laboratorio, que se llevan a cabo mediante una comparación inter-laboratorio; se sobrentiende que los laboratorios participantes están utilizando los mismos (o similares) métodos, reactivos y controles de la prueba. Los resultados se suelen expresar cualitativamente, es decir, como negativos o positivos para determinar criterios de superación/fracaso. No obstante, en el caso de las pruebas de una sola dilución, los resultados semicuantitativos proporcionan datos adicionales para evaluar el error no aleatorio entre los laboratorios participantes. Los programas de pruebas de competencia varían en función del tipo de prueba en cuestión. En el caso de las pruebas de dilución única, los tamaños de los grupos de muestra también varían, pero sería suficiente con un mínimo de cinco muestras, que representen el negativo y tanto el fuertemente positivo como el débilmente positivo, como los que se han descrito anteriormente. Las pruebas de competencia no son más que una forma continua de evaluar la reproducibilidad. No obstante, la reproducibilidad, por definición, es una medida del rendimiento de la prueba en múltiples laboratorios, mientras que las pruebas de competencia son una evaluación de la competencia del laboratorio en cuanto al rendimiento de una prueba establecida y validada. Pueden estimarse mediciones de la precisión tanto para datos de reproducibilidad como de repetibilidad si se incluyen réplicas de la misma muestra de referencia en este grupo de muestras “ciegas”. Consúltese la Directriz sobre Validación 3.6.4 para una explicación más detallada de este tema y su aplicación. Las muestras de referencia del grupo D difieren de las de los Grupos previos en que cada muestra del grupo debe proceder de un solo animal. Como se indica en la Directriz sobre Validación 3.6.8 de la OIE (véase la nota 1 a pie de página), los estudios de exposición experimental a menudo incluyen un muestreo repetido de animales determinados para conocer cómo progresa la enfermedad, pero este es un objetivo distinto del de comparar las características de rendimiento que se asociarían a la sensibilidad diagnóstica (DSe) y a la especificidad diagnóstica (DSp) de un método analítico. No pueden utilizarse muestras obtenidas de forma seriada, tomadas en días distintos del mismo animal, como representativas de animales específicos de las poblaciones a las que va dirigida la prueba, porque estas muestras no cumplen la norma de independencia de muestras que se exige en estos estudios. Hay que proceder con cautela al elegir las muestras de referencia y el método estándar (independiente) que se utilizará en este tipo de comparación para asegurarse de que los analitos que se pretende detectar (si son distintos) muestran el mismo tipo de perfil patógeno en cuanto a tiempo necesario para que aparezcan los signos clínicos tras la exposición al agente infeccioso y a proporción de abundancia en las muestras problema escogidas. Existen situaciones en que no es posible o no es deseable completar la Etapa 2 de la Fase de Validación porque se dispone de muy pocas muestras apropiadas de la población de destino y es difícil acceder a los animales (como en el caso de enfermedades exóticas). No obstante, debe analizarse, mediante la prueba candidata, un grupo pequeño pero escogido de muestras problema altamente caracterizadas que sean representativas del intervalo de concentraciones de analito, de forma paralela al análisis que se realice con un método estándar de la OIE, según se publica en los Manuales de la OIE. Si ambos métodos se consideran comparables (Directriz sobre Validación 3.6.8 de la OIE: véase la nota 1 a pie de página), y en función de la aplicación prevista de la prueba, puede optarse por no exigir otra validación diagnóstica. Por ejemplo, si la aplicación prevista es el cribado de animales importados o de productos animales en cuanto a agentes patógenos exóticos o la confirmación de casos clínicos, es posible que no sea factible o no esté justificada una validación completa tras comparar el método analítico. Por experiencia se sabe que el principal obstáculo para seguir adelante con la Etapa 2 de la Fase de Validación es el número de muestras definidas que se exige para estimar los parámetros de rendimiento diagnóstico con un grado alto de certidumbre (Norma de Validación de la OIE, Sección B.2). En algunos casos, puede estar justificado que las autoridades internacionales, nacionales o locales otorguen un reconocimiento provisional a una prueba que no ha sido completamente evaluada tras las etapas analíticas. Los distintos motivos de aceptación provisional se describen con detalle en la Norma de Validación de la OIE. No obstante, en todos los casos deben existir pruebas irrefutables de comparabilidad de las estimaciones de la DSp y la DSp que se basen en un grupo pequeño y escogido de muestras bien caracterizadas que contengan el analito de interés. Teóricamente, tanto para la comparación con un método de referencia como para el reconocimiento provisional, podría reunirse un grupo de, por ejemplo, 60 muestras para asegurar un tamaño muestral suficiente para el análisis estadístico de los datos obtenidos. Este grupo incluiría 30 negativos “verdaderos” y 30 positivos “verdaderos”. Siempre que sea posible, los positivos deben reflejar el intervalo de concentraciones o actividades del analito esperable en la población de destino. Como se ha mencionado anteriormente, cada muestra de este grupo debe proceder de un solo animal. Consúltese la Directriz sobre Validación 3.6.5 de la OIE para conocer los enfoques estadísticos de la comparabilidad de métodos cuando se utilizan muestras diagnósticas. Puede haber situaciones en que se resulten necesarios y/o estén justificados ciertos cambios en algunas de las sustancias biológicas que se utilizan en la prueba. Ello puede incluir cambios en los reactivos en sí o bien pasar a otro tipo de muestra que también contenga el analito que se detectaba con la prueba validada original (por ejemplo, pasar de suero a saliva). Antes de seguir utilizando la prueba, como mínimo deberán volver a evaluarse todos los criterios analíticos de la fase de validación. Si se cumplen los requisitos analíticos, lo que faltará será averiguar si es necesario proceder a una validación diagnóstica completa. Puede plantearse un enfoque similar al anterior, utilizando un grupo de 60 muestras de referencia individuales. No obstante, en este caso el método analítico original se consideraría la prueba estándar (independiente) y el método modificado se consideraría la prueba candidata. Consúltese la Directriz sobre Validación 3.6.5 de la OIE para conocer los enfoques estadísticos de la comparabilidad de métodos cuando se utilizan muestras diagnósticas Los animales de referencia y las muestras de referencia de este Grupo E se describen con detalle en la Norma de Validación de la OIE, Sección B.2.1. No obstante, merece la pena volver a insistir aquí en algunos aspectos. En el caso de las estimaciones convencionales de la DSp, las muestras de referencia negativas son muestras verdaderamente negativas, procedentes de animales en los que no ha sido posible ni la infección ni la exposición al agente patógeno. En algunas situaciones, cuando en un país nunca se ha declarado la enfermedad o bien se ha limitado a ciertas regiones, hallar muestras de referencia verdaderamente negativas no suele ser difícil. No obstante, cuando la enfermedad es endémica, este tipo de muestras pueden ser difíciles de localizar. A menudo es posible obtener estas muestras de ciertas regiones de un país grande o tal vez de otros países que hayan erradicado o nunca hayan tenido la enfermedad en cuestión. También en este caso, para realizar una estimación convencional de la DSe, las muestras de referencia positivas serán verdaderos positivos. Es importante asegurarse de que la población estudiada sea representativa de la población a la que irá destinada la prueba una vez validada. En general, es difícil hallar cantidades suficientes de animales de referencia verdaderamente positivos, diagnosticados por aislamiento del microorganismo. Puede ser necesario recurrir a muestras de animales que hayan sido analizados mediante una combinación de varios métodos que inequívocamente clasifiquen a los animales como infectados/expuestos, como se explica en la Norma de Validación de la OIE. Lo importante en esta situación es que todas las muestras, sea cual sea su procedencia, deben documentarse como se haría con cualquier otra muestra de referencia, de forma que los animales se clasifiquen inequívocamente como infectados o expuestos, en función de la idoneidad para el propósito y el uso previsto de la prueba. Como se ha mencionado en la Sección 1 de esta Directriz sobre Validación, todas las muestras de referencia deben caracterizarse bien. Ello implica documentar tanto el agente patógeno como sobre el hospedador donante. Respecto a los agentes patógenos, pueden ser datos sobre la cepa, el serotipo, el genotipo, el linaje, etc. La procedencia del material del hospedador debe estar bien descrita respecto a la especie, la raza, la edad, el sexo, el estado reproductivo, el historial de vacunaciones, los antecedentes del rebaño, etc. Siempre que sea posible, debe registrarse la fase de infección, lo cual podría incluir datos relacionados con los signos clínicos, los perfiles de anticuerpos, la carga o excreción de agente patógeno, etc. En algunos casos, la infección/exposición experimental podría ser la única opción viable para producir material de referencia (véase la Norma de Validación de la OIE, Sección B.2.3). En este caso, deberá detallarse todo lo anterior más el protocolo experimental. Un aspecto especialmente relevante de estas muestras de referencia es que las muestras que se utilizan para determinar su denominado estado “verdadero” respecto a la enfermedad/infección tienen que estar bien documentadas, con el fin de evaluar posibles errores en las estimaciones que podrían arrastrarse en las estimaciones relativas a la prueba candidata. De hecho, cuando se utilizan pruebas estándar imperfectas para definir el estado de un animal o una muestra respecto a la enfermedad, es posible que las estimaciones de rendimiento de DSe y DSp de la prueba candidata sea incorrectas y, a menudo, que se sobreestimen. Consúltese la Directriz sobre Validación 3.6.5 de la OIE para conocer los aspectos estadísticos. En la Norma de Validación de la OIE se proporciona una introducción a los modelos de clase latente. Estos modelos no se basan en la suposición de una prueba de referencia (estándar o independiente) perfecta, sino que estiman la exactitud de la prueba candidata y del patrón de referencia con los resultados analíticos combinados. Dado que estos modelos estadísticos son complejos y requieren suposiciones críticas, debe buscarse ayuda estadística para que contribuya a orientar el análisis y a describir el muestreo de la/s población/es de destino, las características de otras pruebas incluidas en el análisis, la elección apropiada del modelo y los métodos de estimación en base a publicaciones 2 El patrón de referencia perfecto se menciona en la Norma de Validación de la OIE, Sección B.2.1.2, y en la Directriz sobre Validación 3.6.5 de la OIE, Introducción y Figura 1. revisadas por expertos. Consúltese la Directriz sobre Validación 3.6.5 de la OIE para conocer los aspectos estadísticos. Las muestras de las poblaciones de referencia, no las muestras referencia individuales, que se utilizan en los estudios de clase latente deben estar bien descritas. Ello incluye documentación tanto sobre el agente patógeno como sobre el hospedador donante. En el caso de los agentes patógenos, pueden ser datos sobre la cepa, el serotipo, el genotipo, el linaje, etc. que podrían estará circulando en la población. La procedencia del material del hospedador debe estar bien descrita respecto a la especie, la raza, la edad, el sexo, el estado reproductivo, el historial de vacunaciones, los antecedentes del rebaño, etc. Siempre que sea posible, debe registrarse la fase de infección en que se encuentran las poblaciones teniendo en cuenta las tasas de morbilidad o mortalidad, la recuperación, etc. Es importante destacar que si van a utilizarse modelos de clase latente para atribuir estimaciones de la DSe y la DSp para incluir múltiples laboratorios en el diseño, es posible incorporar una evaluación de la reproducibilidad. Como se ha explicado anteriormente, debe buscarse consejo estadístico a este respecto. * * *
© Copyright 2025