Taller sobre Conceptualizacion, planeamiento y uso de las evaluaciones de impacto Mario G. Picon and Benjamin K. Wood International Initiative for Impact Evaluation Taller 3ie y SINERGIA Bogota, Abril 2016 Objetivos • Entender el sitio de la evaluacion de impacto en la caja de herramientas del evaluador. • Tener argumentos para decidir cuando llevar a cabo una evaluacion de impacto es adecuado. • Demistificar la evaluacion de impacto en termino de metodos, dilemas eticos, y costo. • Entender la importancia de teorias de cambio, distinguiendolas del marco logico. • Mostrar como las evaluaciones de impacto pueden ser utiles para el diseno de politicas y reformas. Conociendo a 3ie • ONG internacional que financia y produce evidencia de alta calidad sobre la efectividad de políticas y programas: que funciona, cómo, por qué, y a qué costo. • 3ie está basada en membresía de agencias gubernamentales, donantes y ONGs de todo el mundo. • En Latinoamérica, CONEVAL (México), SINERGIA (Colombia), MIDIS y MINEDU (Perú), STP (Paraguay), y próximamente en Argentina. Como para entrar en confianza Cuantos de ustedes trabajan… - En M&E? - Otras unidades técnicas de Ministerios? - Otros? Como para entrar en confianza (2) Cuantos de ustedes han recibido un taller de evaluación de impacto en el pasado? Para aquellos que lo recibieron… Sobre que fue? Metodos? Que le gusto o llamo la atencion del mismo? Que no le gusto o no lo convencio? Para todos… Que es lo primero que viene a la mente cuando hablamos de evaluacion de impacto? Respuestas que normalmente recibimos… • RCTs • Costos elevados • Poco practicas • Demasiado academicas • Extensas/complicadas • Rigor • Costo/efectividad • Encontrando la major intervencion • Planificacion • Atribucion Un par de cosas sobre sus facilitadores… • Futbolista frustrado • Buen cocinero • Me dedicaba a M&E y evaluacion de cartera antes de hacer evaluacion de impacto Un par de cosas sobre su otro facilitador… • Quinta visita a Colombia • Comedor aventurero • Trabaje en Corea y China antes de hacer evaluacion de impacto Evaluacion de impacto en contexto M&E of a development project La Evaluacion de Impacto en Contexto Monitoreo: ‘esta el proyecto haciendo las cosas bien?’ • Monitoreo: recoleccion regular de informacion sobre progreso en la implementacion. Parte integral de reporte y para determinar responsabilidades para la accion. • Monitoreo genera data interna al proyecto y esta enfocada en el cumplimiento de procesos y progreso de acuerdo al plan del Proyecto. Por ejemplo: • Se usan los insumos tal como se planeo? • Se usan los insumos de acuerdo a procesos aceptados? (ej. adquisiciones?) • Estan las actividades resultando en los productos esperados? Evaluacion: ‘esta el proyecto haciendo lo correcto? Es decir, representa el Proyecto un uso efectivo de recursos para los propositos que se persiguen? Resultsbased formativa externa proceso internal proyecto cartera impacto program a independiente implementacion Efectividad en implementacion Resultados Evaluacion Monitoreo basado en resultados y el Marco Logico Impactos Resultados Implementacion Monitoreo Productos Actividades Insumos • Mejoras a nivel sociedad, amplias y largo plazo • Efectos intermedios de productos sobre beneficiarios • Productos y servicios producidos • Tareas del personal para • transformer insumos en productos Recursos financieros, humanos y materiales A que nos referimos con evaluacion de impacto? • Estos son estudios que miden un impacto neto atribuible usando un contrafactual: que hubiera pasado si el programa no hubiese existido. • NO unicamente evaluacion experimental / randomizacion. Los retos de evaluar • “Existe una tendencia general a monitorear en lugar de evaluar.” (Sri Lanka) • “…esta distorsion encontrada en la mayoria de paises de un exceso d emonitoreo y la escasez de evaluacion genuina” (World Bank) • “…M&E no se esta orientando a entender causalidad y atribucion en las etapas de cambio y desarrollo” (Uganda) • “Mientras el Tesoro a nivel nacional y provincial ha enfatizado el recojo de informacion basado en el marco logico, los mismos no se han preocupado de determiner atribucion (South Africa) y causalidad.” Utilidad de las Evaluaciones de Impacto Evaluaciones de impacto • Creando un contrafactual valido, i.e. causalidad Por que no puedo comparar personas que recibieron el programa con personas que no lo recibieron? Porque necesitas un contrafactual valido! A que nos referimos con evaluacion de impacto? • Estos son estudios que miden un impacto neto atribuible usando un contrafactual: que hubiera pasado si el programa no hubiese existido. • NO unicamente evaluacion experimental / randomizacion. La identificacion de Evaluacion de Impacto con Randomizacion (RCTs) • Randomizacion tiene el potencial de eliminar el problema de sesgo de seleccion…porque asigna el tratamiento/intervencion de manera aleatoria. Hay mas en la evaluacion de impacto que RCTs • RCT, sin embargo puede ser muy efectiva en eliminar el sesgo de seleccion (validez interna) • Buena manera de determinear que el efecto medido es causado por la intervencion • Enfatizado en la literatura, pero: • Riesgo 1: el reducir el ambito de la evaluacion rigurosa a preguntas que pueden ser respondidas con RCTs. • Riesgo 2: usar RCT de manera mecanica, sin considerar disenos alternativos o complementarios No hace mucho tiempo, tuvo lugar un importante debate sobre la major manera de hacer evaluacion (de impacto) RCTs, Esther Duflo y los denominados ‘randomistas’ Angus Deaton y la invocacion a hacer “Evaluacion basada en Teoria” Que significa incidir en politicas publicas? Incidencia puede manifestarse: • Expansion de programas exitosos • Cierre de programas que no funcionan • Cambio en el diseno de un programa o politica • Informacion de discusiones de politicas en un sector, pais, o a nivel global. • Fortalecimento de la cultura de evaluacion. Influyen las evaluaciones de impacto las politicas publicas? (1) Si, cuando: • Se involucra a los hacedores de politica desde el inicio • Se elabora un plan de incidencia en la etapa de diseno. • La evaluacion tiene un enfoque en responder lo que los policymakers y sociedad civil necesitan saber • No solo saber que funciona, sino por que y como (usando metodos mixtos) • Plan de comunicacion y diseminacion de resultados Argumentos en contra (1): Las evaluaciones de impacto no responden lo que se necesita saber • La identificacion de Evaluacion de Impacto con Randomizacion (RCT) • El metodo en base al problema a ser abordado • Angust Deaton y la evaluacion de “teorias” • Lant Pritchett y el MeE (aprendizaje basado en experiencia/testeo) Respuesta (1): Involucramiento de policymakers desde el inicio / Plan de incidencia • El Modelo de Ventanas de Politica de 3ie – un primer paso • La Clave: Manejo adecuado de Teorias de Cambio del programa y de la evaluacion • Caja de herramientas -> de evidencia a politicas Argumento (2): La evidencia es importante pero su uso depende solo de factores politicos • Liderazgo tecnico y politico • Involucramiento de sociedad civil • “Cultura de Evaluacion” • Agencias independientes • Diseminacion de informacion como compromiso Respuesta (2): Crear las condiciones para el uso de evidencia en politicas publicas • Evidencia como bien publico global • Generacion de capacidades sociedad civil y sector publico • Como lo han hecho en otros paises? Modelos de las Evaluaciones de Impacto Modelo SINERGIA en Colombia • “Sistema” de Gestion por Resultados dependiente de Direccion Nacional de Planeacion • Cambios en el Tiempo (tres fases desde 1990) • Coordinacion/ diseminacion de cultura de evaluacion sector publico Modelo CONEVAL en Mexico • Agencia independiente en terminos administrativos, presupuestarios. • Palanca: mandato de monitorear y evaluar organismos del estado en base a indicador de pobreza multidimensional • Razon politica de fondo: fomenter que los recursos publicos se usen adecuadamente. Modelo basado en Ministerios de linea – por ejemplo, Peru • Liderazgo del MIDIS desde su origen • Atraccion de cuadros calificados • Fuerte trabajo dentro del Gobierno, obteniendo fuerte apoyo presidencial. • Foco del gobierno en inclusion social como legado como oportunidad. Los “Labs” dentro del Sector Publico • A nivel tecnico, permiten pilotos de nuevas intervenciones, nuevas formas de hacer las cosas • A nivel institucional, fomentan el involucramiento de distintas unidades de una agencia de gobierno • Punto de entrada para sociedad civil: El Lab busca soluciones a problemas concretos. • El caso del EduLab en Peru, y el Lab de Desarrollo urbano en Buenos Aires Behavioural Insights Team en Gran Bretana. Retos por el Lado de la Oferta • El rol de los think tanks Latinoamericanos • En evaluacion de impacto: pocos proveedores • 3ie esta probando: asesores expertos / incubadoras Experiencia 1 Experimento para Impuestos a la Propiedad en Pakistan Evaluacion de Impacto en areas consideradas “no conducentes” a EI • Equipo: Adnan Q. Khan (LSE), Asim I. Khwaja (Harvard) and Benjamin A. Olken (MIT)* • Recaudacion fiscal en Pakistan de las mas bajas • Ingresos fiscales provinciales de Punjab estancados en alrededor de 0.5% del PBI por mas de 10 anios. • Impuesto a la propiedad entre los de peor desempeno. • Departamento de Impuestos de Punjab introduce reformas en recursos humanos desde 2009. • Reformas: incentivar la recoleccion de impuestos y mejorar desempeno en general. Influencia en Politicas El Experimento • Diseño/ Evaluación de alternativas en modelo de pago por desempeño • Objetivo: incrementar recaudación pero manteniendo o aumentando la satisfacción de los contribuyentes. • Ensayo controlado aleatorio (RCT): 482 zonas tributarias asignadas a uno de tres modelos de pago por desempeño o un grupo control. • Honorarios basados en Ingresos • Honorarios basados en Ingresos PLUS monitoreo de recolección agresiva. • Salario fijo condicional (mayor parte de bono entregado a final del año) Influencia en Politicas Resultados • Incentivos funcionan: mejoras sustantivas e impactos no ambiguos sobre recolección tributaria. • Zonas tributarias con incentivos tuvieron mejor desempeño que grupo control por un margen de más de 12% en recolección total en 2 años. • De los tres esquemas, el primero (Honorarios basados en ingreso) el de mayor efecto y mejor retorno a la inversión. • El Departamento de Impuestos de Punjab no registró efectos negativos en satisfacción de contribuyentes o calidad de reporte como consecuencia de los incentivos. Influencia en Politicas Influencia – Siguientes Pasos • Simple es mejor. • Importancia de monitoreo regular de satisfacción de clientes • Beneficios de pago por desempeño se mantienen más allá del periodo de pago: los incentivos no se necesitan cada año. • El experimento no como el fin sino un inicio • El uso del incentivo se expandirá en Punjab, con encuestas y chequeos regulares del reporte. • Departamento de Impuestos quiere ahora comparar el incentivo que funciono mejor contra incentivos no monetarios. Influencia en Politicas 3ie evidence gap maps Experiencia 2 Escuelas Vocacionales vs. Escuelas Generales en China obDiseño: combinando análisis para resultados mas robustos • Autores: Rozelle, S, Park, A, Wang, S, Zhang, L, Rong, W, Song, Y, Loyalka, P, Shi, Yaojiang • Gobierno Chino interesado en como balancear inversión en educación vocacional y en educación general. • Solo un 40% de estudiantes que se gradúan del inicio de la escuela secundaria en zonas rurales pobres continúan sus estudios. • Experimento 1: Expansión de Modelo Vocacional vs. Reducción de Pagos escolares • Experimento 2: Vouchers de ayuda financiera Y Asesoría. • Ensayos controlados aleatorios ( a nivel individual y cluster) Influencia en Politicas Resultados • Escuela vocacional secundaria muestra resultados muy malos en términos de adquisición de habilidades generales (esp. Matemáticas). • No efecto en mejorar habilidades especificas, como computación, comparado a escuelas regulares. • Efectos son mayores entre estudiantes de bajos recursos. • Probabilidad mayor de dejar la escuela entre estudiantes de escuelas vocacionales. Influencia en Politicas Influencia • El concejo del Estado Chino anuncio reformas a su politica de ayuda financiera en base a los resultados del estudio. • Tendencia: Mayor concentracion en politicas en apoyo a escuelas regulares. • Educacion, Finanzas y el Banco de China acordaron establecer un nuevo sistema para distribuir ayuda financiera a estudiantes usando una tarjeta bancaria. • Siguiendo una de las recomendaciones, la distribucion de ayuda financiera se hace ahora antes.. Influencia en Politicas Pasos para administrar y comisionar una evaluacion de impacto Pasos para comisionar una evaluacion de impacto 1. Identifique el programa de interes y obtenga informacion detallada del mismo. 2. En base a los objetivos de aprendizaje, determinar si una EI es apropiada o no. 3. Mapear la teoria de cambio. 4. Determinar las preguntas de la evaluacion (incluyendo los resultados). 5. Examinar las potenciales fuentes de sesgo. 6. Considerar posibles estrategias de identificacion. 7. Escribir la descripcion de la asignacion y saca la convocatoria de propuestas. Cuando hacer una evaluacion de impacto? • Para establecer una ‘prueba de concepto’ para un programa cuya efectividad no ha sido probada todavia. • Testear la implementacion piloto de un nuevo programa—evidencia de efectividad • Testear diferentes disenos para determinar mayor impacto – evidencia para diseno de programas. • Conducir analisis de costo-beneficio o costoefectividad- evidencia para guiar la decision de asignacion de recursos. Una evaluacion de impacto BIEN HECHA puede… • Resolver el problema de atribucion: logra la intervencion alcanzar los resultados deseados? • Identificar como la intervencion funciona, es decir, que mecanismos o comportamientos son activados por la intervencion. • Indicar por que es que la intervencion funciona (o no) Determinando el impacto de un programa de entrenamiento en “habilidades blandas” sobre… Empleo pagado para mujeres Antes Despues Proyecto 0.346 0.618 Comparacion 0.328 0.550 (0.618 – 0.346) – (0.550 – 0.328) = 0.150 Diff en Diff indica un impacto positivo Determinando el impacto de un programa de entrenamiento en “habilidades blandas” sobre… Empleo pagado para hombres Proyecto Antes Despues 0.427 0.702 Comparacion Analisis Antes-Despues sugiere resultado positivo Determinando el impacto de un programa de entrenamiento en “habilidades blandas” sobre… Empleo pagado para hombres Antes Despues Proyecto 0.702 Comparacion 0.689 Comparacion ex-post sugiere efecto positivo, aunque muy pequeno. Determinando el impacto de un programa de entrenamiento en “habilidades blandas” sobre… Empleo pagado para hombres Antes Despues Proyecto 0.427 0.702 Comparacion 0.358 0.689 (0.702 – 0.427) – (0.689 – 0.358) = -0.056 Diff-in-Diff indica no efecto, o en todo caso negative. Pasos para comisionar una evaluacion de impacto 1. Identificar el programa de interes y obtener informacion detallada del mismo. 2. En base a los objetivos de aprendizaje, determinar si una EI es apropiada o no. 3. Mapear la teoria de cambio. 4. Determina las preguntas de la evaluacion (incluyendo los resultados). 5. Examina las potenciales fuentes de sesgo. 6. Considera posibles estrategias de identificacion. 7. Escribe la descripcion de la asignacion y saca la convocatoria de propuestas. Teorias de Cambio Hipotesis Contexto Mecanismo Resultado …no tan rapido! Construyendo una teoria de cambio: Programas de entrenamiento vocacional Participantes reciben entrenamiento vocacional: training en clase, OTJ, cash transfer Aumento en empleo pagado / incremento en empleo formal / Aumento en ingresos Theory of change “Creo que necesitas ser un poquito mas especifico aqui en la segunda etapa…” Teoria de cambio – Programa de entrenamiento vocacional Aumenta empleo Participa de entrenamiento en clase Recibe transferencia en efectivo Obtiene habilidades relevantes Participa de OTJ Aumenta empleo formal Aumenta salarios Aumenta bienestar Teoria de Cambio • Cada paso representa una relacion causa-efecto e involucra supuestos. • Entender la teoria y supuestos que conectan cada paso con el siguiente es lo que hace la diferencia entre un marco de resultados y una cadena causal. Teoria de cambio – Programa de entrenamiento vocacional Participa de entrenamiento en clase Participantes Recibe asisten al transferencia entrenamiento en efectivo Participa de OTJ Aumenta empleo Obtiene habilidades relevantes Aumenta empleo formal Aumenta salarios Aumenta bienestar Teoria de cambio – Programa de entrenamiento vocacional Aumenta empleo Participa de entrenamiento en clase Participantes Recibe asisten al transferencia entrenamiento en efectivo Entrenamien Obtiene to construye habilidades habilidades Participa de OTJ relevantes Aumenta empleo formal Aumenta salarios Aumenta bienestar Teoria de cambio – Programa de entrenamiento vocacional Aumenta empleo Participa de entrenamiento en clase Participantes Recibe asisten al transferencia entrenamiento en efectivo Entrenamien Obtiene to construye habilidades habilidades Participa de OTJ relevantes Las nuevas habilidades sonAumenta las “correctas” empleo formal Aumenta salarios Aumenta bienestar Son las habilidades las correctas? Teoria de cambio – Programa de entrenamiento vocacional Aumenta empleo Participa de entrenamiento en clase Participantes Recibe asisten al transferencia entrenamiento en efectivo Entrenamien Obtiene to construye habilidades habilidades Participa de OTJ relevantes Las nuevas habilidades sonAumenta las “correctas” empleo formal El Mercado de trabajo funciona Aumenta salarios Aumenta bienestar Teoria de cambio – Programa de entrenamiento vocacional Aumenta empleo Participa de entrenamiento en clase Participantes Recibe asisten al transferencia entrenamiento en efectivo Entrenamien Obtiene to construye habilidades habilidades Participa de OTJ relevantes Las nuevas habilidades sonAumenta las “correctas” empleo formal El Mercado de trabajo funciona Aumenta salarios Resultados Aumenta laborales incrementan bienestar bienestar Posibles preguntas de evaluacion Aumenta empleo Participa de entrenamiento en clase Recibe transferencia en efectivo Obtiene habilidades relevantes Participa de OTJ Aumenta empleo formal Aumenta salarios Aumenta bienestar Pasos para comisionar una evaluacion de impacto 1. Identifica el programa de interes y obtiene informacion detallada del mismo. 2. En base a los objetivos de aprendizaje, determiner si una EI es apropiada o no. 3. Mapea la teoria de cambio. 4. Determinar las preguntas de la evaluacion (incluyendo los resultados). 5. Examina las potenciales fuentes de sesgo. 6. Considera posibles estrategias de identificacion. 7. Escribe la descripcion de la asignacion y saca la convocatoria de propuestas. Cuales son las posibles preguntas de la evaluacion? • Las personas capacitadas, requieren de la transferencia para participar? • Es un tipo de entrenamiento mas efectivo que el otro? O son interdependientes? • Cuales habilidades son las mas relevantes? • Que resultados son los mas afectados por el entrenamiento vocacional? • Como se diferencia el impacto entre diferentes grupos? • Cual es el impacto de largo plazo? Posibles preguntas de evaluacion Aumenta empleo Participa de entrenamiento en clase Recibe transferencia en efectivo Obtiene habilidades relevantes Participa de OTJ Aumenta empleo formal Aumenta salarios Aumenta bienestar TdC: Otro ejemplo Design Design of insurance product Marketing Intermediate outcomes Final outcomes (insured) Consumption smoothing and assets protected Average income may be lower Savings utilized and for more productive (possibly riskier) investments Income increase Employment generation Increased utilization health services (and better quality health services) Better health Positive health spillover effects Adoption of insurance product Ambiguous impact on out of pocket expenses. Likely reduction in catastrophic expenses A s s u m p t i o n s Design is appropriate (something people need) (Relevance) Final outcomes (uninsured) Product is well-marketed to target market Concept of insurance is well-understood Premiums are affordable Take up is sufficient for product to be sustainable (Sustainability) Premiums are paid Lack of adverse selection in measurement of impact on utilization Insurance pays out in a timely manner Insurance accepted by service providers Absence of moral hazard in behavioural response of insured Lack of adverse selection in measurement of impact on health status Estrategias de identificacion: los “Metodos” Pasos para comisionar una evaluacion de impacto 1. Identifica el programa de interes y obtiene informacion detallada del mismo. 2. En base a los objetivos de aprendizaje, determiner si una EI es apropiada o no. 3. Mapea la teoria de cambio. 4. Determina las preguntas de la evaluacion (incluyendo los resultados). 5. Examina las potenciales fuentes de sesgo. 6. Considera posibles estrategias de identificacion. 7. Escribe la descripcion de la asignacion y saca la convocatoria de propuestas. Brevemente cubriremos… Construccion de Grupos de Comparacion • Randomizacion (RCT) • Regresion discontinua (RD) • Matching (y propensity score matching) Analizando la data • Diferencias en Diferencias • Metodos de Regresion De donde sale el contrafactual? Experimental: • RCT • Experimentos naturales No-experimental: • Quasi-experimental (pareo estadistico) • Otros metodos estadisticos (ej., variables instrumentales) El dilema del sesgo de seleccion • Participantes de un programa, tipicamente no son seleccionados aleatoriamente, sino a traves de: • Colocacion en el programa • Auto seleccion • Este es un problema si las variables correlacionadas con la seleccion estan tambien correlacionadas con los resultados de interes, dado que aquellos que participan tendrian mejores (o peores) resultados independientemente de la intervencion. En resumidas cuentas… • Existe ‘seleccion’ en quien se beneficia para la mayoria de las intervenciones. • Por esto, necesitamos un grupo de comparacion que tenga las mismas caracteristicas que aquellos seleccionados por la intervencion. Beyond RCT • Randomizacion ataca el probblema del sesgo de seleccion con la asignacion aleatoria del tratamiento. • La unidad de asignacion no necesariamente es al nivel de la unidad de analisis. Por ejemplo • Randomizacion a nivel poblado pero que mide resultados de aprendizaje individual. Randomizacion a nivel sub-diistrito pero medicion de resultados a nivel poblado. Table 4. Verification of Randomization Characteristics at Baseline Age Number of children under 9 Business Owner(Yes=1) Digit Span Recall Risk Tolerance (0=Risk Averse; 10= Risk Lover) Land Years of Education of Spouse Member of a Mixed Group (Yes=1) Own Education Decision Making Pct. Borrowing from … at the time of Baseline* Commercial Bank Microfinance Institution Friends and Relatives Informal lenders All members P-val of Means N. Male Female t-test Obs. Brochure Brochure (2)-(3) (1) (2) (3) (4) Male Female P-val of P-val of Means Means N. Male Female t-test N. Male Female t-test Obs. Brochure Brochure (6)-(7) Obs. Brochure Brochure (11)-(12) (5) (6) (7) (8) (9) (10) (11) (12) 3,451 3,451 3,451 3,451 3,451 3,451 3,451 3,451 3,451 3,451 37.95 1.73 0.60 3.36 3.71 4.38 3.69 0.04 4.26 2.74 37.81 1.83 0.59 3.28 3.52 4.58 3.71 0.08 3.95 2.57 0.74 0.77 0.57 0.85 0.25 0.82 0.69 0.10 0.14 0.35 1,880 1,880 1,880 1,880 1,880 1,880 1,880 1,880 1,880 1,880 37.98 1.92 0.63 3.82 3.81 5.83 2.72 0.02 5.27 3.41 38.40 1.99 0.59 3.88 3.81 6.05 2.73 0.06 5.36 3.26 0.89 0.53 0.75 0.83 0.53 0.77 0.86 0.06 0.78 0.77 1,571 1,571 1,571 1,571 1,571 1,571 1,571 1,571 1,571 1,571 37.91 1.45 0.57 2.72 3.57 2.36 5.05 0.07 2.84 1.82 37.20 1.40 0.60 2.65 3.22 3.05 4.75 0.10 2.47 1.85 0.85 0.17 0.79 0.82 0.49 0.55 0.55 0.89 0.07 0.61 2,931 2,931 2,931 2,931 2.38 71.34 7.71 0.7 1.7 67.62 6.58 0.2 0.64 0.30 0.48 0.07 1,616 1,616 1,616 1,616 3.69 69.44 7.85 0.83 2.71 63.74 5.16 0.26 0.60 0.98 0.05 0.19 1,315 1,315 1,315 1,315 0.51 74.06 7.5 0.51 0.69 71.74 8.09 0.13 0.74 0.46 0.14 0.23 Pct. Offered Business Training 3,451 52.47 51.82 0.83 1,880 51.29 52.03 0.93 1,571 54.1 51.6 0.48 Member is eligible for loan lottery (Yes=1) 3,451 63.72 69.00 0.54 1,880 64.63 59.69 0.82 1,571 62.45 62.21 0.66 P-val of F-test that all baseline characteristics 0.19 0.24 0.14 are jointly insignificant Notes: * denotes variable measured at follow-up, conducted in December 2008. Pct. Offered Business Training and Member eligibility come from administrative data from NRSP Mas alla de RCTs • Randomizacion puede ser difícil Como puedo selecionar aleatoriamente una intervencion a nivel nacional? Evaluaciones cuasi--experimentales • Tal y como disenos experimentales, evaluan hipotesis causales. • Por definicion, no presentan asignacion aleatoria. • Identifican un grupo de comparacion que es lo mas similar possible al grupo de tratamiento en base a caracteristicas d elinea de base (antes de la intervencion). • Existen diferentes tecnicas para crear un grupo de comparacion valido tales como regresion discontinua y propensity score matching (PSM). Cuando utilizarlos? • Cuando no es posible randomizar individuos o grupos en tratamientos y controles. • Para diseños ex-post (retrospectivos). • Evaluacion ex-ante cuando existen restricciones éticas, politicas o logísticas. • Altamente recomendable que la evaluacion se planee con mucho tiempo de anticipacion antes de la intervencion. Linea de base debe recolectarse antes de que los beneficiarios esten expuestos a las actividades del programa. Retos al usar metodos cuasi-experimentales • Riesgo de un match no adecuado. • Centrarnos en resultados estadisticamente significativos y no en los no estadisticamente significativos y tratar de explicarlos. • Se necesita un efecto suficientemente grande para que sea detectado. • Chequeos de calidad de la data deben ser hechos regularmente. Propensity Score Matching Propensity Score Matching (PSM) • Con PSM, el match del individuo no se hace para cada características observable, sino en una propension en base a puntaje – la probabilidad que el individuo participe en la intervencion dadas sus caracteristicas. • PSM agrupa individuos/hogares en el grupo de tratamiento con similares en el grupo de comparacion, y subsecuentemente calcula la diferencia promedio en los indicadores de interes. QED: Matching Source: Gertler, et.al, Impact Evaluation in Practice Propensity Score Matching Características observables • Aldeano A • Tratamiento Aldeano B Control? Aldeano C Control? Propensity Score Matching Características observables • Pueblo A • Tratamiento Pueblo B Control Propensity Score Matching Características observables • Comunidad A • Tratamiento Comunidad B Control Propensity score matching 20 30 Age 40 50 Education & Age of SW Beneficiaries & PSID Respondents 0 5 10 Education 15 Propensity Score Matching • Pero muchas características no son observables… • • • • Emprendimiento Preferencias de riesgo Rasgos de personalidad Capacidad intelectual Retos del PSM • PSM requiere data tanto de grupo de tratamiento como de grupo de control. Busca tener mayor muestra de lo que las formulas de poder indican. • Siempre es posible si la data esta disponible, y puede hacerse incluso una vez que la intervencion concluyo, incluso sin linea de base (pero esto no es ideal) • Si linea de base no esta disponible, ‘recall’ puede ser usado para reconstruir caracteristicas pre-tratamiento. Esto puede ser poco preciso. • Si hay caracteristicas ‘no observadas’ que afectan la particpacion y que cambian en el tiempo, los estimados seran sesgados y afectaran los resultados. Regresion Discontinua (RDD) • Cuando existe algun tipo de criterio que debe ser cumplido antes que la gente pueda participar de la intervencion (Threshold). • Usualmente se basa en una variable continua evaluada para todos los individuos potencialmente elegibles. • Por ejemplo, estudiantes bajo un cierto score, inscritos en un programa de recuperacion/refuerzo. Retos de RDD • Data sobre la variable de seleccion y el indicador de resultado para todos aquellos considerados para la intervencion, sean admitidos o no. • Muchos programas no mantienen informacion de individuos no aceptados en el programa, lo que hace RDD mas dificil. • El criterio de seleccion y el limite o threshold no siempre estan claros y la muestra puede resultar muy pequeña. • RDD da un ‘efecto tratamiento para area local’. Es decir, el impacto estimado es valido solo para aquellos alrededor de el limite Regresion Discontinua Deon Filmer y Norbert Schady “School Enrollment, Selection and Test Scores” Regresion Discontinua • Inscripción= El aprendizaje del estudiante? Regresion Discontinua • Inscripción= El aprendizaje, Control Regresion Discontinua • CCT Inscripción El aprendizaje del estudiante? • • Una muestra grande de hogares de Camboya Incentivos monetarios para familias con estudiantes con probabilidades altas de abandonar la escuela • • • Los incentivos son condicionados a continuar estudiando Inscripción = asistencia, inscripción y tiempo Aprendizaje = resultados de las pruebas de vocabulario y matemáticas Regresion Discontinua • CCT intervención Inscripción Regresion Discontinua • Intervención Inscripción Regresion Discontinua • CCT Intervención Inscripción Regresion Discontinua • CCT Intervención El aprendizaje del estudiante Regresion Discontinua • Puntos clave: • • • La importancia de un contrafactual valido La inscripción por si sola El aprendizaje del estudiante Sólo un efecto local, los estudiantes en el margen Differences –in-Differences • Conocido como metodo de doble diferencia • Compara cambios en resultado en el tiempo entretratamientoos y controles para estimar impacto. • Su aplicacion remueve la diferencia en los resultados entre tratamiento y control a nivel linea de base. • El metodo es major usado en conjunction con otros metodos como PSM y RDD • Si se usa sin matching, se debe testear ‘elsuupuesto de tendencia paralela’; es decir, que la tendencia en los resultados en tratamientoo y control fue similar antes de la intervencion.. Experimentos Naturales • Ciertos eventos resultan en una asignacion casi aleatoria de beneficiaries y no beneficiaries. • Temas burocraticos pueden resultar en tratamiento no aplicandose o siendo accidentalmente retenido. • Preferencias del administrador del programa pueden llevar a escoger un tipo particular de intervencion. • Variaciones al azar pueden ser analizadas como RCT o como si promocion aleatoria de la intervencion fue hecha. • Esta es la base de el diseno d evariables instrumentales • Pero estas cosas usualmente no las puedes planear. • Adicionalmente, la asignacion cuasi aleatoria puede aplicar solo a ciertas unidades. Experimentos Naturales Matias D. Cattaneo, Sebastian Galiani, Paul J. Gertler, Sebastian Martinez, y Rocio Titiunik “Housing, Health and Happiness” Experimentos Naturales Gómez Palacios/Lerdo (control) and Torreón (tratamiento) Experimentos Naturales • Gómez Palacios/Lerdo (control) y Torreón (tratamiento) Experimentos Naturales Experimentos Naturales Experimentos Naturales Experimentos Naturales Experimentos Naturales Metodos mixtos • Data cualitativa puede ser integrada en estudios experimentales y cuasiexperimentales. • Metodos mixtos pueden significativamente mejorar el analisis • Responder otras preguntas a lo largo d ela cadena causal • Explorar el como una vez que sabes el que y si es que la intervencion funciona o no. Consideraciones presupuestarias y de administracion Pasos para comisionar una evaluacion de impacto 1. Identificar el programa de interes y obtener informacion detallada del mismo. 2. En base a los objetivos de aprendizaje, determinar si una EI es apropiada o no. 3. Mapear la teoria de cambio. 4. Determinar las preguntas de la evaluacion (incluyendo los resultados). 5. Examinar las potenciales fuentes de sesgo. 6. Considerar posibles estrategias de identificacion. 7. Escribir la descripcion de la asignacion y sacar la convocatoria de propuestas. Cost and Time considerations Cost and Time considerations Algunas consideraciones • En nuestros inicios, la mayoria de las EI recibiendo financiamiento tenian algun tipo de diseno experimental. • Esto no por ser RCT, sino por la capacidad de establecer atribucion de la intervencion. • Se dice normalmente que ‘RCTs son caras’. Mas bien, estudios multi-anuales con varias rondas de recoleccion de datos y una combinacion de metodos son caras. • Mayor tiempo de implementacion tienen que ver con falta de alineacion entre la implementacion de la EI y la implementacion del programa. A tener en cuenta • Asignaciones “Provisionales” Equipo seleccionado recibe un grant provisional ($20K en el caso de 3ie) para hacer investigacion formativa que lleve a acabar el diseno de la EI y motive mayor coordinacion con la agencia de implementacion. • “Plan de Influencia en Politicas” : equipos de investigacion deben presentar un plan de interaccion con hacedores de politica y listar los agentes relevantes a la evaluacion. • Referencia explicita a como la evaluacion o la intervencion evaluada se basa o mejora/expande la base de evidencia. • Equipo de investigacion debe contar con miembros con experiencia sectorial relevante. A tener en cuenta (2) • Nunca demasiado temprano para planear una evaluacion de impacto. • Presupuesto puede ser distribuido en evaluacion formative y monitoreo considerando la evaluacion de impacto que se viene. • Discute los metodos mas apropiados a las preguntas de investigacion acordadas, NO lo contrario. • Habiendo dicho eso, no descartar RCT. Elementos de aleatoriedad pueden fortalecer el diseno y ultimadamente la confianza en los resultados. • Resultados de EI son/deben ser bienes publicos globales invertir en ellos con una vision programatica. Trabajando con 3ie Algunos de nuestros Productos • Financiamiento de Evaluaciones de Impacto y de Asesores Expertos • Repositorio de Evaluaciones de Impacto • Roster de Expertos • Mapas de Brecha de Evidencia • Desarrollo de Capacidades EL FACTOR COMUN: Facilitar el acceso a la evidencia para los agentes de politica Mapas de Brechas de Evidencia (Banco Mundial, MasterCard- MacArthur Foundations, USAID) • Get the free PowerPoint add-in, and then … • Record, write, and draw on your slides, just like a • Add quizzes, video, and interactive content • Share in the cloud and play on any device Capacitacion – Generacion de Capapcidades whiteboard (UNICEF, AfDB, ONGs, US State Department, Agencias de Gobierno) 3ie Servicios • Get the add-in: http://aka.ms/officemix Profesionales • (Copy the link and paste into your browser. Or, when in a slide show, click the link.) • Read on to learn more … Control de Calidad / Revision de Pares(DFID, PEPFAR, USAID) Servicios de Administracion de EI (DFID, AusAID, CIDA, USAID, MCC, BBC, Sector Privado) Creando las Condiciones para el Uso de Evidencia en Politicas Publicas • • • • 3ie monitorea si las evaluaciones que financia influyen o no politicas Participacion en diversos foros Asesores Senior que acompanan a equipos locales Generacion de Capacidades i. Talleres de Generacion de Demanda ii. Toolkit para influir en politicas iii. Matchmaking / Incubadoras iv. Cursos-Videos-Seminarios Thank you
© Copyright 2024