Shapley value regression

Estimación de Importancia
Relativa
Índice
 ¿Qué es importancia relativa?
 Formas de medirla
 Aplicación práctica en R
 Ejemplo realizado
 Diferencias entre SPSS y R
 Cómo correr programa
2
Regresión simple
Consideramos que una variable y puede venir explicada por una única variable X1 y
un residuo
𝑦 = 𝐹(𝑋1 ) +𝑢
3000
2500
2000
1500
1000
500
0
0,000
0,200
0,400
0,600
0,800
1,000
1,200
3
Regresión simple
Si consideramos que la relación puede ser lineal
𝑦 = 𝛼 + 𝛽1 ∙ 𝑋1 +𝑢
Si disponemos de una muestra con T observaciones, tendríamos que estimar los
parámetros que mejor ajustan la ecuación
𝑦 = 𝛼 + 𝛽1 ∙ 𝑋1 +𝑢
4
Ecuación de regresión
Objetivos
𝑦 = 𝛼 + 𝛽1 ∙ 𝑋1 +𝛽2 ∙ 𝑋2 + ⋯ + 𝛽𝑝 ∙ 𝑋𝑝 + 𝑢
5
Ecuación de regresión
Objetivos
𝑦 = 𝛼 + 𝛽1 ∙ 𝑋1 +𝛽2 ∙ 𝑋2 + ⋯ + 𝛽𝑝 ∙ 𝑋𝑝 + 𝑢
 Conocer R2. En qué medida la variable dependiente se puede predecir a partir de las
independientes.
 Testar o explicar diferentes teorías. Qué variables son más importantes a la hora de explicar el
dato final. (Interpretar la importancia de cada regresor)
 Conocer la importancia relativa de cada uno de estos regresores.
𝐷𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎𝑠
𝑅2 =
=
𝐷𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑎 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑟
𝑛
𝑖=1
𝑛
𝑖=1
𝑦𝑖 − 𝑦
𝑦𝑖 − 𝑦
2
2
6
Importancia relativa
¿Qué entendemos por importancia?
7
Importancia relativa
¿Qué entendemos por importancia?
Importancia
teórica
 Cuánto cambia la variable independiente ante cambios en la dependiente. En función del
coeficiente.
Importancia en
niveles
 Cuánto representa una variable respecto a la media de la variable independiente. Resultado de
coeficiente no estandarizado y media del regresor.
Importancia en
dispersión
 Qué parte de la varianza de la variable a explicar se puede atribuir a cada uno de los regresores.
Importancia relativa: “La contribución proporcional que cada regresor hace al R2, considerando
tanto sus efectos directos (su correlación con la variable a explicar), como sus efectos cuando
se combina con otros regresores de la ecuación (indirectos)”
8
Cómo medirla
Ecuación de regresión
𝑦 = 𝛼 + 𝛽1 ∙ 𝑋1 +𝛽2 ∙ 𝑋2 + ⋯ + 𝛽𝑝 ∙ 𝑋𝑝 + 𝑢
𝑅2
𝑣𝑎𝑟 𝑦 = 𝑣𝑎𝑟 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠 𝑦 𝑣𝑎𝑟𝑠 + 𝑣𝑎𝑟(𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠 𝑦 𝑐𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎𝑠) + var(u)
¿Cómo medir?
𝑅2
 En ausencia de colinealidad, los parámetros estandarizados representarían la importancia
relativa.
2
2
2
𝛽1 + 𝛽2 + ⋯ + 𝛽𝑝 = 𝑅 2
 La suma de estos parámetros al cuadrado sumarían el valor del R2.
 Problemas cuando hay colinealidad. Ya no sumarían, y puede resultar que el coeficiente de
alguna variable independiente incluso salga negativo cuando hay en realidad relación
positiva entre ambas. No podemos hablar de importancia relativa.
9
Cómo medirla
Multicolinealidad en Econometría es una situación en la que se
presenta una fuerte correlación entre variables explicativas del
modelo.
Genera problemas de estimación y contraste de los parámetros.
Dificulta una correcta estimación de los parámetros. Incluso una
variable que debería tener un efecto positivo sobre la dependiente
puede pasar a tener un coeficiente negativo.
Ecuación de regresión
𝑦 = 𝛼 + 𝛽1 ∙ 𝑋1 +𝛽2 ∙ 𝑋2 + ⋯ + 𝛽𝑝 ∙ 𝑋𝑝 + 𝑢
𝑅2
𝑣𝑎𝑟 𝑦 = 𝑣𝑎𝑟 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠 𝑦 𝑣𝑎𝑟𝑠 + 𝑣𝑎𝑟(𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠 𝑦 𝑐𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎𝑠) + var(u)
¿Cómo medir?
𝑅2
 En ausencia de colinealidad, los parámetros estandarizados representarían la importancia
relativa.
2
2
2
𝛽1 + 𝛽2 + ⋯ + 𝛽𝑝 = 𝑅 2
 La suma de estos parámetros al cuadrado sumarían el valor del R2.
 Problemas cuando hay colinealidad. Ya no sumarían, y puede resultar que el coeficiente de
alguna variable independiente incluso salga negativo cuando hay en realidad relación
positiva entre ambas. No podemos hablar de importancia relativa.
10
Cómo medirla
Posibles ejemplos de la problemática
X2
X2
X1
Y
X1
Y
X3
X2
X1
Y
X3
X1
Externa
Y
X3
11
Cómo medirla
Un posible ejemplo de la problemática
𝑋1 → 𝑋2 →y
𝑋2 = 2 ∙ 𝑋1 + 𝑒
y= 50 + 5 ∙ 𝑋2 +v
 ¿Qué ocurre si realizamos una regresión del tipo?
𝑦 = 𝛼 + 𝛽1 ∙ 𝑋1 +𝛽2 ∙ 𝑋2 + 𝑢
 Diferencias entre lo que es mirar la importancia relativa como relevancia de las variables, con
lo que es capacidad de predicción.
12
Cómo medirla
Un posible ejemplo de la problemática
𝑋1 → 𝑋2 →y
𝑋2 = 2 ∙ 𝑋1 + 𝑒
y= 50 + 5 ∙ 𝑋2 +v
 ¿Qué ocurre si realizamos una regresión del tipo?
𝑦 = 𝛼 + 𝛽1 ∙ 𝑋1 +𝛽2 ∙ 𝑋2 + 𝑢
 Diferencias entre lo que es mirar la importancia relativa como relevancia de las variables, con
lo que es capacidad de predicción.
13
Cómo medirla
Un posible ejemplo de la problemática
𝑋1 → 𝑋2 →y
𝑋2 = 2 ∙ 𝑋1 + 𝑒
y= 50 + 5 ∙ 𝑋2 +v
14
Cómo medirla
Métricas first, last y betasq
𝑦 = 𝛼 + 𝛽1 ∙ 𝑋1 +𝛽2 ∙ 𝑋2 + ⋯ + 𝛽𝑝 ∙ 𝑋𝑝 + 𝑢
𝑅2
Objetivos
 Parámetros al cuadrado (betasq). Problemas cuando hay colinealidad. (Métrica betasq).
 Métrica first. Utilizar lo que podría explicar cada uno de los regresores por separado.
Regresión con solo una variable. Si se suman todos, sale muy superior al R2 de la regresión.
 Métrica last. Qué añade de adicional el regresor a los que ya tenemos. Inferior a R2
 Métrica betasq. Utilizar los parámetros estandarizados de la anterior regresión. Parámetros al
cuadrado.
𝛽𝑘,𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑖𝑧𝑎𝑑𝑜 =𝛽𝑘 ∙
𝑠𝑘𝑘
𝑠𝑦𝑦
15
Cómo medirla
Hacia el Shapley value regression
𝑅2
𝑦 = 𝛼 + 𝛽1 ∙ 𝑋1 +𝛽2 ∙ 𝑋2 + ⋯ + 𝛽𝑝 ∙ 𝑋𝑝 + 𝑢
 Métrica Anova. Ir añadiendo variables, y ver cómo se va incrementando el R2.. Importancia
relativa va a depender de en qué orden vayamos incluyendo variables.
Medidas
𝑦 = 𝛼 + 𝛽1 ∙ 𝑋1 +𝑢
𝑦 = 𝛼 + 𝛽1 ∙ 𝑋1 +𝛽2 ∙ 𝑋2 + 𝑢
⋯
 Le podemos llamar seq R2 a la cifra que se obtiene de restar, al R2 que se obtiene al añadir una
nueva variable, el R2 anterior sin la variable.
 LMG (shapley value). Es como el anterior, pero ahora vamos a hacer una suma ponderada de
los distintos ordenes en que se puede incluir una variable en la ecuación.
𝐿𝑀𝐺 𝑥𝑘 =
1
∙
𝑝!
𝑠𝑒𝑞𝑅2 𝑥𝑘
𝑆
𝑟 𝑝𝑒𝑟𝑚𝑢𝑡𝑎𝑐𝑖𝑜𝑛𝑒𝑠
16
Cómo medirla
Medidas finales
𝑦 = 𝛼 + 𝛽1 ∙ 𝑋1 +𝛽2 ∙ 𝑋2 + ⋯ + 𝛽𝑝 ∙ 𝑋𝑝 + 𝑢
𝑅2
 LMG (shapley value). Es como el anterior, pero ahora vamos a hacer una suma ponderada de
los distintos ordenes en que se puede incluir una variable en la ecuación.
Medidas
𝐿𝑀𝐺 𝑥𝑘 =
1
∙
𝑝!
𝑠𝑒𝑞𝑅2 𝑥𝑘
𝑆
𝑟 𝑝𝑒𝑟𝑚𝑢𝑡𝑎𝑐𝑖𝑜𝑛𝑒𝑠
 PMVD. Lo mismo pero dando ponderaciones diferentes en función de cuantas variables haya
ya incluidas. Si el coefiente en la global es 0, esa variable tendrá un peso de 0.
𝐿𝑀𝐺 𝑥𝑘 =
1
∙
𝑝!
𝑝 𝑟 ∙ 𝑠𝑒𝑞𝑅2 𝑥𝑘
𝑆
𝑟 𝑝𝑒𝑟𝑚𝑢𝑡𝑎𝑐𝑖𝑜𝑛𝑒𝑠
17
Cómo medirla
¿Cuál es más adecuada?
𝑦 = 𝛼 + 𝛽1 ∙ 𝑋1 +𝛽2 ∙ 𝑋2 + ⋯ + 𝛽𝑝 ∙ 𝑋𝑝 + 𝑢
𝑅2
Medidas
 LMG (shapley value). Ideal cuando se quiere mirar la importancia relativa desde un punto de
vista de causalidad, variables fundamentales. Cuando se tiene incertidumbre sobre la
verdadera estructura del modelo.
𝑦 = 𝛼 + 𝛽1 ∙ 𝑋1 +𝛽2 ∙ 𝑋2 + 𝑢
𝑋1 → 𝑋2 →y
 PMVD. Ideal para cuando se quiere analizar la causalidad desde el punto de vista de
predicción. Cuáles son las mejores variables para predecir y.
18
Cómo medirla
Un posible ejemplo de la problemática
𝑋1 → 𝑋2 →y
𝑋2 = 2 ∙ 𝑋1 + 𝑒
y= 50 + 5 ∙ 𝑋2 +v
 Ninguno es perfecto19
Ejemplo práctico
Ejemplo Repsol
Valora de 0-10 la imagen de Repsol
P5_1 - Es una empresa líder
P5_2 - Ofrece productos de calidad
P5_3 - Ofrece servicios de calidad
P5_4 - Garantiza la seguridad en todo lo que hace
P5_5 - Es una buena empresa para trabajar en ella
P5_6 - Crea valor económico hoy y en el futuro
P5_7 - Es una empresa innovadora que va por delante de las demás
P5_8 - Es una empresa tecnológicamente avanzada
P5_9 - Es una empresa ética
P5_10 - Es una empresa en la que confío
P5_11 - Ofrece información suficiente sobre su actividad
P5_12 - La información que ofrece sobre su actividad es creíble
P5_13 - Es una empresa comprometida con los problemas sociales
P5_14 - Se adapta a las necesidades actuales de sus clientes
P5_15 - Trabaja para el desarrollo de nuevas energías
P5_16 - Trabaja para reducir el impacto ambiental de sus productos
P5_17 - Está comprometida con el medio ambiente
20
Ejemplo práctico
Ejemplo …. Regresión lineal.
R2=0,59
Coeficientes
tipificados
Coeficientes no
estandarizados
B
(Constante)
Error típ.
1,458
,152
P5_1 - Es una empresa líder
,007
,026
P5_2 - Ofrece productos de calidad
,052
P5_3 - Ofrece servicios de calidad
,152
P5_4 - Garantiza la seguridad en todo lo que hace
Beta
t
Sig.
9,603
,000
,006
,255
,798
,037
,048
1,410
,159
,036
,143
4,228
,000
,011
,026
,012
,431
,666
P5_5 - Es una buena empresa para trabajar en ella
,027
,023
,029
1,170
,242
P5_6 - Crea valor económico hoy y en el futuro
,059
,025
,062
2,398
,017
P5_7 - Es una empresa innovadora que va por delante de las
demás
P5_8 - Es una empresa tecnológicamente avanzada
,056
,029
,053
1,906
,057
-,018
,031
-,016
-,586
,558
P5_9 - Es una empresa ética
,035
,026
,042
1,320
,187
P5_10 - Es una empresa en la que confío
,307
,026
,372
11,694
,000
P5_11 - Ofrece información suficiente sobre su actividad
,056
,025
,066
2,203
,028
P5_12 - La información que ofrece sobre su actividad es creíble
,017
,027
,021
,645
,519
P5_13 - Es una empresa comprometida con los problemas
sociales
P5_14 - Se adapta a las necesidades actuales de sus clientes
-,023
,024
-,029
-,939
,348
,007
,024
,008
,286
,775
,002
,021
,002
,070
,944
-,010
,030
-,012
-,326
,745
,061
,029
,080
2,104
,036
P5_15 - Trabaja para el desarrollo de nuevas energías
P5_16 - Trabaja para reducir el impacto ambiental de sus
productos
P5_17 - Está comprometida con el medio ambiente
21
Ejemplo práctico
Ejemplo …. Correlaciones
P5_7 - Es
P5_11 P5_12 - La P5_13 - Es
P5_4 P5_5 - Es P5_6 - Crea una empresa P5_8 - Es
Ofrece
información una empresa
P5_3 Garantiza la una buena
valor
innovadora una empresa
P5_10 - Es información que ofrece comprometid
P5_1 - Es P5_2 - Ofrece
Ofrece
seguridad en empresa
económico que va por tecnológicam P5_9 - Es una empresa suficiente
sobre su
a con los
una empresa productos de servicios de todo lo que para trabajar hoy y en el delante de
ente
una empresa en la que
sobre su actividad es problemas
líder
calidad
calidad
hace
en ella
futuro
las demás
avanzada
ética
confío
actividad
creíble
sociales
P5_1 - Es una empresa líder
P5_14 - Se
adapta a las
necesidades
actuales de
sus clientes
P5_16 Trabaja para
P5_15 reducir el P5_17 - Está
Trabaja para impacto comprometid
el desarrollo ambiental de a con el
de nuevas
sus
medio
energías
productos
ambiente
1
,623
,605
,533
,517
,589
,592
,597
,463
,499
,476
,500
,416
,460
,472
,437
,424
P5_2 - Ofrece productos de
calidad
P5_3 - Ofrece servicios de
calidad
P5_4 - Garantiza la seguridad
en todo lo que hace
P5_5 - Es una buena empresa
para trabajar en ella
P5_6 - Crea valor económico
hoy y en el futuro
P5_7 - Es una empresa
innovadora que va por delante
P5_8 - Es una empresa
tecnológicamente avanzada
P5_9 - Es una empresa ética
,623
1
,830
,712
,671
,697
,636
,646
,610
,668
,608
,644
,570
,620
,575
,573
,563
,605
,830
1
,731
,648
,667
,611
,618
,619
,677
,631
,654
,584
,641
,567
,557
,559
,533
,712
,731
1
,647
,615
,581
,570
,648
,684
,646
,659
,597
,610
,575
,581
,587
,517
,671
,648
,647
1
,665
,610
,610
,592
,618
,575
,617
,556
,556
,557
,553
,541
,589
,697
,667
,615
,665
1
,619
,615
,557
,582
,556
,584
,533
,557
,572
,543
,521
,592
,636
,611
,581
,610
,619
1
,766
,574
,595
,560
,584
,569
,566
,597
,573
,565
,597
,646
,618
,570
,610
,615
,766
1
,514
,556
,499
,522
,495
,515
,562
,523
,508
,463
,610
,619
,648
,592
,557
,574
,514
1
,801
,724
,753
,789
,733
,664
,734
,760
P5_10 - Es una empresa en la
que confío
P5_11 - Ofrece información
suficiente sobre su actividad
P5_12 - La información que
ofrece sobre su actividad es
P5_13 - Es una empresa
comprometida con los
P5_14 - Se adapta a las
necesidades actuales de sus
P5_15 - Trabaja para el
desarrollo de nuevas energías
P5_16 - Trabaja para reducir el
impacto ambiental de sus
P5_17 - Está comprometida
con el medio ambiente
,499
,668
,677
,684
,618
,582
,595
,556
,801
1
,728
,773
,731
,717
,616
,678
,685
,476
,608
,631
,646
,575
,556
,560
,499
,724
,728
1
,811
,723
,676
,627
,668
,688
,500
,644
,654
,659
,617
,584
,584
,522
,753
,773
,811
1
,753
,690
,638
,701
,711
,416
,570
,584
,597
,556
,533
,569
,495
,789
,731
,723
,753
1
,726
,661
,744
,772
,460
,620
,641
,610
,556
,557
,566
,515
,733
,717
,676
,690
,726
1
,595
,647
,649
,472
,575
,567
,575
,557
,572
,597
,562
,664
,616
,627
,638
,661
,595
1
,756
,740
,437
,573
,557
,581
,553
,543
,573
,523
,734
,678
,668
,701
,744
,647
,756
1
,898
,424
,563
,559
,587
,541
,521
,565
,508
,760
,685
,688
,711
,772
,649
,740
,898
1
22
Ejemplo práctico
Ejemplo …
23
Ejemplo práctico
Ejemplo …. Importancia relativa según metodologías
betasq
0%
lmg
5%
pmvd
10%
15%
20%
25%
30%
35%
40%
45%
P5_1 - Es una empresa líder
P5_2 - Ofrece productos de calidad
P5_3 - Ofrece servicios de calidad
P5_4 - Garantiza la seguridad en todo lo que hace
P5_5 - Es una buena empresa para trabajar en ella
P5_6 - Crea valor económico hoy y en el futuro
P5_7 - Es una empresa innovadora que va por delante de las demás
P5_8 - Es una empresa tecnológicamente avanzada
P5_9 - Es una empresa ética
P5_10 - Es una empresa en la que confío
P5_11 - Ofrece información suficiente sobre su actividad
P5_12 - La información que ofrece sobre su actividad es creíble
P5_13 - Es una empresa comprometida con los problemas sociales
P5_14 - Se adapta a las necesidades actuales de sus clientes
P5_15 - Trabaja para el desarrollo de nuevas energías
P5_16 - Trabaja para reducir el impacto ambiental de sus productos
P5_17 - Está comprometida con el medio ambiente
24
Ejemplo práctico
Ejemplo …
lmg
P5_10 - Es una empresa en la que confío
8,9%
P5_3 - Ofrece servicios de calidad
4,7%
P5_9 - Es una empresa ética
4,1%
P5_11 - Ofrece información suficiente sobre su actividad
3,9%
P5_2 - Ofrece productos de calidad
3,9%
P5_12 - La información que ofrece sobre su actividad es creíble
3,8%
P5_4 - Garantiza la seguridad en todo lo que hace
3,3%
P5_14 - Se adapta a las necesidades actuales de sus clientes
3,1%
P5_6 - Crea valor económico hoy y en el futuro
3,1%
P5_17 - Está comprometida con el medio ambiente
3,0%
P5_13 - Es una empresa comprometida con los problemas sociales
3,0%
P5_5 - Es una buena empresa para trabajar en ella
2,8%
P5_16 - Trabaja para reducir el impacto ambiental de sus productos
2,7%
P5_7 - Es una empresa innovadora que va por delante de las demás
2,6%
P5_15 - Trabaja para el desarrollo de nuevas energías
2,3%
P5_8 - Es una empresa tecnológicamente avanzada
2,1%
P5_1 - Es una empresa líder
1,9%
0%
1%
2%
3%
4%
5%
6%
7%
8%
9%
10%
25
Aplicación en SPSS
El cálculo de la importancia relativa se puede hacer en spss. Para
ello, hay que realizar una serie de instalaciones de programas y
complementos.
Si solo en un momento dado se busca saber la importancia relativa,
esto sería lo ideal. Tendríamos que instalarlo en vuestro ordenador.
Es mucho más sencillo de aplicar en SPSS que en R.
Estos pasos son los utilizados para la versión 18 de spss. Es posible que en la versión 17 sea diferente.
•
•
•
•
•
•
•
•
•
Instalar R. Tiene que ser la versión 2.8.0 o la 2.8.1. Es posible que esto dependa de la versión de spss. Yo lo instale con la 2.8.1.
Abrir R e instalar el paquete Relaimpo. Utilizar los siguientes comandos.
install.packages("relaimpo")
library("relaimpo")
Instalar el fichero para poder utilizar programas de R en SPSS.
Para la versión 18 estaría aquí. http://sourceforge.net/projects/ibmspssstat/files/Versions%20for%20Statistics%2018/
No encuentro si hay para la versión 17 de spss. Habría que localizarlo o probar con la versión 18.
Bajar el archivo STATS_RELIMP.spe de la página https://www.ibm.com/developerworks/community/files/app#/file/447acd1f-35ac-43cdb6d0-39a9f1381a9f.
A continuación abrir PASW statistics vs. 18.
En el menú utilidades, en grupos de extensión, clickear en instalar grupo de extensión.
Buscar el fichero anterior y dar a instalar.
Pedirá información de dónde está la versión de R que habíamos instalado. Depende del ordenador, pero debería estar en la siguiente
localización más o menos: C:\Users\pedro.arevalo\Documents\R\R-2.8.1.
Cerrar y volver a abrir spss y R hasta que aparezca la opción de shapley value en el menú de analizar/regresión/importancia relativa de
regresión.
26
Aplicación en SPSS
El problema es que en SPSS a priori no se pueden extraer los nuevos
parámetros 𝛽𝑘 que sean acordes con las nuevas estimaciones de
importancia relativa.
Para obtenerlos hay que resolver un sistema de ecuaciones no
lineales a partir de las importancias relativas estimadas.
Por ello, hemos preparado un programa en R
Problemas de hacerlo en R:
• Valores missing.
• Variables nominales
27
Recomendado
Vía recomendada
Hacer importancia relativa en SPSS. Solo si realmente hace falta
sacar los parámetros pasar a R (o bien se hace todo en R o solo el
cálculo de los parámetros).
Coger los valores de importancia relativa en términos de variación
explicada (no los que suman 100%, sino los que suman el R2).
Coger las correlaciones.
Llevar todos esos valores a R y calcular los parámetros (programa
2).
En ese caso, ojo con:
• Variables nominales
28
Aplicación en R
Funcionamiento del programa en R
FASE 1
Carga del fichero de datos en R.
Tiene que ser fichero CSV separado por comas para facilitar.
Lo más limpio posible de valores missing. Cuidado con 99s.
FASE 2
Una vez identificadas las variables dependientes e independientes, sustituir en el
programa.
crf <- calc.relimp(P3_REP~P5DIM_REP_1+P5CAL_REP_1+P5CAL_REP_2 +P5CAL_REP_3+P5CAL_REP_4+P5CAL_REP_5
+P5TEC_REP_1+P5TEC_REP_2 +P5ETI_REP_1+P5ETI_REP_2+P5ETI_REP_3+P5ETI_REP_4 +P5ETI_REP_5+P5ETI_REP_6+P5FUT_REP_1+
P5FUT_REP_2+P5FUT_REP_3,REP, type = c("lmg","pmvd", "last", "first", "betasq", "pratt"), PONDE )
FASE 3
Ajuste de la extensión del número de parámetros a estimar en ecuación no lineal, en
función de número de regresores en la ecuación. Ahora mismo preparado para 17
regresores.
Variables a tener cuidado: “correlaciones”, “F” y “x”.
29
Aplicación en R
library("BB", lib.loc="C:/Users/pedro.arevalo/Documents/R/win-library/3.0")
Ggplot2, relaimpo
crf <- calc.relimp(P3_REP~P5DIM_REP_1+P5CAL_REP_1+P5CAL_REP_2 +P5CAL_REP_3+P5CAL_REP_4+P5CAL_REP_5 +P5TEC_REP_1+ P5TEC_REP_2
+P5ETI_REP_1+P5ETI_REP_2+P5ETI_REP_3+P5ETI_REP_4 +P5ETI_REP_5+P5ETI_REP_6+P5FUT_REP_1+P5FUT_REP_2+P5FUT_REP_3,REP2,
type = c("lmg","pmvd", "last", "first", "betasq", "pratt"), PONDE )
plot(crf)
correlaciones<-cor(REP2[,4:20],use="complete.obs")
f <- function(x) {
x1 <- x[1] x2 <- x[2] x3 <- x[3] x4 <- x[4] x5 <- x[5] x6 <- x[6] x7 <- x[7] x8 <- x[8] x9 <- x[9] x10 <- x[10] x11 <- x[11] x12 <- x[12] x13 <- x[13] x14 <x[14] x15 <- x[15] x16 <- x[16] x17 <- x[17]
F <- rep(NA, 2)
F[1] <- x1^2 + x1*(correlaciones[1,2]*x2+correlaciones[1,3]*x3 +correlaciones[1,4]*x4+correlaciones[1,5]*x5 +correlaciones[1,6]*x6+
correlaciones[1,7]*x7+correlaciones[1,8]*x8+correlaciones[1,9]*x9+correlaciones[1,10]*x10+correlaciones[1,11]*x11+correlaciones[1,12]*x12 +
correlaciones[1,13]*x13+correlaciones[1,14]*x14+correlaciones[1,15]*x15+correlaciones[1,16]*x16+correlaciones[1,17]*x17
) - crf$pmvd[1]
…….
F[17] <- x17^2 + x17*(correlaciones[17,1]*x1+correlaciones[17,2]*x2+correlaciones[17,3]*x3
…..
+correlaciones[17,14]*x14+correlaciones[17,15]*x15+correlaciones[17,16]*x16) - crf$pmvd[17]
return(F) }
p0 <- c(crf$first[1],crf$first[2],crf$first[3],crf$first[4],crf$first[5],crf$first[6],crf$first[7],crf$first[8],crf$first[9],crf$first[10]
,crf$first[11],crf$first[12],crf$first[13],crf$first[14],crf$first[15],crf$first[16],crf$first[17])
parametrosnuevos<-dfsane(par=p0, fn=f,control=list(maxit=3000))