Lj ANALES - Universidad Metropolitana de Caracas

Ljr17
ANALES
de la Universidad Metropolitana
Identificación de un evaporador de doble
efecto empleando redes neuronales
Pedro A. Teppa G.
Escuela de Ingeniería Eléctrica
Universidad Metropolitana
José Ferrer
Departamento de Procesos y Sistemas
Universidad Simón Bolívar
En el presente trabajo es resuelto el problema de identificación de una planta
práctica dinámica, no lineal, y multivariable, de fundamental importancia en la
industria petroquímica, como es el evaporador de doble efecto, a través de redes
neuronales artificiales multicapas. El modelo de identificación propuesto es una
extensión al caso multivariable de modelos empleados en la situación escalar
(una entrada-una salida). El mismo consta de filtros lineales transversales y redes
neuronales multicapas como subsistemas, de manera que las relaciones entradasalida del identificador pueden expresarse a través de ecuaciones diferencia no
lineales de parámetros desconocidos. La parametrización propuesta permite la
aplicación de técnicas de gradiente, para efectuar la actualización de los pesos
de la red a lo largo del gradiente negativo del error entre la(s) salida(s) de la
planta y la(s) salida(s) del modelo identificador.
I. Introducción
El procedimiento de identificación de sistemas lineales ha sido tratado con éxito por
medio de la respuesta en frecuencia, respuesta al impulso, función de transferencia y
métodos de espacio de estado [10]. Sin embargo, los sistemas no lineales no han sido
beneficiados con una teoría general de identificación, debido a que las técnicas
tradicionales de modelaje: series de Volterra, Wiener, Uryson y Barret, no han contado
con un éxito comparable al caso lineal, en aplicaciones prácticas, debido a su
complejidad [5]. Segun el teorema de Stone-Weierstrass [3], se demuestra que las
redes neuronales multicapas pueden representar relaciones no lineales arbitrarias con
bastante precisión, por consiguiente, puede pensarse en ellas como componentes de
un modelo de identificación. Narendra y Parthasarathy [5,6,7] proponen varios modelos
para la identificación de sistemas dinámicos, no lineales, con una entrada y una salida
(SISO), compuestos de filtros transversales y redes neuronales multicapas como
subsistemas, de manera que la relación entrada-salida puede describirse a través de
ecuaciones de diferencias no lineales, con parámetros desconocidos. En el presente
trabajo se extienden los modelos de Narendra al caso multivariable [12]. La
parametrización del modelo de identificación es tal, que permite la aplicación de leyes
de actualización de pesos del tipo de gradiente, concretamente, el método "steepest
79
u
71
de la Universidad Metropolitana
descent". Además de la no existencia de una teoría general para la identificación de
sistemas dinámicos no lineales, se tiene un interés económico en el desarrollo de
modelos para procesos químicos complejos. Actualmente, el costo para desarrollar un
modelo es altamente significativo (75% de los gastos en un proyecto de control avanzado
[21), por tal motivo, teorías de identificación como la propuesta, que permiten expresar
las características no lineales y dinámicas de un proceso multivariable complejo, de
una manera eficiente, a bajo costo, además de no requerir de un conocimiento profundo
de la dinámica de la planta o proceso a controlar, son bastante atractivas. El artículo
está organizado de la siguiente manera: la sección II trata de la descripción de la
planta empleada en la identificación, la sección III de la arquitectura de la red neuronal,
mientras que la sección IV describe el proceso de identificación del evaporador de
doble efecto. Finalmente, la sección V ilustra algunos de los resultados obtenidos.
II. Descripción de la planta
La concentración de una solución diluida mediante la evaporación del solvente es un
proceso muy importante en la industría petroquímica, así como en la fabricación de
azúcar, producción de alúmina y manufactura de papel. Aplicaciones típicas de un
evaporador son la concentración de hidróxido de sodio, licores, jugos de frutas, etc. El
agua es el solvente empleado en la mayoría de estos casos [1,9,11]. El evaporador
empleado, ilustrado esquemáticamente en la figura 1, consiste esencialmente de un
tubo vertical corto en el primer efecto y un tubo largo vertical de circulación forzada en
el segundo efecto. El segundo efecto posee adicionalmente un separador y un
condensador, el cual se mantiene a la presión de operación deseada mediante un
expulsor de vapor y un controlador de presión. Los gases no condensables que entran
con la solución de alimentación y se acumulan en el segundo efecto son purgados
continuamente del sistema. La tasa de purgado es controlada por un transmisor local
de presión diferencial de vapor y finalmente, la concentración en cada efecto es
monitoreada mediante refractómetros. El modelo matemático no lineal del evaporador
de doble efecto que se empleará en el problema de identificación usando redes
neuronales es descrito por el siguiente conjunto de ecuaciones diferenciales y
algebraícas [1,11].
dW1 F-B1-01
(ec. 1)
dC1 _ F Cf + Cl (01- F)
(ec. 2)
dt
dt
dhl Q1 + F(hf - hl) - 01(Hol - hl) - Ll
W1
dt
(ec. 3)
dW2 _ B1 - B2 -02
(ec. 4)
dt
80
W1
W1
ANALES
TI
de la Universidad Metropolitana
dC2 _ Bl(C1 - C2) + 02 C2
dt
W1
(ec. 5)
Q1 =U1A1(Ts1 - T1)
(ec. 6)
Q2 = U2 A2(T1 - T2)
(ec. 7)
Tsi _ S(Hsi + 32) + Usl Al T1
S + Usl Al
(ec. 8)
01 = Q2
(ec. 9)
Hol-hs2
02 _Q2 + Bl(h1 - h2)+ X Bl(C2 - C1)- L2
Ho2 - h2 + XC2
(ec. 10)
x = ah2
ac2
(ec. 11)
H = 1066 - 0.4 T
(ec. 12)
h=-32+T
(ec. 13)
En la implementación, controladores del tipo PI son incluidos de manera de
impedir cambios instantáneos en las variables W1 y W2 y así tener un modelo
más realista y estable de la naturaleza del proceso. Por lo que ecuaciones del
tipo
1
m = Kc [ e +--,f
dt]
(ec. 14)
deben ser incorporadas al modelo, donde m y e son la variable manipulada y el error,
Kc y Ti son las constantes proporcional e integral del controlador. Las variables
manipuladas a utilizar serán B1 y B2.
Vecto
03
Tip -
Agua de
Enfilan e nto
....,
01
Vapor
S
fili
o
hip
Ali mentación
Condensado
111
El Producto
—
® 1..
O
Concentrado
132,02,72
Figura 1. Evaporador de doble efecto.
81
U 71 ANALES
de la Universidad Metropolitana
Los nombres de las variables, descripción y unidades aparecen en la tabla 1 y los
subíndices empleados en la tabla 2.
El modelo del evaporador puede describirse por la representación en espacio de estado
por variables físicas siguiente:
-eh= f( x, u, p)
dt
(ec. 15)
y=g(x,u,p)
(ec. 16)
donde:
x = [W1, Cl, hl, W2, C2]T ; vector de estado,
u = [S, B1, B2]T; vector de control,
p = [F, Cf, hf]T; vector de perturbación,
y = [W1, W2, C2]T; vector de salida,
f y g son funciones no lineales.
dW1 = (B 1 , F)
dt
dt = f (W C F C)
(ec. 18)
dhl = f3 (W h F h )
dt
(ec. 19)
dW2=f (B B )
4
2
dt
(ec. 20)
dC2 = f (W , C , F, C2, B i )
dt
$
(ec. 21)
,
f=
82
(ec. 17)
f2, f3, f4, f3] T
Lj71
ANALES
de la Universidad Metropolitana
Tabla 1
Variables y Descripción
VARIABLE DESCRIPCIÓN
UNIDADES
A
pie2
Kg/min
Area de transferencia de calor
Flujo de salida de los efectos
Concentración
Flujo de alimentación
Entalpía de vapor
Entalpía de líquido
Pérdida de calor
Tasa de evaporación
Tasa de transferencia de calor
Flujo de vapor
Temperatura
Coeficiente de transferencia de calor
Peso del líquido
O
S
U
Lbs/min
Btu/lb
Btu/lb
Btu/min
lbs/min
Btu/min
lbs/min
Btu/(CF)(pie2)(min))
Lbs
Tabla 2
Variables y Descripción
SUBÍNDICE
1
2
o1
s1
s2
si
DESCRIPCIÓN
Se refiere al primer efecto
Se refiere al segundo efecto
Se refiere a la alimentación
Se refiere al vapor producido en el primer efecto
Se refiere al vapor de entrada en el primer efecto
Se refiere al vapor de entrada en el segundo efecto
Se refiere al vapor de caldera
III. Arquitectura de la red neuronal
Una red neuronal artificial (RNA) está formada por múltiples unidades de procesamiento
elementales denominadas neuronas, donde cada una posee varias entradas y una
sola salida que se expande a fin de servir como entrada a otras neuronas. El diagrama
de bloques de una neurona típica se muestra en la figura 2. La salida de cada neurona
es una función no lineal de la suma pesada de las entradas. Las RNA poseen la ventaja
de mejorar su desempeño mediante el aprendizaje. Este último consiste en el ajuste
de los pesos de las neuronas para alcanzar una relación entrada-salida deseada. Las
características de cualquier RNA son definidas por la función de activación no lineal
escogida para las neuronas (ver h(.) en figura 2) así, como la arquitectura de
interconexión. En este trabajo se emplean redes neuronales del tipo multicapas.Estas
83
u71
de la Universidad Metropolitana
consisten en capas de neuronas cuyas salidas neuronales se conectan a traves de
enlaces pesados con las entradas de la capa siguiente. La función de activación no
lineal es usualmente escogida de la clase sigmoidal.
1
X.
i
n
Figura 2. Diagrama de bloques de una neurona típica.
IV. Identificación
El problema de identificación consiste en la selección de un modelo de identificación
con una parametrización adecuada, para luego ajustar sus parámetros con el objeto
de optimizar un funcional basado en el error entre la salida de la planta y la salida del
modelo identificador. La relación no lineal que caracteriza la planta se asume que
pertenece a una clase conocida Qen el dominio de interés. La nomenclatura anterior
se emplea para denotar las clases de funciones generadas por una red que contiene N
capas (con N+1 grupos de neuronas que incluyen una capa de salida, N-1 capas
escondidas y i,i,...,ineuronas). La estructura del modelo de identificación se escoge de
manera que sea idéntica a la de la planta como indica la figura 3, donde IS representa
un muestreador ideal con período de muestreo definido por T, su propósito es discriminar
las entradas y las salidas del evaporador debido a que el modelo de identificación está
basado en ecuaciones diferencia no lineales. Las líneas gruesas reflejan la naturaleza
multivariable del proceso y las dobles líneas enfatizan su característica no lineal.
u(t)
EV APOR A DOR
S
IS
Yp(k)
RED
NEURON AL
u( k)
ihn(k)
e(k)
ALGORITMO DE
APRENDIZAJE
Figura 3. Esquema general del proceso de identificación
84
Lj ANALES
71
de la Universidad Metropolitana
El objetivo es aproximar la función no lineal f, ver ecuación (15), mediante el ajuste de
los pesos de la red de manera que el error e(k) = yp(k) - ym(k) tienda a cero
asintóticamente, o sea
e (k)= O.
El proceso de identificación se establece en la figura 4. El evaporador de doble efecto
caracterizado por:
x(k+1) = f[W1p(k), C1p(k), h1p(k), W2p(k), C2p(k), S(k), B1(k),
(ec. 22)
B2(k), F(k), Cf(k) ,hf(k)11-,
se quiere aproximar por
x(k+1) = [W1p(k), Clp(k), hlp(k), W2p(k),
C2p(k), S(k), Bl(k), B2(k), F(k), Cf(k) ,hf(k)]T,
(ec. 23)
x(k+1) = [W1p(k+1), Clp(k+1), hlp(k+1), W2p(k+1),
C2p(k+1)]T,
(ec. 24)
x(k + 1) = [W1m(k+1), Clm(k+1), hlm(k+1), W2m(k+1),
C2m(k+1)]T,
(ec. 25)
donde:
Y
por su parte f y f : IR11 --->
.
Fce
htxt)
cf0)
W1 (t)
W2(t)
C1 (t)
C2(t)
hi (t)
S(t)
B1(t)
EVA PO RA DOR
B2(t)
ei(k)• i=1 ..5
IS
IS
IS
S(k)
B1 (k)
B2
00—
F(k) RED
hf(k)
e(k)
Algoritmo
de adaptación
,Cf(k)
f
W1 m(k) W2rn k) C1 m(k) C2m(k) hl m(k)
Figura 4. Identificacion del evaporador
85
-
u71
ANALES
de la Universidad Metropolitana
El funcional a optimizar se define como un promedio del error cuadrático mediante
N
1
J=—
z_, e2(k)
(ec. 26)
2N
k=0
pero
5
e2 (k) =
(ec. 27)
e3(k)
i=1
donde
el (k)= W l p(k) - Wl m(k)
(ec. 28)
e2(k)= Cl p(k) - C 1 m(k)
(ec. 29)
e3(k)= h 1 p(k) - h 1 m(k)
(ec. 30)
e4(k)= W2 p(k) - W2 m(k)
(ec. 31)
e5(k)= C2 p(k) - C2 m(k)
(ec. 32)
La derivada parcial de J con respecto a un peso (W) en la red neuronal es
N
al
1
aWii N
ei(k)
k =0
1=1
Sin embargo:
ae 1 (k)
aWlm(k)
aw ii
aw••
ae2(k) — - 9C1m(k)
aw••
ae3 (k)
awu
ae4(k)
aw••
De5(k)
aw••
awu
ahl m(k)
awu
aW2m(k),
aw••
aC2m(k),
aw
awiJ
(ec. 33)
(ec. 34)
(ec. 35)
(ec. 36)
(ec. 37)
(ec. 38)
Por lo tanto, el vector de pesos W de la red multicapas del modelo identificador puede
86
71 ANALES
de la Universidad Metropolitana
ajustarse observando el gradiente promedio durante un tiempo finito pero
suficientemente largo. De esta forma el procedimiento de adaptación siguiente es
propuesto
N
W(ko + N) = W(ko) +
I 1[e 1 (k) 9W 1 rn(k) + e2(k)
1 m(k)
aw..
N
aw..
k=0
+ e3(k) ghim(k) + e4(k) aW2m(k) e5(k) aC2m(k)
aw..u
aW..u
aw..
(ec. 39)
donde b.1 es el tamaño del paso en el procedimiento de gradiente, las cantidades
m(k),
aw..
acim(k), ah m(k), aW2m(k), aC2m(k),
aw..
JW..
aw..u
aw..
dependerán del tipo de función de activación de la red. En nuestro caso se utilizará la
tangente hiperbólica como función de activación debido a que el algoritmo de adaptación
es del tipo de gradiente y se requieren salidas bipolares.
La red neuronal empleada en el modelo será del tipo multicapas con dos capas
3
escondidas y pertenecerá a la clase 12,
. La elección de dicha clase no está
11,i2,13.5
orientada por ninguna regla analítica, lo que se persigue es proporcionarle a la red la
mayor cantidad de información posible. Las once entradas son: S(k), B1 (k), B2(k),
F(k), hf(k), Cf(k), Wl(k), Cl (k), hl (k), W2(k) y C2(k) y las cinco salidas, las variables a
identificar, son: Wl(k+1), Cl (k+1), hl (k+1), W2(k+1) y C2(k+1). El número de neuronas
en las dos capas escondidas i2,i3 se determina por ajustes experimentales.
V. Resultados
Con el objeto de poseer una medida cuantitativa de la disimilitud entre las salidas de la
planta y las del modelo identificador se proponen las siguientes normas.
a) Raíz cuadrática media del error (RMS)
N
/ [Y (n) -
(ec. 40)
YA01)12
RMS =
„, ,V
N
b) Diferencia porcentual de la raíz cuadrática media del error (PRD)
N
[Y(n) YA(n)]2
PRD =
x 100,
n=1
(ec. 41)
Y(n)2
87
u
71
ANALES
de la Universidad Metropolitana
donde
N: Intervalo de tiempo considerado,
Salida de la planta,
y (n): salida del modelo.
La red empleada en este caso pertenece a la clase
12
3
con pi = 0.25. Las entradas
Cl i ( t), Cl m ( t) 1 %1
a la red son: S, F, Cf, hf, C1, hl ,B1 ,b2,W1,W2 y C2 y las salidas Cl , C2, W1 ,W2 y hl ,
los pesos se actualizan continuamente para todo t e IR+. En las figuras 5-7 se presentan
los resultados junto a las normas de disimilitud. La figura 5 ofrece la identificación de la
concentración en el primer efecto, la figura 6 ilustra, a su vez, la identificación de la
entalpía en el primer efecto y finalmente, la figura 7 muestra la identificación de la
concentración en el segundo efecto. En todos los resultados se puede apreciar el
seguimiento bastante exacto por parte del modelo identificador de las salidas del
evaporador, note incluso que las normas de disimilitud son prácticamente cero.
6
RMS = 0.01
PRD = 0.23 %
5
4
.
o
50
100
150
¡
Tiempo [mira
200
Figura 5. Identificación de la concentración en el primer efecto.
154
E
RMS = 0.06
PRD = 0_04 %
modelo
— 153
152
'Tiempo [mira
o
50
100
150
200
Figura 6. Identificación de la entalpía en el primer efecto.
88
Lj ANALES
71
de la Universidad Metropolitana
RMS = 0.04
PRD = 0_03 %
7
.
50
100
.
150
,Tiempo [m'in]
200
Figura 7. Identificación de la concentración en el segundo efecto.
Bibliografía
[1] Andre, H. y Ritter, R. (1968). Dynamic Response of a Double Effect Evaporator.
The Canadian Journal of Chemical Engineering, vol. 46, pp. 259-264, ag.
[2] Bhat, N., Minderman, P., McAvoy, T. y Wang N. (1990). Modeling Chemical Process
Systems via Neural Computation. IEEE Control Systems Magazine , vol. 10, no. 3,
pp 24-30, apr.
[31 Cotter, N. (1990).
The Stone-Weierstrass Theorem and lis Application to Neural
Networks. IEEE Transactions on Neural Networks , vol. 1, no. 4, pp 290-295, dec.
[4] Chen, S. y Billings (1990). Non-linear Systems ldentification using Neural Networks.
International Journal of Control , vol. 51, no. 6, pp. 1191-1214.
[5] Narendra, K. y Parthasarathy, K. (1989). Neural Networks and Dynamical Systems.
Part II: ldentification. Technical Report 8902 for Systems Science, Department of
Electrical Engineering, Yale University.
[6] Narendra, K. y Parthasarathy, K. (1990). ldentification and Control of Dynamical
Systems Using Neural Networks. IEEE Transactions on Neural Networks , vol. 1,
no. 1, pp 4-27, march.
171 Narendra, K. y Parthasarathy, K. (1990). ldentification and Control of Dynamical
Systems Using Neural Networks - Part II. Proc. of the Sixth Yale Workshop on Adaptive and Learning Systems», ag.
[8] Narendra, K. y Parthasarathy, K. (1991). Gradient Methods for the Optimization of
Dynamical Systems Containing Neural Networks. IEEE Transactions on Neural
Networks , vol. 2, no. 2, pp 252-262, nnarch.
89
u
71 ANALES
de la Universidad Metropolitana
[9] Newell, R. y Fisher, D. (1972). Model Development, Reduction, and Experimental
Evaluation for an Evaporator. Ind. Eng. Chem. Process Des. Develop. , vol. 11, no
2, pp 213-221.
[10]
Oppenheim, A. y Schafer, R. (1989). Discrete-Time Signal Processing. PrenticeHall.
[11]
Ritter, R. and Andre, H. (1970). Evaporator Control System Design. The Canadian Journal of Chemical Engineering , vol. 48, pp. 696-701, dec.
[12] Teppa, P. y Ferrer, J. (1994). ldentification of a Double Effect Evaporator using
Neural Networks, Proc. of the IMACS International Symposium on Signal Processing, Robotics And Neural Networks , apr.
90