





































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Definiciones sobre funciones con mínimos absolutos y relativos, teoremas como el criterio de la segunda derivada para extremos en un punto crítico y el método de Lagrange para encontrar mínimos y máximos de funciones sujetas a restricciones. Además, se introduce el concepto de gradiente y se relaciona con la derivada direccional.
Tipo: Apuntes
1 / 45
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!






































Programación no lineal
Se puede dar una definición de programación no lineal (PNL) por contraposición con la programación lineal (PL). Recuérdese que esta última trata el problema de optimizar
una función lineal f : Rn^ → R sujeta a una serie de restricciones también lineales. Si el
problema se modifica, cambiando la función objetivo y/o, al menos, una de las restricciones, por no lineales, se cae en el campo de la PNL.
La teoría clásica de la optimización acude al empleo del cálculo diferencial para
determinar los puntos en los cuales la función f : Rn^ → R asume valores óptimos (máximos o mínimos).
Luego de unas definiciones esenciales se expondrán algunos resultados teóricos así como ejemplos de solución de problemas mediante la aplicación de esta teoría. Se inicia con la teoría propia de las variables unidimensionales, pues este campo permite la comprensión intuitiva de los conceptos y procedimientos empleados, y también, porque algunos de sus resultados tiene aplicación directa en la extensión de la teoría a las variables multidimensionales.
(o global) en un punto ∈ S si f ( ) ≤ f ( )
para todo x de S. El número f ()se llama máximo absoluto de f en S.
local) en un punto ∈ S si existe r > 0 tal que
f ( ) ≤ f ()
para todo x ∈ B ( , r ). El número f ()se llama máximo relativo de f en S.
De las definiciones 1 y 2 se concluye que todo máximo absoluto es, a su vez, máximo relativo.
Las definiciones de mínimo absoluto (o global) y mínimo relativo (o local) se hacen de manera equivalente.
Optimización clásica variable unidimensional
f (c) = 0 o f (c) no existe.
c , entonces c es un punto crítico.
f (c) existe. Defínase la función
f c parax c
parax c x c
f x f c g x '( )
entonces lim g ( x ) g ( c ) x c
→ y, en consecuencia , g es continua en c. Se debe demostrar
que g( c ) = 0, para ello se procede por contradicción: si g( c ) > 0, por la propiedad de la conservación del signo para funciones continuas, existe un intervalo que contiene a c en el cual g( x ) es positiva. Por lo tanto en (1), para x en el intervalo mencionado, x ≠ c, el numerador tiene el mismo signo que el denominador, lo cual implica que si x > c entonces f ( x ) > f ( c ), y si x < c entonces f ( x ) < f ( c ). Esto contradice la hipótesis de que f tiene un extremo en c. De manera similar se demuestra que suponer que g( c ) < 0 conduce a la misma contradicción, por lo tanto g( c ) = 0 y como g( c ) = f '( c ) ha
concluido la demostración.
El resultado anterior garantiza que si f tiene un óptimo en c, entonces c es un punto crítico. El recíproco no es cierto, como lo demuestra el conocido contraejemplo
f ( x )= x^3 , pues f ' ( x )= 3 x^2 y entonces f ' ( 0 )= 0 , con lo cual 0 es un punto crítico de
f y, sin embargo, f no tiene un óptimo en 0 como se ve en la figura 1.
Figura 1
Entonces, para determinar el conjunto de puntos óptimos de una función debe hacerse un trabajo adicional, luego de haber determinado el conjunto de puntos críticos, pues solo algunos de ellos serán puntos óptimos. El siguiente teorema aporta las herramientas para realizar este trabajo.
en todo punto de ( a, b ), excepto posiblemente en c ( a, b ) , entonces:
óptimos y determine de que clase son.
x
f x = x −^ = esta función nunca es cero y no está definida en
x = 0. En consecuencia x = 0 es el único punto crítico. Es evidente que para x < 0, f ( x ) < 0, y para x > 0, f ( x ) > 0. Aplicando el teorema 2 se concluye que f tiene un mínimo en x = 0. La figura 3 ilustra la situación.
Figura 3
óptimos relativos.
es entonces x = 0. Sin embargo, f ( x ) es positiva para todo x , x 0. Y por el caso 3 del teorema 2 se concluye que f no tiene óptimos relativos en 0, pues es estrictamente creciente en toda vecindad de 0. Véase la figura 1.
El siguiente teorema, en algunos casos, facilita los cálculos que permiten concluir que tipo de óptimo se presenta en un punto crítico c. Es aplicable únicamente cuando c es tal que f ( c ) = 0 y f ( c ) 0. Es útil para funciones como la del ejemplo 1; no puede ser usado en funciones como la del ejemplo 2. Para funciones como la del ejemplo 3, para la cual f ( c ) = 0, se expondrá un teorema especial más adelante.
existe, entonces:
en una vecindad alrededor de c y como f ( c ) = 0 entonces f pasa de positivo a negativo en c , aplicando el caso 1 del teorema 2 se concluye que f tiene un máximo relativo en c. El caso 2 se demuestra de manera análoga.
f ( x )= x^3 − 3 x^2 − 24 x + 2 , tales que f (-2) = 0 y f (4) = 0. Empleando el teorema 3, determine que clase de valores óptimos son.
f ' ( x )= 3 x^2 − 6 x − 24
y f ' '( x )= 6 x − 6
f (4) = 18 > 0, entonces f tiene un mínimo relativo en 4. f (-2) = -18 < 0, entonces f tiene un máximo relativo en -2.
El teorema 3 no dice que ocurre en el caso de que f ’( c ) = 0. Este es el caso de
f ( x )= x^3 y f ( x )= x^4. El siguiente teorema resuelve este problema.
Supóngase que para un cierto punto c ( a, b ) se tiene:
f ' ( c )= f ''( c )=...= f (^ n −^^1 )( c )= 0 , pero f (^ n^ )( c )≠ 0.
entonces para n par, f posee un mínimo local en c si f (^ n^ )( c )> 0 , y un máximo local en
c si f (^ n )^ ( c )< 0. Si n es impar, no existe óptimo en c.
para cada x ( a, b ) la derivada f (^ n )^ ( x ) tiene el mismo signo que f (^ n^ )( c ). Por la
fórmula de Taylor con resto (con el resto en la forma de Lagrange) se tiene
n
n x c n
f x f x f c ( ) !
() − = − , donde x 1 (^) ∈( a , b )
Si n es par, esta ecuación implica que f ( x ) ≥ f ( c ) cuando f (^ n^ )( c ) > 0, y f ( x ) ≤ f ( c )
cuando f (^ n^ )( c )< 0. Si n es impar y f (^ n )^ ( c )> 0, entonces f ( x ) > f ( c ) cuando x > c , y
f ( x ) < f ( c ) cuando x < c , en consecuencia no existe óptimo en c. Se llega a una
conclusión análoga cuando n es impar y f (^ n^ )( c )< 0.
Nótese que el teorema 3 es un caso particular del teorema 4. Este hecho puede ser empleado como nemotecnia para recordar el resultado.
emplee el teorema 4 para determinar que clase de punto crítico es.
f ' ( x )= 3 x^2 entonces f (0) = 0
En algunos casos la solución de la ecuación f ( x ) = 0 no puede calcularse por medios algebraicos y es necesario recurrir a algún método numérico para llevar a cabo esta labor. En el siguiente ejemplo se ilustra esta situación.
óptimos relativos.
localizarse los óptimos relativos.
Figura 5
La figura 5 permite concluir que, efectivamente, existen óptimos y que estos se encuentran, el primero en [-1, 0] y el segundo en [0, 1]. El procedimiento a seguir es similar al de los ejemplos anteriores.
g '( x )= 3 x^2 - cos ( x )
Esta función está definida en todo , entonces, los puntos críticos son las soluciones de
3 x ² - cos ( x ) = 0
para resolver esta ecuación es necesario acudir a los métodos numéricos. En este caso se empleará el método de Newton. Este método consiste en la aplicación de la ecuación recursiva
1 n
n n n f x
f x x (^) + = x −
en donde x (^) 0 es un número próximo a la raíz buscada. Para este caso se tiene
f ( x )= 3 x^2 - cos ( x ) f ' ( x )= 6 x + sen ( x )
tomando x 1 = -0.8 los cálculos son los siguientes:
Iteración xi^ f^ (^ xi ) f '^ ( xi ) 0 -0.8 1.22329329 -5. 1 -0.5782827 0.16583011 -4. 2 -0.53699325 0.00583458 -3. 3 -0.53543049 8.3762E-06 -3. 4 -0.53542824 1.7364E-11 -3. 5 -0.53542824 0 -3. Tabla 1
Se tiene entonces, que x = -0.53542824 es el punto crítico que se encuentra en [-1, 0]. En virtud de la simetría de f se concluye que el punto crítico en [0, 1] es x = 0.53542824. Para determinar que clase de óptimo es x = -0.53542824 evaluamos g en puntos cercanos a x uno a la izquierda y el otro a la derecha:
g (-0.54) = 1.710 −^2 > 0 y g (-0.52) = -5.610 −^2 < 0
haciendo analogía con el caso 2 del teorema 2 se concluye que en x = -0. g tiene un máximo local. Un procedimiento análogo permite concluir que en x = 0.53542824 g tiene un mínimo local. Estos resultados confirman lo observado en la figura 5. (En este ejemplo hemos incurrido en una imprecisión teórica al afirmar que x es igual al número encontrado con el método numérico, sin embargo, para efectos prácticos, este hecho es irrelevante pues la solución puede ser calculada con la precisión requerida por el problema que se este resolviendo en el momento. Como ejemplo se muestra el resultado que se obtiene al emplear Matemática con una precisión de 40 decimales: x = -0.5354282441646569523641119303647428750992).
Optimización clásica variable multidimensional
un vector unitario y a es un punto interior a S , la derivada
' ( ) lim 0
→ h h
f h f f h
se llama derivada direccional de f en a en la dirección de y. Si y = (^) k (el k-ésimo
derivada parcial respecto a xk y se representa mediante el símbolo
unidimensional, la anulación del gradiente es una condición necesaria, pero no suficiente, para la existencia de óptimos. La definición 6 introduce la terminología que se emplea para clasificar los diferentes casos. Mas adelante se establece un criterio, también análogo al del caso unidimensional, basado en las segundas derivadas para establecer que clase de óptimo (si lo es) es un punto en el cual se anula el gradiente.
contiene puntos x tales que f ( x ) < f ( a ) y otros para los cuales f ( x ) > f ( a ).
excepción, se halla entre 1,3 y 2,0 veces tan alejado del Sol en relación al siguiente planeta más cercano. La única excepción es Júpiter, el quinto planeta, que se halla 3, veces más alejado de lo que está Marte. Este hecho intrigó notablemente a los astrónomos ¿Podría existir un planeta en el hueco entre Marte y Júpiter? Heinrich Wilhelm Mathias Olbers, astrónomo alemán, reclutó un grupo que planeaba emprender la búsqueda sistemática del planeta faltante. Sin embargo, en la noche del 31 de diciembre de 1800 Giuseppe Piazzi, astrónomo italiano, quien desconocía la existencia y los propósitos del grupo de Olbers, localizó, en el mencionado hueco , un objeto celeste que variaba de posición de un día al siguiente. Lo denominó Ceres y fue el primer asteroide de que se tuvo noticia. Un mes después Ceres desapareció detrás del Sol. En los meses posteriores fue buscado infructuosamente en los cielos. Tres meses después apareció exactamente en el lugar en el cual Carl Friedrich Gauss, matemático alemán, empleando un método de su invención para analizar las observaciones hechas, había predicho que lo haría. El método inventado por Gauss se denomina de los mínimos cuadrados , y consiste en una técnica que se utiliza para encontrar la curva que se ajusta mejor a un conjunto de resultados experimentales, de manera que sea mínima la suma de los cuadrados de las diferencias entre las ordenadas de dichos puntos y las de la curva que tienen la misma abscisa. El ejemplo que sigue desarrolla la idea del método.
Dadas n parejas ordenadas distintas ( x 1 (^) , y 1 ),( x 2 , y 2 ),...,( xn , yn ) no siempre es posible
encontrar una recta f ( x )= mx + b que pase por todos los puntos ( x (^) i , yi ). Sin embargo,
pueden calcularse las constantes m y b de tal manera que la recta f ( x )= mx + b se ajuste de la mejor manera a la colección de puntos.
Antes de resolver el problema se considerará el mejor criterio según el cual se puede afirmar que la recta “ se ajusta de la mejor manera ”. En cada punto el error cometido será igual a la diferencia entre el valor generado por la fórmula f ( x )= mx + b y el valor
tabulado, esto es, ei = f ( xi )− yi = mxi + b − yi. Véase la figura 7.
Figura 7
Cualquier método debe, de alguna manera, minimizar el total de los errores cometidos. En un primer momento podría pensarse en minimizar la suma de todos los errores, esto es, minimizar
i i
n
i
1
La figura 8 muestra que no es una buena idea, pues lo mínimo que se espera de la recta de ajuste es que, cuando se tienen exactamente dos puntos, pase por ambos. Este no es el caso, pues cualquier recta que pase por el punto medio, con la única excepción de una vertical, cumple la condición de minimizar la suma de los errores, haciéndola igual a cero (nótese que los errores son iguales en magnitud pero de signo contrario).
Figura 8
Una solución alternativa sería intentar minimizar la suma de los valores absolutos de los errores, o sea, minimizar
i i
n
i
1
la dificultad de este enfoque radica en que es necesario calcular derivadas parciales pero el valor absoluto es una función que se define por partes y que, además, no es derivable en 0. Todas estas dificultades son superadas con el enfoque de los mínimos cuadrados, el cual consiste en minimizar la suma de los errores al cuadrado, esto es, minimizar
( ) ( ) = =
n
i
i i
n
i
f xi yi mx b y 1
2 1
2 ( )
El problema se concreta entonces a determinar las constantes m y b de tal manera que se
n
i
mxi b yi 1
2
∂ n i
mxi b yi xi m
1
∂ n i
mxi b yi b
1
igualando estas derivadas parciales a cero se obtiene
1 1 1 1
= = = =
n
i
i
n
i
i
n
i
i
n
i
m xi y m x y
Aunque se ha trabajado únicamente la regresión de tipo lineal en dos variables, el enfoque de los mínimos cuadrados puede extenderse directamente a polinomios de grado n (en el caso de que se tengan n + 1 puntos el polinomio de regresión será precisamente el polinomio de colocación), el grado del polinomio puede establecerse por algún resultado teórico, alguna expectativa o por la aplicación que se le pretenda dar. Mediante transformaciones, problemas no lineales pueden adaptarse para hacer regresión lineal a datos que, por ejemplo, se ajusten aproximadamente a una
exponencial del tipo y = abcx , ya que, evaluando en ambos lados logaritmos de base b
se obtiene log (^) b y = log ba + cx y haciendo las sustituciones Y = log b y y A = log (^) ba se
llega a una ecuación de tipo lineal. También es posible trabajar en más de dos dimensiones encontrando, ya no la recta, sino el hiperplano que mejor se ajusta a una “nube” de puntos en R n.
Condiciones necesarias y suficientes para la existencia de puntos óptimos
El método empleado en el ejemplo 9 se limitó a determinar un punto estacionario de f. Las derivadas parciales están definidas en todo el plano y, en consecuencia, este punto estacionario es único. Consideraciones teóricas propias del caso particular que se estaba tratando permitían concluir que la solución existía. Por lo tanto se asumió que en este punto se presenta el mínimo buscado. Este procedimiento es lícito. Sin embargo, este no es siempre el caso: la existencia de varios puntos estacionarios puede hacer necesario que se clasifiquen en máximos, mínimos o puntos de silla. También puede ocurrir que el modelo matemático no garantice la existencia de la solución y, en consecuencia, en los puntos estacionarios hallados pueden presentarse puntos de silla u óptimos de naturaleza contraria a los buscados. Estas consideraciones hacen que sea necesario contar con un criterio de clasificación de los puntos estacionarios. Las definiciones y el teorema, sin demostración, que se presentan en seguida suplen esta necesidad.
matriz hessiana y se designa por H( x ). Así, se tiene
2
2
2
2
1
2
2
2 2 2
2
2 1
2 1
2
1 2
2 2 1
2
n n n
n
n
x
f x x
f x x
f
x x
f x
f x x
f
x x
f x x
f x
f
k k kk
k
k
a a a
a a a
a a a
1 2
21 22 2
11 12 1
k = 1,2,... , n
2 3
2 2
2 f ( x 1 , x 2 , x 3 )= x 1 + 2 x 3 + x 2 x 3 − x 1 − x − x
1
x x
f
2
x x x
f
3
x x x
f
tiene como solución el vector a = (1/2, 2/3, 4/3), entonces
los menores principales de H tienen valores -2, 4, -6. Según la definición 9, H es definida negativa. Aplicando el teorema 6 se concluye que f tiene un máximo en a.
minimizar f ( x , y , z ) = x^2 + y^2 + z^2
z
f ∂
= 2 xy – 4 x - 2 y + 2 z + 4 = 0
Para resolver este sistema no lineal de 3 ecuaciones con 3 incógnitas se emplea el método de sustitución. Despejando x en la primer ecuación
x = 1 – yz + 2 z reemplazando en la segunda
2(1 – yz + 2 z ) z - 2 z + 2 y - 4 = 0
haciendo el producto, simplificando y factorizando
z ²(4 - 2 y ) + 2 y – 4 = 0 factorizando de nuevo
(4 – 2 y )( z ² - 1) = (4 – 2 y )( z - 1)( z + 1) = 0
de esta última igualdad se concluye que
y = 2 o z = 1 o z = -1.
Reemplazando x en la segunda ecuación
2(1 – yz + 2 z ) y – 4(1 – yz + 2 z ) - 2 y + 2 z + 4 = 0
simplificando y factorizando
z ( y ² - 4 y + 3) = z ( y – 3)( y - 1) = 0 en consecuencia z = 0 o y = 3 o y = 1.
Se escogen las parejas ( y , z ) de tal manera que se cumplan las 2 condiciones, por ejemplo, si se escoge y = 3 en la segunda condición entonces, por la primera condición, z = 1 o z = -1. Se tienen, por lo tanto, las parejas (3, 1) y (3, -1). Consideraciones análogas dan como resultado las parejas (1, 1), (1, -1) y (2, 0). Tomando, por ejemplo, la pareja (3, 1) se obtiene x = 1 – 31 + 21 = 0, con lo cual se tiene la tripla (0, 3, 1). El mismo procedimiento conduce a la obtención de los puntos (1, 2, 0), (2, 3, -1), (2, 1,
El ejemplo 13, de fácil solución, ilustra las bondades de un problema artificial, esto es, un problema que ha sido creado para que tenga una solución relativamente fácil. En este caso la solución del sistema de ecuaciones, originado al igualar el gradiente a cero, se pudo realizar acudiendo únicamente al álgebra elemental. Sin embargo, este tipo de
problemas constituyen la excepción y no la regla cuando se presentan como parte de la solución de un problema real de aplicación. En estos casos, de manera similar a lo visto en el trabajo con variable unidimensional, hay que recurrir a algún método numérico para resolver el sistema. El método que se tratará aquí es el de Newton para sistemas de ecuaciones no lineales.
Dado el sistema de n ecuaciones F ( x ) = 0 , donde
1
f n
f
f
El método de Newton para sistemas consiste en la aplicación de la ecuación recursiva
[ ( )] ( 1 ) 1 1 1 −
− k = k − − J k − k
en donde 0 es un punto próximo a la raíz buscada y
n
n n n
n
n
x
f x
f x
f
x
f x
f x
f
x
f x
f x
f
1 2
2 2
2 1
2
1 2
1 1
1
f ( x , y , z ) = 2 x ² + y ² + z ² + 6( x + y + z ) + 2 xyz
x
f ∂
= 4 x + 2 yz + 6 = 0
y
f ∂
= 2 y + 2 xz + 6 = 0
z
f ∂
= 2 z + 2 x y + 6 = 0
Para aplicar el método de Newton se construye la matriz J