Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Análisis de funciones: Definiciones, teoremas y métodos para encontrar mínimos y máximos, Apuntes de Ciencias de la Educación

Definiciones sobre funciones con mínimos absolutos y relativos, teoremas como el criterio de la segunda derivada para extremos en un punto crítico y el método de Lagrange para encontrar mínimos y máximos de funciones sujetas a restricciones. Además, se introduce el concepto de gradiente y se relaciona con la derivada direccional.

Tipo: Apuntes

2018/2019

Subido el 07/10/2021

jorge-esquerre
jorge-esquerre 🇲🇽

7 documentos

1 / 45

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Introducción a la Programación Lineal
Claudia Liliana Daza Garzón
Trabajo de Grado para Optar por el Título de Matemático
Director: Pervys Rengifo Rengifo
Ingeniero Universidad Nacional de Colombia
Fundación Universitaria Konrad Lorenz
Facultad de Matemáticas
2 de junio de 2005
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d

Vista previa parcial del texto

¡Descarga Análisis de funciones: Definiciones, teoremas y métodos para encontrar mínimos y máximos y más Apuntes en PDF de Ciencias de la Educación solo en Docsity!

Introducción a la Programación Lineal

Claudia Liliana Daza Garzón

[email protected]

Trabajo de Grado para Optar por el Título de Matemático

Director: Pervys Rengifo Rengifo

Ingeniero Universidad Nacional de Colombia

Fundación Universitaria Konrad Lorenz

Facultad de Matemáticas

2 de junio de 2005

Tabla de contenido

  • Introducción__________________________________________________________
  • Programación no lineal_________________________________________________
  • Optimización clásica variable unidimensional_______________________________
    • Utilización de métodos numéricos en la determinación de puntos críticos___________
  • Optimización clásica variable multidimensional ____________________________
    • Condiciones necesarias y suficientes para la existencia de puntos óptimos __________
    • Utilización de métodos numéricos en la determinación de puntos estacionarios______
      • Método de Newton para sistemas de ecuaciones _____________________________________
    • Extremos restringidos. Multiplicadores de Lagrange ___________________________
      • Método de los multiplicadores de Lagrange ________________________________________
  • Optimización no clásica variable multidimensional _________________________
    • Método del gradiente ______________________________________________________
    • Programación separable ___________________________________________________
    • Algoritmos Genéticos: un cambio de paradigma _______________________________
      • Características de los algoritmos genéticos _________________________________________
  • Conclusiones ________________________________________________________
  • Bibliografía _________________________________________________________

Programación no lineal

Se puede dar una definición de programación no lineal (PNL) por contraposición con la programación lineal (PL). Recuérdese que esta última trata el problema de optimizar

una función lineal f : Rn^ → R sujeta a una serie de restricciones también lineales. Si el

problema se modifica, cambiando la función objetivo y/o, al menos, una de las restricciones, por no lineales, se cae en el campo de la PNL.

La teoría clásica de la optimización acude al empleo del cálculo diferencial para

determinar los puntos en los cuales la función f : Rn^ → R asume valores óptimos (máximos o mínimos).

Luego de unas definiciones esenciales se expondrán algunos resultados teóricos así como ejemplos de solución de problemas mediante la aplicación de esta teoría. Se inicia con la teoría propia de las variables unidimensionales, pues este campo permite la comprensión intuitiva de los conceptos y procedimientos empleados, y también, porque algunos de sus resultados tiene aplicación directa en la extensión de la teoría a las variables multidimensionales.

Definición 1: se dice que una función f : S → R , S ⊂ Rn tiene un máximo absoluto

(o global) en un punto ∈ S si f ( ) ≤ f ( )

para todo x de S. El número f ()se llama máximo absoluto de f en S.

Definición 2: se dice que una función f : S → R , S ⊂ Rn tiene un máximo relativo (o

local) en un punto ∈ S si existe r > 0 tal que

f ( ) ≤ f ()

para todo xB ( , r ). El número f ()se llama máximo relativo de f en S.

De las definiciones 1 y 2 se concluye que todo máximo absoluto es, a su vez, máximo relativo.

Las definiciones de mínimo absoluto (o global) y mínimo relativo (o local) se hacen de manera equivalente.

Optimización clásica variable unidimensional

Definición 3: Un punto crítico de una función f : R → R es un número c para el cual

f  (c) = 0 o f  (c) no existe.

Teorema 1: Si una función f : R → R tiene un máximo o mínimo relativo en un punto

c , entonces c es un punto crítico.

Demostración: si f  (c) no existe, entonces c es un punto crítico. Supóngase ahora que

f  (c) existe. Defínase la función

f c parax c

parax c x c

f x f c g x '( )

entonces lim g ( x ) g ( c ) x c

→ y, en consecuencia , g es continua en c. Se debe demostrar

que g( c ) = 0, para ello se procede por contradicción: si g( c ) > 0, por la propiedad de la conservación del signo para funciones continuas, existe un intervalo que contiene a c en el cual g( x ) es positiva. Por lo tanto en (1), para x en el intervalo mencionado, xc, el numerador tiene el mismo signo que el denominador, lo cual implica que si x > c entonces f ( x ) > f ( c ), y si x < c entonces f ( x ) < f ( c ). Esto contradice la hipótesis de que f tiene un extremo en c. De manera similar se demuestra que suponer que g( c ) < 0 conduce a la misma contradicción, por lo tanto g( c ) = 0 y como g( c ) = f '( c ) ha

concluido la demostración.

El resultado anterior garantiza que si f tiene un óptimo en c, entonces c es un punto crítico. El recíproco no es cierto, como lo demuestra el conocido contraejemplo

f ( x )= x^3 , pues f ' ( x )= 3 x^2 y entonces f ' ( 0 )= 0 , con lo cual 0 es un punto crítico de

f y, sin embargo, f no tiene un óptimo en 0 como se ve en la figura 1.

Figura 1

Entonces, para determinar el conjunto de puntos óptimos de una función debe hacerse un trabajo adicional, luego de haber determinado el conjunto de puntos críticos, pues solo algunos de ellos serán puntos óptimos. El siguiente teorema aporta las herramientas para realizar este trabajo.

Teorema 2 (criterio de la primera derivada para extremos en un punto

crítico): Supóngase que f : R → R es continua en un intervalo [ a, b ] y que existe f '

en todo punto de ( a, b ), excepto posiblemente en c  ( a, b ) , entonces:

  1. Si f  es positiva para toda x , con a < x < c, y negativa para toda x , con c < x < b , entonces f tiene un máximo relativo en c.

Ejemplo 2: encuentre los puntos en los cuales f ( x )= 3 x^2 /^3 + 5 tiene valores

óptimos y determine de que clase son.

Solución:^1 /^33

x

f x = x −^ = esta función nunca es cero y no está definida en

x = 0. En consecuencia x = 0 es el único punto crítico. Es evidente que para x < 0, f ( x ) < 0, y para x > 0, f ( x ) > 0. Aplicando el teorema 2 se concluye que f tiene un mínimo en x = 0. La figura 3 ilustra la situación.

Figura 3

Ejemplo 3: encuentre los puntos críticos de f ( x )= x^3 y establezca si en ellos f tiene

óptimos relativos.

Solución: f ' ( x )= 3 x^2 entonces f  está definida en todo . El único punto crítico de f

es entonces x = 0. Sin embargo, f  ( x ) es positiva para todo x  , x  0. Y por el caso 3 del teorema 2 se concluye que f no tiene óptimos relativos en 0, pues es estrictamente creciente en toda vecindad de 0. Véase la figura 1.

El siguiente teorema, en algunos casos, facilita los cálculos que permiten concluir que tipo de óptimo se presenta en un punto crítico c. Es aplicable únicamente cuando c es tal que f  ( c ) = 0 y f ( c )  0. Es útil para funciones como la del ejemplo 1; no puede ser usado en funciones como la del ejemplo 2. Para funciones como la del ejemplo 3, para la cual f ( c ) = 0, se expondrá un teorema especial más adelante.

Teorema 3 (criterio de la segunda derivada para extremos en un punto

crítico): Supóngase que c  ( a, b ) y que f  ( c ) = 0. Supóngase, además, que f ( c )

existe, entonces:

  1. Si f ( c ) < 0, f tiene un máximo relativo en c.
  2. Si f ( c ) > 0, f tiene un mínimo relativo en c.

Demostración: En el caso 1, al ser f  negativa en c , f  es estrictamente decreciente

en una vecindad alrededor de c y como f ( c ) = 0 entonces f  pasa de positivo a negativo en c , aplicando el caso 1 del teorema 2 se concluye que f tiene un máximo relativo en c. El caso 2 se demuestra de manera análoga.

Ejemplo 4: En el ejemplo 1 se estableció que x = 4 y x = -2 son los puntos críticos de

f ( x )= x^3 − 3 x^2 − 24 x + 2 , tales que f (-2) = 0 y f (4) = 0. Empleando el teorema 3, determine que clase de valores óptimos son.

Solución:

f ' ( x )= 3 x^2 − 6 x − 24

y f ' '( x )= 6 x − 6

f (4) = 18 > 0, entonces f tiene un mínimo relativo en 4. f (-2) = -18 < 0, entonces f tiene un máximo relativo en -2.

El teorema 3 no dice que ocurre en el caso de que f ’( c ) = 0. Este es el caso de

f ( x )= x^3 y f ( x )= x^4. El siguiente teorema resuelve este problema.

Teorema 4: Sea f que posee n-ésima derivada continua en el intervalo ( a, b ).

Supóngase que para un cierto punto c  ( a, b ) se tiene:

f ' ( c )= f ''( c )=...= f (^ n −^^1 )( c )= 0 , pero f (^ n^ )( c )≠ 0.

entonces para n par, f posee un mínimo local en c si f (^ n^ )( c )> 0 , y un máximo local en

c si f (^ n )^ ( c )< 0. Si n es impar, no existe óptimo en c.

Demostración: Como f (^ n )^ ( c )≠ 0 existe un intervalo ( a, b ) que contiene a c , tal que

para cada x  ( a, b ) la derivada f (^ n )^ ( x ) tiene el mismo signo que f (^ n^ )( c ). Por la

fórmula de Taylor con resto (con el resto en la forma de Lagrange) se tiene

n

n x c n

f x f x f c ( ) !

( ) ( )^1

() − = − , donde x 1 (^) ∈( a , b )

Si n es par, esta ecuación implica que f ( x ) ≥ f ( c ) cuando f (^ n^ )( c ) > 0, y f ( x ) ≤ f ( c )

cuando f (^ n^ )( c )< 0. Si n es impar y f (^ n )^ ( c )> 0, entonces f ( x ) > f ( c ) cuando x > c , y

f ( x ) < f ( c ) cuando x < c , en consecuencia no existe óptimo en c. Se llega a una

conclusión análoga cuando n es impar y f (^ n^ )( c )< 0.

Nótese que el teorema 3 es un caso particular del teorema 4. Este hecho puede ser empleado como nemotecnia para recordar el resultado.

Ejemplo 5: En el ejemplo 3 se estableció que 0 es el único punto crítico de f ( x )= x^3 ,

emplee el teorema 4 para determinar que clase de punto crítico es.

Solución:

f ' ( x )= 3 x^2 entonces f (0) = 0

Utilización de métodos numéricos en la determinación de puntos

críticos

En algunos casos la solución de la ecuación f  ( x ) = 0 no puede calcularse por medios algebraicos y es necesario recurrir a algún método numérico para llevar a cabo esta labor. En el siguiente ejemplo se ilustra esta situación.

Ejemplo 8: Determine los puntos en los cuales la función g ( x )= x^3 − sen ( x )presenta

óptimos relativos.

Solución: En primer lugar se grafíca la función para tener una idea de donde pueden

localizarse los óptimos relativos.

Figura 5

La figura 5 permite concluir que, efectivamente, existen óptimos y que estos se encuentran, el primero en [-1, 0] y el segundo en [0, 1]. El procedimiento a seguir es similar al de los ejemplos anteriores.

g '( x )= 3 x^2 - cos ( x )

Esta función está definida en todo , entonces, los puntos críticos son las soluciones de

3 x ² - cos ( x ) = 0

para resolver esta ecuación es necesario acudir a los métodos numéricos. En este caso se empleará el método de Newton. Este método consiste en la aplicación de la ecuación recursiva

1 n

n n n f x

f x x (^) + = x

en donde x (^) 0 es un número próximo a la raíz buscada. Para este caso se tiene

f ( x )= 3 x^2 - cos ( x ) f ' ( x )= 6 x + sen ( x )

tomando x 1 = -0.8 los cálculos son los siguientes:

Iteración xi^ f^ (^ xi ) f '^ ( xi ) 0 -0.8 1.22329329 -5. 1 -0.5782827 0.16583011 -4. 2 -0.53699325 0.00583458 -3. 3 -0.53543049 8.3762E-06 -3. 4 -0.53542824 1.7364E-11 -3. 5 -0.53542824 0 -3. Tabla 1

Se tiene entonces, que x = -0.53542824 es el punto crítico que se encuentra en [-1, 0]. En virtud de la simetría de f se concluye que el punto crítico en [0, 1] es x = 0.53542824. Para determinar que clase de óptimo es x = -0.53542824 evaluamos g  en puntos cercanos a x uno a la izquierda y el otro a la derecha:

g (-0.54) = 1.710 −^2 > 0 y g (-0.52) = -5.610 −^2 < 0

haciendo analogía con el caso 2 del teorema 2 se concluye que en x = -0. g tiene un máximo local. Un procedimiento análogo permite concluir que en x = 0.53542824 g tiene un mínimo local. Estos resultados confirman lo observado en la figura 5. (En este ejemplo hemos incurrido en una imprecisión teórica al afirmar que x es igual al número encontrado con el método numérico, sin embargo, para efectos prácticos, este hecho es irrelevante pues la solución puede ser calculada con la precisión requerida por el problema que se este resolviendo en el momento. Como ejemplo se muestra el resultado que se obtiene al emplear Matemática con una precisión de 40 decimales: x = -0.5354282441646569523641119303647428750992).

Optimización clásica variable multidimensional

Definición 4 (Derivadas direccional y parcial): Sea f : S → R , S ⊂ Rn. Si y es

un vector unitario y a es un punto interior a S , la derivada

' ( ) lim 0

h h

f h f f h

se llama derivada direccional de f en a en la dirección de y. Si y =  (^) k (el k-ésimo

vector de la base canónica de R n ) la derivada direccional f '( a ;  k ) se denomina

derivada parcial respecto a xk y se representa mediante el símbolo

unidimensional, la anulación del gradiente es una condición necesaria, pero no suficiente, para la existencia de óptimos. La definición 6 introduce la terminología que se emplea para clasificar los diferentes casos. Mas adelante se establece un criterio, también análogo al del caso unidimensional, basado en las segundas derivadas para establecer que clase de óptimo (si lo es) es un punto en el cual se anula el gradiente.

Definición 6: Un punto a para el cual ∇ f ( )=se conoce como punto estacionario

de f. Un punto estacionario se llama de silla (o de ensilladura) si toda n-bola B( a )

contiene puntos x tales que f ( x ) < f ( a ) y otros para los cuales f ( x ) > f ( a ).

Ejemplo 9 (método de los mínimos cuadrados): Cada planeta, con una única

excepción, se halla entre 1,3 y 2,0 veces tan alejado del Sol en relación al siguiente planeta más cercano. La única excepción es Júpiter, el quinto planeta, que se halla 3, veces más alejado de lo que está Marte. Este hecho intrigó notablemente a los astrónomos ¿Podría existir un planeta en el hueco entre Marte y Júpiter? Heinrich Wilhelm Mathias Olbers, astrónomo alemán, reclutó un grupo que planeaba emprender la búsqueda sistemática del planeta faltante. Sin embargo, en la noche del 31 de diciembre de 1800 Giuseppe Piazzi, astrónomo italiano, quien desconocía la existencia y los propósitos del grupo de Olbers, localizó, en el mencionado hueco , un objeto celeste que variaba de posición de un día al siguiente. Lo denominó Ceres y fue el primer asteroide de que se tuvo noticia. Un mes después Ceres desapareció detrás del Sol. En los meses posteriores fue buscado infructuosamente en los cielos. Tres meses después apareció exactamente en el lugar en el cual Carl Friedrich Gauss, matemático alemán, empleando un método de su invención para analizar las observaciones hechas, había predicho que lo haría. El método inventado por Gauss se denomina de los mínimos cuadrados , y consiste en una técnica que se utiliza para encontrar la curva que se ajusta mejor a un conjunto de resultados experimentales, de manera que sea mínima la suma de los cuadrados de las diferencias entre las ordenadas de dichos puntos y las de la curva que tienen la misma abscisa. El ejemplo que sigue desarrolla la idea del método.

Dadas n parejas ordenadas distintas ( x 1 (^) , y 1 ),( x 2 , y 2 ),...,( xn , yn ) no siempre es posible

encontrar una recta f ( x )= mx + b que pase por todos los puntos ( x (^) i , yi ). Sin embargo,

pueden calcularse las constantes m y b de tal manera que la recta f ( x )= mx + b se ajuste de la mejor manera a la colección de puntos.

Antes de resolver el problema se considerará el mejor criterio según el cual se puede afirmar que la recta “ se ajusta de la mejor manera ”. En cada punto el error cometido será igual a la diferencia entre el valor generado por la fórmula f ( x )= mx + b y el valor

tabulado, esto es, ei = f ( xi )− yi = mxi + byi. Véase la figura 7.

Figura 7

Cualquier método debe, de alguna manera, minimizar el total de los errores cometidos. En un primer momento podría pensarse en minimizar la suma de todos los errores, esto es, minimizar

i i

n

i

f xy

1

La figura 8 muestra que no es una buena idea, pues lo mínimo que se espera de la recta de ajuste es que, cuando se tienen exactamente dos puntos, pase por ambos. Este no es el caso, pues cualquier recta que pase por el punto medio, con la única excepción de una vertical, cumple la condición de minimizar la suma de los errores, haciéndola igual a cero (nótese que los errores son iguales en magnitud pero de signo contrario).

Figura 8

Una solución alternativa sería intentar minimizar la suma de los valores absolutos de los errores, o sea, minimizar

i i

n

i

f xy

1

la dificultad de este enfoque radica en que es necesario calcular derivadas parciales pero el valor absoluto es una función que se define por partes y que, además, no es derivable en 0. Todas estas dificultades son superadas con el enfoque de los mínimos cuadrados, el cual consiste en minimizar la suma de los errores al cuadrado, esto es, minimizar

( ) ( ) = =

n

i

i i

n

i

f xi yi mx b y 1

2 1

2 ( )

El problema se concreta entonces a determinar las constantes m y b de tal manera que se

minimice S ( m, b ) = ( )

n

i

mxi b yi 1

2

Solución:

( )

n i

mxi b yi xi m

S

1

( )

n i

mxi b yi b

S

1

igualando estas derivadas parciales a cero se obtiene

1 1 1 1

= = = =

n

i

i

n

i

i

n

i

i

n

i

m xi y m x y

Aunque se ha trabajado únicamente la regresión de tipo lineal en dos variables, el enfoque de los mínimos cuadrados puede extenderse directamente a polinomios de grado n (en el caso de que se tengan n + 1 puntos el polinomio de regresión será precisamente el polinomio de colocación), el grado del polinomio puede establecerse por algún resultado teórico, alguna expectativa o por la aplicación que se le pretenda dar. Mediante transformaciones, problemas no lineales pueden adaptarse para hacer regresión lineal a datos que, por ejemplo, se ajusten aproximadamente a una

exponencial del tipo y = abcx , ya que, evaluando en ambos lados logaritmos de base b

se obtiene log (^) b y = log ba + cx y haciendo las sustituciones Y = log b y y A = log (^) ba se

llega a una ecuación de tipo lineal. También es posible trabajar en más de dos dimensiones encontrando, ya no la recta, sino el hiperplano que mejor se ajusta a una “nube” de puntos en R n.

Condiciones necesarias y suficientes para la existencia de puntos óptimos

El método empleado en el ejemplo 9 se limitó a determinar un punto estacionario de f. Las derivadas parciales están definidas en todo el plano y, en consecuencia, este punto estacionario es único. Consideraciones teóricas propias del caso particular que se estaba tratando permitían concluir que la solución existía. Por lo tanto se asumió que en este punto se presenta el mínimo buscado. Este procedimiento es lícito. Sin embargo, este no es siempre el caso: la existencia de varios puntos estacionarios puede hacer necesario que se clasifiquen en máximos, mínimos o puntos de silla. También puede ocurrir que el modelo matemático no garantice la existencia de la solución y, en consecuencia, en los puntos estacionarios hallados pueden presentarse puntos de silla u óptimos de naturaleza contraria a los buscados. Estas consideraciones hacen que sea necesario contar con un criterio de clasificación de los puntos estacionarios. Las definiciones y el teorema, sin demostración, que se presentan en seguida suplen esta necesidad.

Definición 7: La matriz n x n de las segundas derivadas parciales de f es llamada

matriz hessiana y se designa por H( x ). Así, se tiene

2

2

2

2

1

2

2

2 2 2

2

2 1

2 1

2

1 2

2 2 1

2

n n n

n

n

x

f x x

f x x

f

x x

f x

f x x

f

x x

f x x

f x

f

H

  ^ 

Definición 8: Dada la matriz A nxn se define el k-ésimo menor principal de A como

k k kk

k

k

a a a

a a a

a a a

1 2

21 22 2

11 12 1

k = 1,2,... , n

Definición 9: Dada la matriz simétrica A nxn se dice que A es:

  1. definida positiva si los valores de los menores principales de A son positivos (no negativos).
  2. definida negativa si el valor del k-ésimo menor principal tiene signo (− 1 ) k

Teorema 6: sea a un punto estacionario de f entonces

  1. Si H( a ) es definida positiva f tiene un mínimo en a.
  2. Si H( a ) es definida negativa f tiene un máximo en a.

Ejemplo 11: encuentre los puntos óptimos de la función

2 3

2 2

2 f ( x 1 , x 2 , x 3 )= x 1 + 2 x 3 + x 2 x 3 − x 1 − xx

Solución: el sistema

1

x x

f

2

x x x

f

3

x x x

f

tiene como solución el vector a = (1/2, 2/3, 4/3), entonces

H ()

los menores principales de H tienen valores -2, 4, -6. Según la definición 9, H es definida negativa. Aplicando el teorema 6 se concluye que f tiene un máximo en a.

Ejemplo 12: Determine el punto del plano x + 2 y + z = 1 más cercano al origen.

Solución: El problema puede representarse como

minimizar f ( x , y , z ) = x^2 + y^2 + z^2

z

f

= 2 xy – 4 x - 2 y + 2 z + 4 = 0

Para resolver este sistema no lineal de 3 ecuaciones con 3 incógnitas se emplea el método de sustitución. Despejando x en la primer ecuación

x = 1 – yz + 2 z reemplazando en la segunda

2(1 – yz + 2 z ) z - 2 z + 2 y - 4 = 0

haciendo el producto, simplificando y factorizando

z ²(4 - 2 y ) + 2 y – 4 = 0 factorizando de nuevo

(4 – 2 y )( z ² - 1) = (4 – 2 y )( z - 1)( z + 1) = 0

de esta última igualdad se concluye que

y = 2 o z = 1 o z = -1.

Reemplazando x en la segunda ecuación

2(1 – yz + 2 z ) y – 4(1 – yz + 2 z ) - 2 y + 2 z + 4 = 0

simplificando y factorizando

z ( y ² - 4 y + 3) = z ( y – 3)( y - 1) = 0 en consecuencia z = 0 o y = 3 o y = 1.

Se escogen las parejas ( y , z ) de tal manera que se cumplan las 2 condiciones, por ejemplo, si se escoge y = 3 en la segunda condición entonces, por la primera condición, z = 1 o z = -1. Se tienen, por lo tanto, las parejas (3, 1) y (3, -1). Consideraciones análogas dan como resultado las parejas (1, 1), (1, -1) y (2, 0). Tomando, por ejemplo, la pareja (3, 1) se obtiene x = 1 – 31 + 21 = 0, con lo cual se tiene la tripla (0, 3, 1). El mismo procedimiento conduce a la obtención de los puntos (1, 2, 0), (2, 3, -1), (2, 1,

  1. y (0, 1, -1) como puntos estacionarios de f.

Utilización de métodos numéricos en la determinación de puntos

estacionarios

El ejemplo 13, de fácil solución, ilustra las bondades de un problema artificial, esto es, un problema que ha sido creado para que tenga una solución relativamente fácil. En este caso la solución del sistema de ecuaciones, originado al igualar el gradiente a cero, se pudo realizar acudiendo únicamente al álgebra elemental. Sin embargo, este tipo de

problemas constituyen la excepción y no la regla cuando se presentan como parte de la solución de un problema real de aplicación. En estos casos, de manera similar a lo visto en el trabajo con variable unidimensional, hay que recurrir a algún método numérico para resolver el sistema. El método que se tratará aquí es el de Newton para sistemas de ecuaciones no lineales.

Método de Newton para sistemas de ecuaciones

Dado el sistema de n ecuaciones F ( x ) = 0 , donde

( )^2

1

f n

f

f

El método de Newton para sistemas consiste en la aplicación de la ecuación recursiva

[ ( )] ( 1 ) 1 1 1 −

−  k =  k − − J  k −  k

en donde  0 es un punto próximo a la raíz buscada y

n

n n n

n

n

x

f x

f x

f

x

f x

f x

f

x

f x

f x

f

J

1 2

2 2

2 1

2

1 2

1 1

1

Ejemplo 14: Encuentre los puntos estacionarios de

f ( x , y , z ) = 2 x ² + y ² + z ² + 6( x + y + z ) + 2 xyz

Solución: Calculando las derivadas parciales e igualando a cero

x

f

= 4 x + 2 yz + 6 = 0

y

f

= 2 y + 2 xz + 6 = 0

z

f

= 2 z + 2 x y + 6 = 0

Para aplicar el método de Newton se construye la matriz J