Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Introducción a la optimización y convexidad, Apuntes de Matemáticas

Asignatura: matematicas3, Profesor: , Carrera: Economía, Universidad: UCM

Tipo: Apuntes

2013/2014

Subido el 22/01/2014

wnkiki567
wnkiki567 🇪🇸

3.9

(14)

5 documentos

1 / 15

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Chapter 1
Introducci´on a la optimizaci´on y
convexidad
1.1 Introducci´on a la optimizaci´on. Definiciones de los con-
ceptos asicos. Formulaci´on de problemas de progra-
maci´on
Los programas matem´aticos que vamos a formular y resolver este no admiten la siguiente formu-
laci´on general
opt f(x1, . . . , xn)
s.a. (x1, . . . , xn)SD
con DRnel dominio de f.
Los elementos de un problema de optimizaci´on son los siguientes:
Las variables de decisi´on o elecci´on, (x1, . . . , xn). Son las variables principales del modelo y
son las variables para las que queremos encontrar el mejor valor posible.
La funci´on objetivo del problema f(x). Es la funci´on que queremos optimizar. Para deter-
minar el modelo no olo hemos de especificar una funci´on objetivo, sino tambi´en si hay que
maximizarla (max f) o minimizarla (min f). Cuando no se especifica si buscamos el aximo
o el m´ınimo hablamos de optimizar la funci´on objetivo (opt f ). En un problema de maxi-
mizar, los ´optimos de la funci´on objetivo son sus aximos, mientras que en un problema de
minimizar son sus m´ınimos.
Restricciones. En general se consideran dos tipos de restricciones:
Restricciones de igualdad. Son las de la forma h(x) = 0.
Restricciones de desigualdad. Son las de la forma g(x)0 o bien l(x)0.
Las restricciones de la forma xi0 se llaman condiciones de no negatividad.
4
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Vista previa parcial del texto

¡Descarga Introducción a la optimización y convexidad y más Apuntes en PDF de Matemáticas solo en Docsity!

Chapter 1

Introducci´on a la optimizaci´on y

convexidad

1.1 Introducci´on a la optimizaci´on. Definiciones de los con-

ceptos b´asicos. Formulaci´on de problemas de progra-

maci´on

Los programas matem´aticos que vamos a formular y resolver este a˜no admiten la siguiente formu- laci´on general

opt f (x 1 ,... , xn) s.a. (x 1 ,... , xn) ∈ S ⊂ D

con D ⊂ Rn^ el dominio de f. Los elementos de un problema de optimizaci´on son los siguientes:

  • Las variables de decisi´on o elecci´on, (x 1 ,... , xn). Son las variables principales del modelo y son las variables para las que queremos encontrar el mejor valor posible.
  • La funci´on objetivo del problema f (x). Es la funci´on que queremos optimizar. Para deter- minar el modelo no s´olo hemos de especificar una funci´on objetivo, sino tambi´en si hay que maximizarla (max f ) o minimizarla (min f ). Cuando no se especifica si buscamos el m´aximo o el m´ınimo hablamos de optimizar la funci´on objetivo (opt f ). En un problema de maxi- mizar, los ´optimos de la funci´on objetivo son sus m´aximos, mientras que en un problema de minimizar son sus m´ınimos.
  • Restricciones. En general se consideran dos tipos de restricciones:
    • Restricciones de igualdad. Son las de la forma h(x) = 0.
    • Restricciones de desigualdad. Son las de la forma g(x) ≤ 0 o bien l(x) ≥ 0.
  • Las restricciones de la forma xi ≥ 0 se llaman condiciones de no negatividad.

No es necesario que aparezcan todas las restricciones anteriores. Por ejemplo, puede que s´olo tengamos restricciones de desigualdad y que sean todas de la forma ≥. Lo que nunca puede faltar es la funci´on objetivo del problema. Resolver un problema de programaci´on matem´atica es buscar unos valores para las variables principales que cumplan las restricciones y donde la funci´on objetivo alcance su valor ´optimo.

Ejemplo 1.1.1 De manera muy general, puede decirse que el objetivo de esta parte de la asignatura es resolver cierta clase de problemas en los que se busca la mejor decisi´on posible de un conjunto de alternativas. Como ejemplo tenemos el siguiente problema:

Ejemplo 1.1.2 Una pasteler´ıa desea planificar la producci´on diaria de dos tipos de tartas, A y B. Dicha pasteler´ıa dispone de un m´aximo de 12 horas diarias de mano de obra para esta tarea. Cada tarta de tipo A requiere 3 horas, mientras que cada tarta de tipo B requiere 2h. Por otro lado, la producci´on requiere un input I del que la empresa puede disponer como m´aximo de 10 unidades diarias. Cada tarta de tipo A requiere 1 unidad de I, mientras que cada tarta de tipo B requiere 2 unidades de I. ¿Cu´al es la m´axima producci´on diaria de tartas que puede conseguir la pasteler´ıa? ¿Qu´e cantidad debe producir para ello de cada tarta?

Una vez que nos dan un problema de este estilo lo que tendremos que hacer es modelizarlo, es decir, pasarlo a t´erminos matem´aticos para poder resolverlo. En nuestro ejemplo:

Sea x la cantidad diaria de tartas del tipo A e y la cantidad diaria de tartas del tipo B que se producen. Lo que queremos encontrar es la cantidad diaria m´axima de tartas que se pueden producir, que en t´erminos matem´aticos es

max x + y

Para maximizar esta cantidad nos dan ciertas restricciones que tenemos que tener en cuenta. La primera de ellas es que no podemos tener un n´umero negativo de tartas diarias, es decir,

x ≥ 0 , y ≥ 0

Adem´as sabemos que la producci´on diaria de tartas del tipo A requiere 3 horas y la producci´on diaria de tartas del tipo B requiere 2y horas. Como tenemos un l´ımite de 12 horas diarias, esto nos lleva a 3 x + 2y ≤ 12

Aparte, sabemos que la producci´on diaria de tartas del tipo A consume x unidades de I, mientras que la producci´on diaria de tartas de tipo B consume 2y unidades de I. Como s´olo tenemos 10 unidades de I, tendr´a que ser x + 2y ≤ 10

Resumiendo, hemos llegado a

max x + y s.a. 3 x + 2y ≤ 12 x + 2y ≤ 10 x ≥ 0 , y ≥ 0

i) Se dice que x∗^ ∈ S es m´aximo global del problema si se verifica que f (x) ≤ f (x∗), para todo x ∈ S.

ii) Se dice que x∗^ ∈ S es m´aximo local del problema si existe r > 0 tal que f (x) ≤ f (x∗), para todo x ∈ B(x∗, r) ∩ S.

iii) Se dice que x∗^ ∈ S es m´ınimo global del problema si se verifica que f (x) ≥ f (x∗), para todo x ∈ S.

iv) Se dice que x∗^ ∈ S es m´ınimo local del problema si existe r > 0 tal que f (x) ≥ f (x∗), para todo x ∈ B(x∗, r) ∩ S.

1.1.1 Clasificaci´on de los problemas de Optimizaci´on Matem´atica

Puesto que para resolver un problema tendremos que aplicar t´ecnicas diferentes seg´un sus carac- ter´ısticas, vamos a ver ahora las clases de problemas que se pueden presentar. Podemos clasificar los problemas atendiendo a diversos criterios:

  • Programaci´on lineal / Programaci´on no lineal
    • Programaci´on lineal: Tanto la funci´on objetivo como sus restricciones son lineales.
    • Programaci´on no lineal: La funci´on objetivo o algunas de las restricciones son no lineales.
  • Seg´un su soluci´on
    • Problemas con soluci´on: Por lo menos podemos encontrar una soluci´on, aunque podr´ıa darse el caso de haber infinitas soluciones.
    • Problemas sin soluci´on. Tenemos dos posibilidades: puede que ni siquiera se puedan satisfacer las restricciones y puede que podamos encontrar valores que satisfagan las restricciones pero que no sean soluci´on del problema que tenemos.
  • Atendiendo a las restricciones que tengamos.
    • Optimizaci´on sin restricciones: En este caso las variables de restricci´on pueden tomar en principio cualquier valor.
    • Optimizaci´on con restricciones de igualdad. Tan s´olo tenemos restricciones de igualdad.
    • Optimizaci´on con restricciones de desigualdad. En este caso podemos tener tanto re- stricciones de igualdad como restricciones de desigualdad.

Ejemplo 1.1.6 Veamos algunos ejemplos de la ´ultima clasificaci´on:

  1. max x^2 − y^2 − 5 z^3 2. max x^2 − y^2 − 5 z^3 3. max x^2 − y^2 − 5 z^3 s.a. x + y = 3 s.a. x + y = 3 2 x^2 + z^2 ≤ 3 x ≥ 0 , y ≥ 0 , z ≥ 0 En 1. tenemos un caso de optimizaci´on sin restricciones. En 2. el programa es de optimizaci´on con restricciones de igualdad y en 3. lo que tenemos es un problema de optimizaci´on con restric- ciones de desigualdad.

1.1.2 El Teorema de Weierstrass

Definici´on 1.1.7 Sea S un conjunto de Rn. Un punto x ∈ S se dice que es interior si existe r > 0 con B(x, r) ⊂ S, es decir, existe una bola de centro x totalmente contenida en S. Un conjunto se dice que es abierto si todos sus puntos son interiores. Un conjunto se dice que es cerrado si su complementario es abierto.

Definici´on 1.1.8 Sea S un conjunto de Rn. Este conjunto se dice que es acotado si existe un M > 0 y un x 0 de tal forma que S ∈ B(x 0 , M ). Es decir, de manera poco matem´atica, decimos que el conjunto es acotado si le podemos meter dentro de una bola.

Teorema 1.1.9 Teorema de Weierstrass Sea f : Rn^ → R una funci´on continua en un conjunto B ⊂ Rn, con B cerrado y acotado. Entonces, existen x∗, x∗ ∈ B tales que

f (x∗) ≥ f (x) para todo x ∈ B, f (x∗) ≤ f (x) para todo x ∈ B.

Es decir, x∗^ es m´aximo global de f en B y x∗ es m´ınimo global de f en B.

Este teorema lo que nos dice es que si tenemos una funci´on definida en un conjunto cerrado y acotado entonces dicha funci´on alcanza un m´aximo y un m´ınimo en dicho conjunto.

Proposici´on 1.1.10 Sea f : S ⊂ Rn^ → I ⊂ R y sea F : I ⊂ R → R. Sean los problemas

max f (x 1 ,... , xn) (x 1 ,... , xn) ∈ S ⊂ Rn

(I)

max F (f (x 1 ,... , xn)) (x 1 ,... , xn) ∈ S ⊂ Rn

(II)

Entonces

a) Si F es no decreciente y x∗^ es soluci´on de (I) entonces x∗^ es soluci´on de (II).

b) Si F es mon´otona creciente, x∗^ es soluci´on de (I) si y s´olo si x∗^ es soluci´on de (II).

La diferencia entre el apartado a) y el b) es que en el a) la funci´on no tiene porqu´e ser mon´otona creciente, tan s´olo le pedimos que no decrezca, esto es, puede haber intervalos en los que sea constante.

Proposici´on 1.1.11 Dados los programas

min f (x 1 ,... , xn) (x 1 ,... , xn) ∈ B 1 ⊂ Rn

(I)

min f (x 1 ,... , xn) (x 1 ,... , xn) ∈ B 2 ⊂ Rn

(II)

siendo B 1 y B 2 conjuntos cerrados tales que B 2 ⊂ B 1 , entonces

i) Si el programa (I) tiene m´ınimo global en x 1 , entonces el programa (II) tiene m´ınimo global en x 2 verific´andose que f (x 1 ) ≤ f (x 2 ).

En el caso en que la funci´on objetivo no sea lineal puede ser un poco m´as complicado. La idea es la misma, primero se dibuja el conjunto factible S y despu´es se van representando los conjuntos de nivel para diversos valores de k. Si buscamos un m´ınimo tendremos que hallar el que corresponda al k m´as bajo que corte al conjunto S y hallar los puntos de intersecci´on con dicho conjunto. Si lo que buscamos es el m´aximo, lo que hacemos es hallar el que corresponda al k m´as alto que corte al conjunto S y hallar los puntos de intersecci´on con dicho conjunto. Cuando a partir de la gr´afica se observa que la soluci´on se encuentra en el punto de tangencia entre cierta curva f (x, y) = α y el conjunto S, lo que hacemos para hallar dicho corte es igualar la pendiente de la curva de nivel y la pendiente de la recta o curva que sea el borde del conjunto S en dicho punto. Dada una curva f (x, y) = α, el valor de la tangente en un punto cualquiera de la curva vale

∂f ∂x (x, y) ∂f ∂y (x, y)^

Es decir, si tenemos la curva de nivel f (x, y) = α y sabemos que es tangente a la curva dada por g(x, y) = c, igualando las pendientes de ambas curvas y sabiendo que en el punto de tangencia tiene que ser g(x, y) = c, obtenemos el sistema  



∂f ∂x (x, y) ∂f ∂y (x, y)

∂g ∂x (x, y) ∂g ∂y (x, y) g(x, y) = c.

Ejemplo 1.1.15 Supongamos que tenemos el problema

max xy s.a. x + 2y ≤ 100 x ≥ 0 , y ≥ 0

Si representamos gr´aficamente las curvas de nivel y el conjunto S tenemos lo siguiente donde

Out[5]=

(^00 20 40 60 80 )

10

20

30

40

50

60

podemos ver que la soluci´on es el corte de una curva de nivel xy = α con la recta x + 2y = 100. En el punto de corte, las tangentes de ambas curvas coinciden. El valor de la tangente de la funci´on f (x, y) = α en un punto cualquiera vale

∂f ∂x ∂f ∂y

y x

Por otra parte, como la recta x + 2y = 100 se puede escribir como y = − 12 x + 50, tenemos que el valor de su tangente en cualquier punto vale − 12. Igualando ambas tangentes tenemos

y x

con lo que obtenemos que x = 2y. Puesto que estamos buscando un punto en la recta x + 2y = 100, sustituyendo este valor tenemos que

2 y + 2y = 100, lo que implica que y = 25.

Como y = 25 y x = 2y, de aqu´ı sacamos que el punto que buscamos es (50, 25), que es por tanto la soluci´on a nuestro problema. El valor del m´aximo vale f (50, 25) = 50 ∗ 25 = 1250.

1.2 Convexidad

1.2.1 Conjuntos convexos. Propiedades

En R^2 , se dice que un conjunto S es convexo si se puede unir cada par de puntos de S por un segmento que est´e totalmente contenido en S. Vamos a extender esta definici´on a Rn.

Definici´on 1.2.1 Un conjunto S de Rn^ se dice que es convexo si para cada par de puntos x, y ∈ S y todo λ ∈ [0, 1] se verifica que z = λx + (1 − λ)y ∈ S. Es decir, si llamamos segmento de extremos x e y al conjunto

[x, y] = {z ∈ Rn/z = λx + (1 − λ)y, λ ∈ [0, 1]},

S es convexo si para todo x, y ∈ S se verifica que [x, y] ⊂ S.

Es decir, un conjunto es convexo si para cualquier par de puntos el segmento que los une tambi´en est´a en el conjunto. Esto es relativamente f´acil de ver cuando trabajamos en R^2 o R^3.

Proposici´on 1.2.2 Intersecci´on de conjuntos convexos Si S 1 ,... , Sm son conjuntos convexos de Rn^ entonces S 1

Sm es un conjunto convexo.

Dicho con otras palabras: la intersecci´on de conjuntos convexos da como resultado un conjunto convexo.

Tambi´en podemos dar la definici´on de conjunto estrictamente convexo. La diferencia es que en este caso no puede haber tramos rectos en el conjunto.

Proposici´on 1.2.4 Sea f una funci´on definida sobre un conjunto convexo S de Rn. Entonces:

a) Si f es una funci´on convexa en S entonces −f es c´oncava.

b) Si f es una funci´on estrictamente convexa en S entonces −f es una funci´on estrictamente c´oncava.

c) Si f es una funci´on convexa en S y λ ∈ R entonces

i) Si λ > 0 la funci´on λf es convexa. ii) Si λ < 0 la funci´on λf es c´oncava.

d) Si fi para i = 1,... , m es una familia de funciones convexas en S, entonces la funci´on h =

∑m i=1 αifi, con^ αi^ ≥^0 ,^ i^ = 1,... , m, es una funci´on convexa en^ S. e) Si fi para i = 1,... , m es una familia de funciones c´oncavas en S, entonces la funci´on h =

∑m i=1 αifi, con^ αi^ ≥^0 ,^ i^ = 1,... , m, es una funci´on c´oncava en^ S.

Veamos ahora una manera para descubrir si una funci´on dada es c´oncava, convexa o ni c´oncava ni convexa.

Proposici´on 1.2.5 Sea S un conjunto abierto, no vac´ıo y convexo de Rn^ y f una funci´on C^2 (sus derivadas parciales segundas son continuas) de S en R.

i) La funci´on f es convexa en S si y s´olo si para todo x ∈ S la forma cuadr´atica con matriz asociada Hf (x) es semidefinida positiva o definida positiva.

ii) Si para todo x ∈ S se verifica que la forma cuadr´atica con matriz asociada Hf (x) es definida positiva, la funci´on f es estrictamente convexa en S.

El resultado para funciones c´oncavas se obtiene considerando formas cuadr´aticas semidefinidas negativas y definidas negativas,

iii) La funci´on f es c´oncava en S si y s´olo si para todo x ∈ S la forma cuadr´atica con matriz asociada Hf (x) es semidefinida negativa o definida negativa.

iv) Si para todo x ∈ S se verifica que la forma cuadr´atica con matriz asociada Hf (x) es definida negativa, la funci´on f es estrictamente c´oncava en S.

Cuando tenemos conjuntos definidos por desigualdades de funciones entonces podemos utilizar la concavidad o convexidad de las funciones involucradas para ver si los conjuntos son convexos o no.

Proposici´on 1.2.6 Sea S un conjunto convexo de Rn^ y f una funci´on definida de S en R. Se verifica que:

i) Si f es convexa en S, entonces los conjuntos Λα = {x ∈ S/ f (x) ≤ α} son convexos para todo α ∈ R.

ii) Si f es c´oncava en S, entonces los conjuntos Ωα = {x ∈ S/ f (x) ≥ α} son convexos para todo α ∈ R.

Los conjuntos de la forma {x ∈ S/ f (x) ≥ α} se llaman conjuntos de sobre nivel de la funci´on. Los que son de la forma {x ∈ S/ f (x) ≤ α} se llaman conjuntos bajo nivel de la funci´on.

1.2.3 Funciones cuasiconvexas y cuasic´oncavas

Definici´on 1.2.7 Sea S un conjunto convexo no vac´ıo de Rn^ y f una aplicaci´on de S en R. Se dice que

i) La funci´on f es cuasiconvexa si y s´olo si para todo α ∈ R el conjunto

Λα = {x ∈ S/ f (x) ≤ α}

es convexo.

ii) La funci´on f es cuasic´oncava si y s´olo si para todo α ∈ R el conjunto

Ωα = {x ∈ S/ f (x) ≥ α}

es convexo.

Proposici´on 1.2.8 Sea f una funci´on definida sobre un conjunto convexo S de Rn. Entonces:

i) f es cuasic´oncava si y s´olo si −f es cuasiconvexa.

ii) Sea f : R → R. Si f es creciente o decreciente, entonces f es cuasic´oncava y cuasiconvexa.

iii) a) Si f es convexa en S, entonces f es cuasiconvexa en S. b) Si f es c´oncava en S, entonces f es cuasic´oncava en S. c) Si f es estrictamente convexa en S, entonces f es estrictamente cuasiconvexa en S. d) Si f es estrictamente c´oncava en S, entonces f es estrictamente cuasic´oncava en S.

iii) Si para todo (x, y) ∈ S se tiene que

| Hf˜ (x, y)| < 0

entonces la funci´on f es estrictamente cuasiconvexa.

iv) Si para todo (x, y) ∈ S se tiene que

| Hf˜ (x, y)| > 0

entonces la funci´on f es estrictamente cuasic´oncava.

v) Si para todo (x, y) ∈ S se tiene que

| Hf˜ (x, y)| = 0

entonces la funci´on f es cuasiconvexa y cuasic´oncava.

Si estamos en m´as dimensiones:

Proposici´on 1.2.12 Sea S un conjunto abierto, no vac´ıo y convexo de Rn^ y f una funci´on C^2 en S. Sea Hf˜ (x) la matriz cuadrada de orden n + 1 definida por

Hf^ ˜ (x) =

∂f ∂x 1

(x)

∂f ∂x 2

(x) · · ·

∂f ∂xn

(x) ∂f ∂x 1

(x)

∂^2 f ∂x^21

(x)

∂^2 f ∂x 2 ∂x 1

(x) · · ·

∂^2 f ∂xn∂x 1

(x) ∂f ∂x 2

(x) ∂^2 f ∂x 1 ∂x 2

(x) ∂^2 f ∂x^22

(x) · · · ∂^2 f ∂xn∂x 2

(x) .. .

∂f ∂xn

(x)

∂^2 f ∂x 1 ∂xn

(x)

∂^2 f ∂x 2 ∂xn

(x) · · ·

∂^2 f ∂x^2 n

(x)

Se verifica que

i) Si la funci´on f es cuasiconvexa en S, entonces para todo x ∈ S y todo r = 2,... , n + 1 se cumple que

Dr [ Hf˜ (x)] ≤ 0.

ii) Si la funci´on f es cuasic´oncava en S, entonces para todo x ∈ S y todo r = 2,... , n + 1 se cumple que

(−1)r−^1 Dr [ Hf˜ (x)] ≥ 0.

Es decir, D 2 ≤ 0 , D 3 ≥ 0 , ..., se empieza con D 2 ≤ 0 y despu´es los signos se van alternando.

iii) Si para todo x ∈ S y todo r = 2,... , n + 1 se tiene que

Dr [ Hf˜ (x)] < 0

entonces la funci´on f es estrictamente cuasiconvexa.

iv) Si para todo x ∈ S y todo r = 2,... , n + 1 se tiene que

(−1)r−^1 Dr [ Hf˜ (x)] > 0

entonces la funci´on f es estrictamente cuasic´oncava.

Dr [ Hf˜ (x)] es el determinante de la matriz formada por las r primeras filas y las r primeras columnas; es decir,

Dr [ Hf˜ (x)] =

∂f ∂x 1

(x) · · · ∂f ∂xr− 1

(x) ∂f ∂x 1

(x) ∂^2 f ∂x^21

(x) · · · ∂^2 f ∂xr− 1 ∂x 1

(x) .. .

∂f ∂xr− 1

(x) ∂^2 f ∂x 1 ∂xr− 1

(x) · · · ∂^2 f ∂x^2 r− 1

(x)

1.2.4 El teorema fundamental de la programaci´on convexa

Definici´on 1.2.13 Dado el programa

opt f (x 1 ,... , xn) (x 1 ,... , xn) ∈ B ⊂ Rn

se dice que

i) Es convexo para m´ınimo si B es convexo y f es una funci´on convexa o cuasiconvexa en B.

ii) Es convexo para m´aximo si B es convexo y f es una funci´on c´oncava o cuasic´oncava en B.

Teorema 1.2.14 Teorema fundamental de la programaci´on convexa Sea el programa

min f (x 1 ,... , xn) (x 1 ,... , xn) ∈ B ⊂ Rn

con B un conjunto convexo, y f una funci´on convexa o cuasiconvexa (es decir, el programa es convexo para m´ınimo). Entonces se verifica que

i) Si x∗ ∈ B es un m´ınimo local, entonces x∗ es un m´ınimo global.

ii) El conjunto de todos los m´ınimos del programa es un conjunto convexo.

Para un problema de m´aximo se obtiene un resultado an´alogo sustituyendo el concepto de m´ınimo por el de m´aximo: