Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Forme quadratiche - Esempi e teoremi, Dispense di Matematica

Esempi e teoremi riguardo le forme quadratiche

Tipologia: Dispense

2020/2021

Caricato il 08/01/2021

luigi-fortunato-1
luigi-fortunato-1 🇮🇹

4 documenti

1 / 36

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Forme Quadratiche Una forma quadratica ´e un polinomio omogeneo
di grado 2 in nvariabili.
In generale x= (x1, x2, . . . , xn)
q(x) =
n
X
i,j=1
ai,jxixj=
n
X
i=1
ai,ix2
i+
n
X
i6=j
ai,jxixj
Scritta cos`ı, quanti sono i coefficienti di una forma quadratica in nvariabili
? Sono n2.
A= (ai,j)
In forma di prodotto scalare
q(x) = Ax ·x
In forma matriciale
q(x) = xTAx
Esercizi di riscrittura dalla forma alla matrice associata e viceversa.
q(x1, x2, x3) = x2
1+ 3x2
2+x2
324x1x26x1x3+ 2x2x3
La matrice associata `e
112 3
12 3 1
3 1 1
A una forma quadratica resta associata una matrice simmetrica.
Come riconoscere se la forma quadratica ( o la matrice associata) `e definita
positiva ossia
q(x1, x2, x3,...xn) =
n
X
i,j=1
ai,jxixj0,x6= 0
soluzione n. 1 (calcolo degli autovalori)
D(λ) =
λ112 3
12 λ3 1
3 1 λ1
D(λ) = 0,
(λ1)
λ3 1
1λ1+ 12 12 1
3λ1312 λ3
3 1 = 0
(λ1)((λ3)(λ1) 1) 144(λ1) + 36 + 36 9(λ3) =
(λ1)(λ24λ+ 3) λ+ 1 144λ+ 144 + 72 9λ+ 27 =
λ34λ2+ 3λλ2+ 4λ3λ+ 1 144λ+ 144 + 72 9λ+ 27
λ35λ2147λ+ 241 = 0
Osserviamo che
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24

Anteprima parziale del testo

Scarica Forme quadratiche - Esempi e teoremi e più Dispense in PDF di Matematica solo su Docsity!

Forme Quadratiche Una forma quadratica ´e un polinomio omogeneo di grado 2 in n variabili. In generale x = (x 1 , x 2 ,... , xn)

q(x) =

∑^ n

i,j=

ai,j xixj =

∑^ n

i=

ai,ix^2 i +

∑^ n

i 6 =j

ai,j xixj

Scritta cos`ı, quanti sono i coefficienti di una forma quadratica in n variabili ? Sono n^2. A = (ai,j )

In forma di prodotto scalare

q(x) = Ax · x

In forma matriciale q(x) = xT^ Ax Esercizi di riscrittura dalla forma alla matrice associata e viceversa. q(x 1 , x 2 , x 3 ) = x^21 + 3x^22 + x^23 − 24 x 1 x 2 − 6 x 1 x 3 + 2x 2 x 3

La matrice associata `e  

A una forma quadratica resta associata una matrice simmetrica. Come riconoscere se la forma quadratica ( o la matrice associata) `e definita positiva ossia

q(x 1 , x 2 , x 3 ,... xn) =

∑^ n

i,j=

ai,j xixj ≥ 0 , ∀x 6 = 0

soluzione n. 1 (calcolo degli autovalori)

D(λ) =

λ − 1 − 12 − 3 − 12 λ − 3 1 − 3 1 λ − 1

D(λ) = 0,

(λ − 1)

∣∣ λ^ −^3 1 λ − 1

∣∣ −^12

− 3 λ − 1

∣∣ −^12 λ^ −^3 − 3 1

(λ − 1)((λ − 3)(λ − 1) − 1) − 144(λ − 1) + 36 + 36 − 9(λ − 3) = (λ − 1)(λ^2 − 4 λ + 3) − λ + 1 − 144 λ + 144 + 72 − 9 λ + 27 = λ^3 − 4 λ^2 + 3λ − λ^2 + 4λ − 3 − λ + 1 − 144 λ + 144 + 72 − 9 λ + 27 λ^3 − 5 λ^2 − 147 λ + 241 = 0

Osserviamo che 1

Tutte le soluzioni sono reali (due soluzioni sono positive e una negativa). L’equazione di terzo grado per il Teorema Fondamentale dell’Algebra, ha tre soluzioni. L’equazione di terzo grado ha sempre almeno una radice reale, nel caso in esame sappiamo che tutte le soluzioni sono reali. Possiamo avere informazioni sul segno senza calcolarle? Se r, s e t sono le sue tre radici, l’equazione si annulla se x = r o se x = s o sex = t, cioe dovra essere: (x – r) (x – s) (x – t) = 0 Si ottiene:

x^3 –(r + s + t)x^2 + (rs + rt + st)x–rst = 0 Da cui si trova r + s + t = 5 e rst = −241. Almeno una dovra essere negativa, non non tutte e tre perch´e la sommae positiva. Data l’equazione di terzo grado (Tartaglia, Cardano). x^3 + bx^2 + cx + d = 0

la trasformiamo in un’equazione priva del termine di secondo grado

x = y–b/ 3

(y–b/3)^3 + b(y–b/3)^2 + c(y–b/3) + d = 0

(y^3 –3(b/3)y^2 + 3(b^2 /9)y–b^3 /27) + b(y^2 –2(b/3)y + b^2 /9) + cy–bc/3 + d = 0

y^3 – by^2 + (b^2 /3)y–b^3 /27 + by^2 –(2b^2 /3)y + b^3 /9 + cy–bc/3 + d = 0

y^3 + (−b^2 /3 + c)y + 2b^3 /27–bc/3 + d = 0 p = −b^2 /3 + c q = 2b^3 /27–bc/3 + d

y^3 + py + q = 0 Introduciamo u e v y = u + v p = − 3 uv (u + v)^3 − 3 uv(u + v) + q = 0 Da cui u^3 + v^3 = −q u^3 v^3 = −p^3 / 27

Risolviamo z^3 + qz − p^3 /27 = 0

z 1 , 2 =

−q ±

p^2 + 4p^3 / 27 2 Consideriamo un caso particolare : assumiamo p^2 + 4p^3 / 27 ≥ 0

Se detQ < 0 , allora Q `e indefinita.

Proof. Data la forma quadratica

ax^21 + 2bx 1 x 2 + cx^22 ,

essa pu`o essere equivalentemente scritta

a

x 1 +

b a

x 2

ac − b^2 a

x^22 ,

da questa formula si evince chiaramente il risultato. 

Consideriamo le forme quadratiche nel caso di dimensione due associate alla matrice hessiana. Ricordiamo che la matrice hessiana, o matrice di Hesse, nel caso n = 2 `e la matrice quadrata 2 × 2 delle derivate parziali seconde della funzione.

(Hf )i,j =

∂^2 f ∂xi∂xj

ove il simbolo ∂xi∂xj indica che prima deriviamo rispetto a xi e poi rispetto a xj

  1. Regressione lineare Minimi quadrati

Dati n > 2 di R^2 con ascisse distinte tra loro si vuole determinare la retta che minimizza l’errore quadratico totale

F (a 0 , a 1 ) =

∑^ n

j=

(a 1 xj + a 0 − yj )^2

Funzione di due variabili di cui possiamo calcolare i punti critici { ∂F ∂a 0 = 2^

∑n j=1(a^1 xj^ +^ a^0 −^ yj^ ) = 0 ∂F ∂a 1 = 2^

∑n j=1 xj^ (a^1 xj^ +^ a^0 −^ yj^ ) = 0

Scritto sotto forma di sistema { a 0 n + a 1

( ∑n j=1 xj

∑n j=1 yj a 0

( ∑n j=1 xj

  • a 1

( ∑n j=1 x

2 j

∑n j=1 xj^ yj

D =

n

∑n ∑n j=1^ xj j=1 xj

∑n j=1 x

2 j

∣ =^ n

( ∑n

j=

x^2 j

( ∑n

j=

xj

Esercizio 1.1. Dimostrare, assumendo xj distinti tra loro al variare di j = 1,... , ( ∑n

j=

xj

< n

∑^ n

j=

x^2 j , n ∈ N, n ≥ 2

Proof. La disuguaglianza `e verificata per n = 2. Assumendo vera la disuguaglianza al passo n dobbiamo dimostare

( n∑+

j=

xj

< (n + 1)

n∑+

j=

x^2 j.

( n∑+

j=

xj

( ∑n

j=

xj + xn+

( ∑n

j=

xj

  • x^2 n+1 + 2xn+

∑^ n

j=

xj <

n

∑^ n

j=

x^2 j + x^2 n+1 + 2xn+

∑^ n

j=

xj =

(n + 1)

∑^ n

j=

x^2 j + nx^2 n+1 + x^2 n+1 − x^2 n+1 +... x^2 n+ ︸ ︷︷ ︸ n volte

∑^ n

j=

x^2 j + 2xn+

∑^ n

j=

xj =

(n + 1)

n∑+

j=

x^2 j −

∑^ n

j=

xj − xn+1)^2 < (n + 1)

n∑+

j=

x^2 j.

Calcolo delle soluzioni Un sistema con 2 equazioni e 2 incognite ha un’unica soluzione se e solo se il determinante D e diverso da zero. In questo caso, la soluzionee data da:

a 0 =

∑n j=1 yj

∑n ∑n j=1^ xj j=1 xj^ yj

∑n j=1 x

2 j

n

∑n ∑n j=1^ xj j=1 xj

∑n j=1 x

2 j

a 1 =

n

∑n ∑n j=1^ yj j=1 xj

∑n j=1 xj^ yj

∣∣^ n^

∑n ∑n j=1^ xj j=1 xj

∑n j=1 x

2 j

Gruppi di lavoro per impostazione problema. La dieta peso altezza, tariffa bus percorso prezzo, planning: consumi/ aumento salariale. Riflessioni sulla validit`a del metodo. Regressione polinomiale

Punto di minimo relativo che `e anche punto di minimo assoluto

f (b p−^11 ) =

b

p p− 1 p

bq q

bq^ − b p−^11 b =

p

q

bq^ = 0

Allora risulta per ogni numero reale a ≥ 0

f (a) ≥ 0 ,

ossia

ab ≤

p

ap^ +

q

bq



Teorema 2.2 (disuguaglianza di H¨older). Per p, q esponenti coniugati e p, q ∈ [1, +∞) e ∀x, y ∈ Rm^ abbiamo

(2.1) |x · y| ≤ ‖x‖p‖y‖q.

Si fissi ai =

|xi| ‖x‖p

, bi =

|yi| ‖y‖q Dalla disuguaglianza di Young

aibi ≤

p

|xi|p ‖x‖pp

q

|yi|q ‖y‖qq Sommando ∑^ m

i=

aibi ≤

p

∑m i=1 |xi|

p ‖x‖pp

q

∑m i=1 |yi|

q ‖y‖qq

Da cui si evince ∑m

i=

aibi =

∑^ m

i=

|xi| ‖x‖p

|yi| ‖y‖q

e la disuguaglianza di H¨older segue

(2.2) |x · y| ≤ ‖x‖p‖y‖q.

Teorema 2.3 ( Disuguaglianza Minkowski ). Per p ∈ [1, +∞) e ∀ x, y ∈ Rm abbiamo

(2.3) ‖x + y‖p ≤ ‖x‖p + ‖y‖p.

|xi + yi|p^ = |xi + yi|p−^1 |xi + yi| ≤ |xi + yi|p−^1 (|xi| + |yi|)

∑^ m

i=

|xi + yi|p^ ≤

∑^ m

i=

|xi + yi|p−^1 |xi| +

∑^ m

i=

|xi + yi|p−^1 |yi|

Si ha

∑^ m

i=

|xi + yi|p−^1 |xi| ≤ ‖x‖p‖(x + y)(p−1)‖q = ‖x‖p

( (^) ∑m

i=

|xi + yi|(p−1)q

) (^1) q

∑^ m

i=

|xi + yi|p−^1 |yi| ≤ ‖y‖p‖(x + y)(p−1)‖q = ‖y‖p

( (^) ∑m

i=

|xi + yi|(p−1)q

) (^1) q

Quindi da (p − 1)q = p

‖x + y‖pp ≤ ‖x + y‖p p− 1 (‖x‖p + ‖y‖p)

e dividendo per ‖x + y‖p p− 1 (assumendo non nullo) si ottiene la Disug- uaglianza di Minkowski

‖x + y‖p ≤ ‖x‖p + ‖y‖p.

Esempio 2.4.

  • La formula ‖x‖ 1 = |x 1 | + · · · + |xm| , x = (x 1 ,... , xm) ∈ Rm definisce una norma su Rm.
  • La formula ‖x‖∞ = max {|x 1 | ,... , |xm|} definisce una norma su Rm.

Due norme ‖x‖a ‖x‖b si dicono equivalenti se esistono due costanti m e M tali che m ‖x‖b ≤ ‖x‖a ≤ M ‖x‖b

Vale la relazione

p→lim+∞ ‖x‖p^ =^ ‖x‖∞ Sfruttando la relazione tra le norme, valida per ogni p ≥ 1

‖x‖∞ ≤ ‖x‖p ≤ m

(^1) p ‖x‖∞

si ha che le norme p per p ≥ 1 sono tra loro equivalenti.

Definizione 2.5. Definiamo la distanza tra due punti di Rm^ tramite la formula d(x, y) := ‖x − y‖

d(x, y) := ‖x − y‖ =

∑m

i=

(xi − yi)^2

  • d(x, y) ≥ 0
  • d(x, y) = 0 ⇐⇒ x = y
  • d(x, y) = d(y, x)
  • d(x, y) ≤ d(x, z) + d(z, y)

Definizione 3.3. Un insieme X e chiuso se l’insieme complementare in Rm^e aperto

X e il piu piccolo insieme chiuso che contiene X.

Proposizione 3. ∅ e Rm^ sono chiusi. L’unione di un numero finito di insiemi chiusi e un insieme chiuso. L’intersezione qualunque di insiemi chiusie un insieme chiuso.

Definizione 3.4. K e limitato ⇐⇒ esiste una costante L tale che ‖x‖ < L per ogni x ∈ K Il diametro di Ke definito come

diam(K) = sup{d(x, y), x, y ∈ K}.

Se diam(K) = +∞ diremo che K `e illimitato.

Definizione 3.5. K `e compatto se ∀(xn) ⊂ X esiste una sottosuccessione (xnk ) con lim xnk ∈ X

Teorema 3.6. (Teorema di Heine-Borel) K compatto ⇐⇒ K `e chiuso e limitato

L’intersezione infinita di una famiglia infinita di aperti pu`o non essere aperta. Esempio (− (^1) n , (^) n^1 ). L’intersezione { 0 }: un insieme chiuso. ∅ e Rm^ sono gli unici insiemi che sono sia aperti che chiusi. Ci sono insiemi che non sono n´e aperti n´e chiusi, ad esempio gli intervalli di R a cui appartiene un solo estremo.

  1. Insiemi convessi

Definizione 4.1. Ω ⊂ RN^ si dice convesso se per ogni x e y ∈ Ω,

λx + (1 − λ)y ∈ Ω per ogni λ ∈ [0, 1].

Se Ω contiene x e y, allora contiene tutti i punti del segmento di estremi x e y che indicheremo con [x, y]. Nel piano il cerchio BR(x) e un insieme convesso, mentre una corona circolare none un insieme convesso. In Rm l’insieme Br(a) := {x ∈ Rm^ : ‖x − a‖ < r} `e convesso. Siano x, y ∈ Br(a) allora per λ ∈ [0, 1]

‖λx + (1 − λ)y − a‖ = ‖λ(x − a) + (1 − λ)(y − a)‖ ≤ λ ‖(x − a)‖+(1−λ) ‖y − a)‖ ≤ r

L’intersezione di due insieme convessi e un insieme convesso. Esempio l’intersezione non vuota di un cerchio con un quadrato. L’intersezione di un numero finito di insiemi convessie un insieme con- vesso. Esempi di insieme convessi

  • p non nullo. Iperpiano (insieme chiuso)

H = {x ∈ Rm^ : pT^ x = α}, ossia l’insieme dei vettori di Rm^ ortogonali a p

  • p non nullo. Semispazi (insieme chiuso) H+^ = {x ∈ Rm^ : pT^ x ≥ α}, H− = {x ∈ Rm^ : pT^ x ≤ α}, Un insieme X e un poliedro see intersezione di un numero finito di semis- pazi chiusi e iperpiani. In R^3 un esempio di poliedro `e il cubo. In R^2 i poligoni piani. Verificare che l’insieme {(x, y) : y + x ≤ 1 , x ≥ 0 , y ≥ 0 }

e un sottoinsieme convesso di R^2. Dato un insieme Ω, l’involucro convesso di Ω, co(Ω)e il pi`u piccolo insieme convesso che contiene Ω. Teorema 4.2 (Teorema di separazione). Siano C 1 e C 2 due sottoinsiemi convessi di ⊂ RN^ tali int(C 1 ) ∩ C 2 = ∅. allora esiste p ∈ RN^ , p 6 = 0, tale che (4.1) py ≥ px, ∀x ∈ C 1 , ∀y ∈ C 2

  1. Convergenza 5.1. Successioni.

Definizione 5.1. Una successione (xn) xn ∈ Rm^ `e convergente, se esiste un punto a ∈ Rm, detto limite della successione tale che ‖xn − a‖ → 0 per n → ∞. Diremo anche che (xn) converge ad a, e scriviamo xn → a anche lim xn = a .

Esempio 5.2.

  • Per m = 1 si ha la nozione di convergenza per successioni reali

Definizione 5.3. Una successione (xn) xn ∈ Rm^ `e una successione di Cauchy se ∀ε > 0 ∃ν > 0 tale che ‖xn − xm‖ < ε, ∀n, m > ν Equivalentemente

Definizione 5.4. Una successione (xn) xn ∈ Rm^ e una successione di Cauchy se ∀ε > 0 ∃ν > 0 tale ‖xn+p − xn‖ < ε, ∀n > ν, ∀p ∈ N (Caratterizzazione della convergenza). Sia (xn) xn ∈ Rm, a ∈ Rm^ scrivi- amo xn = (xn 1 ,... , xnm) e a = (a 1 ,... , am). Allora xn → a in Rm^ ⇐⇒ xnk → ak in R, per ciascuna componente k. k = 1,... , m. In Rm^ non valgono piu i risultati che fanno uso della monotonia.

dD : RN^ → R la funzione distanza di x ∈ RN^ dall’insieme chiuso D `e allora definita

dD(x) = min y∈D

|x − y|.

Proposizione 5. Sia D un insieme compatto. Allora dD `e Lipschitz con- tinua (^) ∣ ∣dD(x) − dD(x′)∣∣ (^) ≤ ∣∣x − x′∣∣ (^) ∀x, x′^ ∈ RN^.

Proof. dD(x′) = x′^ − yˆ per qualche ˆy ∈ D allora

dD(x) − dD(x′) ≤ |x − yˆ| −

x′^ − yˆ

x − x′

La dimostrazione segue scambiando il ruolo di x and x′. 

  1. Test degli autovalori Gli autovalori di una matrice simmetrica n × n sono numeri reali che possiamo ordinare dal piu piccolo al piu grande

λ 1 ≤ λ 2 ≤... λn

Teorema 7.1. Se λ 1 e λn sono il piu piccolo e il piu grande autovalore di A allora

(7.1) λ 1 ‖h‖^2 ≤ Ah · h ≤ λn ‖h‖^2 , ∀h ∈ Rn

Introduciamo la forma quadratica

f (h) = Ah · h =

∑^ n

i,j=

ai,j hihj

in

K = {h ∈ Rn^ : ‖h‖ = 1} f (h) e una funzione continua su K (insieme chiuso e limitato). Per il teorema di Weierstrass ammette minimo e massimo in K, siano h 1 e h 2 rispettivamente con f (h 1 ) = m e f (h 2 ) = M. Se h = 0 la (7.1)e ovviamente verificata. Supponiamo h ∈ Rn^ con h 6 = 0. Poniamo

μ =

h ‖h‖

e consideriamo

Aμ · μ =

∑^ n

i,j=

ai,j μiμj.

Si ha μ ∈ K, segue allora

m ≤

∑^ n

i,j=

ai,j μiμj ≤

∑^ n

i,j=

ai,j

hi ‖h‖

hj ‖h‖

‖h‖^2

∑^ n

i,j=

ai,j hihj ≤ M

La funzione g(h) =

‖h‖^2

∑^ n

i,j=

ai,j hihj

in Rn^ \ 0 ammette in h 1 un punto di minimo e in h 2 un punto di massimo. Rimane da dimostrare che m e M sono autovalori di A Ah 1 = mh 1 , Ah 2 = M h 2 , piu esattamente sono il piu piccolo e il pi`u grande autovalore di A. Calcoliamo le derivate parziali della funzione g ∂g ∂hi

( (^) ∑n

i,j

ai,j hihj

∂hi

‖h‖^2

‖h‖^2

∂hi

∑n

i,j=

ai,j hihj

Calcoliamo ∂ ∂hi

‖h‖^2

∂hi

h^21 + h^22 +... h^2 n

2 hi (h^21 + h^22 +... h^2 n)^2

2 hi ‖h‖^4 e utilizzando ai,j = aj,i ( ∂ ∂hi

∑n

i,j=

ai,j hihj

∑^ n

i,j=

aj,ihj.

Da cui si deduce ∂g ∂hi

‖h‖^2

( (^) ∑n

i,j=

aj,ihj −

Ah · h ‖h‖^2

hi

Dg(h 1 ) = 0 ⇐⇒ Ah 1 −g(h 1 )h 1 = 0 Dg(h 2 ) = 0 ⇐⇒ Ah 2 −g(h 2 )h 2 = 0 ossia m = g(h 1 ) e M = g(h 2 ) autovalori per A. Inoltre sono il piu piccolo e il piu grande autovalore come segue facilmente.

  1. Funzioni convesse e concave Definizione 8.1. Sia C un insieme aperto e convesso. f : C → R si dice i) convessa se (8.1) f (λx + (1 − λ)y) ≤, λf (x) + (1 − λ)f (y) ∀x, y ∈ Cλ ∈ [0, 1]. Si dice strettamente convessa se in (8.2) si ha la disuguaglianza stretta per λ ∈ (0, 1) ii) concava se −f e convessa ossia (8.2) λf (x) + (1 − λ)f (y) ≤ f (λx + (1 − λ)y) ∀x, y ∈ C, λ ∈ [0, 1]. Le funzioni affini definite in RN^ sono convesse e concave, un esempio di funzione strettamente convessae f (x) = ‖x‖^2. La funzione f : R → R definita da

(8.3) f (x) =

|x|^2 , x ≥ 0 , |x| x < 0

`e convessa, ma non strettamente convessa.

e

f

( (^) x 1 + x 2 + · · · + xk k

k

f (x 1 ) + f (x 2 ) +... f (xk)

e dimostriamo x 1 + x 2 + · · · + xk + xk+ k + 1

∈ C

e

f

( (^) x 1 + x 2 + · · · + xk + xk+ k + 1

k + 1

f (x 1 )+f (x 2 )+... f (xk)+f (xk+1)

Poniamo

λ =

k k + 1

1 − λ = 1 −

k k + 1

k + 1

allora x 1 + x 2 + · · · + xk + xk+ k + 1

= λ

x 1 + x 2 + · · · + xk k

  • (1 − λ)xk+1 ∈ C

Si ha

f

( (^) x 1 + x 2 + · · · + xk + xk+ k + 1

= f

( (^) x 1 + x 2 + · · · + xk k + 1

k + 1

xk+

e

f

( (^) x 1 + x 2 + · · · + xk + xk+ k + 1

= f

( (^) x 1 + x 2 + · · · + xk k + 1

k + 1

xk+

f

λ

x 1 + x 2 + · · · + xk k

k + 1

xk+

λf

( (^) x 1 + x 2 + · · · + xk k

) + (1 − λ)f (xk+1) ≤

λ

k

f (x 1 ) + f (x 2 ) +... f (xk)

  • (1 − λ)f (xk+1) =

1 k + 1

f (x 1 ) + f (x 2 ) +... f (xk) + f (xk+1)

8.4. Trasformata di Legendre-Fenchel. La trasformata di Legendre e un procedimento che trasforma una funzione convessa a valori reali di vari- abile reale in un’ altra funzione convessa. Sia f : RN^ → R, f ∈ C^2 (RN^ ) e f tale che D^2 f > 0 in C. Allora fe strettamente convessa e la trasformata di Legendre-Fenchel di f `e definita come

(8.5) f ∗(x) = sup y∈RN

[

x · y − f (y)

]

x ∈ RN

Esempio 8.2. 1 − dimensione

f (x) =

x^2

f ∗(x) =

x^2.

In dimensione n siano p.q esponenti coniugati.

f (x) =

p

‖x‖p

con ‖x‖p^ = (x^21 + x^22 + · · · + x^2 n)

p 2

Allora f ∗(x) =

q

‖x‖q^.

Infatti annullando il gradiente si ha

xj − ‖yˆ‖p−^1

yˆj ‖yˆ‖

= 0 ⇐⇒ xj − ‖yˆ‖p−^2 yˆj = 0

Si ricava ‖yˆ‖p−^1 = ‖x‖ ⇐⇒ ‖yˆ‖ = ‖x‖ p−^11 . Perci`o y ˆj = xj ‖x‖−^

p− 2 p− 1 Sostituendo il valore si ottiene

f ∗(x) =

j

xj yˆj −

p

‖ˆy‖p^ =

j

xj xj ‖x‖−^

p− 2 p− (^1) − 1 p

‖x‖

p p− (^1) =

‖x‖^2 ‖x‖−^

p− 2 p− (^1) − 1 p

‖x‖

p p− (^1) =

‖x‖ p−p 1 −

p

‖x‖ p−p 1 =

q

‖x‖q

Esempio 8.3. Sia f (x) = x^2 con x ∈ C = [2, 3]. Per ogni y fissato yx − x^2 e continua in un intervallo compatto. Ne segue cha f ∗^e definite in R. Si ha un punto stazionario 2 x = y con x ∈ [2, 3] ⇐⇒ y = x 2 4 ≤ y ≤ 6 , altrimenti ( 4 > y oppure y > 6 ) il massimo e assunto agli estremi (x = 2 oppure x = 3). In conclusione la trasformatae definita in tutto R e f ∗(y) vale i) 2y − 4 y < 4 ii) y

4 4 4 ≤^ y^ ≤^6 iii) 3y − 9 y > 6

Teorema 8.4. Sia C un insieme aperto e convesso. Sia f : C → R f ∈ C^2 (C) e D^2 f > 0 allora i) Per ogni x, esiste y = y(x) tale che il sup in (8.5) e assunto. ii) f ∗^e convessa. iii) f ∗∗^ = f

8.8. Esempio: Minimo e Massimo assoluti per funzioni di 3 variabili su un insieme chiuso e limitato. f (x, y) = x−y−z in un parallelepipedo (esempio − 1 ≤ x ≤ 1 , − 2 ≤ y ≤ 2 , − 3 ≤ z ≤ 3). Tra tutti i parallelepipedi retti a base rettangolare inscritti in un ellissoide di equazione x^2 a^2

y^2 b^2

z^2 c^2

determinare quello di volume massimo. Se x, y, z indicano i semispigoli si tratta di massimizzare la funzione

f (x, y, z) = 8xyz,

soggetta al vincolo x

2 a^2 +^

y^2 b^2 +^

z^2 c^2 = 1,^ x >^0 , y >^0 , z >^ 0. Il problema pu`o essere scritto nella forma  



maxx,y,z 8 xyz x^2 a^2 +^

y^2 b^2 +^

z^2 c^2 = 1 x > 0 , y > 0 , z > 0

8.9. Metodo di Lagrange. { maxx,y,z 8 xyz x^2 a^2 +^

y^2 b^2 +^

z^2 c^2 = 1

L(x, y, z, λ) = max x,y,z

8 xyz + λ(

x^2 a^2

y^2 b^2

z^2 c^2

Si calcolano i punti stazionari della funzione L   

 

8 yz + (^2) aλx 2 = 0 8 xz + (^2) bλy 2 = 0 8 xy + (^2) cλz 2 = 0 x^2 a^2 +^

y^2 b^2 +^

z^2 c^2 = 1 Si ricava dalla prima equazione

λ = −

4 a^2 yz x  



8 x^2 zb^2 − 8 a^2 y^2 z = 0 8 x^2 yc^2 + 8yz^2 a^2 = 0 x^2 a^2 +^

y^2 b^2 +^

z^2 c^2 = 1 Semplificando (^) 





x^2 a^2 =^

y^2 b^2 x^2 a^2 =^

z^2 c^2 x^2 a^2 +^

y^2 b^2 +^

z^2 c^2 = 1

x^2 =

a^2 3

la cui soluzione positiva `e

x =

a √ 3

Dunque

x =

a √ 3

y =

b √ 3

z =

c √ 3

In generale il problema di minimizzazione per funzioni a valori reali soggetta a m vincoli

min f (x), x ∈ Ω = {x ∈ RN^ : φ 1 (x) = φ 2 (x) = · · · = φm(x) = 0}

L(x, λ) = f (x) +

∑^ m

i=

λiφi(x) = f (x) + λT^ φ(x)

In ipotesi di regolarit`a i punti stazionari sono dati dalla soluzione nelle N +m variabili

DL(x, λ) = Df (x) +

∑^ m

i=

λiDφi(x) = Df (x) + λT^ Dφ(x) = 0

Vediamo le condizioni per il problema di minimizzazione per la forma quadratica

min xT^ Ax, x ∈ Ω = {x ∈ RN^ : Cx = d},

con A definita positiva, C matrice m × n, d ∈ Rm^ m < n di rango m

L(x, λ) = xT^ Ax + λ(Cx − d),

DxL(x, λ) = Ax + CT^ λ = 0 DλL(x, λ) = Cx − d = 0

λ ∈ Rm. Esempio.

8.10. Vincoli di disuguaglianza. Condizioni necessarie (KKT).

min x^2 + y, x ∈ Ω = {x ∈ RN^ : x^2 + y^2 ≤ 4 , x + y ≤ 1 }, L(x, y, λ 1 , λ 2 ) = x^2 + y + λ 1 (x^2 + y^2 − 4) + λ 2 (x + y − 1).

Minimizzazione sotto la condizione x^2 + y^2 ≤ 4 , x + y ≤ 1, λ 1 , λ 2 ≥ 0 λ 1 (x^2 + y^2 − 4) = 0 λ 2 (x + y − 1)=

  • x + y < 1, x^2 + y^2 < 4 il minimo non `e influenzato dai vincoli λ 1 = λ 2 = 0. DxL(x, y, λ) = 2x DyL(x, y, λ) = 1.

Non vi sono punti interni in cui si annulla il gradiente

  • x + y = 1, x^2 + y^2 < 4 il minimo non `e influenzato da un vincolo λ 1 = 0.

DxL(x, y, λ) = 2x + λ 2 DyL(x, y, λ) = 1 + λ 2. 1 + λ 2 = 0 non `e possibile.