Estruturas algébricas básicas, Notas de estudo de Matemática
william-santos-27
william-santos-27

Estruturas algébricas básicas, Notas de estudo de Matemática

85 páginas
50Números de download
1000+Número de visitas
Descrição
PARS ALGEBRISTAS
70 pontos
Pontos de download necessários para baixar
este documento
Baixar o documento
Pré-visualização3 páginas / 85
Esta é apenas uma pré-visualização
3 mostrados em 85 páginas
Esta é apenas uma pré-visualização
3 mostrados em 85 páginas
Esta é apenas uma pré-visualização
3 mostrados em 85 páginas
Esta é apenas uma pré-visualização
3 mostrados em 85 páginas

Caṕıtulo 2

Estruturas Algébricas Básicas

Conteúdo

2.1 Estruturas Algébricas Básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

2.1.1 Álgebras Universais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

2.1.2 Reticulados e Álgebras Booleanas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

2.1.3 Semi-Grupos, Monóides e Grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

2.1.4 Corpos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

2.1.5 Espaços Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

2.1.6 Anéis, Módulos e Álgebras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

2.1.6.1 Anéis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

2.1.6.2 Módulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

2.1.6.3 Álgebras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

2.1.7 Exemplos Especiais de Álgebras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

2.1.7.1 Álgebras de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

2.1.7.2 Álgebras de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

2.1.7.3 Álgebras de Jordan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

2.1.7.4 Álgebras de Grassmann . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

2.1.7.5 Álgebras de Clifford . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

2.1.8 Mais sobre Anéis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

2.1.9 Ações e Representações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

2.1.10 Morfismos, Homomorfismos, Epimorfismos, Isomorfismos, Monomorfismos, Endomorfismos e Au-

tomorfismos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

2.1.11 Induzindo Estruturas Algébricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

2.2 Grupos. Estruturas e Construções Básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

2.2.1 Cosets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

2.2.2 Subgrupos Normais e o Grupo Quociente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

2.2.3 O Centro de um Grupo. Centralizadores e Normalizadores . . . . . . . . . . . . . . . . . . . . . . 93

2.2.4 Grupos Gerados por Conjuntos. Grupos Gerados por Relações . . . . . . . . . . . . . . . . . . . 94

2.2.5 O Produto Direto e o Produto Semi-Direto de Grupos. O Produto Tensorial de Grupos Abelianos 95

2.2.5.1 O Produto Direto de Grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

2.2.5.2 O Produto Semi-Direto Grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

2.2.5.3 Produtos Tensoriais de Grupos Abelianos . . . . . . . . . . . . . . . . . . . . . . . . . . 99

2.3 Espaços Vetoriais. Estruturas e Construções Básicas . . . . . . . . . . . . . . . . . . . . . . 100

2.3.1 Bases Algébricas de um Espaço Vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

2.3.2 O Dual Algébrico de um Espaço Vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

2.3.3 Subespaços e Espaços Quocientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

2.3.4 Somas Diretas de Espaços Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

2.3.5 Produtos Tensoriais de Espaços Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

2.3.5.1 Duais Algébricos e Produtos Tensoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

2.3.5.2 Produtos Tensoriais de um mesmo Espaço Vetorial. Espaços Simétrico e Anti-Simétrico 117

2.3.5.3 O Produto Tensorial de Módulos. Derivações . . . . . . . . . . . . . . . . . . . . . . . . 120

2.4 Anéis e Álgebras. Estruturas e Construções Básicas . . . . . . . . . . . . . . . . . . . . . . 121

2.4.1 Ideais em Anéis e Álgebras Associativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

2.4.1.1 Ideais em Anéis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

2.4.1.2 Ideais em Álgebras Associativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

2.5 Álgebras Tensoriais e Álgebras Exteriores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

2.5.1 Álgebras Tensoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

2.5.2 Álgebras Exteriores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

54

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 55/1507

2.6 Tópicos Especiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

2.6.1 O Grupo de Grothendieck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

2.6.2 Grupóides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

2.6.3 Quatérnios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

A o aprofundar seu estudo de Matemática o estudante freqüentemente depara com conceitos como o de grupo,semi-grupo, espaço vetorial, álgebra, anel, corpo, módulo etc. Nosso objetivo neste caṕıtulo é apresentardefinições básicas de tais conceitos acompanhadas, quando posśıvel, de alguns exemplos relevantes. Nossaintenção não é de forma alguma a de cobrir esses assuntos e seus resultados mais importantes, mas apenas a de introduzir ao leitor noções dessas estruturas algébricas, de modo que o mesmo possa encontrar aqui referências rápidas às mesmas quando delas necessitar. Vários dos tópicos aqui abordados serão desenvolvidos em caṕıtulos posteriores, de modo que, como no caso do Caṕıtulo 1 o objetivo não é um tratamento extensivo dos diversos assuntos. O estudante já familiar com alguns desses conceitos (os conceitos de grupo e álgebra são populares entre estudantes de F́ısica) encontrará nessa exposição uma visão unificada dos mesmos.

Este caṕıtulo deve ser compreendido como uma continuação do Caṕıtulo 1. O leitor pode achar ser este caṕıtulo uma longa seqüência de apenas definições e exemplos, com poucos resultados, o que é parcialmente correto. Seu obje- tivo, porém, é apresentar várias idéias comuns a várias áreas de um ponto de vista unificado e introduzir construções empregadas ulteriormente.

2.1 Estruturas Algébricas Básicas

Ainda atentos ao caráter introdutório apresentaremos aqui definições e exemplos das estruturas algébricas mais comuns.

• Operações e relações Sejam C e I dois conjuntos não-vazios e consideremos o produto Cartesiano CI (o conceito de produto Cartesiano

de conjuntos foi definido à página 27). Uma função f : CI → C é por vezes dita ser uma operação sobre C. Se I é um conjunto finito, f é dita ser uma operação finitária sobre C.

Um conjunto R ⊂ CI é dito ser uma relação em C. Se I é um conjunto finito, R é dito ser uma relação finitária em C.

• Funções finitárias Sejam C e I dois conjuntos e consideremos funções f : CI → C. Se I é um conjunto finito f : CI → C é dita ser uma

função finitária sobre C ou operação finitária sobre C. Sem perda de generalidade consideraremos aqui funções finitárias do tipo f : Cn → C para algum n ∈ N. Se f é uma função finitária para um dado n, f é dita ser uma função n-ária sobre C. Um exemplo de uma função não finitária seria uma função do tipo f : CN → C que a cada seqüência em C associa um elemento de C.

Funções 2-árias serão chamadas aqui de funções binárias e funções 1-árias são chamadas de funções unárias. Funções unárias e binárias são as de maior relevância.

Por vezes iremos falar também de funções 0-árias sobre C, que consistem em funções f : {∅} → C. Uma tal função tem por imagem simplesmente um elemento fixo de C. Exemplos de funções 0-árias sobre R seriam f(∅) = 1 ou f(∅) = 0 ou f(∅) =

√ 2. Freqüentemente denotamos tais funções pelo elemento de C por ela associado. Nos três exemplos acima,

podeŕıamos denotar as funções por 1, 0 ou √ 2, respectivamente.

• Magmas Um conjunto C dotado de uma relação binária C ×C → C é dito ser um magma. Essa nomenclatura foi introduzida

por Bourbaki1 mas não é, porém, universalmente empregada.

1Nicolas Bourbaki. Nome coletivo adotado por um grupo de importantes matemáticos franceses, nascido por volta de 1935, que teve grande, mas declinante, influência na estruturação e sistematização da Matemática ao longo do século XX. O grupo Bourbaki sofreu diversas cŕıticas pelo seu abstracionismo, considerado em certos ćırculos como excessivo e mesmo estéril.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 56/1507

• Relações finitárias Há uma nomenclatura análoga para o caso de relações. Sejam C e I dois conjuntos e consideremos relações R ⊂ CI .

Se I é um conjunto finito R é dita ser uma relação finitária sobre C. Sem perda de generalidade consideraremos aqui relações finitárias do tipo R ⊂ Cn para algum n ∈ N. Se R é uma relação finitária para um dado n, R é dita ser uma relação n-ária sobre C. Para o caso n = 1 as relações são também chamadas de unárias e para o caso n = 2 são ditas binárias. Relações binárias foram estudadas à página 22.

• Estruturas Seja C um conjunto, F uma coleção de operações (não necessariamente finitárias) sobre C e seja R uma coleção de

relações (não necessariamente finitárias) em C. A tripla 〈C, F, R〉 é dita ser uma estrutura sobre C. Note-se que tanto F quanto R podem ser vazias.

Dado que operações sobre um conjunto C também são relações sobre C, a definição de estrutura acima poderia ser simplificada. É porém conveniente mantê-la como está, pois funções são de importância especial.

Uma estrutura 〈C, F〉 é dita ser uma estrutura algébrica e uma estrutura 〈C, R〉 é dita ser uma estrutura relacional.

• Tipos de operações e de relações Ainda um comentário sobre a nomenclatura.

Sejam C e I conjuntos e seja α : CI → C uma operação sobre o conjunto C. A cardinalidade de I é dita ser o tipo da operação α. Assim, uma função n-ária é também dita ser de tipo n. Analogamente, se R ⊂ CI é uma relação em C a cardinalidade de I é dita ser o tipo da relação R.

• Comentários sobre a notação. Notação mesofixa Antes de prosseguirmos, façamos uma observação sobre a notação que é costumeiramente adotada, especialmente

quando se trata de funções binárias.

Dado um conjunto C e uma função binária denotada por um śımbolo φ, a imagem de um par (a, b) ∈ C2 é comummente denotada por φ(a, b). É muito prático, por vezes, usar uma outra notação e denotar φ(a, b) por a φ b. Essa notação é denominada notação mesofixa. Um exemplo claro desse uso está na função soma de dois números complexos, denotada pelo śımbolo + : C2 → C. Denotamos +(z, w) por z + w. Outro exemplo está na função produto de dois números complexos: · : C2 → C. Denotamos ·(z, w) por z · w.

Essa notação será usada adiante para outras funções binárias além das funções soma e produto de números ou matrizes.

Funções unárias também têm por vezes uma notação especial, freqüentemente do tipo exponencial. Tal é o caso da operação que associa a cada elemento de um grupo à sua inversa, g 7→ g−1, ou o caso da operação que associa a cada conjunto o seu complementar A 7→ Ac. Ou ainda o caso da transposição de matrizes M 7→ MT , da conjugação de números complexos z 7→ z∗ para o que usa-se também sabidamente a notação z 7→ z.

• Comutatividade, associatividade e distributividade Uma função binária χ : C2 → C é dita ser comutativa se para quaisquer a e b ∈ C valer

χ(a, b) = χ(b, a) ,

ou seja, na notação mesofixa, se aχb = bχa .

Funções binárias comutativas são freqüentemente chamadas de Abelianas2.

Uma função binária χ : C2 → C é dita ser associativa se para quaisquer a, b e c ∈ C valer

χ(a, χ(b, c)) = χ(χ(a, b), c) ,

ou seja, na notação mesofixa, se aχ(bχc) = (aχb)χc .

2Niels Henrik Abel (1802–1829).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 57/1507

A associatividade permite-nos eliminar os parênteses de expressões como aχ(bχc), que podem ser escritas sem am- bigüidade na forma aχbχc.

Dadas duas funções binárias χ1, χ2 : C 2 → C, dizemos que χ1 é distributiva em relação a χ2 se valer

χ1 ( a, χ2(b, c)

) = χ2

( χ1(a, b), χ1(a, c)

) ou seja, aχ1(bχ2c) = (aχ1b)χ2(aχ1c)

para quaisquer a, b, c ∈ C.

2.1.1 Álgebras Universais

Uma álgebra Universal é constitúıda por um conjunto C e uma coleção F de funções finitárias sobre C. A coleção F não precisa ser finita. Freqüentemente denotaremos uma álgebra universal por 〈C, F〉.

O estudo sistemático das álgebras universais foi iniciado por Withehead3 e Birkhoff4, tendo Boole5, Hamilton6, De Morgan7 e Sylvester8 como precursores. Para uma referência, vide [60]. Vamos a alguns exemplos.

1. Seja C = R e F = {s, m}, onde s e m são duas funções binárias dadas por s : R2 → R, s(x, y) = x + y e m : R2 → R, s(x, y) = x · y.

2. Seja C = Mat(n) (o conjunto das matrizes complexas n× n para um certo n ∈ N) e F = {s, m}, onde s e m são duas funções binárias dadas por s : C2 → C, s(A, B) = A+B e m : C2 → C, s(A, B) = A · B.

3. Seja C o conjunto de todas as matrizes complexas n ×m (para n e m ∈ N) e seja F = {c, s, t} onde c : C → C é a função unária dada por c(A) = A (a matriz complexo-conjugada de A), s : C2 → C é a função binária dada por s(A, B) = A + B e t : C3 → C é a função 3-ária dada por t(A, B, C) = ABTC, onde BT é a transposta da matriz B.

Algumas álgebras universais com propriedades especiais de importância em Matemática recebem denominações próprias e são chamadas de grupos, semi-grupos, anéis, corpos etc. Vamos introduźı-las adiante. Em todos elas as funções de F são 0-árias, unárias ou binárias.

Algumas estruturas freqüentemente encontradas, como espaços vetoriais, álgebras e módulos, não se enquadram exatamente no conceito de álgebra universal, mas podem ser encarados como constitúıdos por pares de álgebras universais dotadas de uma ação de uma das álgebras universais sobre a outra. A noção abstrata de ação de uma álgebra universal sobre uma outra álgebra universal será vista mais adiante.

A leitura do restante desta subseção sobre álgebras universais pode ser omitida pois não afetará o que segue.

• Morfismos entre álgebras universais Sejam 〈A, A〉 e 〈B, B〉 duas álgebras universais. Uma função ∆ : A → B é dita preservar o tipo das operações de A

se para todo α ∈ A a operação ∆(α) ∈ B tiver o mesmo tipo que a operação α. Assim, uma aplicação que preserva o tipo leva aplicações unárias em unárias, aplicações binárias em binárias etc.

Um morfismo da álgebra universal 〈A, A〉 na álgebra universal 〈B, B〉 é um par de aplicações 〈D, ∆〉 comD : A → B e ∆ : A → B, onde ∆ é uma aplicação que preserva o tipo e de tal forma que para todo α ∈ A tenhamos

D ◦ α = ∆(α) ◦D

como aplicações An → B, onde n é o tipo de α. Isso significa que para todo α ∈ A temos

D(α(a1, . . . , an)) = ∆(α)(D(a1), . . . , D(an))

3Alfred North Withehead (1861–1947). 4George David Birkhoff (1884–1944). 5George Boole (1815–1864). 6William Rowan Hamilton (1805–1865). 7Augustus De Morgan (1806–1871). 8James Joseph Sylvester (1814–1897).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 58/1507

para toda (a1, . . . , an) ∈ An, n sendo o tipo de α. Exemplo. Sejam as álgebras universais 〈R+, {·, 1}〉 e 〈R, {+, 0}〉 com as definições usuais e seja o par 〈 ln, L〉,

onde ln : R+ → R é o logaritmo Neperiano9 e L : {·, 1} → {+, 0} dado por L(·) = +, L(1) = 0. Então 〈 ln, L〉 é um morfismo de 〈R+, {·, 1}〉 em 〈R, {+, 0}〉, dado que para todo a, b ∈ R+ vale

ln(a · b) = ln(a) + ln(b).

• Ações de uma álgebra universal sobre uma outra álgebra universal Por razões de completeza apresentaremos aqui a noção geral de ação de uma álgebra universal sobre uma outra.

Vamos começar com algumas definições. Sejam A e B dois conjuntos e seja uma função G : A×B → B. Para todo n, m ∈ N definamos

G(n, 1) : An ×B → Bn tal que (a1, . . . , an, b) 7→ (G(a1, b), . . . , G(an, b)) com ai ∈ A, b ∈ B.

Para todo m, m ∈ N definamos G(1, m) : A×Bm → Bm tal que (a, b1, . . . , bm) 7→ (G(a, b1), . . . , G(a, bm))

com a ∈ A, bi ∈ B. Para um conjunto C qualquer idC : C → C denota a identidade em C: idC(c) = c, ∀c ∈ C. Fora isso, se γ : C → C é

uma aplicação, denotaremos por γ(n) : An → An a aplicação tal que γ(n)(c1, . . . , cn) = (γ(c1), . . . , γ(cn)). Finalmente, para duas aplicações α : An → A e β : Bm → B o par (α, β) denota a aplicação An × Bm → A × B

dada por (α, β)(a1, . . . , an, b1, . . . , bm) = (α(a1, . . . , an), β(b1, . . . , bm))).

Com isso podemos formular a definição desejada de ação de uma álgebra universal sobre uma outra.

Sejam 〈A, A〉 e 〈B, B〉 duas álgebras universais. Uma ação de 〈A, A〉 sobre 〈B, B〉 é um par 〈G, Γ〉 onde G : A×B → B e Γ : A → B

são aplicações tais que Γ preserva tipos e as seguintes condições são válidas: Para quaisquer α ∈ A e β ∈ B (cujos tipos serão n e m, respectivamente) tem-se que

G ◦ (α, β) = Γ(α) ◦G(n, 1) ◦ (idAn , β) = β ◦G(1, m) ◦ (α, idBm) (2.1) como aplicações An ×Bm → B.

De (2.1) segue que G ◦ (α, idB) = Γ(α) ◦G(n, 1) ◦ (idAn , idB) (2.2)

e G ◦ (idA, β) = β ◦G(1, m) ◦ (idA, idBm) . (2.3)

E. 2.1 Exerćıcio. Mostre isso. 6

De (2.2) e (2.3) segue que

G(n, 1) ◦ (idAn , β) = (

β ◦G(1, m) )(n)

◦ j (2.4) e

G(1, m) ◦ (α, idBm) = (

Γ(α) ◦G(n, 1) )(m)

◦ k , (2.5) onde j : An ×Bm → (A×Bm)n é dada por

j(a1, . . . , an, b1, . . . , bm) := (a1, b1, . . . , bm, a2, b1, . . . , bm, . . . , an, b1, . . . , bm)

e k : An ×Bm → (An ×B)m é dada por k(a1, . . . , an, b1, . . . , bm) := (a1, . . . , an, b1, a1, . . . , an, b2, . . . , a1, . . . , an, bm) .

9John Napier (Neper ou Nepair) (1550–1617).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 59/1507

E. 2.2 Exerćıcio. Mostre isso. 6

Das relações (2.4) e (2.5) segue que a condição (2.1) pode ser escrita como

G ◦ (α, β) = Γ(α) ◦ (

β ◦G(1, m) )(n)

◦ j = β ◦ (

Γ(α) ◦G(n, 1) )(m)

◦ k . (2.6)

Observação. Acima estamos considerando idA, idB, como elementos de A, respectivamente de B, o que sempre pode ser feito sem perda de generalidade.

2.1.2 Reticulados e Álgebras Booleanas

• Reticulados Um reticulado10 é uma álgebra universal constitúıda por um conjunto não-vazio C e duas funções binárias denotadas

por ∧ e ∨ (lê-se “e” e “ou”, respectivamente), dotadas as seguintes propriedades, válidas para todos a, b e c ∈ C (usaremos a notação mesofixa):

1. Idempotência: a ∧ a = a , a ∨ a = a .

2. Comutatividade: a ∧ b = b ∧ a , a ∨ b = b ∨ a .

3. Associatividade: a ∧ (b ∧ c) = (a ∧ b) ∧ c , a ∨ (b ∨ c) = (a ∨ b) ∨ c .

4. Absorvência11: a ∧ (a ∨ b) = a , a ∨ (a ∧ b) = a .

Um reticulado em um conjunto C é dito ser um reticulado sobre C. Vamos a exemplos de reticulados.

Exemplo 2.1 Seja C = P(B), para algum conjunto não-vazio B e sejam as funções binárias ∧ e ∨ definidas para todos a, b ⊂ B, por a ∧ b = a ∩ b, a ∨ b = a ∪ b. ◊ Exemplo 2.2 Seja C = R e sejam as funções binárias ∧ e ∨ definidas para todos a, b ∈ R, por

a ∧ b := min{a, b} = 1 2

(

a+ b− ∣ ∣a− b

∣ ∣

)

,

a ∨ b := max{a, b} = 1 2

(

a+ b+ ∣ ∣a− b

∣ ∣

)

.

Exemplo 2.3 Este exemplo generaliza o Exemplo 2.2. Seja X um conjunto não-vazio e C = RX , o conjunto de todas as funções reais definidas em X . Para duas funções f, g : X → R defina-se duas novas funções f ∧ g e f ∨ g por

(f ∧ g)(x) := min{f(x), g(x)} = 1 2

(

f(x) + g(x)− ∣ ∣f(x)− g(x)

∣ ∣

)

,

(f ∨ g)(x) := max{f(x), g(x)} = 1 2

(

f(x) + g(x) + ∣ ∣f(x)− g(x)

∣ ∣

)

.

10Denominado “lattice” em inglês e “Verband” em alemão. 11Também denominada “Amalgamento”. O estudante deve observar que essa é a única propriedade das listadas acima que relaciona ambas

as operações ∧ e ∨.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 60/1507

Exemplo 2.4 Uma outra generalização do Exemplo 2.2. Seja C um conjunto linearmente ordenado (a definição está à página 31) e sejam as funções binárias ∧ e ∨ definidas para todos a, b ∈ C, por

a ∧ b = {

a, se a  b , b, de outra forma ,

a ∨ b = {

a, se a  b , b, de outra forma .

E. 2.3 Exerćıcio. Mostre que cada um dos exemplos acima compõe um reticulado. 6

• Reticulados e relações de ordem O Exemplo 2.4, acima, mostra-nos que é posśıvel constituir um reticulado a partir de uma relação de ordem total.

Reciprocamente, é posśıvel construir uma relação de ordem parcial a partir de um reticulado. Para tratar disso (e para futura referência), enunciemos e provemos o seguinte lema:

Lema 2.1 Seja C um conjunto não-vazio, o qual constitui um reticulado com duas operações binárias e . Então, dois elementos x, y ∈ C satisfazem a igualdade x = x ∧ y se e somente se satisfizerem também y = x ∨ y. 2

Prova. Se x e y ∈ C satisfazem x = x∧ y, então segue que x∨ y = (x∧ y)∨ y = y, sendo que na última igualdade usamos as propriedades de comutatividade e absorvência. Analogamente, se y = x ∨ y, segue que x ∧ y = x ∧ (x ∨ y) = x, onde novamente usamos as propriedades de comutatividade e absorvência.

Essas observações do Lema 2.1, adicionadas à inspiração do Exemplo 2.4, induzem-nos à seguinte definição de uma relação de ordem parcial em C: dizemos que x  y se e somente se x = x ∧ y ou, equivalentemente, se e somente se y = x ∨ y.

Precisamos agora justificar dizer que se trata de uma relação de ordem parcial, provando serem válidas as propriedades de reflexividade, transitividade e anti-simetria listadas à página 31. Notemos que, pela propriedade de idempotência, vale x = x ∧ x para todo x ∈ C e, portanto, x  x para todo x ∈ C. Essa é a propriedade de reflexividade da ordem parcial. Notemos também que se x, y e z ∈ C têm as propriedades x = x ∧ y e y = y ∧ z, segue que x = x ∧ y = x ∧ (y ∧ z) = (x ∧ y) ∧ z = x ∧ z, onde usamos a propriedade de associatividade. Logo, provamos que se x  y e y  z vale x  z. Essa é a propriedade de transitividade da ordem parcial. Por fim, se x = x∧ y e y = y ∧ x, a propriedade de comutatividade diz-nos que x = x ∧ y = y. Assim, provamos que se x  y e y  x vale x = y. Essa é a propriedade de anti-simetria da ordem parcial.

E. 2.4 Exerćıcio. Estude as relações de ordem que advêm dos Exemplos 2.1 e 2.3 e constate que são relações de ordem parciais, não totais (exceto no caso em que C tem apenas um elemento). 6

• Reticulados limitados superiormente. Reticulados limitados inferiormente Um reticulado C é dito ser limitado superiormente se tiver um máximo, ou seja, se existir ω ∈ C tal que x  ω para

todo x ∈ C, o que equivale a dizer que x = x ∧ ω para todo x ∈ C. Um reticulado C é dito ser limitado inferiormente se tiver um máximo, ou seja, se existir α ∈ C tal que α  x para

todo x ∈ C, o que equivale a dizer que x = x ∨ α para todo x ∈ C. Essas definições coincidem, como veremos, com as definições de unidade e elemento nulo de um reticulado que

apresentaremos adiante.

• Unidade e elemento nulo de um reticulado Caso um reticulado C possua um elemento e tal que x ∧e = x para todo x ∈ C o elemento e é dito ser uma identidade

ou unidade do reticulado, e é freqüentemente denotado pelo śımbolo 1. Pelo Lema 2.1, a relação x ∧ 1 = x é válida se e somente se 1 = x ∨ 1.

Caso um reticulado C possua um elemento z tal que x ∨ z = x para todo x ∈ C o elemento z é dito ser um elemento nulo do reticulado, e é freqüentemente denotado pelo śımbolo 0. Pelo Lema 2.1, a relação x∨ 0 = x é válida se e somente se 0 = x ∧ 0.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 61/1507

Assim, se existirem unidade e elemento nulo teremos

x = x ∧ 1 , 1 = x ∨ 1 , x = x ∨ 0 e 0 = x ∧ 0 (2.7)

para todo x ∈ C. A unidade e o elemento nulo, se existirem, são únicos. Se fato, se 1 e 1′ são unidades de um reticulado C então, por

definição, 1 ∧ 1′ = 1, mas também 1′ ∧ 1 = 1′, provando (pela comutatividade) que 1 = 1′. Analogamente, se 0 e 0′ são elementos nulos de um reticulado C então, também por definição, 0 ∨ 0′ = 0, mas também 0′ ∨ 0 = 0′, provando (pela comutatividade) que 0 = 0′.

Como dissemos acima, podemos associar naturalmente uma relação de ordem parcial  a um reticulado dizendo que x  y se e somente se x = x∧ y ou, equivalentemente, se y = y ∨ x. Se C possui uma unidade 1 teremos x  1 para todo x ∈ C, pois x = x∧ 1. Analogamente, se Se C possui um elemento nulo 0 teremos 0  x para todo x ∈ C, pois x = x∨ 0.

Vemos com isso que 1 é o máximo e 0 o mı́nimo do reticulado (se existirem).

• Reticulados limitados Um reticulado que for limitado superiormente e inferiormente é dito ser um reticulado limitado. Assim, um reticulado

é limitado se possuir uma unidade e um elemento nulo (ou seja, um máximo e um mı́nimo).

Em um reticulado limitado C vale 0  x  1 para todo x ∈ C. Se em um reticulado C tivermos 0 = 1, valerá, portanto, x = 0 = 1 para todo x ∈ C, ou seja, C possui um único elemento. Um tal caso é totalmente trivial, de forma que sempre consideraremos 0 6= 1.

• Reticulados completos Um reticulado é dito ser um reticulado completo se todo seu subconjunto não-vazio possuir um supremo e um

ı́nfimo (em relação à relação de ordem parcial ). Para as definições de supremo e ı́nfimo, vide página 35 e seguintes. Naturalmente, reticulados completos devem ser limitados.

A coleção de todas as topologias definidas em um conjunto não-vazio constitui um reticulado completo. Vide Exerćıcio E. 22.20, página 1006.

• Elementos complementares Seja C um reticulado limitado (ou seja, que possui uma unidade e um elemento nulo). Dizemos que dois elementos

x, y ∈ C são complementares se x ∧ y = 0 e x ∨ y = 1 .

Em um tal caso dizemos que x é complementar a y e vice-versa. Elementos complementares não são necessariamente únicos, ou seja, se y é complementar a x pode haver y′ 6= y que também é complementar a x. Como veremos, uma condição suficiente para garantir a unicidade (não a existência!) do complementar de um elemento x é a propriedade distributiva.

Pela definição de unidade e de elemento nulo, valem 0 = 0∧ 1 e 1 = 1∨ 0. Essas relações estão dizendo que 0 e 1 são elementos complementares.

• Reticulados complementados Um reticulado no qual todo elemento possui ao menos um complementar é dito ser um reticulados complementado.

• Reticulados distributivos Um reticulado sobre um conjunto C é dito ser um reticulado distributivo se as operações ∧ e ∨ forem distributivas

uma em relação à outra, ou seja, se forem satisfeitas as propriedades

a ∧ (b ∨ c) = (a ∧ b) ∨ (a ∧ c)

e a ∨ (b ∧ c) = (a ∨ b) ∧ (a ∨ c) .

para todos a, b e c ∈ C.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 62/1507

E. 2.5 Exerćıcio. Nos Exemplos 2.1–2.4, acima, quais reticulados são distributivos? Quais não são? 6

• Reticulados limitados e distributivos Em um reticulado distributivo e limitado C, o complementar de um elemento x ∈ C, se existir, é único. De fato, se

y e y′ ∈ C são complementares a x, teremos 0 = x ∧ y = x ∧ y′ e 1 = x ∨ y = x ∨ y′. Agora,

y = y ∧ 1 = y ∧ (x ∨ y′) distrib.= (y ∧ x) ∨ (y ∧ y′) = 0 ∨ (y ∧ y′) = y ∧ y′

e, analogamente,

y′ = y′ ∧ 1 = y′ ∧ (x ∨ y) distrib.= (y′ ∧ x) ∨ (y′ ∧ y) = 0 ∨ (y′ ∧ y) = y′ ∧ y ,

provando que y = y ∧ y′ = y′. Em um reticulado distributivo e limitado, o complementar (único!) de um elemento x ∈ C, se existir, é denotado

pelo śımbolo ∁x, pelo śımbolo ¬x ou ainda pelo śımbolo xc. Se ¬x é o complementar de x, é evidente que ¬x tem um complementar, a saber, x. Logo, ¬(¬x) = x sempre que ¬x

existir. É importante notar também que, pelo comentado acima, valem ¬0 = 1 e ¬1 = 0.

• Reticulados limitados, complementados e distributivos Se além de distributivo e limitado o reticulado for também complementado haverá um complementar único para cada

elemento de C e, portanto, haverá uma função unária ¬ : C → C que a cada x ∈ C associa o seu complementar ¬x. Como vimos, vale nesse caso ¬(¬x) = x para todo x ∈ C, assim como valem as relações ¬0 = 1 e ¬1 = 0.

Um reticulado limitado, complementado e distributivo é dito ser uma álgebra Booleana.

• Álgebras Booleanas Uma álgebra Booleana12 é uma álgebra universal formada por um conjunto B e por uma famı́lia F de cinco funções

finitárias: duas binárias, denotadas por ∧ e ∨, uma função unária, denotada por ¬ ou pelo śımbolo ∁, e denominada “negação” ou “complemento”, e duas funções 0-árias, denotadas genericamente por 0 e 1 (denominadas, obviamente, “zero” e “um”), as quais representam elementos fixos distintos de B. As funções acima são supostas satisfazer aos seguintes requisitos:

1. B, ∧ e ∨ formam um reticulado distributivo.

2. Para todo a ∈ B vale que 1 ∧ a = a e que 0 ∨ a = a.

3. Para todo a ∈ B vale que a ∧ (¬a) = 0 e que a ∨ (¬a) = 1.

Por vezes, denota-se ¬a por ∁a ou por ac. Tal uso é comum em operações envolvendo conjuntos. Novamente, tem-se pelas definições que ¬0 = 1, ¬1 = 0 e ¬ (¬a) = a para todo a ∈ B.

• Regras de De Morgan Em uma álgebra Booleana B valem para todos a, b ∈ B as importantes relações

¬(a ∧ b) = (¬a) ∨ (¬b) e ¬(a ∨ b) = (¬a) ∧ (¬b) , (2.8)

as quais são conhecidas como regras de De Morgan13.

A segunda relação em (2.8) é decorrência da primeira, como se vê trocando a → ¬a e b → ¬b. Por isso, basta provar a primeira, o que significa provar que

(

(¬a) ∨ (¬b) )

∧ (a ∧ b) = 0 e (

(¬a) ∨ (¬b) )

∨ (a ∧ b) = 1 . (2.9)

12George Boole (1815–1864). 13Augustus De Morgan (1806–1871).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 63/1507

Ambas decorrem da comutatividade, da associatividade, da distributividade e das relações (2.7). Para provar a primeira relação em (2.9), temos

(

(¬a) ∨ (¬b) )

∧ (a ∧ b) associat.= [(

(¬a) ∨ (¬b) )

∧ a ]

∧ b

distribut. =

[(

(¬a) ∧ a )

∨ (

(¬b) ∧ a )]

∧ b

= [

0 ∨ (

(¬b) ∧ a )]

∧ b

(2.7) =

(

(¬b) ∧ a )

∧ b comutat.= b ∧ (

(¬b) ∧ a )

associat. =

(

b ∧ (¬b) )

∧ a = 0 ∧ a (2.7)= 0 .

Para provar a segunda relação em (2.9), temos (

(¬a) ∨ (¬b) )

∨ (a ∧ b) associatt.= (¬a) ∨ (

(¬b) ∨ (a ∧ b) )

distribut. = (¬a) ∨

[(

(¬b) ∨ a )

∧ (

(¬b) ∨ b )]

= (¬a) ∨ [(

(¬b) ∨ a )

∧ 1 ]

(2.7) = (¬a) ∨

(

(¬b) ∨ a )

comutat. = (¬a) ∨

(

a ∨ (¬b) )

associatt. =

(

(¬a) ∨ a )

∨ (¬b) = 1 ∨ (¬b) (2.7)= 1 .

• Exemplos básicos de álgebras Booleanas Exemplo 2.5 Seja A um conjunto não-vazio e tomemos B = P(A). Para a, b ∈ P(A) definamos a∧b = a∩b, a∨b = a∪b, ¬a = ∁a = A \ a, 0 = ∅, 1 = A. ◊ Exemplo 2.6 A menor álgebra Booleana, e talvez uma das mais importantes em aplicações, é composta por dois elementos distintos, denotados por 0 e 1: B = {0, 1} e as operações ∧, ∨ e ¬ são dadas por

0 ∧ 0 = 0 , 0 ∧ 1 = 0 , 1 ∧ 0 = 0 , 1 ∧ 1 = 1 , 0 ∨ 0 = 0 , 0 ∨ 1 = 1 , 1 ∨ 0 = 1 , 1 ∨ 1 = 1 ,

e por ¬0 = 1 e ¬1 = 0. ◊ Exemplo 2.7 B = [0, 1] ⊂ R, as operações ∧, ∨ são dadas como no Exemplo 2.2, página 59:

a ∧ b := min{a, b} e a ∨ b := max{a, b}

para todos a, b ∈ [0, 1] e a operação ¬ é dada por ¬a = 1− a para todo a ∈ [0, 1]. Naturalmente, o elemento nulo é o número 0 e a unidade é o número 1. ◊

Exemplo 2.8 O mesmo que o anterior, mas tomando B como sendo qualquer subconjunto de [0, 1] que contenha 0 e 1. ◊

Exemplo 2.9 Seja X um conjunto não-vazio e seja I qualquer subconjunto de [0, 1] que contenha 0 e 1. Seja B = IX , a coleção de todas as funções de X em I. Como no Exemplo 2.3, página 59, defina-se para cada x ∈ X

(f ∧ g)(x) = min{f(x), g(x)} e (f ∨ g)(x) = max{f(x), g(x)}

e defina-se (¬f)(x) = 1 − f(x). Tome-se o elemento nulo como sendo a função identicamente nula e a unidade como sendo a função identicamente igual a 1. ◊

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 64/1507

E. 2.6 Exerćıcio. Mostre que os sistemas definidos nos exemplos acima formam álgebras Booleanas. 6

* ** *

A relevância das álgebras Booleanas está em capturarem algebricamente as operações mais importantes da teoria dos conjuntos (como as de união, intersecção e complemento, conjunto vazio) e as da lógica (“e”, “ou”, “negação”, “verdadeiro”, “falso”). Os dois primeiros exemplos acima atestam essa concepção. Álgebras Booleanas são de fácil implementação em Eletrônica e de amplo uso em processamento digital.

2.1.3 Semi-Grupos, Monóides e Grupos

Nesta seção introduziremos algumas noções algébricas de grande importância.

• Quase-grupos e loops Um quase-grupo é um conjunto Q, dotado de uma operação binária Q×Q → Q, denotada por “·”, tal que para todo

par a e b ∈ Q existem x e y ∈ Q, únicos, satisfazendo x · a = b e a · y = b. Em palavras, um quase-grupo é uma estrutura onde a “divisão”, à esquerda e à direita, é sempre posśıvel.

Um loop L é um quase-grupo com elemento neutro, ou seja, é um quase-grupo no qual existe um elemento e, denominado identidade, tal que a · e = e · a = a para todo a ∈ L.

O elemento neutro de um loop é sempre único, pois se e′ é também um elemento neutro, segue que e′ = e′ · e = e. Em um loop, todo elemento possui uma única inversa à direita e uma única inversa à esquerda (não necessariamente

iguais). Ou seja, para cada a ∈ L existem um único elemento em L que denotamos por a−1l , denominado inverso à esquerda de a, tal que a−1l · a = e e um único elemento em L que denotamos por a−1r , denominado inverso à direita de a, tal que a · a−1r = e. A existência e unicidade de tais elementos é conseqüência da propriedade definidora de quase-grupo.

• Semi-grupos Um semi-grupo é um conjunto não-vazio S dotado de uma operação binária S×S → S denotada por “·” e denominada

produto tal que a seguinte propriedade é satisfeita.

1. Associatividade. Para todos a, b e c ∈ S vale (a · b) · c = a · (b · c).

• Monóides Ummonóide é um conjunto não-vazioM dotado de uma operação bináriaM×M → M denotada por “·” e denominada

produto tal que as seguintes propriedades são satisfeitas.

1. Associatividade. Para todos a, b e c ∈ M vale (a · b) · c = a · (b · c). 2. Elemento neutro. Existe um (único!) elemento e ∈ M , denominado elemento neutro, tal que g · e = e · g = g para

todo g ∈ M .

Observação: A unicidade do elemento neutro é garantida pela observação que se houvesse e′ ∈ M tal que g · e′ = e′ · g = g para todo g ∈ M teŕıamos e′ = e′ · e = e.

• Grupos Uma das noções mais fundamentais de toda a Matemática é a de grupo. Um grupo é um conjunto não-vazio G

dotado de uma operação binária G×G → G, denotada por “·” e denominada produto, e de uma operação unária G → G (bijetora) denominada inversa, denotada pelo expoente “−1”, tais que as seguintes propriedades são satisfeitas.

1. Associatividade. Para todos a, b e c ∈ G vale (a · b) · c = a · (b · c). 2. Elemento neutro. Existe um (único!) elemento e ∈ G, denominado elemento neutro, tal que g · e = e · g = g para

todo g ∈ G.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 65/1507

3. Inversa. Para cada g ∈ G existe um (único!) elemento h ∈ G tal que g ·h = h · g = e. Esse elemento é denominado a inversa de g e denotado por g−1.

Observações elementares:

1. A unicidade do elemento neutro é garantida pela observação que se houvesse e′ tal que g · e′ = e′ · g = g para todo g ∈ G teŕıamos e′ = e′ · e = e.

2. Analogamente se estabelece a unicidade da inversa, pois se g, h ∈ G são tais que h · g = g · h = e, teremos, usando a associatividade, g−1 = g−1 · e = g−1 · (g · h) = (g−1 · g) · h = e · h = h.

3. A função G ∋ g 7→ g−1 ∈ G, que associa cada elemento de G à sua inversa, é um exemplo de uma função unária.

4. Como e · e = e, segue que e−1 = e.

5. Para todo g ∈ G vale (g−1)−1 = g pois, usando a associatividade,

(g−1)−1 = ( g−1)−1 · e = (g−1)−1 · (g−1 · g) = ((g−1)−1 · g−1) · g = e · g = g .

6. Todo grupo é, trivialmente, um quase-grupo, um loop, um semi-grupo e um monóide.

Um grupo é dito ser comutativo ou Abeliano14 se a · b = b · a para todos a, b ∈ G. Essa nomenclatura se aplica também a semi-grupos e monóides.

É evidente que todo grupo é um monóide e que todo monóide é um semi-grupo.

Existe uma construção canônica devida a Grothendieck, que discutimos à página 131, que permite construir um grupo Abeliano a partir de um semi-grupo Abeliano dado. Essa construção é importante em várias áreas da Matemática. O leitor interessado poderá passar sem perda à discussão da página 131.

• Exemplos simples

1. O conjunto S = {1, 2, 3, . . .} é um semi-grupo em relação à operação de soma usual. O conjunto M = {0, 1, 2, 3, . . .} é um monóide em relação à operação de soma usual, sendo o elemento neutro e = 0. O conjunto G = Z = {. . . , −2, −1, 0, 1, 2, . . .} é um grupo em relação à operação de soma usual, sendo o elemento neutro e = 0 e a inversa n−1 = −n.

2. R dotado da operação de multiplicação usual é um monóide onde o elemento neutro é o número 1. Não é um grupo, pois 0 não tem inversa multiplicativa.

3. O conjunto {x ∈ R, x > 0} é um semi-grupo Abeliano em relação à operação de soma, mas não é um monóide.

4. O conjunto R+ = {x ∈ R, x ≥ 0} é um monóide Abeliano em relação à operação de soma mas não um grupo.

5. O conjunto dos números inteiros Z é um grupo Abeliano em relação à operação usual de soma de números inteiros. Esse grupo é comummente denotado por (Z, +), para lembrar o conjunto considerado (no caso, Z) e a operação considerada nesse conjunto (no caso, +) .

6. O conjunto dos números racionais Q é um grupo Abeliano em relação à operação usual de soma de números racionais. Esse grupo é comummente denotado por (Q, +).

7. O conjunto Q \ {0} = {r ∈ Q, r 6= 0} é um grupo Abeliano em relação à operação usual de produto de números racionais. Esse grupo é comummente denotado por (Q, ·).

8. O conjunto dos números reais R é um grupo Abeliano em relação à operação usual de soma de números reais. Esse grupo é comummente denotado por (R, +).

9. O conjunto dos números complexos C é um grupo Abeliano em relação à operação usual de soma de números complexos. Esse grupo é comummente denotado por (C, +).

14Niels Henrik Abel (1802–1829).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 66/1507

10. O conjunto R \ {0} = {x ∈ R, x 6= 0} é um grupo Abeliano em relação à operação usual de produto de números reais. Esse grupo é comummente denotado por (R, ·).

11. O conjunto C \ {0} = {z ∈ C, z 6= 0} é um grupo Abeliano em relação à operação usual de produto de números complexos. Esse grupo é comummente denotado por (C, ·).

12. Mat(C, n), o conjunto das matrizes complexas n× n com o produto usual de matrizes é apenas um monóide.

13. Mat(C, n), o conjunto das matrizes complexas n× n é um grupo em relação à operação de soma de matrizes.

14. O conjunto GL(R, n) de todas as matrizes reais n× n com determinante não-nulo (e, portanto, inverśıveis) é um grupo em relação à operação de produto usual de matrizes. GL(R, n) é não-Abeliano se n > 1.

15. O conjunto GL(C, n) de todas as matrizes complexas n× n com determinante não-nulo (e, portanto, inverśıveis) é um grupo em relação à operação de produto usual de matrizes. GL(C, n) é não-Abeliano se n > 1.

16. O conjunto GL(Q, n) de todas as matrizes racionais n× n com determinante não-nulo (e, portanto, inverśıveis) é um grupo não-Abeliano (se n > 1) em relação à operação de produto usual de matrizes. O conjunto GL(Z, n) de todas as matrizes inteiras n× n com determinante não-nulo (e, portanto, inverśıveis) é um monóide não-Abeliano (se n > 1) em relação à operação de produto usual de matrizes. Não é um grupo pois a inversa de uma matriz inverśıvel com entradas inteiras não é sempre uma matriz com entradas inteiras.

17. O conjunto SL(C, n) de todas as matrizes complexas n × n com determinante igual a 1 (e, portanto, inverśıveis) é um grupo não-Abeliano (se n > 1) em relação à operação de produto usual de matrizes. O mesmo é verdadeiro para SL(R, n), SL(Q, n) e SL(Z, n), as matrizes reais, racionais ou inteiras, respectivamente, com determinante igual a 1.

18. O conjunto de todas as matrizes complexas n×n cujo determinante têm módulo igual a 1: {A ∈ Mat (C, n)| | det(A)| = 1}. é um grupo não-Abeliano (se n > 1) em relação à operação de produto usual de matrizes.

19. Seja X um conjunto não-vazio. Então P(X) é um grupo Abeliano em relação à operação de diferença simétrica A△B, A, B ∈ X , definida em (1.2), página 22. De fato, o Exerćıcio E. 1.2, página 22, garante associatividade e comutatividade, o elemento neutro é o conjunto vazio ∅ e para todo A ∈ P(X) tem-se A−1 = A. Verifique!

20. Outro exemplo importante é o seguinte. Seja C um conjunto não-vazio e tomemos S = CC , o conjunto de todas as funções de C em C. Então, S é um monóide com o produto formado pela composição de funções: f ◦ g, e onde o elemento neutro é a função identidade id(s) = s, ∀s ∈ C. O subconjunto de CC formado pelas funções bijetoras de C em C é um grupo não-Abeliano, onde o produto é a composição de funções, o elemento neutro é a função identidade e o elemento inverso de uma função f : C → C é a função inversa f−1. Esse grupo é denominado grupo de permutações do conjunto C e denotado por Perm(C).

E. 2.7 Exerćıcio. Em caso de dúvida, prove todas as afirmações acima. 6

• Subgrupos Seja G um grupo em relação a uma operação “·” e cujo elemento neutro seja e. Um subconjunto H de G é dito ser

um subgrupo de G se for também por si só um grupo em relação à mesma operação, ou seja, se

1. e ∈ H ,

2. h1 · h2 ∈ H para todos h1 ∈ H e h2 ∈ H ,

3. h−1 ∈ H para todo h ∈ H .

Todo grupo G sempre possui pelo menos dois subgrupos: o próprio G e o conjunto {e} formado apenas pelo elemento neutro de G.

É fácil verificar que (Z, +) e (Q, +) são subgrupos de (R, +). É fácil ver que SL(R, n), o conjunto de todas as matrizes reais n × n com determinante igual a 1, é um subgrupo de GL(R, n). Idem para SL(C, n) em relação a GL(C, n).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 67/1507

• Os grupos Zn O bem conhecido algoritmo de Euclides afirma que, dado n ∈ N, então todo número inteiro z pode ser escrito de

maneira única na forma z = qn+ r, onde q ∈ Z e r ∈ {0, 1, . . . , n− 1}. O número r é denominado resto da divisão de z por n e é também denotado por r = z mod n.

Seja n um inteiro positivo maior ou igual a 2 e seja o conjunto {0, 1, . . . , n−1}. Vamos definir uma operação binária em {0, 1, . . . , n− 1}, denominada soma e denotada pelo śımbolo “+”, da seguinte forma:

α+ β = [α+ β] mod n

para todos α, β ∈ {0, 1, . . . , n− 1}. Acima [α+ β] representa a soma usual de números inteiros em Z.

E. 2.8 Exerćıcio. Prove que a operação de soma definida acima é uma operação binária de {0, 1, . . . , n − 1} e mostre que a mesma é associativa, comutativa e tem 0 como elemento neutro. 6

E. 2.9 Exerćıcio. Para cada a ∈ {0, 1, . . . , n− 1}, defina a−1 = (n− a) mod n. Mostre que a−1 ∈ {0, 1, . . . , n− 1} e que a+ a−1 = 0. 6

Os dois exerćıcios acima provam que {0, 1, . . . , n− 1} é um grupo Abeliano em relação à operação de soma definida acima. Esse grupo é denominado grupo Zn, ou Z(n).

• R+ estendido O conjunto R+ = {x ∈ R, x ≥ 0} é um monóide Abeliano em relação à operação de soma e em relação à operação de

produto e vale ainda a propriedade distributiva a(b+ c) = ab+ac. Sabidamente, R+ é também um conjunto linearmente ordenado pela relação de ordem usual.

Vamos abaixo descrever um outro conjunto linearmente ordenado que contém R+ e é também um monóide Abeliano em relação à operação de soma e em relação à operação de produto e vale ainda a propriedade distributiva.

Definimos um conjunto, que denotaremos por R+, juntando a R+ um conjunto formado por um elemento, elemento esse que denotaremos provisoriamente por ω, com ω 6∈ R+, para o qual certas relações algébricas serão definidas. Seja R+ = R+ ∪ {ω} e definimos as operações de soma e produto em R+ da seguinte forma: se a e b são elementos de R+ suas soma a+ b e seu produto ab são definidos como usualmente. Fora isso, valem

1. a+ ω = ω + a = ω, para todo a ∈ R+.

2. ω + ω = ω.

3. aω = ωa = ω, para todo a ∈ R+, a 6= 0.

4. 0ω = ω0 = 0.

5. ωω = ω.

E. 2.10 Exerćıcio. Verifique que R+ é um monóide Abeliano em relação à operação de soma e em relação à operação de produto definidas acima e que vale ainda a propriedade distributiva. 6

R+ é linearmente ordenado tomando-se em R+ a relação de ordem usual e fixando-se a < ω para todo a ∈ R+. É bastante claro que na definição abstrata acima o objeto representado pelo śımbolo ω desempenha o papel formal-

mente desempenhado por um número infinito positivo. A construção das relações algébricas acima prescinde, porém, dessa noção, pois ω pode ser qualquer objeto (fora de R+).

Com um certo abuso de linguagem, é costume, substituir o śımbolo ω pelo śımbolo ∞, dando a entender que ω representa algo como um número infinito positivo. É comum também denotar-se R+ = [0, ∞].

E. 2.11 Exerćıcio. Que problemas surgem quando se tenta estender a construção acima para o conjunto R de todos os reais? 6

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 68/1507

2.1.4 Corpos

Um corpo15 é um conjunto não-vazio K dotado de duas operações binárias, denotadas por “+” e “·”, denominadas soma e produto, respectivamente, satisfazendo o seguinte :

1. A operação de soma tem as seguintes propriedades:

(a) Comutatividade: para todos α, β ∈ K vale α+ β = β + α. (b) Associatividade: para todos α, β, γ ∈ K vale α+ (β + γ) = (α+ β) + γ. (c) Elemento neutro: existe um elemento 0 ∈ K, chamado de elemento nulo, ou zero, tal que α+0 = α para todo

α ∈ K. (d) Inversa: para cada α ∈ K existe um elemento denotado por β, único, com a propriedade α + β = 0. Esse

elemento é mais comummente denotado por −α.

2. A operação de produto tem as seguintes propriedades:

(a) Comutatividade: para todos α, β ∈ K vale α · β = β · α. (b) Associatividade: para todos α, β, γ ∈ K vale α · (β · γ) = (α · β) · γ. (c) Elemento neutro: existe um elemento 1 ∈ K, chamado de unidade, tal que α · 1 = α para todo α ∈ K. (d) Inversa: para cada α ∈ K, α 6= 0, existe um único elemento denotado por β com a propriedade α ·β = 1. Esse

elemento é mais comummente denotado por α−1.

3. Distributividade: o produto é distributivo em relação à adição: para todos α, β, γ ∈ K vale α ·(β+γ) = α ·β+α ·γ.

Alguns autores consideram conveniente incluir também a hipótese de que o elemento neutro e o elemento nulo são distintos, 1 6= 0, pois doutra forma teŕıamos K = {0} (justifique!), uma situação um tanto trivial.

Note-se que corpos são grupos comutativos em relação à operação de soma e monóides comutativos em relação à operação de produto. Pelo que comentamos anteriormente, isso garante a unicidade do elemento nulo e da unidade de um corpo. A distributividade é a única propriedade listada acima que relaciona as operações de soma e produto.

Os elementos de um corpo são por vezes denominados escalares. Por motivos estruturais é importante frisar que um corpo depende em sua definição do conjunto K e das operações binárias “+” e “·” nele definidas e muitas vezes nos referiremos a um corpo como sendo uma tripla (K, +, ·). É freqüente omitir-se o śımbolo “·” de produto por escalares quando nenhuma confusão é posśıvel.

Em um corpo K sempre vale que α · 0 = 0 para todo α ∈ K. De fato, como 0 = 0 + 0, segue que

α · 0 = α · (0 + 0) = α · 0 + α · 0 .

Somando-se a ambos os lados o elemento inverso −α · 0 teremos

α · 0 + (−α · 0) = α · 0 + α · 0 + (−α · 0) ,

ou seja, 0 = α · 0 + 0 = α · 0 ,

como queŕıamos provar. Pela comutatividade do produto vale também 0 · α = 0 para todo α ∈ K. É fácil verificar que Q, R e C são corpos em relação às operações usuais de soma e produto. Esses são os exemplos

que inspiraram a definição. Outros exemplos serão discutidos logo abaixo. O conjunto das matrizes n× n para qualquer n ≥ 2 com o produto usual de matrizes não é um corpo pois, entre outras razões, o produto não é comutativo.

• Os corpos Q(√p), com p primo

E. 2.12 Exerćıcio. Mostre que o conjunto de todos os números reais da forma a+ b √ 2, com a e b racionais, é um corpo.

Esse corpo é denotado por Q( √ 2). 6

15Em inglês a palavra empregada é field. A expressão em português provavelmente provem do francês corp ou do alemão Körper.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 69/1507

E. 2.13 Exerćıcio. Generalizando o exerćıcio anterior, seja p um número primo. Mostre que o conjunto de todos os números reais da forma a+ b

√ p, com a e b racionais, é um corpo. Esse corpo é denotado por Q(

√ p). 6

E. 2.14 Exerćıcio. Mostre que o conjunto de todos os números reais da forma a+ b √ 2 com a e b inteiros não é um corpo.

6

• Os corpos Zp, com p primo Como observamos à página 67, os conjuntos Zn = {0, 1, . . . , n− 1}, com n ∈ N, n ≥ 2, são grupos Abelianos com

a soma definida por α+ β = [α+ β] mod n ,

para α, β ∈ Zn, onde [α+β] denota a soma usual em Z. Podemos também considerar em Zn uma operação de produto, definida por,

α · β = [αβ] mod n , onde [αβ] denota o produto usual em Z. Temos o seguinte teorema:

Teorema 2.1 O conjunto Zn é um corpo com as operações acima definidas se e somente se n for um número primo. 2

Prova. As operações de soma e produto definidas acima são comutativas, associativas e distributivas (justifique!). Fora isso sempre vale que −α = n− α para todo α ∈ Zn. Resta-nos estudar a existência de elementos inversos α−1. Vamos supor que Zn seja um corpo. Então, a ∈ {2, . . . , n−1} tem uma inversa em Zn, ou seja, um número b ∈ {1, . . . , n−1} tal que a · b = 1. Lembrando a definição de produto em Zn, isso significa que existe um inteiro r tal que ab = rn + 1. Mas isso implica

b− 1 a

= r (n

a

)

.

Como o lado esquerdo não é um número inteiro, o lado direito também não pode ser. Isso diz então que n/a não pode ser inteiro para nenhum a ∈ {2, . . . , n − 1}, ou seja, n não tem divisores e é, portanto, um primo. Resta-nos mostrar que Zp é efetivamente um corpo quando p é primo, o que agora se reduz a mostrar que para todo a ∈ Zp existe um elemento inverso.

Para apresentar a demonstração, recordemos três conceitos da teoria de números. 1. Sejam dois números inteiros f e g, dizemos que f divide g se g/f ∈ Z. Se f divide g, denotamos esse fato por f |g. 2. Sejam dois números inteiros f e g. O máximo divisor comum de f e g, denotado mdc(f, g) é o maior inteiro m tal que m|f e m|g. 3. Dois números inteiros f e g são ditos ser primos entre si se mdc(f, g) = 1.

A demonstração da existência de inverso em Zp será apresentada em partes. Vamos primeiro demonstrar a seguinte afirmativa.

Lema 2.2 Se f e g são dois números inteiros quaisquer então existem inteiros k′ e l′ tais que

mdc(f, g) = k′f + l′g .

2

Prova. Seja m = mdc(f, g). Seja M o conjunto de todos os números positivos que sejam da forma kf + lg com k e l inteiros. Seja m′ o menor elemento de M . Note que como os elementos de M são positivos, esse menor elemento existe. Claramente

m′ = k′f + l′g (2.10)

para algum k′ e l′. Como, por definição, m|f e m|g, segue que m|m′, o que só é posśıvel se

m′ ≥ m. (2.11)

Vamos agora demonstrar por contradição que m′|f . Se isso não fosse verdade, existiriam (pelo algoritmo de Euclides) inteiros α e β com

0 < β < m′ (2.12)

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 70/1507

tal que f = αm′ + β .

Usando (2.10) isso diz que β = f − α(k′f + l′g) = (1− αk′)f + (−αl′)g .

Mas, como β > 0 isso diz que β ∈ M . Logo, β ≥ m′, contradizendo (2.12). Logo m′|f . De maneira totalmente análoga prova-se que m′|g. Portanto m′ ≤ mdc(f, g) = m. Lembrando que hav́ıamos provado (2.11), segue que m = m′ e, portanto m = k′f + l′g, demonstrando o Lema.

Corolário 2.1 Se f e g são dois números inteiros primos entre si então existem inteiros k′ e l′ tais que

1 = k′f + l′g .

2

Prova. Pela definição, como f e g são dois números inteiros primos entre si segue que mdc(f, g) = 1.

Para finalmente demonstrarmos a existência de inverso em Zp, com p primo, seja a ∈ {1, . . . , p− 1}. É óbvio que a e p são primos entre si (por que?). Assim, pelo corolário, existem inteiros r e s com

1 = sa− rp .

Isso diz que sa = rp+ 1. Logo, definindo b ∈ Zp como sendo b = s mod p teremos

ba = (s mod p)a = (rp + 1) mod p = 1 ,

ou seja, b = a−1, completando a demonstração.

E. 2.15 Exerćıcio. Considere o conjunto Z4. Constate que nele produto do elemento 2 consigo mesmo resulta no elemento nulo. Conclua disso que 2 não pode possuir inversa multiplicativa e constate que tal é realmente o caso. 6

• Isomorfismos entre corpos Dois corpos K1 e K2 são ditos isomorfos se existir uma aplicação bijetora φ : K1 → K2 que preserve as operações

algébricas de K1 e K2, ou seja, tal que

φ(a+ b) = φ(a) + φ(b) , φ(ab) = φ(a)φ(b) , φ(1K1) = 1K2 e φ(0K1 ) = 0K2 .

Acima, 1Kj e 0Kj são a unidade e o elemento nulo, respectivamente, de Kj , j = 1, 2. É elementar constatar que φ(−a) = −φ(a) para todo a ∈ K1 e que φ(a−1) = φ(a)−1 para todo a ∈ K1, a 6= 0K1 .

E. 2.16 Exerćıcio. Considere o conjunto de todas as matrizes reais da forma ( a −b b a

) , com a, b ∈ R. Mostre que esse

conjunto é um corpo em relação às operações usuais de soma e produto de matrizes. Mostre que esse corpo é isomorfo ao corpo C pelo isomorfismo φ(a+ bi) :=

( a −b b a

) para todos a, b ∈ R. 6

O leitor que apreciou o Exerćıcio E. 2.16 é estimulado a posteriormente estudar a noção de quatérnios, apresentada neste texto na Seção 2.6.3, página 134, pois aquela noção generaliza de diversas formas o conteúdo do exerćıcio.

• Caracteŕıstica de um corpo Seja K um corpo e 1 sua unidade. Para um número natural n definimos n · 1 := 1 + · · ·+ 1

︸ ︷︷ ︸

n vezes

.

Define-se a caracteŕıstica de K como sendo o menor número natural não-nulo n tal que n · 1 = 0. Se um tal número não existir, diz-se que o corpo tem caracteŕıstica zero.

Exemplos. Q, R, C, Q( √ 2) têm caracteŕıstica zero. Zp, p primo, tem caracteŕıstica p. Mostre isso.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 71/1507

E. 2.17 Exerćıcio. Mostre que a caracteŕıstica de um corpo é ou igual a zero ou é um número primo. Sugestão: Mostre primeiro que (nm) · 1 = (n · 1)(m · 1) para quaisquer números naturais n e m. Use então o fato que todo natural pode ser decomposto em um produto de fatores primos e use o fato que, em um corpo, se ab = 0 então ou a ou b ou ambos são zero (ou seja, todo corpo é um anel de integridade: não tem divisores de zero). 6

2.1.5 Espaços Vetoriais

Um espaço vetorial V sobre um corpo K é um conjunto de elementos chamados vetores dotado de uma operação “+”: V × V → V denominada soma vetorial e também de um produto por escalares “·”: K × V → V com as seguintes propriedades:

1. A cada par u, v ∈ V de vetores é associado um elemento u+ v ∈ V , denominado soma de u e v, com as seguintes propriedades:

(a) A soma é comutativa: u+ v = v + u para todos u, v ∈ V . (b) A soma é associativa: u+ (v + w) = (u+ v) + w para todos u, v, w ∈ V . (c) Existe um único vetor denotado por 0, denominado vetor nulo, tal que u+ 0 = u para todo u ∈ V . (d) A cada u ∈ V existe associado um único vetor denotado por −u tal que u+ (−u) = 0.

2. A cada par α ∈ K, u ∈ V existe associado um vetor denotado por α · u ∈ V , denominado produto de u por α, de forma que

(a) O produto por escalares é associativo: α · (β ·u) = (αβ) ·u, para todos α, β ∈ K e u ∈ V , onde αβ é o produto de α por β em K.

(b) 1 · u = u para todo u ∈ V , onde 1 é a unidade de K. (c) O produto por escalares é distributivo em relação à soma de vetores: α · (u + v) = α · u + α · v, para todo

α ∈ K e todos u, v ∈ V . (d) O produto por escalares é distributivo em relação à soma de escalares: (α+ β) · u = α · u+ β · u, para todos

α, β ∈ K e todo u ∈ V .

Note-se que espaços vetoriais são grupos comutativos em relação à operação de soma, fato que, como comentamos anteriormente, garante a unicidade do vetor nulo.

Os elementos de um corpo sobre os quais um espaço vetorial se constitui são freqüentemente denominados escalares. É freqüente omitir-se o śımbolo “·” de produto por escalares quando nenhuma confusão é posśıvel. É de se notar também que emprega-se o śımbolo “+” tanto para a operação de adição do corpo K quanto para a operação de adição do espaço vetorial V , ainda que se trate de operações distintas. Igualmente usamos o mesmo śımbolo “0” para designar o vetor nulo de V e o elemento nulo de K. Raramente esses usos são fonte de confusão.

E. 2.18 Exerćıcio. Mostre, usando os postulados acima, que 0 · u = 0 para todo u ∈ V , onde, permitindo-nos um certo abuso de linguagem, o 0 do lado esquerdo representa o zero do corpo K e o do lado direito o vetor nulo de V . Em seguida, prove que para todo α ∈ K e todo u ∈ V vale (−α) · u = −(α · u), sendo que −α denota a inversa aditiva de α em K e −(α · u) denota a inversa aditiva de α · u em V . 6

• Alguns exemplos elementares de espaços vetoriais Ao estudante iniciante sugerimos provar com detalhe as afirmações feitas sobre os exemplos que seguem.

1. Se K é um corpo, então K é um espaço vetorial sobre K com as mesmas operações de soma e produto definidas em K.

2. Se K é um corpo e L é um subcorpo de K (ou seja, um subconjunto de K que é por si só um corpo com as operações definidas em K), então K é um espaço vetorial sobre L. Por exemplo, R é um espaço vetorial sobre Q (esse espaço é curioso, por ser um espaço de dimensão infinita. Vide Seção 2.3.1, página 101 e seguintes).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 72/1507

3. Se K é um corpo, o produto Cartesiano Kn = {(k1, . . . , kn), kj ∈ K, j = 1, . . . , n} é um espaço vetorial sobre K com a operação de soma definida por (k1, . . . , kn) + (l1, . . . , ln) = (k1 + l1, . . . , kn + ln) e o produto por escalares por α · (k1, . . . , kn) = (αk1, . . . , αkn) para todo α ∈ K. O vetor nulo é o vetor (0, . . . , 0). Os três exemplos a seguir são casos particulares do de acima.

4. O produto Cartesiano Rn = {(x1, . . . , xn), xj ∈ R, j = 1, . . . , n} é um espaço vetorial sobre R com a operação de soma definida por (x1, . . . , xn) + (y1, . . . , yn) = (x1 + y1, . . . , xn + yn) e o produto por escalares por α · (x1, . . . , xn) = (αx1, . . . , αxn) para todo α ∈ R. O vetor nulo é o vetor (0, . . . , 0).

5. O produto Cartesiano Cn = {(z1, . . . , zn), zj ∈ C, j = 1, . . . , n} é um espaço vetorial sobre C (sobre R) com a operação de soma definida por (z1, . . . , zn) + (w1, . . . , wn) = (z1 + w1, . . . , zn + wn) e o produto por escalares por α · (z1, . . . , zn) = (αz1, . . . , αzn) para todo α ∈ C (para todo α ∈ R). O vetor nulo é o vetor (0, . . . , 0).

6. Para p primo, o produto Cartesiano (Zp) n = {(z1, . . . , zn), zj ∈ Zp, j = 1, . . . , n} é um espaço vetorial sobre

Zp com a operação de soma definida por (z1, . . . , zn) + (w1, . . . , wn) = (z1 + w1, . . . , zn + wn) e o produto por escalares por α · (z1, . . . , zn) = (αz1, . . . , αzn) para todo α ∈ Zp. O vetor nulo é o vetor (0, . . . , 0). Note que (Zp)

n tem um número finito de elementos, a saber pn.

7. Se K é um corpo, o conjunto Mat (K, m, n), de todas as matrizes m × n cujos elementos de matriz pertencem a K, é um espaço vetorial sobre K, com a soma sendo a soma usual de matrizes e o produto por escalares sendo o produto usual de matrizes por números escalares. O vetor nulo é a matriz nula.

8. O conjunto Mat (R, m, n), de todas as matrizes reais m × n, é um espaço vetorial sobre R, com a soma sendo a soma usual de matrizes e o produto por escalares sendo o produto usual de matrizes por números reais. O vetor nulo é a matriz nula.

9. O conjunto Mat (C, m, n), de todas as matrizes complexas m × n, é um espaço vetorial sobre C (sobre R), com a soma sendo a soma usual de matrizes e o produto por escalares sendo o produto usual de matrizes por números complexos (reais). O vetor nulo é a matriz nula.

10. Este exemplo generaliza vários dos anteriores. Sejam V um espaço vetorial sobre um corpo K e seja C um conjunto não-vazio. O conjunto V C de todas as funções de C em V é um espaço vetorial sobre K com a soma e o produto por escalares definidos da seguinte forma: se f e g são funções de C em V define-se a soma f + g como sendo a função definida por (f + g)(c) = f(c) + g(c) para todo c ∈ C e se α ∈ K, então α · f é a função definida por (α · f)(c) = αf(c) para todo c ∈ C. O vetor nulo é a função identicamente nula.

11. Este é um exemplo um tanto exótico, mas que serve para ilustrar que a noção de espaço vetorial é menos trivial do

que parece. O conjunto V = (0, 1) é um espaço vetorial real com as operações de soma a ◦ + b = ab1−a−b+2ab , para

todos a, b ∈ (0, 1), e com o produto por escalares α ∈ R dado por α · a = aαaα+(1−a)α , para todo a ∈ V . O vetor nulo é 1/2, a inversa aditiva de a ∈ V é

( ◦ − a

)

= 1− a.

E. 2.19 Exerćıcio. Verifique que o intervalo (0, 1) é, de fato, um espaço vetorial real com as operações definidas acima. 6

Este exemplo será estudado com mais profundidade e generalizado na Seção 2.1.11, página 86.

Anti-exemplo. Tomemos o conjunto dos reais com a operação de soma usual, um corpo Zp com p primo e o produto Zp × R → R, α · x, α ∈ Zp e x ∈ R dada pelo produto usual em R. Essa estrutura não forma um espaço vetorial. A regra distributiva

(α+ β) · x = α · x+ β · x não é satisfeita para todo α, β ∈ Zp. Acima, α · x é o produto usual em R.

Outros exemplos serão de espaços vetoriais serão encontrados nas Seções que seguem, notadamente quando tratarmos das noções de soma direta e produto tensorial de espaços vetoriais.

*

É quase desnecessário mencionar o quão importantes espaços vetoriais são no contexto da F́ısica, onde, porém, quase somente espaços vetoriais sobre o corpo dos reais ou dos complexos ocorrem.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 73/1507

2.1.6 Anéis, Módulos e Álgebras

2.1.6.1 Anéis

• Anéis não-associativos Um anel não-associativo é um conjunto A dotado de duas operações binárias denotadas por “+” e “·” e denominadas

soma e produto, respectivamente, tais que A é um grupo Abeliano em relação à operação de soma e a operação de produto é distributiva em relação à soma: para quaisquer a, b e c ∈ A valem a · (b + c) = a · b+ a · c e (a+ b) · c = a · c+ b · c.

Como usual, denotamos por −a a inversa aditiva do elemento a de um anel não-associativo. Se 0 é o elemento neutro de um anel não-associativo A em relação à operação de soma, então a · 0 = 0 pois, como

0 = 0+0, tem-se pela propriedade distributiva a ·0 = a ·0+a ·0, que implica 0 = a ·0− (a ·0) = a ·0+a ·0− (a ·0) = a ·0. Exemplo 2.10 Seja Mat (Z, n) o conjunto das matrizes n × n cujos elementos de matriz são números inteiros. Para A, b ∈ Mat (Z, n) defina o produto [A, B] = AB − BA, denominado comutador de A e B onde AB é o produto usual das matrizes A e B. Então Mat (Z, n) com o produto do comutador é um anel não-associativo. ◊

Em um anel não-associativo, a propriedade de associatividade do produto “·” não é requerida. Se ela, porém, for válida, temos a estrutura de um anel.

• Anéis Um anel é um conjunto A dotado de duas operações binárias denotadas por “+” e “·” e denominadas soma e produto,

respectivamente, tais que A é um grupo Abeliano em relação à operação de soma e um semi-grupo em relação à operação de produto (ou seja, o produto é associativo). Por fim, a operação de produto é distributiva em relação à soma: para quaisquer a, b e c ∈ A valem a · (b + c) = a · b + a · c e (a+ b) · c = a · c+ b · c.

Como usual, denotamos por −a a inversa aditiva do elemento a de um anel. Se 0 é o elemento neutro de um anel A em relação à operação de soma, então a · 0 = 0 para todo a ∈ A, pois, como

0 = 0+0, tem-se pela propriedade distributiva a ·0 = a ·0+a ·0, que implica 0 = a ·0− (a ·0) = a ·0+a ·0− (a ·0) = a ·0. Observamos que alguns autores, como Bourbaki, incluem a existência de uma unidade (não-nula) na definição de

anel. Aqui denominaremos anéis com unidade tais anéis. Vide página 80.

2.1.6.2 Módulos

Seja A um anel. Um A-módulo à esquerda é um grupo Abeliano M (cujo produto, seguindo a convenção, denotaremos por “+”) dotado de uma função A ×M → M que a cada par a ∈ A, m ∈ M associa um elemento de M denotado por a ·m com as seguintes propriedades: para todos a, b ∈ A e todos m, n ∈ M

1. a · (m+ n) = a ·m+ a · n,

2. (a+ b) ·m = a ·m+ b ·m,

3. a · (b ·m) = (ab) ·m,

4. Se A possuir uma identidade e (i.e., um elemento neutro para o produto), então e ·m = m.

Seja A um anel. Um A-módulo à direita é um grupo Abeliano M dotado de uma função M × A → M que a cada par a ∈ A, m ∈ M associa um elemento de M denotado por m · a com as seguintes propriedades: para todos a, b ∈ A e todos m, n ∈ M

1. (m+ n) · a = m · a+ n · a,

2. m · (a+ b) = m · a+m · b,

3. (m · b) · a = m · (ba),

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 74/1507

4. Se A possuir uma identidade e, então m · e = m.

Sejam A e B dois anéis. Um bimódulo em relação a A e B é um grupo AbelianoM dotado de duas funções A×M → M e M ×B → M que a cada a ∈ A, b ∈ B e m ∈ M associam elementos de M denotados por a ·m e m · b, respectivamente, de modo que M seja um A-módulo à esquerda e um B-módulo à direita e de modo que valha

1. a · (m · b) = (a ·m) · b para todos a ∈ A, b ∈ B, m ∈ M .

2.1.6.3 Álgebras

Uma álgebra é um espaço vetorial V sobre um corpo K dotado de uma operação de produto binária “·” dita produto da álgebra, de modo que as seguintes propriedades são satisfeitas:

a. O produto da álgebra é distributivo em relação a soma vetorial: para todos a, b e c ∈ V valem

a · (b+ c) = a · b+ a · c e (a+ b) · c = a · c+ b · c .

b. O produto por escalares comuta com o produto da álgebra e é distributivo em relação a ele: para todos a, b ∈ V e α ∈ K vale

α(a · b) = (αa) · b = a · (αb) .

Uma álgebra V é dita ser uma álgebra comutativa ou uma álgebra Abeliana16 se para todos a, b ∈ V tivermos

a · b = b · a.

Uma álgebra V é dita ser uma álgebra associativa se para todos a, b e c ∈ V tivermos

a · (b · c) = (a · b) · c .

Notação. Se A é uma álgebra associativa, podemos sem ambigüidade denotar produtos triplos como a(bc) e (ab)c simplesmente como abc.

Devemos dizer que há muitas álgebras importantes encontradas na F́ısica que não são nem comutativas nem associ- ativas. Por exemplo, a álgebra do produto vetorial em R3 não é nem comutativa nem associativa.

Os seguintes comentários são úteis:

1. Álgebras associativas são anéis. Álgebras não-associativas são anéis não-associativos.

2. Uma álgebra associativa pode não ser comutativa, um exemplo sendo as álgebras de matrizes complexas n×n com n > 1 (vide adiante).

3. Uma álgebra comutativa pode não ser associativa, um exemplo sendo as álgebras de Jordan não-associativas (vide página 78, adiante).

Alguns exemplos elementares de anéis e álgebras:

1. O conjunto Mat (C, n) das matrizes complexas n × n é uma álgebra complexa, associativa e não-comutativa (se n > 1) em relação à soma e ao produto usuais de matrizes. O conjunto Mat (Z, n) das matrizes inteiras n × n é um anel (não-comutativo, se n > 1) em relação à soma e ao produto usuais de matrizes.

2. O conjunto Mat (Q, n) das matrizes racionais n× n é um anel (não-comutativo, se n > 1) em relação à soma e ao produto usuais de matrizes. É também uma álgebra em relação ao corpo dos racionais Q.

3. O conjunto Pol(C) de todos os polinômios em uma variável complexa com coeficientes complexos é uma álgebra complexa, associativa e Abeliana em relação à soma e ao produto usuais de polinômios. O conjunto Pol(Z) de todos os polinômios em uma variável complexa com coeficientes inteiros é um anel Abeliano em relação à soma e ao produto usuais de polinômios.

16Niels Henrik Abel (1802–1829).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 75/1507

4. O conjunto Pol(Q) de todos os polinômios em uma variável complexa com coeficientes racionais é um anel Abeliano em relação à soma e ao produto usuais de polinômios. É também uma álgebra associativa e Abeliana em relação ao corpo dos racionais Q.

E. 2.20 Exerćıcio. Em caso de dúvida, justifique as afirmações de acima. 6

• Sub-álgebras. Álgebras geradas Se A é uma álgebra sobre um corpo K e dotada de um produto “·” dizemos que um subespaço vetorial A0 de A é

uma sub-álgebra de A se A0 for também uma álgebra com o mesmo produto “·”. Se C é um subconjunto de uma álgebra A, denominamos a menor sub-álgebra de A que contém C como sendo a

sub-álgebra gerada por C. A sub-álgebra gerada por C será composta por todos os elementos de A que possam ser escritos como combinações lineares finitas de produtos finitos de elementos de C.

Se G é um subconjunto de uma álgebra A e a sub-álgebra gerada por G for a própria A, então dizemos que G é um conjunto gerador de A. Se uma álgebra A é gerada por um conjunto G ⊂ A, então todo elemento de A pode ser escrito como uma combinação linear finita de produtos finitos de elementos de G.

No caso de álgebras topológicas as definições acima podem ser modificadas para levar em conta o fato de álgebras e sub-álgebras serem fechadas (topologicamente) ou não. Assim, dizemos que G é um conjunto gerador de uma álgebra A se a menor álgebra que contém G for densa em A (na topologia de A). Nesse esṕırito, dizemos que se uma álgebra A é gerada por um conjunto G ⊂ A, então todo elemento de A pode ser escrito como limite (na topologia de A) de combinações lineares finitas de produtos finitos de elementos de G.

• Constantes de estrutura Seja A uma álgebra de dimensão finita (enquanto espaço vetorial) e seja B = {b1, . . . , bn} uma base em A. Então,

para cada i, j = 1, . . . , n o produto bi · bj poderá ser escrito como uma combinação linear de elementos de B:

bi · bj = n∑

k=1

ckijbk .

As n3 constantes ckij são denominadas constantes de estrutura da álgebra A na base B e elas fixam o produto de todos

os elementos de A. De fato, se p, q ∈ A são da forma p = ∑ni=1 αibi e q = ∑n

i=j βjbj , então p · q = ∑

k=1 γkbk, com

γk = ∑n

i=1

∑n i=j αiβjc

k ij . Por essa razão, o conhecimento das constantes de estrutura fornece, em prinćıpio, informações

completas sobre álgebras de dimensão finita. É importante enfatizar também que as constantes de estrutura dependem da base escolhida e são transformadas por mudanças de base.

E. 2.21 Exerćıcio. Obtenha a regra de transformação de constantes de estrutura por mudanças de base. 6

2.1.7 Exemplos Especiais de Álgebras

Existem inúmeras álgebras de especial interesse em áreas como a F́ısica, a Teoria de Grupos e a Geometria Diferencial. Listaremos alguns poucos exemplos aqui com os quais lidaremos futuramente.

2.1.7.1 Álgebras de Lie

Uma classe especialmente importante de álgebras é formada pelas chamadas álgebras de Lie. Por razões históricas o produto de dois elementos de uma álgebra de Lie é denotado pelo śımbolo [a, b] em lugar de a · b, notação que seguiremos aqui.

Uma álgebra L (sobre um corpo K) é dita ser uma álgebra de Lie17 se seu produto, além das propriedades 1 e 2 da página 74, satisfizer

17Marius Sophus Lie (1842–1899).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 76/1507

a. Para todo a ∈ L vale [a, a] = 0.

b. Identidade de Jacobi18. Para todos a, b e c ∈ L vale

[a, [b, c]] + [c, [a, b]] + [b, [c, a]] = 0 . (2.13)

A primeira propriedade tem uma implicação importante. Como [a, a] = 0 para todo a ∈ L, vale também que [a + b, a + b] = 0 para todos a, b ∈ L. Expandindo o lado esquerdo teremos que 0 = [a + b, a + b] = [a, a] + [b, b] + [a, b] + [b, a] = [a, b] + [b, a], ou seja, valerá a importante propriedade de anti-comutatividade: [a, b] = −[b, a] para todos a, b ∈ L. Reciprocamente, se assumirmos válida a propriedade de anti-comutatividade então, tomando b = a, a mesma afirmará que [a, a] = −[a, a] o que implica [a, a] = 0 exceto se o corpo K tiver caracteŕıstica igual a 2.

Assim, para corpos com caracteŕıstica diferente de 2 (como é o caso do corpo dos racionais, dos reais ou dos complexos, que têm caracteŕıstica 0) nossa definição de álgebra de Lie, acima, equivale à seguinte: L é dita ser uma álgebra de Lie se seu produto satisfizer:

a. Anti-comutatividade. Para todos a, b ∈ L vale [a, b] = −[b, a].

b. Identidade de Jacobi. Para todos a, b e c ∈ L vale

[a, [b, c]] + [c, [a, b]] + [b, [c, a]] = 0 . (2.14)

É evidente pelas considerações acima que uma álgebra de Lie L só pode ser comutativa se seu produto for trivial [a, b] = 0 para todos a, b ∈ L, um caso que raramente merece consideração especial. Uma álgebra de Lie L também não pode ter uma unidade, pois se e ∈ L fosse uma identidade, teŕıamos e = [e, e] = 0. Logo, para todo a ∈ L valeria também a = [a, e] = [a, 0] = 0, implicando que L possui apenas o vetor nulo, novamente um caso trivial que não merece consideração. Por fim, se uma álgebra de Lie L for associativa, então a identidade de Jacobi e a anti-comutatividade implicam [a, [b, c]] = 0 para todos a, b, c ∈ L (Prove isso!). Um exemplo de uma álgebra de Lie com tal propriedade é a álgebra de Heisenberg (vide Seção 17.2.2, página 790). Note que em tal caso a identidade de Jacobi é trivialmente satisfeita.

E. 2.22 Exerćıcio. Para álgebras de Lie de dimensão finita escreva a condição de anticomutatividade e a identidade de Jacobi (2.14) em termos das constantes de estrutura. 6

• Álgebras associativas e álgebras de Lie Seja A uma álgebra associativa. Podemos associar a A uma álgebra de Lie definindo o produto [a, b] = ab − ba,

denominado comutador de a e b ∈ A. Com essa definição, é claro que [a, a] = 0 para todo a ∈ A e a identidade de Jacobi segue do fato que

[a, [b, c]] + [c, [a, b]] + [b, [c, a]]

= a(bc− cb)− (bc− cb)a+ c(ab− ba)− (ab− ba)c+ b(ca− ac)− (ca− ac)b

= abc− acb− bca+ cba+ cab− cba− abc+ bac+ bca− bac− cab+ acb

= 0 ,

como facilmente se constata.

• Exemplos básicos de álgebras de Lie Todos os exemplos aqui exibidos são relevantes na teoria dos grupos de Lie.

E. 2.23 Exerćıcio. Mostre que R3 dotado do produto vetorial usual é uma álgebra de Lie. 6

18Carl Gustav Jacob Jacobi (1804–1851).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 77/1507

E. 2.24 Exerćıcio. Mostre que Mat (R, n) (ou Mat (C, n)), o conjunto de todas as matrizes n × n reais (complexas) é uma álgebra de Lie com relação ao produto [A, B] = AB −BA. 6

E. 2.25 Exerćıcio. Mostre que o subconjunto de Mat (R, n) (ou de Mat (C, n)) formado pelas matrizes com traço nulo é uma álgebra de Lie com relação ao produto [A, B] = AB −BA. 6

E. 2.26 Exerćıcio. Mostre que o subconjunto de Mat (R, n) (ou de Mat (C, n)) formado pelas matrizes anti-simétricas, ou seja, tais que AT = −A, é uma álgebra de Lie com relação ao produto [A, B] = AB −BA. 6

E. 2.27 Exerćıcio. Mostre que o subconjunto de Mat (C, n) formado pelas matrizes anti-autoadjuntas, ou seja, tais que A∗ = −A, é uma álgebra de Lie (sobre o corpo dos reais!) com relação ao produto [A, B] = AB −BA. 6

E. 2.28 Exerćıcio. Conclua igualmente que o subconjunto de Mat (C, n) formado pelas matrizes anti-autoadjuntas, ou seja, tais que A∗ = −A, e de traço nulo (Tr(A) = 0) é uma álgebra de Lie (sobre o corpo dos reais!) com relação ao produto [A, B] = AB −BA. 6

E. 2.29 Exerćıcio. Fixada uma matriz B ∈ Mat (R, n), mostre que o subconjunto de Mat (R, n) formado pelas matrizes A com a propriedade AB = −BAT é uma álgebra de Lie real com relação ao produto [A, B] = AB −BA. 6

E. 2.30 Exerćıcio. Fixada uma matriz B ∈ Mat (C, n), mostre que o subconjunto de Mat (C, n) formado pelas matrizes A com a propriedade AB = −BA∗ é uma álgebra de Lie real com relação ao produto [A, B] = AB −BA. 6

Tratemos agora de exibir um exemplo básico de uma álgebra de Lie de dimensão infinita.

• Colchetes de Poisson Sejam f(p, q) e g(p, q), com f : R2 → R e g : R2 → R, duas funções reais, infinitamente diferenciáveis, de duas

variáveis reais p e q. Definimos os colchetes de Poisson19 de f e g, denotados por {f, g}, por

{f, g} := ∂f ∂p

∂g

∂q − ∂f

∂q

∂g

∂p .

É claro que {f, g} é igualmente uma função infinitamente diferenciável de p e q. Os colchetes de Poisson satisfazem as seguintes propriedades: para quaisquer funções f, g e h como acima, valem

a. Linearidade: {f, αg + βh} = α{f, g} + β{f, h} para quaisquer α, β ∈ R. Analogamente {αf + βg, h} = α{f, h}+ β{g, h}.

b. Anti-simetria: {f, g} = −{g, f}.

c. Identidade de Jacobi20: {f, {g, h}}+ {h, {f, g}}+ {g, {h, f}} = 0.

d. Identidade de Leibniz21: {f, gh} = {f, g}h+ g{f, h}.

E. 2.31 Exerćıcio importante. Verifique a validade das quatro propriedades acima. 6

As propriedades 1 e 2 e 3 indicam que o conjunto das funções R2 → R infinitamente diferenciáveis é uma álgebra de Lie com o produto definido pelos colchetes de Poisson. Trata-se de uma álgebra de Lie de dimensão infinita.

19Siméon Denis Poisson (1781–1840). 20Carl Gustav Jacob Jacobi (1804–1851). 21Gottfried Wilhelm von Leibniz (1646–1716).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 78/1507

A definição acima dos colchetes de Poisson pode ser facilmente generalizada para variedades diferenciáveis de dimensão par, mas não trataremos disso aqui por ora. Os colchetes de Poisson desempenham um papel importante na Mecânica Clássica.

E. 2.32 Exerćıcio. Mostre que matrizes A, B, C de Mat (R, n) (ou de Mat (C, n)) também satisfazem uma identidade de Leibniz: [A, BC] = [A, B]C + B[A, C]. Em verdade, essa identidade é válida em qualquer álgebra associativa. Mostre isso também (a prova é idêntica ao caso de matrizes). 6

2.1.7.2 Álgebras de Poisson

O exemplo dos colchetes de Poisson e do Exerćıcio E. 2.32 conduzem à definição da noção de álgebra de Poisson.

Uma álgebra de Poisson é um espaço vetorial P (em relação a um corpo K) dotado de dois produtos, denotados por ∗ e por {· , ·}, satisfazendo as seguintes propriedades:

• P é uma álgebra associativa em relação ao produto ∗. • P é uma álgebra de Lie em relação ao produto {· , ·}.

• Para todos a, b, c ∈ P vale a identidade de Leibniz {a, b ∗ c} = {a, b} ∗ c+ b ∗ {a, c}. Isso significa que o produto {· , ·} age como uma derivação para o produto ∗.

Naturalmente, se A é uma álgebra associativa com produto ∗ obtemos em A uma álgebra de Poisson definindo {a, b} = a ∗ b− b ∗ a, como observamos no Exerćıcio E. 2.32. De maior interesse são álgebras de Poisson onde o produto {a, b} não seja do tipo a ∗ b− b ∗ a.

2.1.7.3 Álgebras de Jordan

Outra classe de álgebras não-associativas de interesse é formada pelas álgebras de Jordan.

Uma álgebra não-associativa J sobre um corpo K é dita ser uma álgebra de Jordan22 se seu produto satisfizer

a. Comutatividade. Para todos a, b ∈ J vale a · b = b · a. b. Identidade de Jordan. Para todos a, b ∈ J vale

(a · a) · (a · b) = a · ((a · a) · b) . (2.15)

Como a identidade de Jordan é trivialmente satisfeita por uma álgebra associativa, alguns autores aceitam a inclusão das álgebras associativas dentre as de Jordan (desde que sejam também comutativas, naturalmente). De qualquer forma, dada uma álgebra associativa (não-necessariamente comutativa) é sempre posśıvel definir um produto que faz dela uma álgebra de Jordan.

De fato, se A é uma álgebra associativa (não-necessariamente comutativa) sobre R ou C23, cujo produto denotamos por ab, o produto

a · b = 1 2 (ab+ ba) (2.16)

faz de A uma álgebra de Jordan. Em textos de F́ısica a expressão ab+ba é denominada anticomutador e é freqüentemente denotada pelo śımbolo {a, b}.

E. 2.33 Exerćıcio. Verifique que esse produto é comutativo (trivial) e satisfaz a identidade de Jordan. Verifique também que esse produto não é, em geral, associativo se A não for Abeliana. Esse produto é denominado produto de Jordan. 6

As álgebras de Jordan surgiram da tentativa de definir produtos de observáveis na Mecânica Quântica (representados por operadores auto-adjuntos) que definissem novamente observáveis. O seguinte exerćıcio deve tornar isso claro.

22Ernst Pascual Jordan (1902–1980) foi um dos fundadores da Mecânica Quântica. 23Ou, mais genericamente, sobre qualquer corpo que não tenha caracteŕıstica 2.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 79/1507

E. 2.34 Exerćıcio. Verifique que a coleção das matrizes auto-adjuntas de Mat (C, n) forma uma álgebra de Jordan para o produto de Jordan acima. 6

2.1.7.4 Álgebras de Grassmann

Álgebras de Grassmann, especialmente em uma de suas formas especiais, as chamadas Álgebras Exteriores (vide Seção 2.5, página 128), são importantes na Topologia Diferencial e na Geometria Diferencial, por exemplo no estudo das chamadas formas diferenciais.

Seja V um espaço vetorial sobre um corpoK. Uma álgebra de Grassmann24 sobre V é uma álgebra associativa e unital sobre K, denotada por Γ(V ), e cujo produto é denotado (por razões históricas) pelo śımbolo ∧ (denominado “cunha”), com as seguintes propriedades

a. V é um subespaço vetorial de Γ(V ).

b. Para todo v ∈ V tem-se v ∧ v = 0.

A condição de V ser um subespaço de Γ(V ) é por vezes substitúıda pela condição de V ser isomorfo a um subespaço de Γ(V ). Como essa distinção dificilmente possui relevância, vamos ignorá-la aqui.

Como observamos na discussão sobre álgebras de Lie, a condição v ∧ v = 0 para todo v ∈ V implica a condição de anti-comutatividade u ∧ v = −v ∧ u para todos u, v ∈ V , mas só equivale a essa se a caracteŕıstica de K não for 2. Fazemos notar também que a condição v∧v = 0 é assumida apenas para os elementos de V , não para todos os elementos de Γ(V ). Analogamente, fazemos notar que V é suposta ser um subespaço vetorial de Γ(V ), não necessariamente uma sub-álgebra de Γ(V ).

A unidade e de Γ(V ) não pode ser um elemento de V , pois se tal fosse o caso teŕıamos e = e∧ e = 0, o que implicaria para todo a ∈ Γ(V ) que a = a ∧ e = a ∧ 0 = 0, o que só faz sentido se Γ(V ) (e, portanto, V ) consistir apenas do vetor nulo, um caso desprovido de interesse especial. Assim, nos casos de interesse, Γ(V ) possui ao menos dois subespaços distintos: o subespaço gerado pela unidade e e o subespaço V .

Proposição 2.1 Em uma álgebra de Grassmann Γ(V ) vale a seguinte afirmação: se v1, . . . , vm são vetores de V , então o produto v1 ∧ · · · ∧ vm será nulo se v1, . . . , vm forem linearmente dependentes. 2

Prova. Vamos supor, sem perda de generalidade, que possamos escrever v1 como combinação linear dos demais: v1 = m∑

k=2

αkvk. Então, v1 ∧ · · · ∧ vm = m∑

k=2

αkvk ∧ ( v2 ∧ · · · ∧ vm

) . Agora, usando a anticomutatividade podemos passar o vetor

vk que ocorre no produto v2 ∧ · · · ∧ vm para a primeira posição no mesmo, ganhando um fator (−1)k−2. Assim, devido à associatividade, obtemos vk ∧

( v2 ∧ · · · ∧ vm

) = (−1)k−2vk ∧ vk ∧ · · · ∧ vm = 0, pois vk ∧ vk = 0.

Na Seção 2.5.2, página 129, discutiremos um procedimento geral de construção de uma álgebras de Grassmann a partir de um espaço vetorial V dado. Para aquelas álgebras, as chamadas álgebras exteriores, vale a rećıproca da Proposição 2.1: um produto v1 ∧ · · · ∧ vm de vetores v1, . . . , vm ∈ V será nulo se e somente se v1, . . . , vm forem linearmente dependentes.

Vamos a alguns exemplos elementares (quiçá triviais) de álgebras de Grassmann. Na Seção 2.5.2, página 129, dis- cutiremos um procedimento geral de construção de uma álgebras de Grassmann a partir de um espaço vetorial V dado dentro do qual mais exemplos poderão ser constrúıdos.

Exemplo 2.11 Seja V o espaço vetorial (sobre C) das matrizes 2×2 da forma ( 0 b0 0 ), com b ∈ C. Então, uma álgebra de Grassmann sobre V seria o conjunto das matrizes 2× 2 da forma ( a b0 a ), com a, b ∈ C, com o produto usual de matrizes. ◊

Exemplo 2.12 Seja V o espaço vetorial (sobre C) das matrizes 3 × 3 da forma (

0 b c 0 0 0 0 0 0

)

, com b, c ∈ C. Então, uma álgebra de Grassmann sobre V seria o conjunto das matrizes 3 × 3 da forma

( a b c 0 a 0 0 0 a

)

, com a, b, c ∈ C, com o produto 24Hermann Günther Grassmann (1809–1877).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 80/1507

usual de matrizes. Note que nesse caso há uma relação adicional, pois o produto de matrizes da forma (

0 b 0 0 0 0 0 0 0

)

com

matrizes da forma (

0 0 c 0 0 0 0 0 0

)

é nulo. ◊

2.1.7.5 Álgebras de Clifford

Álgebras de Clifford têm particular relevância na Teoria de Grupos, surgindo também na Geometria Diferencial, na Mecânica Quântica Relativ́ıstica e na Teoria da Relatividade Geral.

Seja V um espaço vetorial sobre um corpo K (que suporemos não ter caracteŕıstica 2) e seja ω uma forma bilinear simétrica em V (para a definição, vide página 140). Uma álgebra de Clifford25 sobre V e ω, denotada por Cl(V, ω), é uma álgebra associativa dotada de uma unidade e e com as seguintes propriedades

a. V é um subespaço vetorial de Cl(V, ω).

b. Para todo v ∈ V tem-se v2 = ω(v, v)e.

A condição de V ser um subespaço de Cl(V, ω) é por vezes substitúıda pela condição de V ser isomorfo a um subespaço de Cl(V, ω). Como essa distinção dificilmente possui relevância, vamos ignorá-la aqui.

Notemos que se u e v são elementos de V então, pela propriedade b, acima, vale (u + v)(u + v) = ω(u+ v, u+ v)e. Expandindo ambos os lados e usando que u2 = ω(u, u)e e v2 = ω(v, v)e, obtemos uv+vu = 2ω(u, v)e. Reciprocamente, se supormos que uv + vu = 2ω(u, v)e para todos u e v ∈ V , segue evidentemente que v2 = ω(v, v)e. Assim, a condição b equivale a

b’. Para todos u e v ∈ V tem-se uv + vu = 2ω(u, v)e.

A definição de álgebra de Clifford para o caso em que K tem caracteŕıstica 2 é semelhante (ao invés de uma forma bilinear simétrica emprega-se uma forma quadrática sobre V ), mas como certos resultados gerais não são válidos nesse caso (por exemplo, a condição b não equivale à b’), não faremos menção a ele aqui e remetemos o estudante à literatura especializada (e.g. [115]).

2.1.8 Mais sobre Anéis

Apresentaremos em seqüência uma série de definições após as quais discutiremos exemplos relevantes.

• Anéis com unidade Um anel com unidade é um anel R com a propriedade de existir em R um elemento 1, chamado de unidade, com

1 6= 0, tal que a · 1 = 1 · a = a para todo a ∈ R. A condição 1 6= 0 é necessária para evitar uma situação trivial. Se 1 = 0 então para qualquer a ∈ R vale a = a · 1 =

a ·0 = 0, ou seja, R contém apenas o elemento 0. Como observamos, alguns autores, como Bourbaki, incluem a existência de uma unidade (não-nula) na definição de anel.

• Anéis sem divisores de zero Dado um anel R um elemento não-nulo a ∈ R é dito ser um divisor de zero se existir pelo menos um b ∈ R com b 6= 0

tal que a · b = 0 ou b · a = 0. Se em um dado anel a relação a · b = 0 só for posśıvel se a = 0 ou b = 0 ou ambos, então esse anel é dito ser um anel

sem divisores de zero.

Exemplos. C e R são anéis sem divisores de zero (com os produtos e somas usuais), mas os anéis Mat(n, C), n > 1, têm divisores de zero (com o produto e soma usuais), pois tem-se, por exemplo, ( 1 00 0 ) (

0 0 0 1 ) = (

0 0 0 0 ).

E. 2.35 Exerćıcio. Mostre que em Z4 tem-se 2 · 2 = 0, ou seja, 2 é um divisor de zero. Há outros divisores de zero? 6 25William Kingdon Clifford (1845–1879).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 81/1507

E. 2.36 Exerćıcio. Mostre que em Zn existem divisores de zero caso n não seja um número primo. 6

• Anéis de integridade Um anel comutativo (ou seja, cujo produto é comutativo), com unidade e sem divisores de zero é dito ser um anel de

integridade ou também um domı́nio de integridade.

Para a relação entre anéis de integridade e corpos, vide adiante.

• Anéis de divisão Um anel R é dito ser um anel de divisão se possuir uma unidade multiplicativa 1, i.e., um elemento tal que para todo

a ∈ R vale a · 1 = 1 · a = a e se para todo a ∈ R, a 6= 0, existir uma inversa multiplicativa em R, ou seja, um elemento denotado por a−1 tal que a · a−1 = a−1 · a = 1.

E. 2.37 Exerćıcio importante. Mostre que um anel de divisão não pode possuir divisores de zero. Portanto, todo anel de divisão comutativo é também um anel de integridade. 6

Exemplos. Com as definições usuais R, C e Q são anéis de divisão mas Z não o é (falha a existência da inversa multiplicativa). Mat(n, C), com n > 1, também não é um anel de divisão com as definições usuais pois nem toda a matriz não-nula é inverśıvel.

Outro exemplo de anel de divisão (não comutativo!) são os quatérnios, que serão discutidos à página 134.

• Álgebras de divisão Uma álgebra A é dita ser uma álgebra de divisão se possuir uma unidade multiplicativa 1, i.e., um elemento tal que

para todo a ∈ A vale a · 1 = 1 · a = a e se para todo a ∈ A, a 6= 0, existir uma inversa multiplicativa em A, ou seja, um elemento denotado por a−1 tal que a · a−1 = a−1 · a = 1.

• Corpos Todo anel de divisão cujo produto “·” é comutativo é um corpo (verifique!).

• Corpos não-comutativos Como a única distinção entre as definições de corpos e de anéis de divisão é que para os primeiros a comutatividade

do produto é requerida, diz-se também por vezes que anéis de divisão não-comutativos são corpos não-comutativos.

• Corpos e anéis de integridade É bem claro pelas definições que todo corpo é também um anel de integridade. A rećıproca é parcialmente válida:

Teorema 2.2 Todo anel de integridade finito é um corpo. 2

Prova. Se A é um anel de integridade, tudo que precisamos é mostrar que todo elemento não-nulo de A é inverśıvel. Seja a um elemento de A \ {0}. Definamos a aplicação α : A \ {0} → A dada por

α(y) = ay .

Note que, como A é um anel de integridade o lado direito é não-nulo pois nem a nem y o são. Assim, α é, em verdade, uma aplicação de A \ {0} em A \ {0} e, como tal, é injetora, pois se ay = az, segue que a(y − z) = 0, o que só é posśıvel se y = z, pois A é um anel de integridade e a 6= 0. Agora, uma aplicação injetora de um conjunto finito em si mesmo tem necessariamente que ser sobrejetora (por que?). Assim, α é uma bijeção de A \ {0} sobre si mesmo. Como 1 ∈ A \ {0}, segue que existe y ∈ A \ {0} tal que ay = 1, ou seja, a tem uma inversa. Como a é um elemento arbitrário de A \ {0}, segue que todo elemento de A \ {0} tem inversa e, portanto, A é um corpo.

Anéis de integridade infinitos não são necessariamente corpos:

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 82/1507

Anti-exemplo. Um exemplo de um anel de integridade que não é um corpo é o conjunto de todos os polinômios de C em C com o produto e soma usuais. Em verdade, os únicos polinômios que têm inverso multiplicativo são os polinômios constantes não-nulos.

• Anéis de divisão finitos O seguinte teorema, originalmente devido a Wedderburn26, é bastante surpreendente por mostrar uma insuspeita

relação entre a cardinalidade de um anel de divisão e a natureza de seu produto

Teorema 2.3 Todo anel de divisão finito é comutativo. 2

Assim, pelas observações feitas acima conclúı-se:

Corolário 2.2 Todo anel de divisão finito é um corpo. 2

A prova do Teorema 2.3 não será apresentada aqui. Uma demonstração elegante, devida a Witt27, pode ser encontrada na magńıfica referência [2].

2.1.9 Ações e Representações

• Ações Seja M um conjunto não-vazio e G um grupo. Uma função α : G ×M → M é dita ser uma ação à esquerda de G

sobre M se as seguintes condições forem satisfeitas:

1. Para todo g ∈ G a função α(g, ·) : M → M é bijetora28.

2. Se e é a identidade de G então α(e, ·) : M → M é a função identidade: α(e, x) = x para todo x ∈ M .

3. Para todos g, h ∈ G e todo x ∈ M vale

α(g, α(h, x)) = α(gh, x) . (2.17)

Uma função β : G×M → M é dita ser uma ação à direita de G sobre M se as seguintes condições forem satisfeitas

1. Para todo g ∈ G a função β(g, ·) : M → M é bijetora.

2. Se e é a identidade de G então β(e, ·) : M → M é a função identidade: β(e, x) = x para todo x ∈ M .

3. Para todos g, h ∈ G e todo x ∈ M vale

β(g, β(h, x)) = β(hg, x) . (2.18)

Note-se que a distinção básica entre (2.17) e (2.18) é a ordem do produto no grupo. Se G é Abeliano não há distinção entre uma ação à direita ou à esquerda.

E. 2.38 Exerćıcio. Seja α : G × M → M uma ação à esquerda de um grupo G em um conjunto M . Mostre que β : G×M → M definida por β(g, x) = α(g−1, x) é uma ação à direita de G em M . 6

26Joseph Henry Maclagen Wedderburn (1882–1948). O trabalho original de Wedderburn é: J. H. M. Wedderburn, “A theorem on finite algebras”, Trans. Amer. Math. Soc. 6, 349-352 (1905). Esse trabalho contém três demonstrações do Teorema 2.3.

27Ernst Witt (1911–1991). O trabalho original de Witt é “Über die Kommutativität endlicher Schiefköerper”. Abh. Math. Sem. Univ. Hamburg, 8, 413 (1931).

28Para g ∈ G fixo, α(g, ·) : M → M denota a função M ∋ m 7→ α(g, m) ∈ M , ou seja, a função que a cada m ∈ M associa α(g, m) ∈ M .

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 83/1507

É freqüente encontrar-se outras notações para designar ações de grupos em conjuntos. Uma ação à esquerda α(g, x) é freqüentemente denotada por αg(x), de modo que a relação (2.17) fica αg(αh(x)) = αgh(x). Para uma ação à direita, (2.18) fica βg(βh(x)) = βhg(x).

Talvez a notação mais conveniente seja denotar uma ação à esquerda α(g, x) simplesmente por g · x ou apenas gx. A relação (2.17) fica g(hx) = (gh)x. Para uma ação à direita β(g, x) a notação fica x · g, ou apenas xg, de modo que (2.18) fica (xh)g = x(hg). Essa notação justifica o uso da nomenclatura à direita ou à esquerda para classificar as ações.

Seja F uma coleção de funções bijetoras de um conjunto M em si mesmo. Uma ação α : G×M → M é dita ser uma ação de G em M pela famı́lia F se para todo g ∈ G as funções α(g, ·) : M → M forem elementos do conjunto F.

E. 2.39 Exerćıcio. Seja G = SO(n) o grupo de todas as matrizes reais n×n ortogonais (ou seja, tais que RT = R−1, onde RT denota a transposta de R). Seja M o conjunto de todas as matrizes reais n× n simétricas (ou seja, tais que AT = A). Mostre que αR(A) := RAR

T , com R ∈ SO(n) e A ∈ M, é uma ação à esquerda de G em M . Com as mesmas definições, mostre que βR(A) := R

TAR é uma ação à direita de G em M.

Sugestão. O único ponto que poderia ser dif́ıcil para alguns seria mostrar que, para cada R fixo, αR é bijetora, ou seja, é sobrejetora e injetora. Para mostrar que αR é sobrejetora, note que se A é uma matriz simétrica qualquer, podemos trivialmente escrever A = R(RTAR)RT , mostrando que A = αR(B), onde B = R

TAR é simétrica. Para provar que αR é injetora note que, se RA1R

T = RA2R T , segue facilmente, multiplicando-se por RT à esquerda e por R à direita, que A1 = A2. 6

E. 2.40 Exerćıcio. Seja G = SU(n) o grupo de todas as matrizes complexas n× n unitárias (ou seja, tais que U∗ = U−1, onde U∗ denota a adjunta de U : U∗ = UT ). Seja M o conjunto de todas as matrizes complexas n× n Hermitianas (ou seja, tais que A∗ = A). Mostre que αU (A) := UAU

∗, com U ∈ SU(n) e A ∈ M, é uma ação à esquerda de G em M. Com as mesmas definições, mostre que βU (A) := U

∗AU é uma ação à direita de G em M. 6

• Órbita de uma ação Seja G um grupo e α : G×M → M uma ação (à esquerda ou à direita) de G sobre um conjunto não-vazio M . Para

m ∈ M , definimos a órbita de m pela ação α como sendo o conjunto Orbα(m) := {αg(m), g ∈ G} ⊂ M . Claro está que para todo m ∈ M vale m ∈ Orbα(m).

E. 2.41 Exerćıcio. Mostre que para todo m ∈ M vale a afirmação que para todo m′ ∈ Orbα(m) tem-se Orbα(m′) = Orbα(m). 6

E. 2.42 Exerćıcio. Conclua que se existe m ∈ M tal que Orbα(m) = M , então Orbα(m′) = M para todo m′ ∈ M . 6

• Transitividade e espaços homogêneos O fato descrito no Exerćıcio E. 2.42 conduz naturalmente às seguintes definições:

Seja G um grupo e α : G×M → M uma ação (à esquerda ou à direita) de G sobre um conjunto não-vazioM . Dizemos que α age transitivamente em M se existir m ∈ M tal que {αg(m), g ∈ G} = M . Em palavras, α age transitivamente em M se existir pelo menos um elemento de M cuja órbita é todo M . Pelo Exerćıcio E. 2.41, se um elemento de M possui essa propriedade, então todos a possuem.

Se uma ação α age transitivamente em M dizemos que M é um espaço homogêneo do grupo G pela a ação α, ou simplesmente um espaço homogêneo do grupo G.

• Representações de grupos Uma representação de um grupo é uma ação a esquerda do mesmo em um espaço vetorial pela famı́lia das aplicações

lineares inverśıveis agindo nesse espaço vetorial.

Sejam G um grupo e V um espaço vetorial sobre um corpo K. Uma representação de G em V é uma função π : G× V → V tal que para todo g ∈ G as funções π(g, ·) : V → V sejam lineares e bijetivas e satisfazem π(e, v) = v e π(g, π(h, v)) = π(gh, v) para todos g, h ∈ G e todo v ∈ V .

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 84/1507

Devido à linearidade é conveniente denotar π(g, v) por π(g)v. Uma representação satisfaz assim:

1. Para todo g ∈ G, π(g) é uma aplicação linear bijetora de V em V :

π(g)(αu + βv) = απ(g)u+ βπ(g)v

para todos α, β ∈ K e todos u, v ∈ V .

2. π(e) = 1, o operador identidade em V . 3. Para todos g, h ∈ G vale

π(g)π(h) = π(gh).

• Representações de álgebras Seja A uma álgebra sobre um corpo K e V um espaço vetorial sobre o mesmo corpo. Uma representação de A em V

é uma famı́lia de funções lineares de V em V , {π(a), a ∈ A}, satisfazendo

1. Para todo a ∈ A, π(a) : V → V é uma aplicação linear, ou seja

π(a)(αu + βv) = απ(a)u + βπ(a)v

para todos α, β ∈ K e todos u, v ∈ V .

2. Para todos α, β ∈ K e todos a, b ∈ A vale

π(αa+ βb) = απ(a) + βπ(b) .

3. Para todos a, b ∈ A π(ab) = π(a)π(b) .

Uma representação π de uma álgebra A em um espaço vetorial V é dita ser uma representação fiel se π(a) = 0 só ocorrer para a = 0.

Uma representação π de uma álgebra A em um espaço vetorial V é dita ser uma representação não-degenerada se π(a)v = 0 para todo a ∈ A só ocorrer para v = 0.

2.1.10 Morfismos, Homomorfismos, Epimorfismos, Isomorfismos, Mono-

morfismos, Endomorfismos e Automorfismos

Dos radicais gregos hómos: semelhante, igual; mónos: um, sozinho; epi: sobre; ı́sos: semelhante, igual; endon: para dentro, dentro; autós: próprio,

mesmo e morphé: forma.

Nesta seção nos limitaremos a listar algumas definições básicas que serão usadas e desenvolvidas no restante do texto, onde também exemplos serão apresentados. A pretensão não é a de desenvolver os assuntos, mas de apresentar as definições para referência futura.

Em termos informais um morfismo entre duas estruturas de um mesmo tipo (dois grupos, dois espaços vetoriais, duas álgebras, dois anéis etc.) é uma função entre as mesmas que respeita as operações de produto lá definidas.

• Morfismos em grupos Dados dois gruposG eH , com unidades eG e eH , respectivamente, uma função φ : G → H é dita ser um homomorfismo

ou morfismo de grupos se φ(eG) = eH e se φ(a · b) = φ(a) · φ(b) para todos a, b ∈ G. Dados dois grupos G e H , com unidades eG e eH , respectivamente, uma função φ : G → H é dita ser um anti-

homomorfismo se φ(eG) = eH e se φ(a · b) = φ(b) ·φ(a) para todos a, b ∈ G. Por exemplo, a aplicação φ : G → G tal que φ(g) = g−1 é um anti-homomorfismo (verifique).

Um homomorfismo φ : G → H entre dois grupos é dito ser um monomorfismo se for injetivo.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 85/1507

Um homomorfismo φ : G → H entre dois grupos é dito ser um epimorfismo se for sobrejetor. Um homomorfismo φ : G → H entre dois grupos é dito ser um isomorfismo se for bijetor, em cujo caso a aplicação

inversa φ−1 : H → G é também um homomorfismo. Se dois grupos G e H forem tais que exista um isomorfismo φ entre ambos dizemos que G e H são isomorfos (por φ)

e denotamos esse fato por G ≃φ H , ou simplesmente por G ≃ H .

E. 2.43 Exerćıcio importante. Mostre que a relação de isomorfia entre grupos é uma relação de equivalência. 6

Um homomorfismo ρ de um grupo G em si mesmo ρ : G → G é dito ser um endomorfismo de G. Um isomorfismo α de um grupo G em si mesmo α : G → G é dito ser um automorfismo de G. Um exemplo básico de automorfismo é o seguinte: seja g ∈ G fixo. Definimos αg : G → G por αg(a) = g−1ag para

todo a ∈ G.

E. 2.44 Exerćıcio. Mostre que para cada g ∈ G fixo, αg é um homomorfismo e que sua inversa é αg−1 . 6

Um automorfismo de um grupo G é dito ser um automorfismo interno se for da forma αg para algum g ∈ G. Muitas das definições apresentadas acima têm seus análogos em outras estruturas, como espaços vetoriais, álgebras,

anéis, módulos etc. Trataremos de alguns casos.

• Morfismos em espaços vetoriais Sejam U e V dois espaços vetoriais sobre o mesmo corpo K. Uma função φ : U → V é dita ser um homomorfismo ou

morfismo de espaços vetoriais se φ(α1u1 + α2u2) = α1φ(u1) + α2φ(u2) para todos α1, α2 ∈ K e todos u1, u2 ∈ U . Sejam U e V dois espaços vetoriais sobre o mesmo corpo K. Uma função φ : U → V é dita ser um isomorfismo de

espaços vetoriais se for um morfismo de espaços vetoriais, e se for bijetora.

Se dois espaços vetoriais U e V sobre o mesmo corpo forem tais que exista um isomorfismo φ entre ambos dizemos que U e V são isomorfos (por φ) e denotamos esse fato por U ≃φ V , ou simplesmente por U ≃ V .

E. 2.45 Exerćıcio importante. Mostre que a relação de isomorfia entre espaços vetoriais é uma relação de equivalência. 6

Em espaços vetoriais os conceitos de mono-, endo- e e automorfismo não são muito empregados. Em verdade, morfismos de espaços vetoriais são mais freqüentemente denominados operadores lineares ou aplicações lineares, como matrizes, por exemplo.

No caso de espaços vetoriais sobre o corpo dos complexos existem também os conceitos de anti-homomorfismo, anti- isomorfismo etc. Sejam U e V dois espaços vetoriais sobre C. Uma função φ : U → V é dita ser um anti-homomorfismo ou anti-morfismo de espaços vetoriais se φ(α1u1+α2u2) = α1φ(u1)+α2φ(u2) para todos α1, α2 ∈ C e todos u1, u2 ∈ U . O conceito de anti-isomorfismo é análogo.

• Morfismos em álgebras Sejam A e B duas álgebras (sobre o mesmo corpo K, como espaços vetoriais). Uma função φ : A → B é dita

ser um homomorfismo ou morfismo de álgebras se for um morfismo de espaços vetoriais (ou seja φ(α1a1 + α2a2) = α1φ(a1) + α2φ(a2) para todos α1, α2 ∈ K e todos a1, a2 ∈ A) e se φ(a1 · a2) = φ(a1) · φ(a2) para todos a1, a2 ∈ A.

Sejam A e B duas álgebras sobre o mesmo corpo K. Uma função φ : A → B é dita ser um isomorfismo de álgebras se for um morfismo de álgebras e se for bijetora.

Se duas álgebras A e B sobre o mesmo corpo forem tais que exista um isomorfismo φ entre ambos dizemos que A e B são isomorfas (por φ) e denotamos esse fato por A ≃φ B, ou simplesmente por A ≃ B.

E. 2.46 Exerćıcio importante. Mostre que a relação de isomorfia entre álgebras é uma relação de equivalência. 6

Um morfismo de álgebra ρ de uma álgebra A em si mesma ρ : A → A é dito ser um endomorfismo de A.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 86/1507

2.1.11 Induzindo Estruturas Algébricas

Uma construção muito interessante permite induzir a outros conjuntos estruturas de grupo, de espaço vetorial etc., definidas em certos conjuntos. Com ela é posśıvel construir exemplos não-triviais de grupos e espaços vetoriais.

• Induzindo estruturas de semi-grupos e de grupos Seja C um conjunto não-vazio e seja S um semigrupo, cujo produto denotamos por “·”. Suponhamos que exista uma

função bijetora f : C → S. Então podemos definir em C um produto C ×C → C, denotado por “∗”, em relação ao qual C é um também um semi-grupo: para todos a, b ∈ C definimos

a ∗ b := f−1 ( f(a) · f(b)

) . (2.19)

De fato, é fácil ver que para todos a, b e c ∈ C vale

a∗ ( b∗c

) = f−1

( f(a)·f(b∗c)

) = f−1

( f(a)·

( f(b)·f(c)

)) = f−1

(( f(a)·f(b)

) ·f(c)

) = f−1

( f ( a∗b

) ·f(c)

) =

( a∗b

) ∗c ,

provando que o produto ∗ é associativo. Como acima, seja C um conjunto não-vazio e seja G um grupo cujo produto denotamos por “·” e cujo elemento

neutro é n. Então, se existir uma função bijetora f : C → G o conjunto C é um grupo com o produto ∗ definido acima, seu elemento neutro, denotado por e, sendo dado por

e = f−1(n) (2.20)

sendo que para cada a ∈ C sua inversa é dada por

a−1 = f−1 ( f(a)−1

) . (2.21)

De fato, vale para todo a ∈ C que

a ∗ e = f−1 ( f(a) · f(e)

) = f−1

(

f(a) · f ( f−1(n)

))

= f−1 ( f(a) · n

) = f−1

( f(a)

) = a ,

provando que f−1(n) é o elemento neutro em C. Finalmente, vale para todo a ∈ C que

a ∗ f−1 ( f(a)−1

) = f−1

(

f(a) · f (

f−1 ( f(a)−1

)))

= f−1 ( f(a) · f(a)−1

) = f−1(n) = e ,

provando que a inversa de a em C é f−1 ( f(a)−1

) .

Comentamos que, por construção, o grupo formado por C com o produto “∗” é isomorfo ao grupo formado por G com o produto “·”, o isomorfismo sendo dado por f .

E. 2.47 Exerćıcio. Mostre que se G é um grupo Abeliano, então C, com a estrutura acima, também o será. 6

Exemplo 2.13 Seja C = (0, 1) e G = R, o grupo aditivo dos reais. Seja f : (0, 1) → R definida por f(x) := 12 ln (

x 1−x

)

.

A função f é bijetora (prove isso!) e sua inversa f−1 : R → (0, 1) é dada por f−1(y) = e2y1+e2y . Então (0, 1) é um grupo com o produto

a ∗ b = exp

[

ln (

a 1−a

)

+ ln (

b 1−b

)]

1 + exp [

ln (

a 1−a

)

+ ln (

b 1−b

)] = ab

1− a− b+ 2ab ,

para todos a, b ∈ (0, 1). O elemento neutro é f−1(0) = e01+e0 = 12 e para cada a ∈ (0, 1) a inversa é

a−1 = e− ln(

a 1−a )

1 + e− ln( a

1−a ) = 1− a .

É fácil constatar que esse grupo é Abeliano, como deveŕıamos esperar. ◊

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 87/1507

E. 2.48 Exerćıcio. Encontre outras funções bijetoras entre C = (0, 1) e R. Descreva, como acima, as estruturas de grupo induzidas em C. 6

E. 2.49 Exerćıcio. Considere C = (−1, 1), o grupo aditivo dos reais R e a função bijetora f : C → R dada por f(x) = tan(πx/2). Descreva, como acima, a estrutura de grupo induzida em C. 6

E. 2.50 Exerćıcio. Considere C = (−1, 1), o grupo aditivo dos reais R e a função bijetora f : C → R dada por f(x) = argtanh(x) ≡ tanh−1(x). Descreva, como acima, a estrutura de grupo induzida em C. 6

• Induzindo estruturas de espaços vetoriais Seja agora V um espaço vetorial sobre um corpo K, sendo 0 seu vetor nulo.

Como acima, seja C um conjunto não-vazio e f : C → V uma função bijetora. Como V é um grupo Abeliano em relação à operação de soma “+”, C também o será com relação à operação de “soma” definida por (vide (2.19))

a ◦ + b := f−1

( f(a) + f(b)

) .

para todo a, b ∈ C. O elemento neutro será o “vetor nulo”, denotado por ◦0 e dado por ◦

0:= f−1(0) (vide (2.20)). A

inversa de a ∈ C, denotada por ◦ − a é dada por

◦ − a := f−1(−f(a)) (vide (2.21)).

Contudo, C pode ser transformado em um espaço vetorial sobre o corpo K definindo, para cada α ∈ K e a ∈ C, o produto por escalares, denotado por α ◦ a, por

α ◦ a := f−1(αf(a)) .

Para mostrar que C é, de fato, um espaço vetorial sob estas estruturas precisamos ainda constatar que valem as seguintes propriedades (vide Seção 2.1.5, página 71):

1. Para todos α, β ∈ K e todo a ∈ C vale α ◦ (β ◦ a) = (αβ) ◦ a. De fato, tem-se

α ◦ (β ◦ a) = f−1 ( αf(β ◦ a)

) = f−1

( α (βf(a))

) = f−1

( (αβ)f(a)

) = (αβ) ◦ a .

2. Para todo α ∈ K e todos a, b ∈ C vale α ◦ (

a ◦ + b

)

= (α ◦ a) ◦ + (α ◦ b). De fato, tem-se

α ◦ (

a ◦ + b

)

= α ◦ ( f−1

( f(a) + f(b)

)) = f−1

(

αf (

f−1 ( f(a) + f(b)

)))

= f−1 ( α ( f(a) + f(b)

))

= f−1 (αf(a) + αf(b)) = f−1 (f(α ◦ a) + f(α ◦ b)) = (α ◦ a) ◦ + (α ◦ b) .

3. Para todos α, β ∈ K e todo a ∈ C vale (α + β) ◦ a = (α ◦ a) ◦ + (β ◦ a). De fato, tem-se

(α+ β) ◦ a = f−1 ( (α+ β)f(a)

) = f−1

( αf(a) + βf(a)

) = f−1

( f(α ◦ a) + f(β ◦ a)

) = (α ◦ a)

◦ + (β ◦ a) .

Novamente, comentamos que, por construção, o espaço vetorial formado por C, como descrito acima, é isomorfo ao espaço vetorial V , o isomorfismo sendo dado por f .

O seguinte exemplo ilustra um espaço vetorial não-trivial sobre os reais que pode ser obtido pela construção de acima.

Exemplo 2.14 Como no Exemplo 2.13, página 86, seja C = (0, 1) e V = R, o espaço vetorial dos reais sobre o corpo

R. Seja f : (0, 1) → R, definida por f(x) := 12 ln (

x 1−x

)

. A função f é bijetora e sua inversa f−1 : R → (0, 1) é dada por f−1(y) = e

2y

1+e2y . Então C = (0, 1) é um espaço vetorial com a operação de soma

a ◦ + b =

ab

1− a− b+ 2ab ,

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 88/1507

para todos a, b ∈ (0, 1), o vetor nulo é 1/2, a inversa de a ∈ C é (

◦ − a

)

= 1− a

e o produto por escalares α ∈ R é dado por

α ◦ a = a α

aα + (1− a)α ,

para todo a ∈ C. ◊

E. 2.51 Exerćıcio. Prove todas as afirmações feitas acima. Prove explicitamente que para todos α, β ∈ R e todos a, b ∈ (0, 1) valem α ◦ (β ◦ a) = (αβ) ◦ a, α ◦

(

a ◦ + b

)

= (α ◦ a) ◦ + (α ◦ b) e (α+ β) ◦ a = (α ◦ a)

◦ + (β ◦ a). 6

O exerćıcio a seguir mostra que R também pode adquirir outras estruturas de espaço vetorial real, além da usual.

E. 2.52 Exerćıcio. Seja C = R e V = R o espaço vetorial dos reais sobre o corpo R. Seja f : R → R, definida por f(x) := x3. A função f é bijetora e sua inversa é f−1(y) = y1/3. Descreva as operações de soma e multiplicação por escalares definidas em C pela construção acima descrita. 6

• Mais exemplos. Śımplices como espaços vetoriais reais Para d inteiro, d ≥ 1, seja Σd ⊂ Rd+1 o simplex padrão d-dimensional definido por

Σd :=

 (a1, . . . , ad+1) ∈ Rd+1 com 0 ≤ aj ≤ 1 para todo j e

d+1∑

j=1

aj = 1

 .

Seu interior, denotado por Σ0d ⊂ Rd+1, é o simplex padrão aberto d-dimensional:

Σ0d :=

 (a1, . . . , ad+1) ∈ Rd+1 com 0 < aj < 1 para todo j e

d+1∑

j=1

aj = 1

 .

Vide Figura 2.1, página 89.

Os dois exemplos a seguir29 desempenham um papel na análise estat́ıstica de dados composicionais, uma área desen- volvida, entre outros, por Aitchison30.

E. 2.53 Exerćıcio-exemplo. A aplicação f : Σ0d → Rd definida por

f(a1, . . . , ad+1) :=

( 1

2 ln

( a1

ad+1

)

, . . . , 1

2 ln

( ad

ad+1

))

(2.22)

é bijetiva (prove isso!) e sua inversa é (verifique!)

f−1(y1, . . . , yd) =

( e2y1

1 + e2y1 + · · ·+ e2yd , . . . , e2yd

1 + e2y1 + · · ·+ e2yd , 1

1 + e2y1 + · · ·+ e2yd )

,

a qual é definida para todo (y1, . . . , yd) ∈ Rd. Como Rd é um espaço vetorial sobre o corpo dos reais, podemos com a função f induzir uma estrutura de espaço vetorial

sobre o corpo dos reais em Σ0d, de acordo com as prescrições de acima. Mostre que para a soma teremos

a ◦ + b =

( a1b1

a1b1 + · · ·+ ad+1bd+1 , . . . ,

ad+1bd+1 a1b1 + · · ·+ ad+1bd+1

)

, (2.23)

29Agradecemos a Ricardo Zorzetto Nicoliello Vêncio por chamar-nos a atenção para estes exemplos. 30John Aitchison (1926–). Vide J. Aitchison “The Statistical Analysis of Compositional Data”. Chapman and Hall, London, (1986).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 89/1507

0

1

1

1

Figura 2.1: O simplex padrão Σ2 no espaço tridimensional (área triangular acinzentada, incluindo sua borda). O simplex padrão aberto Σ02 corresponde apenas à área acinzentada, excluindo sua borda.

com a, b ∈ Σ0d na forma a = (a1, . . . , ad+1) e b = (b1, . . . , bd+1). Mostre que para o produto por escalares teremos

α ◦ a = (

(a1) α

(a1)α + · · ·+ (ad+1)α , . . . ,

(ad+1) α

(a1)α + · · ·+ (ad+1)α )

, (2.24)

para todo α ∈ R e a ∈ Σ0d. O vetor nulo ◦

0 é o elemento de Σ0d dado por

0 =

( 1

d+ 1 , . . . ,

1

d+ 1

)

. (2.25)

6

E. 2.54 Exerćıcio-exemplo. Seja a = (a1, . . . , ad+1) ∈ Σ0d e denotemos por g(a) a média geométrica de a1, . . . , ad+1:

g(a) := ( a1 · · · ad+1

) 1 d+1 .

Está claro que g(a) > 0 para todo a ∈ Σ0d. A aplicação f : Σ0d → Rd definida por

f(a1, . . . , ad+1) :=

(

ln

( a1 g(a)

)

, . . . , ln

( ad g(a)

))

, (2.26)

é bijetiva (prove isso!) e sua inversa é (verifique!)

f−1(y1, . . . , yd)

=

( ey1

ey1 + · · ·+ eyd + e−(y1+···+yd) , . . . , eyd

ey1 + · · ·+ eyd + e−(y1+···+yd) , e−(y1+···+yd)

ey1 + · · ·+ eyd + e−(y1+···+yd) )

,

a qual é definida para todo (y1, . . . , yd) ∈ Rd. Como Rd é um espaço vetorial sobre o corpo dos reais, podemos com a função f induzir uma estrutura de espaço vetorial

sobre o corpo dos reais em Σ0d, de acordo com as prescrições de acima. Mostre que para a, b ∈ Σ0d a soma a ◦ + b é a mesma

que a dada em (2.23), que para α ∈ R o produto por escalares α ◦ a é o mesmo que o dado em (2.24) e que o vetor nulo é o mesmo dado em (2.25). 6

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 90/1507

Em alguns textos a função f dada em (2.22) é denotada por alr e a função f dada em (2.26) é denotada por clr. É elementar constatar que (2.22) e (2.26) coincidem no caso d = 1.

2.2 Grupos. Estruturas e Construções Básicas

Nesta seção apresentaremos algumas estruturas e construções básicas da teoria de grupos.

2.2.1 Cosets

• Cosets à esquerda, ou “left cosets” Seja G um grupo e H um subgrupo de G. Podemos definir em G uma relação de equivalência, que denotaremos

por ∼Hl (o sub-́ındice “l” denotando “left”) dizendo que dois elementos x e y de G são equivalentes se x−1y ∈ H . Representaremos por x ∼Hl y o fato de x e y serem equivalentes no sentido acima.

E. 2.55 Exerćıcio importante. Verifique que a definição acima corresponde de fato a uma relação de equivalência. 6

Denotemos por (G/H)l a coleção das classes de equivalência de G pela relação ∼Hl . O conjunto (G/H)l é denominado coset à esquerda de G por H , ou left coset de G por H .

Seja [·]l a aplicação G → (G/H)l que associa a cada elemento de G a classe de equivalência a qual o elemento pertence. A aplicação [·]l é denominada aplicação quociente à esquerda associada a H . Note-se que [·]l é sobrejetora mas, em geral, não é injetora, pois se g′ ∼Hl g então [g′]l = [g]l. Com isso, os elementos de (G/H)l poderão ser denotados por [g]l com g ∈ G, o que freqüentemente faremos.

Podemos identificar [g]l com o conjunto gH = {gh, h ∈ H} ⊂ G. De fato, g′ ∈ gH se e somente se existe h ∈ H tal que g′ = gh e, portanto, se e somente se g−1g′ ∈ H , ou seja, se e somente se g ∼Hl g′.

• Cosets à direita, ou “right cosets” Seja G um grupo e H um subgrupo de G. Podemos definir em G uma relação de equivalência, que denotaremos

por ∼Hr (o sub-́ındice “r” denotando “right”) dizendo que dois elementos x e y de G são equivalentes se xy−1 ∈ H . Representaremos por x ∼Hr y o fato de x e y serem equivalentes no sentido acima.

E. 2.56 Exerćıcio importante. Verifique que a definição acima corresponde de fato a uma relação de equivalência. 6

Denotemos por (G/H)r a coleção das classes de equivalência de G pela relação ∼Hr . O conjunto (G/H)r é denominado coset à direita de G por H , ou right coset de G por H .

Seja [·]r a aplicação G → (G/H)r que associa a cada elemento de G a classe de equivalência a qual o elemento pertence. A aplicação [·]r é denominada aplicação quociente à direita associada a H . Note-se que [·]r é sobrejetora mas, em geral, não é injetora, pois se g′ ∼Hr g então [g′]r = [g]r. Com isso, os elementos de (G/H)r poderão ser denotados por [g]r com g ∈ G, o que freqüentemente faremos.

Podemos identificar [g]r com o conjunto Hg = {hg, h ∈ H} ⊂ G. De fato, g′ ∈ Hg se e somente se existe h ∈ H tal que g′ = hg e, portanto, se e somente se g′g−1 ∈ H , ou seja, se e somente se g′ ∼Hr g.

Doravante, denotaremos ∼Hl simplesmente por ∼l e ∼Hr por ∼r, ficando o subgrupo H subentendido.

• Ação à esquerda de G sobre (G/H)l É sempre posśıvel definir uma ação à esquerda de G sobre o coset à esquerda (G/H)l, a qual age transitivamente em

(G/H)l (vide definição à página 83). Isso faz de (G/H)l um espaço homogêneo de G (vide definição à página 83).

Seja G um grupo, H um subgrupo de G e seja o coset à esquerda (G/H)l, definido acima. Defina

α : G× (G/H)l → (G/H)l tal que G× (G/H)l ∋ (g, [f ]l) 7→ αg([f ]l) := [gf ]l ∈ (G/H)l . Então, α define uma ação à esquerda de G sobre (G/H)l. De fato, tem-se que

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 91/1507

1. Para cada g ∈ G, αg : (G/H)l → (G/H)l é bijetora, pois se existem f1, f2 ∈ G tais que [gf1]l = [gf2]l, então gf1 ∼l gf2, ou seja, (gf1)−1(gf2) ∈ H , ou seja, (f1)−1f2 ∈ H . Isso estabelece que f1 ∼l f2, ou seja, que [f1]l = [f2]l, provando que αg : (G/H)l → (G/H)l é injetora. Note-se que αg : (G/H)l → (G/H)l é sobrejetora, pois αg([g

−1f ]l) = [f ]l e variando f em G, [f ]l varre todo (G/H)l.

2. Para a identidade e ∈ G, αe([f ]l) = [ef ]l = [f ]l para todo f ∈ G, provando que αe : (G/H)l → (G/H)l é a aplicação identidade.

3. Para todos g, h ∈ G vale αg(αh([f ]l)) = αg([hf ]l) = [ghf ]l = αgh([f ]l) para qualquer f ∈ G.

Isso provou que α : G× (G/H)l → (G/H)l é uma ação à esquerda de G em (G/H)l. Não é dif́ıcil ver que a ação α age transitivamente em (G/H)l. De fato, se e é a unidade de G, então αg([e]l) = [g]l e

variando g por todo G a imagem [g]l varre todo (G/H)l.

• Ação à direita de G sobre (G/H)r É sempre posśıvel definir uma ação à direita de G sobre o coset à direita (G/H)r, a qual age transitivamente em

(G/H)r (vide definição à página 83). Isso faz de (G/H)r um espaço homogêneo de G (vide definição à página 83).

Seja G um grupo, H um subgrupo de G e seja o coset à direita (G/H)r, definido acima. Defina

β : G× (G/H)r → (G/H)r tal que G× (G/H)r ∋ (g, [f ]r) 7→ βg([f ]r) := [fg]r ∈ (G/H)r .

Então, β define uma ação à direita de G sobre (G/H)r. De fato, tem-se que

1. Para cada g ∈ G, βg : (G/H)r → (G/H)r é bijetora, pois se existem f1, f2 ∈ G tais que [f1g]r = [f2g]r, então f1g ∼r f2g, ou seja, (f1g)(f2g)−1 ∈ H , ou seja, f1(f2)−1 ∈ H . Isso estabelece que f1 ∼r f2, ou seja, que [f1]r = [f2]r, provando que βg : (G/H)r → (G/H)r é injetora. Note-se que βg : (G/H)r → (G/H)r é sobrejetora, pois βg(f [g

−1]r) = [f ]r e variando f em G, [f ]r varre todo (G/H)r.

2. Para a identidade e ∈ G, βe([f ]r) = [fe]r = [f ]r para todo f ∈ G, provando que βe : (G/H)r → (G/H)r é a aplicação identidade.

3. Para todos g, h ∈ G vale βg(βh([f ]r)) = βg([fh]r) = [fhg]r = βhg([f ]r) para qualquer f ∈ G.

Isso provou que β : G× (G/H)r → (G/H)r é uma ação à direita de G em (G/H)r. Não é dif́ıcil ver que a ação β age transitivamente em (G/H)r. De fato, se e é a unidade de G, então αg([e]r) = [g]r

e variando g por todo G a imagem [g]r varre todo (G/H)r.

*

Os cosets (G/H)l e (G/H)r podem ser identificados e transformados em grupos se uma certa hipótese for feita sobre o subgrupo H e sua relação com G. Esse é nosso assunto na Seção 2.2.2.

2.2.2 Subgrupos Normais e o Grupo Quociente

• Subgrupos normais Seja G um grupo. Um subgrupo N de G é dito ser um subgrupo normal se gng−1 ∈ N para todo g ∈ G e todo n ∈ N .

Se N é um subgrupo normal de G denotamos esse fato escrevendo N  G. Observe que todo subgrupo de um grupo Abeliano G é normal.

E. 2.57 Exerćıcio. Sejam G e H dois grupos e ϕ : G → H um homomorfismo. Mostre que Ran (ϕ) := {ϕ(g)| g ∈ G} é um subgrupo de H . 6

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 92/1507

E. 2.58 Exerćıcio importante. Sejam G e H dois grupos e ϕ : G → H um homomorfismo. Seja eH a unidade de H . Mostre que Ker (ϕ) := {g ∈ G| ϕ(g) = eH} é um subgrupo normal de G. 6

Nota sobre a nomenclatura dos dois exerćıcios acima. O śımbolo Ran provém da palavra inglesa “range” (“alcance”, em português) e é freqüen-

temente empregado como sinônimo da imagem de uma função ou aplicação. O śımbolo Ker provem do inglês “kernel” (“núcleo” ou “caroço”, em

português).

• Cosets por subgrupos normais Nesse contexto, a seguinte proposição é fundamental.

Proposição 2.2 Seja G um grupo e seja N um subgrupo de G. Então, uma condição necessária e suficiente para que possamos identificar (G/N)l com (G/N)r, ou seja, para que tenhamos [g]l = [g]r para todo g ∈ G, é que N G, ou seja, que N seja um subgrupo normal de G. 2

Prova. Por definição, g′ ∈ [g]l se e somente existe n ∈ N tal que g−1g′ = n, o que é verdade se e somente se g′g−1 = gng−1. Mas g′ ∈ [g]r se e somente se g′g−1 ∈ N . Assim [g]l = [g]r para todo g ∈ G se e somente se gng−1 ∈ N para todo g ∈ G e n ∈ N , o que é verdade se somente se N é um subgrupo normal de G.

Com isso, caso N  G, definimos [g] := [g]l = [g]r para todo g ∈ G e definimos o coset de G por N por G/N := (G/N)l = (G/N)r , ou seja, G/N = {[g], g ∈ G}.

Advertência. O leitor deve ser advertido aqui que, infelizmente, é comum na literatura denotar o coset à esquerda (G/H)l por G/H , mesmo quando H não é normal (vide, por exemplo, [155] ou [71], entre outros). Evitaremos fazer isso, pois isso pode levar a uma confusão de conceitos.

• Ações à direita e à esquerda sobre o coset por um subgrupo normal Se H é um subgrupo qualquer de G, definimos páginas acima uma ação transitiva à esquerda α : G × (G/H)l →

(G/H)l e uma ação transitiva à direita β : G × (G/H)r → (G/H)r. Fica claro pela Proposição 2.2 que se N  G, podemos definir tanto

α : G× (G/N) → G/N tal que G× (G/N) ∋ (g, [f ]) 7→ αg([f ]) := [gf ] ∈ G/N

como uma ação à esquerda de G sobre G/N quanto

β : G× (G/N) → G/N tal que G× (G/N) ∋ (g, [f ]) 7→ βg([f ]) := [fg] ∈ G/N

como uma ação à direita de G sobre G/N . Ambas as ações agem transitivamente.

• O grupo quociente de G por N Subgrupos normais são importantes, pois com eles podemos fazer da coleção de classes de equivalência G/N um

grupo, denominado grupo quociente de G por N . A construção é a seguinte.

Seja N  G. Podemos fazer de G/N um grupo definindo o produto como [g]N [h]N = [gh]N . É muito fácil ver que, se esta expressão está bem definida, ela de fato representa um produto associativo na coleção de classes de equivalência G/N . O elemento neutro seria a classe [e]N , onde e é a identidade de g. Por fim, [g]

−1 N = [g

−1]N . O ponto não-trivial é mostrar que a definição de produto como [g]N [h]N = [gh]N faz sentido, ou seja, é independente dos elementos tomados nas classes de g e h. Para isso precisaremos que N seja normal.

O que temos de fazer é mostrar que se g′ ∼N g e h′ ∼N h então g′h′ ∼N gh, ou seja, precisamos mostrar que se g′g−1 ∈ N e h′h−1 ∈ N então g′h′(gh)−1 ∈ N . Mas, de fato, tem-se que

g′h′(gh)−1 = g′h′h−1g−1 = (g′g−1)[g(h′h−1)g−1] .

Agora, por hipótese, h′h−1 ∈ N . Dáı, como N é normal (é aqui que essa hipótese entra pela primeira vez), g(h′h−1)g−1 ∈ N . Como, também pela hipótese, g′g−1 ∈ N e N é um subgrupo, conclúımos que g′h′(gh)−1 ∈ N , ou seja, g′h′ ∼N gh.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 93/1507

Assim [g]N [h]N = [gh]N está bem definido e faz das classes G/N um grupo. Esse grupo é denominado de grupo quociente de G por N .

A noção de grupo quociente é muito importante na teoria de grupos e iremos explorar algumas das aplicações nessas notas. Adiante usaremo-la para construir a noção de produto tensorial e soma direta de vários objetos, tais como grupos, álgebras etc. A noção de grupo quociente é importante por permitir estudar a relação de certos grupos entre si. Mais adiante, por exemplo, mostraremos que o grupo SO(3) é isomorfo ao grupo SU(2)/{1, −1}, um resultado de direto interesse f́ısico na Mecânica Quântica. A noção de grupo quociente é também muito importante em problemas combinatórios envolvendo grupos, mas não falaremos disso aqui. Para uma discussão mais ampla, vide [154], [155] ou [127].

2.2.3 O Centro de um Grupo. Centralizadores e Normalizadores

• O centro de um grupo Seja G um grupo. O conjunto dos elementos de G que têm a propriedade de comutarem com todos os elementos de

G é denominado o centro do grupo G e é freqüentemente denotado por31 Z(G). Em śımbolos:

Z(G) := {h ∈ G| hg = gh para todo g ∈ G} .

Note que Z(G) nunca é um conjunto vazio, pois o elemento neutro de G sempre pertence e Z(G). Em alguns grupos, porém, esse pode ser o único elemento de Z(G). Esse é o caso, por exemplo, do grupo de permutações de n elementos (por que?).

E. 2.59 Exerćıcio. Mostre que Z(G) é sempre um subgrupo Abeliano de G. 6

É elementar constatar que para qualquer grupo G, seu centro Z(G) é um subgrupo normal de G. É igualmente elementar constatar que se G é Abeliano então Z(G) = G.

• Centralizadores e normalizadores Seja G um grupo e F um subconjunto não vazio de G.

Dado um elemento h ∈ G, denotamos por hFh−1 o conjunto de todos os elementos de G que sejam da forma hfh−1 para algum f ∈ F , ou seja, hFh−1 := {hfh−1, f ∈ F}.

O chamado normalizador de F (emG), denotado porN(F, G) (ou simplesmente porN(F ), quandoG é subentendido), é o conjunto de todos os elementos g ∈ G tais que gFg−1 = F .

O chamado centralizador de F (em G), denotado por C(F, G) (ou simplesmente por C(F ), quando G é subentendido), é o conjunto de todos os elementos de G que comutam com todos os elementos de F :

C(F, G) := {g ∈ G| gf = fg para todo f ∈ F} .

E. 2.60 Exerćıcio. Mostre que o centralizador de F ⊂ G é um subgrupo de G. 6

E. 2.61 Exerćıcio. Se F ⊂ G, mostre que o normalizador N(F ) ≡ N(F, G) de F em G é um subgrupo de G. Mostre que se F é um subgrupo de G então F é normal em relação a N(F ) (ou seja, F  N(F )) e que se H é um subgrupo de G tal que F é normal em relação a H (ou seja, F H), então H ⊂ N(F ) e, portanto, N(F ) é o maior subgrupo de G em relação ao qual F é normal. 6

• O centro de GL(C, n) Como exerćıcio vamos determinar o centro de GL(C, n). Se A ∈ Z(GL(C, n)) então AB = BA para toda B ∈

GL(C, n). Tomemos, em particular, uma matriz B da forma B = 1 + Ea, b, onde Ea, b, com a, b ∈ {1, . . . , n}, é a 31O emprego da letra Z provavelmente provem da palavra alemã “Zentrum”.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 94/1507

matriz cujo elemento ij é nulo a menos que i = a e que j = b, em cujo caso (Ea, b)ij = 1. Em śımbolos, (E a, b)ij = δiaδjb.

(Antes de prosseguir, convença-se que 1+ Ea, b ∈ GL(C, n), notando que det(1 + Ea, b) 6= 0). Agora, como AB = BA, segue que AEa, b = Ea, bA. Pela regra de produto de matrizes, isso significa

(AEa, b)ij =

n∑

k=1

Aik(E a, b)kj =

n∑

k=1

Aikδkaδjb = Aiaδjb

q

(Ea, bA)ij =

n∑

k=1

(Ea, b)ikAkj =

n∑

k=1

δiaδkbAkj = Abjδia .

Assim, Aiaδjb = Abjδia. Tomando-se j = b, conclúımos Aia = Abbδia. Para i = a isso diz que Aaa = Abb e, como a e b são arbitrários, conclúımos dessa igualdade que Abb = λ, constante independente de b. Dáı, Aia = λδia, o que significa que A = λ1. Como det(A) 6= 0, devemos ter λ 6= 0.

Para futura referência expressamos nossas conclusões na forma de uma proposição:

Proposição 2.3 O centro do grupo GL(C, n), ou seja, Z(GL(C, n)), coincide com o conjunto de todas as matrizes da forma λ1, com λ 6= 0, ou seja, é o conjunto das matrizes não-nulas que são múltiplos da unidade. Em śımbolos,

Z(GL(C, n)) = {λ1, λ ∈ C, λ 6= 0} . Como conseqüência podemos afirmar que se uma matriz A ∈ Mat (C, n) comuta com todas as demais matrizes de Mat (C, n) então A = λ1 para algum λ ∈ C. 2 E. 2.62 Exerćıcio. Mostre que o centro de SL(C, n) é o conjunto de todas as matrizes da forma λ1, com λ ∈ C satisfazendo λn = 1. Mostre que esse grupo é isomorfo ao grupo Zn. 6

E. 2.63 Exerćıcio. Mostre que o centro de SL(R, n) é o conjunto de todas as matrizes da forma λ1, com λ ∈ R satisfazendo λn = 1. Esse grupo é {1} quando n é ı́mpar e {1, −1} quando n é par. (Lembre-se que SL(R, n) é formado apenas por matrizes reais). 6

2.2.4 Grupos Gerados por Conjuntos. Grupos Gerados por Relações

• Suporte de uma função Seja f : X → G uma função de um conjunto não-vazio X em um grupo G. O suporte de f , denotado por supp (f), é

o conjunto de todos os pontos x ∈ X tais que f(x) 6= e, onde e é a unidade de G: supp (f) := {x ∈ X | f(x) 6= e}. Uma função f : X → G é dita ser de suporte finito se seu suporte for um conjunto finito.

• Grupo Abeliano livremente gerado por um conjunto Uma noção importante que usaremos adiante é a de grupo Abeliano livremente gerado por um conjunto X . Seja X um

conjunto. Seja F (X) a coleção de todas as funções de suporte finito de X em Z. É fácil ver que F (X) tem naturalmente uma estrutura de grupo Abeliano, definindo, para f , f ′ ∈ F (X) o produto de f e f ′ como sendo o elemento ff ′ = (f+f ′) de F (X) dado por

(f + f ′)(x) = f(x) + f ′(x) . (2.27)

para todo x ∈ X . É claro que esse (f + f ′) tem suporte finito. O elemento neutro e de F (X) é claramente a função identicamente nula. Pelo fato de F (X) ter essa estrutura natural de grupo F (X) é denominado grupo Abeliano livremente gerado pelo conjunto X .

Para x ∈ X vamos denotar por δx a função caracteŕıstica de x:

δx(y) :=

{ 1, se y = x 0, se y 6= x . (2.28)

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 95/1507

Claramente δx ∈ F (X). Dado que cada f ∈ F (X) tem suporte finito, pode-se escrevê-lo da forma

f =

N∑

n=1

an δxn , (2.29)

para valores de N e dos an’s dependentes de f , com {x1, . . . , xN} = supp f e com ai ∈ Z para i = 1, . . . , N . Com um flagrante abuso de linguagem é costume escrever (2.29) da forma

f =

N∑

n=1

an xn , (2.30)

onde fica, por assim dizer, subentendido que aqui os xn’s representam não os elementos de X mas sim suas funções caracteŕısticas (X pode ser um conjunto qualquer, de modo que operações como soma de elementos de X ou multiplicação de elementos de X por um inteiro podem não serem sequer definidas).

É fácil verificar que F (X) é um grupo Abeliano livre (dáı seu nome), o que quer dizer que não há em F (X) nenhuma

relação não-trivial entre seus elementos, a não ser aquela que lhe confere Abelianidade: ff ′f−1f ′ −1

= e.

• Relações e grupos gerados módulo relações Vamos passar agora a uma construção muito importante, a de grupo Abeliano livremente gerado por um conjunto

módulo relações. Vamos apresentar essa construção de forma bem geral.

Seja J um conjunto (em prinćıpio arbitrário) de ı́ndices e sejam então, para cada j ∈ J , elementos de F (X) dados por

rj :=

n(j) ∑

i=1

αj, i xj, i , (2.31)

onde, para cada j ∈ J , n(j) ∈ N e, para todo j ∈ J e i ∈ {1, . . . , n(j)}, tem-se αj, i ∈ Z e xj, i ∈ X com xj, i 6= xj, i′ se i 6= i′. Denotamos R := {rj , j ∈ J}. Os elementos de R serão chamados “relações”.

Seja então R o subgrupo de F (X) formado por todos os elementos de F (X) que são combinações lineares finitas de rj ’s com coeficientes em Z:

s ∈ R ⇐⇒ s = s1rj1 + · · ·+ smrjm , (2.32) para certos si ∈ Z e m ∈ N, que dependem de s. R é dito ser o subgrupo de F (X) gerado pelos rj ’s.

Por ser um subgrupo de um grupo Abeliano, R é normal. Assim, podemos definir o grupo Abeliano livremente gerado por X, módulo as relações R como sendo o grupo F (X)/R. Note-se que [R]R = e, o que equivale a dizer que os elementos de R são identificados como zero (dáı serem chamados de “relações”, pois refletem identidades que não existiam em F (X) e que estão sendo agora impostas em F (X)/R).

*

Mais adiante vamos usar as definições e construções acima nas definições de produto tensorial de grupos Abelianos e de espaços vetoriais.

2.2.5 O Produto Direto e o Produto Semi-Direto de Grupos. O Produto

Tensorial de Grupos Abelianos

Vamos aqui descrever alguns procedimentos importantes que permitem construir um grupo a partir de outros grupos dados: o produto direto e o produto semi-direto de grupos. Para o caso de grupos Abelianos descreveremos também o chamado produto tensorial, de importância na definição de produtos tensoriais de espaços vetoriais.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 96/1507

2.2.5.1 O Produto Direto de Grupos

• O produto direto de dois grupos Se G e H são dois grupos, cujas identidades são eG e eH , respectivamente é por vezes muito importante fazer do

produto Cartesiano G×H um grupo. A maneira mais fácil é definir o produto de dois pares ordenados (g1, h1), (g2, h2), com g1, g2 ∈ G e h1, h2 ∈ H , por

(g1, h1) · (g2, h2) := (g1g2, h1h2) . O leitor pode facilmente se convencer que esse produto é associativo, que (eG, eH) é o elemento neutro e que (g, h)

−1 = (g−1, h−1).

Isso faz de G×H um grupo, denominado produto direto de G e H e denotado também por G×H (vide comentário sobre a notação adiante). Alternativamente, esse grupo pode ser chamado também de soma direta de G e H e denotado por G⊕H . No caso de haver uma famı́lia finita de grupos envolvida não há distinção entre a noção de produto direto e de soma direta. Vide adiante.

E. 2.64 Exerćıcio. Mostre que os produtos diretos G⊕H e H ⊕G são grupos isomorfos. 6

• Produto direto e soma direta de coleções arbitrárias de grupos As idéias de acima podem ser generalizadas com as definições de produtos diretos e somas diretas de coleções arbitrárias

de grupos (não necessariamente Abelianos).

Seja J um conjunto arbitrário de ı́ndices e G := {Gj , j ∈ J} uma coleção de grupos. Seja o produto Cartesiano32 G :=×

j∈J

Gj . Podemos fazer de G um grupo definindo o produto de dois elementos G ∋ g =× j∈J

( gj ) , G ∋ h =×

j∈J

( hj )

como g · h =× j∈J

( gjhj

) . Com essa estrutura G é dito ser o produto direto dos grupos Gj , j ∈ J , e será denotado por

Gp =× j∈J

Gj ou por Gp = ∏

j∈J

Gj . Vide comentário sobre notação, adiante.

O produto direto Gp possui um subgrupo importante, aquele formado por elementos× j∈J

gj ∈ Gp onde apenas um

número finito de gj ’s é distinto da identidade ej do respectivo grupo Gj . Esse subgrupo é dito ser a soma direta dos

grupos Gj , j ∈ J , e é denotado por Gs = ⊕

j∈J

Gj .

Comentário sobre a notação. O uso dos śımbolos× j∈J

Gj ou ∏

j∈J

Gj para denotar o produto direto da famı́lia de grupos

{Gj, j ∈ J} não é universal. Muitos autores, especialmente em textos mais antigos, usam o śımbolo ⊗

j∈J

Gj . Evitamos

fazê-lo, pois o śımbolo ⊗ é mais freqüentemente empregado para denotar produtos tensoriais de grupos Abelianos, uma noção que introduziremos na Seção 2.2.5.3, página 99. É importante observar também que no caso de J ser um conjunto

finito não há distinção entre o produto direto e a soma direta: ∏

j∈J

Gj = ⊕

j∈J

Gj (se J for finito).

Neste ponto devemos gastar algumas palavras sobre a questão da associatividade das construções de acima. Dados três grupos G1, G2 e G3, podemos, repetindo o procedimento de construção da soma direta de dois grupos, construir os grupos G1⊕ (G2 ⊕G3) e (G1 ⊕G2)⊕G3, assim como podemos construir diretamente o grupo G1⊕G2⊕G3. A distinção entre esses três objetos, enquanto conjuntos, muito se assemelha à distinção entre produtos Cartesianos de três conjuntos que fizemos à página 28 e é conveniente ignorá-la na grande maioria das situações. É de se notar também que se trata de três grupos isomorfos, pois

ϕ1 : G1 ⊕ (G2 ⊕G3) → G1 ⊕G2 ⊕G3 , ϕ1 ( a1 ⊕ (a2 ⊕ a3)

) := a1 ⊕ a2 ⊕ a3

ϕ2 : (G1 ⊕G2)⊕G3 → G1 ⊕G2 ⊕G3 , ϕ2 ((a1 ⊕ a2)⊕ a3) := a1 ⊕ a2 ⊕ a3 32Para a notação, vide página 27.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 97/1507

são dois isomorfismos de grupo, como facilmente se constata, os quais são denominados isomorfismos canônicos.

2.2.5.2 O Produto Semi-Direto Grupos

• O produto semi-direto de dois grupos Dados dois grupos G e H há uma outra maneira de fazer de G × H um grupo além do produto direto. Para tal é

necessário que exista uma ação de G em H por automorfismos de H . Expliquemos melhor isso.

Lembremos que um automorfismo α de um grupo H é um isomorfismo de H em si mesmo α : H → H . Uma ação (à esquerda) de G sobre H por automorfismos é um função α : G×H → H tal que a cada par (g, h) ∈ G×H associa um elemento denotado por αg(h) de H de tal forma que as seguintes condições sejam satisfeitas:

1. Para todo g ∈ G, a função αg(·) : H → H é um automorfismo de H , ou seja, αg(h)αg(h′) = αg(hh′), sendo que αg(·) : H → H é bijetora com (αg)−1 = αg−1 .

2. Para todo h ∈ H vale αeG(h) = h.

3. Para todo h ∈ H vale αg(αg′(h)) = αgg′(h) para quaisquer g, g′ ∈ G.

Acima eG e eH são as unidades de G e H , respectivamente.

E. 2.65 Exerćıcio-exemplo. Um exemplo importante é o seguinte. Seja N G. Então, com n ∈ N , αg(n) := gng−1 define uma ação (à esquerda) de G sobre N por automorfismos. Verifique! 6

Pela definição geral, tem-se pelas propriedades 1, 2 e 3 acima que para quaisquer g ∈ G e h ∈ H

αg(eH)h = αg(eH)αg(αg−1(h)) = αg(eHαg−1(h)) = αg(αg−1(h)) = h ,

o que implica αg(eH) = eH para todo g ∈ G. Se G e H são grupos e α : G × H → H é uma ação à esquerda de G sobre H por automorfismos, então podemos

definir em G×H um produto de dois pares ordenados (g1, h1), (g2, h2), com g1, g2 ∈ G e h1, h2 ∈ H , por

(g1, h1) · (g2, h2) := (g1g2, h1αg1(h2)) .

E. 2.66 Exerćıcio importante. Mostre que esse produto é associativo, que (eG, eH) é a unidade e que para quaisquer

g ∈ G, h ∈ H tem-se (g, h)−1 = (g−1, αg−1(h−1)). 6

Com isso G ×H adquire a estrutura de um grupo, denominado produto semi-direto de G por H pelo automorfismo α : G×H → H , ou simplesmente produto semi-direto de G por H quando um automorfismo α : G×H → H espećıfico é subentendido. Na literatura, o produto semi-direto de G por H é denotado de várias formas: por G×α H , por G⊗α H , por GsαH , ou por por GsH quando um automorfismo α : G × H → H espećıfico é subentendido. Nestas notas adotaremos as duas últimas formas.

• Exemplos I. Seja G um grupo e N G. Então, para g1, g2 ∈ G e n1, n2 ∈ N o produto

(g1, n1) · (g2, n2) := (g1g2, n1g1n2g−11 )

define o grupo GsN , produto semi-direto de um grupo G por um subgrupo normal N através do automorfismo natural.

II. Considere o grupo G, formado por todos os números reais não-nulos com o produto dado pela multiplicação usual e o grupo H , formado por todos os reais com o produto dado pela soma: G = (R \ {0}, ·) e H = (R, +).

Para todo a ∈ R\{0} e x ∈ R definimos α : G×H → H por αa(x) := ax. Para cada a ∈ G, tem-se que αa é bijetora, com inversa dada por α1/a. Fora isso, αa(x) + αa(y) = ax+ ay = a(x+ y) = αa(x+ y). Assim, αa é um automorfismo (condição 1. da definição acima). Fora isso, para todo x ∈ H , α1(x) = x (condição 2.). Por fim, para todo x ∈ H ,

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 98/1507

αa(αb(x)) = abx = αab(x), para quaisquer a, b ∈ G (condição 3.). Conclúımos que α é uma ação à esquerda de G sobre H por automorfismos.

Assim, fazemos de G×H um grupo GsαH com o produto

(a, x) · (b, y) := (ab, x+ ay) .

O elemento neutro é o par (1, 0) e (a, x)−1 = (1/a, −x/a). Para interpretar o que esse grupo GsαH significa, vamos definir uma ação33 Γ de GsαH sobre o conjunto R da

seguinte forma. Para (a, x) ∈ GsαH e z ∈ R, definimos

Γ((a, x), z) := az + x .

Para verificar que isso é uma ação notemos as seguintes propriedades: i. para cada (a, x) fixo Γ((a, x), z) é uma função bijetora de R em R (lembre-se que a 6= 0). ii. Para todo z ∈ R, Γ((1, 0), z) = z.

iii. Γ((a, x), Γ((b, y), z)) = Γ((a, x), bz + y) = a(bz + y) + x = abz + (x+ ay)

= Γ((ab, x+ ay), z) = Γ((a, x) · (b, y), z) .

Isso mostrou que Γ é uma ação de GsαH sobre o conjunto R. Como vemos, a ação de um elemento (a, x) consiste em uma combinação de uma multiplicação por a 6= 0 seguida por uma translação por x ∈ R. Isso exibe o significado geométrico do grupo GsαH . Vamos a um outro exemplo semelhante.

III. Considere o conjunto de todas as operações do espaço tridimensional que envolvem rotações e translações. Por exemplo, considere-se a operação na qual cada vetor ~x é primeiramente rodado por uma matriz de rotação R ∈ SO(3) e em seguida é transladado por um vetor ~x0:

~x 7→ R~x+ ~x0. (2.33) A composição de duas de tais operações conduz à transformação ~x 7→ R′(R~x+ ~x0) + ~x′0, ou seja,

~x 7→ (R′R)~x+ ~x′0 +R′~x0 . (2.34)

O espaço vetorialR3 é naturalmente um grupo Abeliano em relação à adição de vetores. Se R ∈ SO(3), αR(~x0) := R~x0 define uma ação por automorfismos de SO(3) sobre R3. A expressão (2.34) inspira a definição do produto semi-direto SO(3)sαR3 por

(R′, ~x′0) · (R, ~x0) = (R′R, ~x′0 +R′~x0) .

E. 2.67 Exerćıcio. Verifique que a transformação (2.33) define uma ação à esquerda do grupo SO(3)sαR3 sobre o conjunto R3. 6

Definição. Os grupos En := SO(n)sαRn são denominados grupos Euclidianos34.

IV. Seja V um espaço vetorial (e, como tal, um grupo Abeliano em relação à soma de vetores) e seja Aut(V ) a coleção de todas as aplicações lineares bijetoras de V em V .

Por exemplo V = Rn e Aut(Rn) é o conjunto de todas as matrizes reais n× n inverśıveis. Então, fazemos de Aut(V )× V um grupo, definindo

(A, v) · (B, u) := (AB, v +Au) .

Esse grupo é por vezes denominado grupo afim do espaço vetorial V .

Observação. O caso V = R corresponde exatamente ao exemplo II, acima.

Mencionamos, por fim, que o grupo de Poincaré, introduzido à página 837, é também um exemplo de um grupo definido como um produto semi-direto de dois grupos, a saber, o produto semi-direto do grupo das transformações de Lorentz com grupo das translações no espaço-tempo.

33O conceito de ação de um grupo em um conjunto foi definido à página 82. 34Para alguns autores, os grupos Euclidianos são os grupos O(n)sαRn.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 99/1507

2.2.5.3 Produtos Tensoriais de Grupos Abelianos

• A noção “intuitiva” de produto tensorial de dois grupos Recordemos primeiramente na situação mais simples a noção de soma direta de dois grupos Abelianos, introduzida

na Seção 2.2.5.1, página 96. Sejam A e B dois grupos Abelianos, com identidades eA e eB (e cujas operações de produto denotaremos ambas pelo mesmo śımbolo “+”). Desejamos encontrar uma maneira de fazer do produto Cartesiano A×B um grupo também. Uma maneira de fazer isso é definir a “soma” de dois pares ordenados (a, b), (a′, b′) ∈ A×B por

(a, b) + (a′, b′) := (a+ a′, b+ b′) . (2.35)

O leitor pode facilmente constatar que essa operação é uma operação binária de A×B em si mesmo, que ela é associativa, que tem por elemento neutro o par (eA, eB) e que para cada (a, b) ∈ A ×B a inversa é (a, b)−1 = (−a, −b), onde −a é o elemento inverso de a em A, e analogamente para −b. Portanto, com esse produto, A × B é um grupo Abeliano, denominado soma direta de A e B ou produto direto de A e B35 e denotado pelo śımbolo A⊕B. Com essa estrutura de grupo em mente, os pares ordenados (a, b) são freqüentemente denotados pelo śımbolo a⊕ b.

A definição de produto tensorial de dois grupos Abelianos A e B, que denotaremos por A⊗B, é distinta da de soma direta. A idéia básica, porém, é a mesma, ou seja, tentar fazer do produto Cartesiano A× B um grupo, mas a regra de produto é muito diferente daquela dada em (2.35). Em primeiro lugar, os elementos de A⊗B são somas formais finitas de pares ordenados de A×B como (a, b)+ (a′, b′), mas não impomos a relação (2.35). O que realmente entendemos por “soma formal” será precisado adiante, fazendo uso do conceito de grupo Abeliano livremente gerado por um conjunto, uma noção introduzida na Seção 2.2.4, página 94. Por ora fiquemos apenas com a noção intuitiva. Para dar a A ⊗ B uma estrutura de grupo, desejamos impor algumas condições às somas formais acima. Primeiramente impomos que

(a, b) + (a′, b′) = (a′, b′) + (a, b) ,

para todos a, a′ ∈ A, b, b′ ∈ B. Em segundo lugar, impomos que

(a+ a′, b) = (a, b) + (a′, b) e que (a, b+ b′) = (a, b) + (a, b′)

para todos a, a′ ∈ A, b, b′ ∈ B. O estudante deve notar que essas imposições são mais limitadas que aquelas de (2.35). As imposições acima são inspiradas na bem-conhecida propriedade de transitividade de produtos e somas de números reais ou complexos: (x+ x′)y = xy + x′y e x(y + y′) = xy + xy′.

E. 2.68 Exerćıcio. Mostre que com as regras de soma dadas acima todos os pares (eA, b) e (a, eB) são identificados entre si e com o elemento neutro da operação de soma de pares ordenados. Fora isso, o elemento inverso de um par (a, b) é (−a, b) = (a, −b). Mostre que, com isso, A⊗B é um grupo Abeliano, denominado Produto Tensorial dos Grupos Abelianos A e B. 6

Com essa estrutura de grupo em mente, os pares ordenados (a, b) são freqüentemente denotados pelo śımbolo a⊗ b.

• O produto tensorial de uma coleção finita de grupos Abelianos A definição geral abstrata de produtos tensoriais de uma coleção finita de grupos Abelianos faz uso do conceito de

grupo livremente gerado por um conjunto, noção discutida na Seção 2.2.4, página 94. Usaremos a notação lá empregada. Comecemos com o caso de dois grupos Abelianos para passarmos depois ao caso de uma coleção finita de grupos Abelianos.

Sejam A1 e A2 dois grupos Abelianos cujo produto de grupo denotaremos aditivamente: com o śımbolo +. Seja X = A1 ×A2. Seja em F (X) = F (A1 ×A2) o conjunto R de relações dado por

R := {

r ∈ F (X) ∣ ∣ ∣ r = (a1 + a

′ 1, a2)− (a1, a2)− (a′1, a2)

ou r = (a1, a2 + a ′ 2)− (a1, a2)− (a1, a′2) , com a1, a′1 ∈ A1 e a2, a′2 ∈ A2

}

. (2.36)

Seja R = R(A1 ×A2) o subgrupo de F (A1 ×A2) gerado por R. Chegamos assim à definição do grupo Abeliano A1 ⊗A2, o produto tensorial de A1 e A2, que é definido como A1 ⊗A2 := F (A1 ×A2)/R(A1 ×A2).

35A distinção entre produto direto e soma direta só se faz quando uma coleção não-finita de grupos é envolvida. Vide Seção 2.2.5.1, página 96.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 100/1507

Notação. Para a1 ∈ A1 e a2 ∈ A2 denotaremos por a1⊗a2 o elemento de A1⊗A2 que corresponde (na notação discutida acima) à função δ(a1, a2).

Essas idéias podem agora ser facilmente generalizadas para o caso de uma coleção finita A1, . . . , An de grupos Abelianos. Como acima, consideramos X = A1 × · · · ×An. Seja em F (X) = F (A1 × · · · ×An) o conjunto R de relações dado por R =

⋃n k=1 Rk, onde

Rk := {

r ∈ F (X)| r = (a1, . . . , ak−1, ak + a′k, ak+1, . . . an)

− (a1, . . . , ak−1, ak, ak+1, . . . an)− (a1, . . . , ak−1, a′k, ak+1, . . . an) ,

com aj ∈ Aj para todo j = 1, . . . , n e a′k ∈ Ak }

.

Seja R = R(A1×· · ·×An) o subgrupo de F (A1×· · ·×An) gerado por R. Chegamos assim à definição do grupo Abeliano A1⊗· · ·⊗An, o produto tensorial de A1, . . . , An, que é definido como A1⊗· · ·⊗An := F (A1×· · ·×An)/R(A1×· · ·×An).

Os elementos de A1 ⊗ · · · ⊗ An são denotados por a1 ⊗ · · · ⊗ an, com ak ∈ Ak para cada k. O elemento neutro de A1 ⊗ · · · ⊗An é da forma

e1 ⊗ a2 ⊗ · · · ⊗ an = · · · = a1 ⊗ · · · ⊗ an−1 ⊗ en , (2.37) onde, para cada k, ek é o elemento neutro de Ak. Isso se vê do fato que vale

a1 ⊗ a2 ⊗ · · · ⊗ an + e1 ⊗ a2 ⊗ · · · ⊗ an = (a1 + e1)⊗ a2 ⊗ · · · ⊗ an = a1 ⊗ a2 ⊗ · · · ⊗ an , ...

... ...

a1 ⊗ a2 ⊗ · · · ⊗ an + a1 ⊗ a2 ⊗ · · · ⊗ en = a1 ⊗ a2 ⊗ · · · ⊗ (an + en) = a1 ⊗ a2 ⊗ · · · ⊗ an .

As igualdades em (2.37) seguem da unicidade do elemento neutro de um grupo. Como facilmente se constata, a inversa de um elemento da forma a1 ⊗ a2 ⊗ · · · ⊗ an é

− ( a1 ⊗ a2 ⊗ · · · ⊗ an

) = (−a1)⊗ a2 ⊗ · · · ⊗ an = · · · = a1 ⊗ · · · ⊗ an−1 ⊗ (−an) ,

onde −ak é a inversa de ak em Ak. Novamente, as igualdades acima seguem da unicidade da inversa em um grupo. Como discutimos no caso de somas diretas, os grupos A1 ⊗ (A2 ⊗A3), (A1 ⊗A2)⊗A3 e A1 ⊗A2 ⊗A3 são isomorfos,

com os isomorfismos canônicos definidos por

ϕ1 : A1 ⊗ (A2 ⊗A3) → A1 ⊗A2 ⊗A3 , ϕ1 ( ∑

k

αk a k 1 ⊗

( ak2 ⊗ ak3

)

)

:= ∑

k

αk a k 1 ⊗ ak2 ⊗ ak3 ,

ϕ2 : (A1 ⊗A2)⊗A3 → A1 ⊗A2 ⊗A3 , ϕ2 ( ∑

k

αk ( ak1 ⊗ ak2

) ⊗ ak3

)

:= ∑

k

αk a k 1 ⊗ ak2 ⊗ ak3 ,

e analogamente para o caso em que se tem uma coleção maior de fatores. Acima, αk ∈ Z e aki ∈ Ai para todo i e k, as somas em k sendo, naturalmente, finitas.

E. 2.69 Exerćıcio. Mostre que ϕ1 e ϕ2, definidos acima, são, de fato, isomorfismos de grupo. 6

2.3 Espaços Vetoriais. Estruturas e Construções Básicas

Nesta seção apresentaremos algumas estruturas e construções básicas da teoria dos espaços vetoriais. Discutiremos a noção de espaço quociente e apresentaremos duas maneiras distintas de construir espaços vetoriais a partir de uma coleção dada de espaços vetoriais (sobre um mesmo corpo), a chamada soma direta espaços vetoriais e o chamado produto tensorial de espaços vetoriais. Um comentário pertinente (destinado aos estudantes mais avançados) é que as construções que

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 101/1507

apresentaremos adiante correspondem às noções de soma direta e produto tensorial algébricos. Isso significa que outras estruturas, como uma topologia, ou propriedades, como completeza, não são necessariamente herdadas pela construção. Assim, por exemplo, o produto tensorial algébrico de dois espaços de Banach não é necessariamente um espaço de Banach. Para tal é necessário introduzir um completamento extra, que pode não ser único.

2.3.1 Bases Algébricas de um Espaço Vetorial

• Dependência linear Seja V um espaço vetorial sobre um corpo K. Um conjunto finito u1, . . . , un ∈ V de vetores é dito ser linearmente

dependente se existir um conjunto de escalares α1, . . . , αn ∈ K, nem todos nulos, tais que

α1u1 + · · ·+ αnun = 0 .

Um conjunto arbitrário de vetores é dito ser linearmente independente se não possuir nenhum subconjunto finito que seja linearmente dependente.

• Combinações lineares Para um conjunto finito de vetores {u1, . . . , un} ⊂ V e de escalares {α1, . . . , αn} ⊂ K, uma expressão como

α1u1 + · · ·+ αnun

é dita ser uma combinação linear dos vetores u1, . . . , un.

• Varredura linear Seja C ⊂ V um conjunto de vetores. A varredura linear (“linear span”) de C, denotado por span (C) é o conjunto

de todos os vetores de V que podem ser escritos como uma combinação linear finita de elementos de C.

• Bases algébricas em espaços vetoriais Aqui I designa um conjunto arbitrário não-vazio de ı́ndices.

Uma base algébrica36 em um espaço vetorial V é um conjunto B = {bi, i ∈ I} de vetores linearmente independentes tais que span (B) = V e tais que qualquer vetor u de V pode ser escrito de modo único como uma combinação linear finita de elementos de B.

Se B é uma base algébrica, então para cada u ∈ V existem univocamente definidos α1, . . . , αn ∈ K e i1, . . . , in ∈ I tais que:

u = α1bi1 + · · ·+ αnbin .

Os seguintes teoremas podem ser demonstrados com uso do Lema de Zorn (omitiremos as demonstrações aqui. Vide, por exemplo, [75]).

Teorema 2.4 Todo espaço vetorial V possui uma base algébrica, exceto o espaço vetorial trivial V = {0}. 2

Teorema 2.5 Dado um espaço vetorial V (não-trivial), todas as bases algébricas em V têm a mesma cardinalidade. 2

• Dimensão algébrica Um espaço vetorial é dito ser de dimensão algébrica finita se possuir uma base algébrica finita. Se um espaço vetorial

V tem dimensão algébrica finita, sua dimensão algébrica, ou simplesmente dimensão é definida como sendo o número de elementos de sua base.

36Também denominada “base de Hamel”. Georg Hamel (1877-1954).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 102/1507

Nem todo espaço vetorial tem uma base algébrica finita (vide exemplos abaixo). De modo geral, se um espaço vetorial possui uma base algébrica, sua dimensão algébrica é definida como sendo a cardinalidade de suas bases algébricas (pelo Teorema 2.5 acima são todas iguais).

Exemplo 1. V = Cn sobre o corpo dos complexos ou V = Rn sobre o corpo dos reais. Tais são bem conhecidos exemplos-protótipo de espaços vetoriais de dimensão finita (= n).

Seja P = conjunto de todos os polinômios de uma variável real com coeficientes complexos: Pn(t) ∈ P,

Pn(t) = ant n + · · ·+ a1t+ a0

com t ∈ R, ai ∈ C, é dito ser um polinômio de grau n se an 6= 0. Exemplo 2. V = P sobre o corpo dos complexos. Este é claramente um espaço vetorial de dimensão infinita. V possui

uma base algébrica, a saber, o conjunto de todos os polinômios da forma bn = t n, n = 0, 1, 2, . . ..

Exemplo 3. V = R sobre o corpo dos reais. O conjunto dos reais sobre o corpo dos reais é também um espaço vetorial de dimensão 1, a saber, uma posśıvel base é formada pelo elemento 1: B = {1}, já que, obviamente, qualquer elemento x ∈ R pode ser escrito como x = x · 1, com x no corpo dos reais.

Esse exemplo pode parecer banal, e de fato o é, mas leva a um anti-exemplo curioso que mostra que a dimensão algébrica de um espaço vetorial é também fortemente dependente do corpo de escalares utilizado.

Exemplo 4. V = R sobre o corpo dos racionais.

A surpresa aqui é que este não é um espaço vetorial de dimensão algébrica finita: não existe um conjunto finito {x1, . . . , xm} de números reais tais que todo x ∈ R possa ser escrito como

x = r1x1 + · · ·+ rmxm ,

onde os números ri são racionais. A razão é que, como Q é um conjunto contável, a coleção de números que se deixam escrever como o lado direito é uma coleção contável (tem a mesma cardinalidade de Qm). O conjunto R, porém, não é contável.

Um resultado um tanto surpreendente diz, porém, que esse espaço vetorial possui uma base algébrica, ou seja, existe um conjunto H ⊂ R tal que para cada x ∈ R existe um conjunto finito h1, . . . , hn de elementos de H e um conjunto finito de racionais r1, . . . , rn tais que x = r1h1 + · · ·+ rnhn. A demonstração da existência de uma tal base faz uso do Lema de Zorn e pode ser encontrada em [25] ou [27]. Essa base é denominada base de Hamel de R.

Uma conseqüência curiosa da existência de bases de Hamel em R será discutida no tópico que se inicia à página 103.

Outros exemplos menos dramáticos que mostram a dependência da dimensão com o corpo utilizado são os seguintes: sejam V1 = C sobre o corpo dos complexos e V2 = C sobre o corpo dos reais. V1 tem dimensão 1, mas V2 tem dimensão 2.

Mais adiante faremos uso do seguinte resultado:

Teorema 2.6 Se em um espaço vetorial V existir um conjunto {v1, . . . , vn} de n vetores linearmente independentes, então a dimensão algébrica de V é maior ou igual a n. 2

Prova. A demonstração é feita por absurdo. Suponhamos que haja uma base B = {b1, . . . , bk} em V com k < n. Então podemos escrever

v1 = α1b1 + · · ·+ αkbk . pois B é uma base. Nem todos os αi podem ser nulos. Supondo que αk seja um elemento não-nulo, podemos escrever

bk = (αk) −1(v1 − α1b1 − · · · − αk−1bk−1) (2.38)

Analogamente, temos que v2 = β1b1 + · · ·+ βkbk

e, usando (2.38), podemos escrever v2 = γ1b1 + · · ·+ γk−1bk−1 + λ1v1 .

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 103/1507

Os γi não podem ser todos nulos, pois de outra forma teŕıamos v2 = λ1v1, contrariando a hipótese de os vi’s serem linearmente independentes. Suponhamos que γk−1 seja o elemento não-nulo, podemos escrever bk−1 como uma combinação linear envolvendo {b1, . . . , bk−2} e os vetores v1 e v2. Prosseguindo, concluiremos após k passos que

vk+1 = λ ′ 1v1 + · · ·+ λ′kvk ,

contrariando a hipótese de que os vi’s são linearmente independentes.

• Automorfismos descont́ınuos do grupo (R, +) Nota para os estudantes mais avançados. Neste tópico usaremos as bases de Hamel da reta real para ilustrar uma patologia cuja existência é por vezes menci-

onada na teoria de grupos, a saber, a existência de automorfismos descont́ınuos do grupo (R, +).

Considere-se a equação f(x+ y) = f(x) + f(y) para todo x, y ∈ R. Podemos nos perguntar: que funções f : R → R podem satisfazê-la? É bastante claro que funções do tipo f(x) = cx, com c constante real, satisfazem f(x+y) = f(x)+f(y) para todo x, y ∈ R. Fora isso, f(x) = cx são cont́ınuas e são bijeções de R em R (a menos que c = 0).

Serão essas as únicas funções com a propriedade f(x+y) = f(x)+f(y) para todo x, y ∈ R? Será que há outras funções com essa propriedade e que não sejam cont́ınuas? Será que há outras funções com essa propriedade, não-cont́ınuas, e que também sejam bijeções de R em R? A resposta a essa última pergunta é muito curiosa e conduz a uma classe de funções cuja existência ilustra algumas dificuldades encontradas na teoria de grupos.

Provemos em primeiro lugar a seguinte afirmação:

Proposição 2.4 Se f : R → R satisfizer f(x+ y) = f(x) + f(y) para todo x, y ∈ R e f for cont́ınua em toda reta real R, então f é da forma f(x) = cx para algum c, constante real. 2

Historicamente esse pequeno resultado é devido a Cauchy37.

Prova. Seja f cont́ınua satisfazendo f(x + y) = f(x) + f(y) para todo x, y ∈ R e f : R → R. É claro que, tomando x = y = 0 tem-se f(0) = f(0 + 0) = 2f(0) e, portanto f(0) = 0. Segue facilmente dáı que 0 = f(0) = f(x + (−x)) = f(x) + f(−x) e, portanto f(−x) = −f(x) para todo x ∈ R.

Seja agora p inteiro positivo e x real, ambos arbitrários. Teremos que f(px) = f((p− 1)x+x) = f((p− 1)x)+ f(x) = f((p − 2)x) + 2f(x) etc. Repetindo p vezes esse proceder, conclúımos que f(px) = pf(x). Como f(−x) = −f(x), essa relação vale para p negativo também. Seja agora q inteiro, não-nulo. Então, pelo que acabamos de provar, f(1) = f(q/q) = qf(1/q) e conclúımos que f(1/q) = f(1)/q. Se então tivermos um número racional r da forma r = p/q, com p inteiro e q inteiro não-nulo, teremos que f(r) = f(p/q) = pf(1/q) = (p/q)f(1) = rf(1). Finalizamos a prova evocando a continuidade de f e o fato que todo x real pode ser aproximado por um número racional: seja x ∈ R e rn, n ∈ N, uma seqüência de números racionais que converge a x, i.e., x = limn→∞ rn. Então f(x) = f(limn→∞ rn) = limn→∞ f(rn) = (limn→∞ rn) f(1) = xf(1). Na segunda igualdade usamos a hipótese (crucial!) que f é cont́ınua em toda parte. Denotando f(1) = c a afirmação está provada.

Com esse resultado em mãos podemos nos perguntar: haverá funções não-cont́ınuas que satisfazem f(x + y) = f(x) + f(y)? Talvez surpreendentemente, a resposta é positiva. Não só há funções não cont́ınuas com essa propriedade, mas há dentre elas funções bijetoras de R em R. Funções com tais caracteŕısticas um tanto patológicas podem ser constrúıdas com o uso das assim chamadas bases de Hamel da reta real. Detalhemos.

Seja o espaço vetorial V dos números reais sob o corpo dos racionais. Como consideramos páginas acima, esse espaço vetorial tem dimensão algébrica infinita, mas existe uma base H ⊂ R de V , não-contável, denominada base de Hamel, tal que todo elemento x de R pode ser escrito como combinação linear finita (única!) por racionais de elementos de H , ou seja, para todo x ∈ R existe um n (que depende de x), racionais r1, . . . , rn (que dependem de x) e elementos h1, . . . , hn de H (que também dependem de x) tais que x pode ser escrita (de forma única!) como x = r1h1+ · · ·+rnhn. Denominaremos essa expressão a decomposição de x em H .

Notemos que se x e y são números reais e x = r1h1 + · · ·+ rnhn e y = r′1h′1 + · · ·+ r′mh′m são suas decomposições em H , então a decomposição de x+ y é r1h1 + · · ·+ rnhn + r′1h′1 + · · ·+ r′mh′m.

37Augustin Louis Cauchy (1789-1857).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 104/1507

Vamos definir uma função f : R → R, da seguinte forma. Primeiramente fixamos seus valores nos elementos de H tomando, para cada h ∈ H , f(h) := fh ∈ R, onde os números fh são escolhidos arbitrariamente. Em segundo lugar, para qualquer x ∈ R, e cuja decomposição em H seja x = r1h1+ · · ·+ rnhn, definimos f(x) := r1f(h1)+ · · ·+ rnf(hn) = r1fh1 + · · · + rnfhn . Assim, se x e y são números reais e x = r1h1 + · · · + rnhn e y = r′1h′1 + · · · + r′mh′m são suas decomposições em H , teremos f(x+ y) = r1fh1 + · · ·+ rnfhn + r′1fh′1 + · · ·+ r′mfh′m = f(x) + f(y).

O leitor pode convencer-se que há, para cada base de Hamel H , infinitas funções desse tipo (devido à arbitrariedade da escolha dos fh’s) e que todas são descont́ınuas, exceto se escolhermos fh = ch para todo h ∈ H , com uma constante c fixa.

Espertamente, podemos tomar f como uma bijeção de H em H , ou seja, podemos escolher38 fh ∈ H para todo h ∈ H e de modo que para todo h ∈ H exista um g ∈ H único tal que fg = h. Uma situação trivial dessas é aquela na qual f é a identidade quando restrita a H : fh = h para todo h ∈ H , mas outras escolhas são também posśıveis. Se f for uma bijeção de H em H , é fácil de se ver que imagem de f no domı́nio R é toda a reta real R (mostre isso)!

Além disso, uma tal f , bijetora enquanto função de H em H , é igualmente bijetora como função de R em R. Mostremos isso. Sejam x e y ∈ R com decomposições x = r1h1 + · · ·+ rnhn e y = s1g1 + · · ·+ smgm com rj , sk ∈ Q e hj, gk ∈ H e suponhamos que f(x) = f(y). Isso significa que r1fh1 + · · ·+ rnfhn = s1fg1 + · · ·+ smfgm . Como cada fhj e cada fgk é elemento de H , essa igualdade só é posśıvel se m = n, se fhj = fgπ(j) e se rj = sπ(j) para todo j = 1, . . . , n, onde π é um elemento do grupo de permutações de n elementos (ou seja, é uma bijeção de {1, . . . , n} em si mesmo). Como f é uma bijeção de H em si mesmo, segue que hj = gπ(j) para todo j = 1, . . . , n. Assim,

x =

n∑

j=1

rjhj =

n∑

j=1

sπ(j)gπ(j) =

n∑

j=1

sjgj = y

e, portanto, f : R → R é bijetora. Uma função que satisfaça f(x + y) = f(x) + f(y) para todo x, y ∈ R e f : R → R representa um endomorfismo

do grupo (R, +). O que aprendemos no último parágrafo pode ser expresso na linguagem da teoria de grupos como a afirmação que existem automorfismos de (R, +) que não são cont́ınuos. Esse fato ilustra algumas situações patológicas que são por vezes encontradas ou mencionadas no estudo de grupos cont́ınuos. Com o uso de funções f desse tipo é posśıvel, por exemplo, construir subgrupos uniparamétricos não-cont́ınuos de um grupo de Lie dado ou representações não-cont́ınuas de tais subgrupos.

Assim, por exemplo, se A é uma matriz real n × n anti-simétrica, então O(t) = exp(tA), t ∈ R é um subgrupo uniparamétrico cont́ınuo de SO(n), pois O(0) = 1 e O(t)O(t′) = O(t + t′) para todos t, t′ ∈ R, sendo os elementos de matriz de O(t) funções cont́ınuas de t. Se agora definirmos P (t) = exp(f(t)A), t ∈ R, para uma função f : R → R, patológica como acima (ou seja, satisfazendo f(x + y) = f(x) + f(y) para todo x, y ∈ R, bijetora mas descont́ınua), ainda teremos P (0) = 1 e P (t)P (t′) = P (t+ t′) para todos t, t′ ∈ R, mas os elementos de matriz de P (t) não são funções cont́ınuas de t.

• Bases topológicas em espaços vetoriais Nota para os estudantes mais avançados. O conceito de base algébrica não deve ser confundido com o de base topológica, conceito esse pertencente ao contexto

dos espaços vetoriais topológicos:

Uma base topológica em um espaço vetorial topológico V é um conjunto B = {bi, i ∈ I} de vetores linearmente independentes tais que span (B) é um conjunto denso em V , ou seja, o fecho de span (B) é V .

Uma base topológica é dita ser base topológica completa se não possuir nenhum subconjunto próprio que também seja uma base topológica.

A dimensão topológica de um espaço vetorial é então definida como sendo a cardinalidade das bases topológicas completas de V .

Para ilustrar como os conceitos de base algébrica e base topológica são diferentes, consideremos novamente o seguinte Exemplo 4 acima:

Exemplo 5. V = R sobre o corpo dos racionais, com a topologia usual sobre R, tem uma base topológica completa de dimensão finita: B = {1}. De fato, o conjunto {r · 1, r ∈ Q} é denso em R. Esse espaço vetorial possui então uma dimensão topológica igual a um.

38Que tal é posśıvel é garantido pelo axioma da escolha −→ Exerćıcio.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 105/1507

Definição. Um espaço vetorial topológico sobre o corpo dos reais ou dos complexos é dito ser separável se possuir uma base topológica contável.

2.3.2 O Dual Algébrico de um Espaço Vetorial

Seja V um espaço vetorial sobre um corpo K (por exemplo, o corpo C). Uma aplicação l : V → K, definida sobre todo V , é dita ser um funcional linear se

l(αx+ βy) = αl(x) + βl(y)

para todo x, y ∈ V e todo α, β ∈ K.

E. 2.70 Exerćıcio. Mostre que, de acordo com a definição acima, vale para qualquer funcional linear l que l(0) = 0. 6

O conjunto de todos os funcionais lineares de V em K é denominado espaço dual algébrico de V e denotado V ′. O conjunto V ′ é feito um espaço vetorial (sobre K), através da seguinte relação:

(αl + βm)(x) := l(αx) +m(βx),

para todo l e m ∈ V ′ ; α, β ∈ K e todo x ∈ V . O vetor nulo de V ′ é o funcional linear que associa trivialmente todo vetor de V a zero: l(x) = 0, ∀x ∈ V .

O seguinte teorema é verdadeiro e será implicitamente usado várias vezes no que segue. Sua demonstração é, como veremos, elementar mas instrutiva.

Teorema 2.7 Seja um espaço vetorial V sobre um corpo K. Se um vetor v tem a propriedade que l(v) = 0 para todo l ∈ V ′ então v = 0. 2

Prova. Seja B uma base algébrica em V . Para cada elemento b ∈ B podemos associar um funcional linear lb, definido da seguinte forma. Como todo w ∈ V pode ser escrito como uma combinação linear finita de elementos de B, podemos sempre escrever

w = wbb+ w ′ ,

onde w′ é uma combinação linear finita de elementos de B \ {b} e wb ∈ K. (É claro que wb = 0 caso b não compareça na decomposição de w em uma soma finita de elementos de B).

Definimos, então lb(w) := wb ,

para todo vetor w ∈ V . É um exerćıcio simples mostrar que, para cada b ∈ B, a aplicação lb : V → K dada acima é um funcional linear.

E. 2.71 Exerćıcio. Mostre isso. 6

Seja então v um vetor como no enunciado do teorema. Se l(v) = 0 para todo l ∈ V ′, vale obviamente que lb(v) = 0 para todo b ∈ B. Isso, porém, trivialmente implica que v = 0, completando a demonstração.

Se A e B são espaços vetoriais e A ⊂ B então B′ ⊂ A′.

E. 2.72 Exerćıcio. Justifique essa última afirmativa. 6

• Notação Para x ∈ V e l ∈ V ′ é freqüente usar-se a notação 〈l, x〉 em lugar de l(x). A expressão 〈l, x〉 é muitas vezes dita

ser o “pairing”, ou “emparelhamento”, entre l ∈ V ′ e x ∈ V . É essa notação e graficamente conveniente por expressar a igualdade de status entre V e V ′. Uma inconveniência se dá em casos em que pode haver confusão com a notação de produto escalar.

Com essa notação, as propriedades de linearidade expressam-se como

〈α1l1 + α2l1, x〉 = α1〈l1, x〉+ α2〈l2, x〉 e 〈l, α1x1 + α2x2〉 = α1〈l, x1〉+ α2〈l, x2〉 ,

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 106/1507

válidas para todos l, l1, l2 ∈ V ′, x, x1, x2 ∈ V e α1, α2 ∈ K.

• Base dual canônica Seja U um espaço vetorial sobre um corpo K e suponhamos que U tenha dimensão finita, ou seja, que U possua

uma base finita {e1, . . . , en}, n ∈ N. Todo elemento de u ∈ U pode ser escrito na forma n∑

i=1

uiei com ui ∈ K. Para

j = 1, . . . , n definamos ℓj : U → K por ℓj(u) = uj .

É elementar provar que cada ℓj é um funcional linear em U e, portanto, um elemento de U ′. Pela definição, vale

ℓj ( ei )

= δij ,

para todos i, j = 1, . . . , n, ou seja, na notação de emparelhamento,

〈ℓj , ei〉 = δij .

Em verdade o conjunto {ℓ1, . . . , ℓn} forma uma base em U ′, denominada base dual canônica da base {e1, . . . , en}. De fato, se ℓ ∈ U ′ teremos

ℓ(u) = ℓ

( n∑

i=1

uiei

)

=

n∑

i=1

uiℓ ( ei )

=

n∑

i=1

ℓ ( ei ) ℓi(u) ,

para todo u ∈ U provando que

ℓ =

n∑

i=1

ℓ ( ei ) ℓi ,

o que estabelece que todo elemento de U ′ é uma combinação linear de {ℓ1, . . . , ℓn}. Os elementos de {ℓ1, . . . , ℓn} são linearmente independentes, pois se

∑n i=1 αiℓi = 0 isso significa que para todo ej , j = 1, . . . , n, valerá 0 =∑n

i=1 αiℓi(ej) = αj .

É relevante comentar que a base dual de {e1, . . . , en} é única. De fato, se {ℓ1, . . . , ℓn} e {ℓ′1, . . . , ℓ′n} satisfazem 〈ℓj, ei〉 = δij e 〈ℓ′j, ei〉 = δij para todos i, j, então 〈ℓ′j − ℓj, ei〉 = 0 para todos i, j, o que implica que para cada j e para todo u ∈ U vale 〈ℓ′j − ℓj , u〉 = 0, de onde conclui-se que ℓ′j = ℓj para todo j.

• O dual topológico de um espaço vetorial Seja V um espaço vetorial topológico. O conjunto de todos os funcionais lineares cont́ınuos sobre V é dito ser o dual

topológico de V . O dual topológico será denotado neste texto por V †. Note-se que V † ⊂ V ′.

• Exemplos de funcionais lineares Exemplo 1. Seja V = Cn, sobre o corpo dos complexos. Seja a1, . . . , an um conjunto fixo de números complexos.

Para qualquer vetor z = (z1, . . . , zn) ∈ Cn defina-se l(z) = a1z1 + · · ·+ anzn. Então l é um funcional linear em Cn.

E. 2.73 Exerćıcio. Verifique. 6

Em verdade, é posśıvel demonstrar a rećıproca: em Cn todo funcional linear é da forma acima para algum conjunto {a1, . . . , an}. Essa afirmativa é um caso particular de um teorema importante conhecido como “Lema de Riesz”, que será demonstrado no contexto mais geral dos chamados espaços de Hilbert, dos quais Cn é um exemplo.

Seja P o conjunto de todos os polinômios de uma variável real com coeficientes complexos: Pn(t) ∈ P,

Pn(t) = ant n + · · ·+ a1t+ a0

com t ∈ R, ai ∈ C, é dito ser um polinômio de grau n se an 6= 0. O conjunto P é claramente um espaço vetorial sobre os complexos.

Exemplo 2. Para cada t0 ∈ R e p ∈ P, l(p) = p(t0) é um funcional linear em P.

E. 2.74 Exerćıcio. Verifique. 6

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 107/1507

Esse exemplo pode ser generalizado:

Exemplo 3. Sejam t1, . . . , tn ∈ R, distintos, e a1, . . . , an números complexos. Para todo p ∈ P, definamos

l(p) = a1p(t1) + · · ·+ anp(tn) .

Então l é um funcional linear em P.

E. 2.75 Exerćıcio. Verifique. 6

O último exemplo pode ser fortemente generalizado nos dois exemplos que seguem.

Exemplo 3. Seja (a, b) um intervalo finito de R e h uma função complexa integrável nesse intervalo (ou seja, ∫ b

a |h(t)|dt ≤ ∞). Então,

l(p) =

∫ b

a

h(t) p(t) dt

está definida para todo p ∈ P e define um funcional linear em P.

E. 2.76 Exerćıcio. Justifique as duas últimas afirmativas. 6

Exemplo 4. Seja a função g(x) = e−x 2

. Então

l(p) =

∫ ∞

−∞

g(t) p(t) dt .

está definida para todo p ∈ P e define um funcional linear em P.

E. 2.77 Exerćıcio. Justifique as duas últimas afirmativas. 6

• A relação entre V e V ′

Vamos aqui discutir o fato que sempre existe uma maneira (não-canônica, vide abaixo) de associar vetores de um espaço vetorial V com elementos de seu dual algébrico V ′.

Seja V um espaço vetorial sobre um corpo K e B ⊂ V uma base algébrica em V . Seja FB a coleção de todas as funções de B em K. Afirmamos que existe uma bijeção de FB sobre V

′, ou seja, esses dois conjuntos podem ser identificados nesse sentido.

Para tal, seja f ∈ FB. Definimos uma aplicação I : FB → V ′ da seguinte forma. Como todo x ∈ V pode ser escrito como uma combinação linear finita de elementos de B, digamos, x = α1bi1 + · · ·+ αnbin , escrevemos

I(f)(x) = α1f(bi1) + · · ·+ αnf(bin) .

I(f) é um funcional linear pois, se escrevemos y = αn+1bin+1 + · · ·+ αn+mbin+m , teremos

I(f)(x+ y) = α1f(bi1) + · · ·+ αn+mf(bin+m)

= α1f(bi1) + · · ·+ αnf(bin) + αn+1f(bin+1) + · · ·+ αn+mf(bin+m)

= I(f)(x) + I(f)(y) . (2.39)

Isso então mostrou que I(f) é de fato um elemento de V ′ para cada f ∈ FB . Vamos mostrar o reverso: que a cada elemento l de V ′ há um elemento gl de FB associado e que I(gl) = l. Seja novamente x = α1bi1 + · · ·+ αnbin ∈ V e seja l um elemento de V ′. Tem-se

l(x) = α1l(bi1) + · · ·+ αnl(bin) . Definimos gl : B → K por

gl(b) := l(b)

para todo b ∈ K. Pela definição

I(gl)(x) = α1gl(bi1) + · · ·+ αngl(bin) = α1l(bi1) + · · ·+ αnl(bin) = l(x) (2.40)

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 108/1507

para todo x ∈ V . Logo I(gl) = l como queŕıamos. A aplicação I : FB → V ′ é, portanto, uma bijeção entre esses dois conjuntos. Notemos, porém, que essa bijeção não

é canônica no sentido que a mesma depende da base adotada. Se trocarmos B por outra base a bijeção altera-se.

De posse desses fatos podemos entender a relação entre V e V ′ da seguinte forma. Seja o subconjunto GB de FB formado por todas as funções que assumem valores não-nulos (no corpo K) apenas para um conjunto finito de B, ou seja, para g ∈ GB existe um conjunto finito Bg = {b1, . . . , bn} ⊂ B tal que g é não-nula nos elementos de Bg, mas é nula em B \Bg.

Os conjuntos GB e V podem ser identificados no seguinte sentido. Afirmamos que existe uma bijeção J : GB → V . Tal é fácil de ver se lembrarmos que os elementos de V podem ser escritos como uma combinação linear finita de elementos de B. De fato, para g ∈ GB definimos

J(g) = g(b1)b1 + · · ·+ g(bn)bn ∈ V

onde {b1, . . . , bn} = Bg. Reciprocamente, se x ∈ V e x = α1bi1 + · · ·+ αnbin , definimos gx ∈ GB por

gx(bia) = αa, a = 1, . . . , n e gx(b) = 0 se b 6∈ {bi1 , . . . , bin} .

É fácil ver então que J(gx) = g(bi1)bi1 + · · ·+ g(bin)bin = α1bi1 + · · ·+ αnbin = x , (2.41)

o que mostra que J é bijetora. Notemos novamente que essa bijeção também não é canônica, no sentido que a mesma depende da base adotada. Se trocarmos B por outra base a bijeção altera-se.

E. 2.78 Exerćıcio importante. Mostre agora que J−1 : V → Gb é linear, ou seja, J−1(αx + βy) = αJ−1(x) + βJ−1(y) para todos x, y ∈ V e todos α, β ∈ K. 6

Juntando o discutido acima, conclúımos que φ1 = I ◦ J−1 é uma aplicação linear injetora de V em V ′. A mesma, porém, não é “natural”, pois depende da base algébrica B escolhida.

Assim, fixada uma base B em V há uma maneira de associar todos os elementos de V com elementos do seu dual algébrico. Notemos porém que pode haver elementos de V ′ aos quais não correspondem tais identificações, ou seja, a imagem de φ1 = I ◦ J−1 é tipicamente (especialmente em dimensão infinita) um subconjunto próprio de V ′.

Exemplo. Seja P o espaço vetorial dos polinômios em R definido acima. Seja T = {ti ∈ R, i ∈ N}, um conjunto contável de pontos distintos da reta real e seja q(t) = q0 + q1t+ · · ·+ qntn, polinômio. Definamos lq ∈ V ′ por

lq(p) = q0p(t0) + q1p(t1) + · · ·+ qnp(tn) .

E. 2.79 Exerćıcio. Mostre que a aplicação P ∋ q → lq ∈ V ′ é linear e injetora. 6

E. 2.80 Exerćıcio. Será que com o conjunto T fixado todo elemento de V ′ seria da forma lq para algum q?. Pense. Inspire-se nos exemplos 3 e 4 da página 107. O que acontece para conjuntos T diferentes? 6

Comentário. Mais interessante que a relação entre V e V ′, é a relação de V com o dual algébrico de V ′, o chamado bidual algébrico de V e denotado por (V ′)′, assunto que discutiremos agora. A razão é que, ao contrário do que tipicamente ocorre entre V e V ′, há sempre uma aplicação linear injetora entre V e (V ′)′ que é natural, ou seja, independente de escolhas de bases.

Outro interesse na relação entre V e (V ′)′ reside no fato que a mesma revela-nos, como veremos, uma profunda distinção entre espaços vetoriais de dimensão finita e infinita.

• O bidual algébrico de um espaço vetorial Se V é um espaço vetorial sobre um corpo K já observamos que V ′ é também um espaço vetorial sobre o mesmo

corpo. Assim, V ′ tem também seu dual algébrico que é denominado bidual algébrico de V .

O bidual algébrico de um espaço vetorial V é o espaço (V ′)′. Como vimos nas páginas anteriores, existe pelo menos uma aplicação linear injetiva de V em V ′. Chamemos esta aplicação de φ1. Analogamente, existe pelo menos uma

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 109/1507

aplicação linear injetiva φ2 de V ′ em (V ′)′. A composição φ2 ◦ φ1 fornece uma aplicação linear injetiva de V em (V ′)′.

Como φ1 e φ2 dependem de escolhas de base, a composição φ2 ◦ φ1 também depende, não sendo, assim, natural. Ao contrário do que ocorre na relação entre V e V ′, podemos sempre encontrar uma aplicação linear injetiva de V

em (V ′)′ que é natural: independente de base. Vamos denotá-la por λ. Definimos λ : V → (V ′)′ da seguinte forma: para x ∈ V , λ(x) é o elemento de (V ′)′ que associa a cada l ∈ V ′ o valor l(x):

λ(x)(l) = l(x) .

E. 2.81 Exerćıcio. Mostre que λ : V → (V ′)′ é linear. 6

E. 2.82 Exerćıcio. Mostre que λ : V → (V ′)′ é injetora. Sugestão: use o Teorema 2.7, enunciado e demonstrado na página 105. 6

É transparente pela definição de λ que a mesma é independente de bases e, portanto, “natural”. A relação entre x ∈ V e um elemento de (V ′)′ mostrada acima é tão direta que quase podeŕıamos dizer que V é um subconjunto de (V ′)′: V ⊂ (V ′)′. Alguns autores, abusando um pouco da linguagem, chegam mesmo a escrever uma tal relação de inclusão. Mais correta, no entanto é a relação λ(V ) ⊂ (V ′)′.

Podeŕıamos nesse momento nos perguntar: quando podemos eventualmente ter λ(V ) = (V ′)′? Para o caso de espaços vetoriais sobre o corpo dos reais ou dos complexos resposta é simples e um tanto surpreendente e se expressa no seguinte teorema.

Teorema 2.8 Seja V um espaço vetorial sobre o corpo dos reais ou dos complexos. Então λ(V ) = (V ′)′ se e somente se V é um espaço vetorial de dimensão finita. 2

Este teorema revela uma importante distinção entre espaços de dimensão finita e infinita. Em dimensão finita todos os funcionais lineares do dual algébrico de V ′ são da forma λ(x) para algum vetor x. Em dimensão infinita, porém, há certamente elementos em (V ′)′ que não são dessa forma. Assim, ao tomarmos duais duplos em dimensão infinita sempre obtemos espaços vetoriais “maiores”, o que não ocorre em dimensão finita.

Prova. Seja V um espaço vetorial sobre um corpo K = C ou R.

Caso de dimensão finita. Vamos em primeiro lugar supor que V é de dimensão finita e denotemos por dim V sua dimensão. Seja também B = {b1, . . . , bn} uma base de V . É claro que o número de elementos de B é n = dim V .

É fácil mostrar que o conjunto {λ(b1), . . . , λ(bn)} é linearmente independente em (V ′)′. De fato, se existirem escalares αi tais que

α1λ(b1) + · · ·+ αnλ(bn) = 0 , ou seja, λ(α1b1 + · · ·+ αnbn) = 0 teŕıamos para todo l ∈ V ′

λ(w)(l) = l(w) = 0 ,

onde w = α1b1+ · · ·+α1bn. Isso, porém, implica w = 0 (pelo Teorema 2.7, página 105), o que implica α1 = · · · = αn = 0. Isso claramente diz que dim (V ′)′ ≥ dim V . Afirmamos que a igualdade só se dá se λ(V ) = (V ′)′. De fato, se

λ(V ) = (V ′)′ então todo elemento de (V ′)′ é da forma

λ(α1b1 + · · ·+ αnbn) = α1λ(b1) + · · ·+ αnλ(bn)

e, portanto {λ(b1), . . . , λ(bn)} é uma base em (V ′)′ e dim (V ′)′ = dim V . Se, por outro lado, λ(V ) é um subconjunto próprio de (V ′)′, existem elementos v′′ ∈ (V ′)′ tais que v′′ − α1λ(b1)− · · · − αnλ(bn) 6= 0 para todos αi ∈ K. Portanto, {v′′, λ(b1), . . . , λ(bn)} é um conjunto de n + 1 vetores linearmente independentes. Logo dim (V ′)′ > n = dim V , pelo Teorema 2.6, página 102.

Vamos então mostrar que obrigatoriamente tem-se que dim (V ′)′ = dim V , provando o teorema.

Como vimos quando discutimos a relação entre V e V ′ à página 107, V ′ é equivalente ao conjunto FB de todas as funções de B em K, enquanto que V é equivalente ao conjunto GB formado por todas as funções que assumem valores não-nulos (no corpo K) apenas para um conjunto finito de B. Como B tem um número finito de elementos, sucede GB = FB (por que?). Logo V e V

′ são equivalentes: existe uma bijeção linear ϕ1 entre ambos.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 110/1507

A aplicação ϕ1 leva a base B em uma base ϕ1(B) em V ′. Para ver isso, notemos que todo elemento l ∈ V ′ é da forma

l = ϕ1(v), para algum v ∈ V . Como todo v ∈ V é da forma v = α1b1 + · · · + αnbn, segue que todo elemento l ∈ V ′ é da forma α1ϕ1(b1) + · · · + αnϕ1(bn). Como ϕ1 é bijetora, {ϕ1(b1), . . . , ϕ1(bn)} é um conjunto de vetores linearmente independentes pois se existirem escalares β1, . . . , βn tais que

β1ϕ1(b1) + · · ·+ βnϕ1(bn) = 0

teŕıamos ϕ1(β1b1 + · · · + βnbn) = 0 o que implica β1b1 + · · · + βnbn = 0, pois ϕ1 é bijetora. Isso porém implica β1 = · · · = βn = 0, pois {b1, . . . , bn} é uma base. Assim, ϕ1(B) = {ϕ1(b1), . . . , ϕ1(bn)} é uma base em V ′ e, portanto, dim V ′ = n = dim V .

Analogamente, tem-se que V ′ e (V ′)′ são equivalentes e, portanto, existe uma bijeção linear ϕ2 entre ambos que leva a base ϕ1(B) em uma base ϕ2 ◦ ϕ1(B) em (V ′)′. Portanto, dim V ′ = dim (V ′)′.

Logo dim V = dim V ′ = dim (V ′)′, como queŕıamos provar.

Caso de dimensão infinita. No caso de dimensão infinita desejamos mostrar que sempre há elementos em (V ′)′ que não são da forma λ(x) para algum x ∈ V .

Abaixo K é o corpo dos reais ou dos complexos.

Vamos primeiro delinear a estratégia a ser seguida. Seja B uma base em V (fixa daqui por diante). Como sabemos, existe uma aplicação linear bijetora φ : FB → V ′. Uma função s : B → K, s ∈ FB é dita ser limitada se existir um M > 0 tal que |s(b)| < M para todo b ∈ B. Seja LB o conjunto de todas as funções limitadas de B em K. É claro que LB ⊂ FB. Vamos mostrar o seguinte: não existe nenhum vetor não-nulo v ∈ V com a propriedade que λ(v)(β) = 0 para todo β ∈ φ(LB). Seja v = α1b1 + · · · + αmbm um tal vetor para o qual λ(v)(β) = 0. Isso significa que para todo β ∈ φ(LB)

0 = λ(v)(β) = β(v) = α1β(b1) + · · ·+ αmβ(bm) . Tomemos funcionais βi’s da forma

βi(b) =

{ 1, se b = bi 0, de outra forma

para i = 1, . . . ,m. Como todo βi é um elemento de φ(LB) (por que?), teŕıamos 0 = βi(v) = αi para todo i, o que implica v = 0.

A conclusão é que nenhum elemento de (V ′)′ que seja da forma λ(v) para algum v ∈ V não-nulo pode anular todos os elementos de φ(LB) ⊂ V ′. A estratégia que seguiremos será a de exibir um elemento de (V ′)′ que tem precisamente a propriedade de anular todos os elementos de φ(LB). Um tal elemento não pode pertencer, portanto, a λ(V ), o que mostra que λ(V ) é um subconjunto próprio de (V ′)′ no caso de dimensão infinita.

Seja u ∈ V ′ \ φ(LB) e U o subespaço de V ′ gerado por u. Todo elemento l ∈ V ′ pode ser escrito de modo único na forma l = au + y, onde a ∈ K e y pertence ao subespaço complementar de U . Definamos α(l) = a. É claro que α ∈ (V ′)′ e que α aniquila todo elemento de φ(LB), pois estes pertencem ao subespaço complementar de U (por que?). Assim, α ∈ (V ′)′ mas α 6∈ λ(V ).

2.3.3 Subespaços e Espaços Quocientes

• subespaços Seja V um espaço vetorial sobre um corpo K. Um subconjunto W de V é dito ser um subespaço de V (sobre o mesmo

corpo K) se para todo α, β ∈ K e todo u, v ∈ W valer que αu + βv ∈ W . É evidente que um subespaço de um espaço vetorial é por si só um espaço vetorial.

• Quocientes Se W é um subespaço de um espaço vetorial V sobre um corpo K, então é posśıvel definir em V uma relação de

equivalência EW ⊂ V × V da seguinte forma: dizemos que (u, v) ∈ V × V pertence a EW se u− v ∈ W .

E. 2.83 Exerćıcio. Mostre que isso de fato define uma relação de equivalência em V . 6

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 111/1507

Seguindo a notação usual denotaremos também essa relação de equivalência pelo śımbolo ∼W : u ∼W v se u− v ∈ W . Denotemos por V/W o conjunto das classes de equivalência de V pela relação EW . Denotaremos por [u] ∈ V/W a

classe de equivalência que contém o vetor u ∈ V . Com esses ingredientes podemos transformar V/W em um espaço vetorial sobre K. Isso se dá definindo em V/W uma

soma e um produto por escalares. O vetor nulo será a classe de equivalência [0] que contém o vetor 0. Como subconjunto de V , a classe [0], aliás, vem a ser o conjunto W (por que?).

Se [u] e [v] são as classes de equivalência que contêm os elementos u e v, respectivamente, de V , então definimos

[u] + [v] = [u+ v] .

E. 2.84 Exerćıcio. Mostre que essa definição é coerente, no sentido que independe dos representantes (u e v) escolhidos nas classes. 6

E. 2.85 Exerćıcio. Mostre que essa operação de soma é comutativa e associativa. 6

E. 2.86 Exerćıcio. Mostre que [u] + [0] = [u] para todo u ∈ V . 6

Analogamente, a operação de multiplicação por escalares é definida por

α[u] = [αu] ,

para todo u ∈ V .

E. 2.87 Exerćıcio. Mostre que essa definição é coerente, no sentido que independe do representante u escolhido na classe. 6

E. 2.88 Exerćıcio. Mostre que o conjunto V/W é, portanto, um espaço vetorial sobre o corpo K com as operações definidas acima. 6

O espaço vetorial V/W assim obtido é denominado espaço quociente de V por W .

2.3.4 Somas Diretas de Espaços Vetoriais

• A soma direta de uma coleção finita de espaços vetoriais Sejam V1 e V2 dois espaços vetoriais (sobre um mesmo corpo K, sendo doravante K = R ou K = C). Como V1 e

V2 são dois grupos Abelianos, o grupo Abeliano obtido pela soma direta V1 ⊕ V2 está definido pelo procedimento geral descrito na Seção 2.2.5, página 95. Isso, entretanto, ainda não faz de V1 ⊕ V2 um espaço vetorial.

Para isso, é preciso definir o produto um elemento de V1 ⊕ V1 por um escalar (um elemento de K). Definimos o produto de v1 ⊕ v2 ∈ V1 ⊕ V2 por α ∈ K como sendo o elemento (αv1)⊕ (αv2), ou seja,

α(v1 ⊕ v2) := (αv1)⊕ (αv2) . (2.42)

É fácil constatar que, com essa definição, V1 ⊕ V2 torna-se um espaço vetorial (vide a definição formal de espaço vetorial à página 71), que denotaremos por V1 ⊕K V2. O assim definido espaço vetorial V1 ⊕K V1 é dito ser a soma direta dos espaços vetoriais V1 e V2 sobre o corpo K.

Se tivermos uma coleção finita de espaços vetoriais V1, . . . , Vn (sobre um mesmo corpoK) procedemos analogamente, primeiro definindo o grupo Abeliano V1 ⊕ · · · ⊕ Vn e depois definindo a multiplicação por escalares por

α(v1 ⊕ · · · ⊕ vn) := (αv1)⊕ · · · ⊕ (αvn) ,

com α ∈ K e v1 ⊕ · · · ⊕ vn ∈ V1 ⊕ · · · ⊕ Vn. O espaço vetorial (sobre K) assim definido é denotado por V1 ⊕K · · · ⊕K Vn.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 112/1507

• Soma direta de coleções arbitrárias de espaços vetoriais Se {Vi, i ∈ J} é uma coleção de espaços vetoriais que, em particular, são grupos Abelianos, cai definida, pelo

apresentado na sub-seção anterior, a soma direta Vs := ⊕i∈J Vi, definida primeiramente como grupo Abeliano. Vs pode ser feito um espaço vetorial definindo-se, para um escalar genérico α ∈ K,

α · (

× a∈J

( va )

)

:= × a∈J

( αva

) , (2.43)

para todo × a∈J

( va ) ∈ Vs (para a notação de produtos Cartesianos gerais, vide página 27). É um exerćıcio elementar

(faça-o!) mostrar que, com essas estruturas, Vs é de fato um espaço vetorial, satisfazendo a definição apresentada na Seção 2.1.5, página 71.

2.3.5 Produtos Tensoriais de Espaços Vetoriais

• A noção “intuitiva” de produto tensorial de dois espaços vetoriais Sejam U e V dois espaços vetoriais em relação a um mesmo corpo, digamos, C. U e V são dois grupos Abelianos em

relação às respectivas operações de soma de vetores. Assim, podemos, como acima, definir o grupo Abeliano U ⊗ V , o produto tensorial dos grupos Abelianos U e V . Esse objeto ainda não tem uma estrutura de espaço vetorial (sobre os complexos), pois não dissemos como definir o produto de um elemento de U ⊗ V por um escalar α ∈ C. Isso é feito da seguinte forma, para u ∈ U , v ∈ V , define-se α(u⊗ v) impondo

α(u⊗ v) := (αu)⊗ (v) = (u)⊗ (αv) . (2.44)

O estudante deve comparar essa regra de produto por escalares com a regra 2.42. Para elementos de U ⊗ V que sejam somas finitas, como por exemplo u⊗ v + u′ ⊗ v′, impomos

α (u⊗ v + u′ ⊗ v′) := α (u⊗ v) + α (u′ ⊗ v′)

= (αu)⊗ v + (αu′)⊗ v′ = u⊗ (αv) + u′ ⊗ (αv′) .

E. 2.89 Exerćıcio. Constate que, com essa definição, U ⊗ V torna-se um espaço vetorial, ou seja, verifique que são válidos os postulados da definição formal de espaço vetorial dados à página 71. 6

Esse espaço vetorial que denotaremos por U ⊗C V , é denominado produto tensorial dos espaços U e V . O sub-́ındice C aposto ao śımbolo ⊗ é por vezes dispensado, e serve apenas para recordar que um escalar (ou seja, um elemento de C, nesse caso) pode ser passado de um lado para outro do śımbolo ⊗, tal como na última igualdade em (2.44). Passemos agora à formalização dessas idéias.

• O produto tensorial de dois espaços vetoriais Sejam U e V dois espaços vetoriais sobre um mesmo corpo K (que assumiremos, por simplicidade, tendo caracteŕıstica

zero, como C ou R). Como U e V são dois grupos Abelianos, o grupo Abeliano U ⊗ V está definido pelo procedimento de acima. Isso, entretanto, ainda não faz de U ⊗ V um espaço vetorial. Para isso tomemos X = U ⊗ V e consideremos o subconjunto de F (X) definido por

R := {r ∈ F (U ⊗ V )| r = (αu)⊗ v − u⊗ (αv), com α ∈ K, u ∈ U, v ∈ V } . (2.45)

Como antes, seja R = R(U ⊗ V ) o subgrupo gerado por R. Definimos agora um novo grupo Abeliano U ⊗K V como U ⊗K V := F (U ⊗ V )/R(U ⊗ V ).

U ⊗K V é por ora apenas mais um grupo Abeliano, mas podemos adicionar-lhe uma estrutura de espaço vetorial da seguinte forma. Primeiramente é preciso definir o produto de um escalar por um elemento de U ⊗K V . Para elementos da forma u⊗K v com u ∈ U e v ∈ V , definimos então o produto α(u ⊗K v), para α ∈ K por

α(u ⊗K v) := (αu)⊗K v = u⊗K (αv) . (2.46)

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 113/1507

A última igualdade segue da definição de U ⊗K V . Os demais elementos de U ⊗K V são da forma de combinações lineares finitas com coeficientes inteiros de elementos como u⊗K v, ou seja, são da forma

n∑

k=1

ck (uk ⊗K vk)

para algum n > 0 e ck ∈ Z. Para os mesmos, definimos

α

( n∑

k=1

ck (uk ⊗K vk) )

:= n∑

k=1

ck α (uk ⊗K vk) = n∑

k=1

ck (αuk) ⊗K vk = n∑

k=1

ck uk ⊗K (αvk) .

É fácil constatar (faça-o!) que, com essa definição, U ⊗K V torna-se um espaço vetorial (vide a definição formal de espaço vetorial na Seção 2.1.5, página 71), que também denotaremos por U ⊗K V . O assim definido espaço vetorial U ⊗K V é denominado produto tensorial dos espaços vetoriais U e V sobre o corpo K. O sub-́ındice K aposto ao śımbolo ⊗ é por vezes dispensado, e serve apenas para recordar que um escalar (ou seja, um elemento de K) pode ser passado de um lado para outro do śımbolo ⊗, tal como na última igualdade em (2.46).

• O produto tensorial de uma coleção finita de espaços vetoriais As idéias de acima podem ser generalizadas para o caso de uma coleção finita de espaços vetoriais. Sejam U1, . . . , Un

uma coleção finita de espaços vetoriais sobre um mesmo corpoK (que assumiremos, por simplicidade, tendo caracteŕıstica zero, como C ou R). Como cada Ua é um grupo Abeliano, o grupo Abeliano U1⊗· · ·⊗Un está definido pelo procedimento descrito anteriormente. Isso, entretanto, ainda não faz de U1 ⊗ · · · ⊗ Un um espaço vetorial. Para isso, tomemos

X = U1 ⊗ · · · ⊗ Un e consideremos o subconjunto R de F (X) definido por R := n⋃

i, j=1 i6=j

Rij , com

Rij := {

r ∈ F (X) ∣ ∣ ∣ r =

( u1 ⊗ · · · ⊗ ui−1 ⊗

( αui

) ⊗ ui+1 ⊗ · · · ⊗ un

) − ( u1 ⊗ · · · ⊗ uj−1 ⊗

( αuj

) ⊗ uj+1 ⊗ · · · ⊗ un

)

com α ∈ K, uk ∈ Uk para todo k = 1, . . . , n }

.

Como antes, sejaR = R(U1⊗· · ·⊗Un) o subgrupo gerado por R. Definimos agora um novo grupo Abeliano U1⊗K· · ·⊗KUn como U1 ⊗K · · · ⊗K Un := F (U1 ⊗ · · · ⊗ Un)/R(U1 ⊗ · · · ⊗ Un).

U1 ⊗K · · · ⊗K Un é por ora apenas mais um grupo Abeliano, mas podemos adicionar-lhe uma estrutura de espaço vetorial da seguinte forma. Primeiramente é preciso definir o produto de um escalar por um elemento de U1⊗K · · ·⊗KUn. Para elementos da forma u1⊗K · · ·⊗K un com uk ∈ Uk para todo k = 1, . . . , n, definimos o produto α(u1⊗K · · ·⊗K un), para α ∈ K por

α(u1 ⊗K · · · ⊗K un) := u1 ⊗K · · · ⊗K uj−1 ⊗K ( αuj

) ⊗K uj+1 ⊗K · · · ⊗K un

para qualquer j = 1, . . . , n. Que o lado direito independe do particular j adotado segue da definição de U1⊗K · · ·⊗KUn. Os demais elementos de U1⊗K· · ·⊗KUn são da forma de combinações lineares finitas com coeficientes inteiros de elementos como u1 ⊗K · · · ⊗K un, ou seja, são da forma

m∑

k=1

ck ( u1k ⊗K · · · ⊗K unk

)

para algum m > 0 e ck ∈ Z. Para os mesmos, definimos

α

( m∑

k=1

ck ( u1k ⊗K · · · ⊗K unk

)

)

:=

m∑

k=1

ck α ( u1k ⊗K · · · ⊗K unk

) =

m∑

k=1

ck u 1 k⊗K· · ·⊗Kuj−1k ⊗K

( αujk

) ⊗Kuj+1k ⊗K· · ·⊗Kunk ,

onde, como anteriormente mencionado, a última igualdade é válida para qualquer j adotado.

É fácil constatar (faça-o!) que, com essa definição, U1 ⊗K · · · ⊗K Un torna-se um espaço vetorial (vide a definição formal de espaço vetorial na Seção 2.1.5, página 71), que também denotaremos por U1 ⊗K · · · ⊗K Un. O assim definido

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 114/1507

espaço vetorial U1 ⊗K · · · ⊗K Un é denominado produto tensorial dos espaços vetoriais Uk, k = 1, . . . , n, sobre o corpo K.

Observe-se que, com a construção acima, vale ( α1u

1 ) ⊗K · · · ⊗K

( αku

n k

) =

(

α1 · · ·αk ) (

u1 ⊗K · · · ⊗K unk ) .

Esse fato limita a construção que efetivamos a coleções finitas de espaços Uk, pois para coleções não-finitas o produto infinito de escalares αk geralmente não estar definido.

Quando não houver motivo de confusão denotaremos U1⊗K· · ·⊗KUn simplesmente por U1⊗· · ·⊗Un. Freqüentemente usaremos a notação U⊗Kn, ou simplesmente U⊗n, para denotar U ⊗K · · · ⊗K U

︸ ︷︷ ︸

n vezes

. É também conveniente definir U⊗Kn

para n = 0 como sendo o corpo K.

Seja U um espaço vetorial sobre K. Como todo corpo K é também, naturalmente, um espaço vetorial sobre K, o produto tensorial K ⊗K U está igualmente definido. É, porém, natural nesse contexto identificar-se K ⊗K U com U através do isomorfismo α ⊗K u 7→ αu, para todos α ∈ K e u ∈ U . Doravante essa identificação será feita silentemente, salvo menção em contrário. O dito acima repete-se para o produto U ⊗K K.

• O isomorfismo canônico Dadas duas coleções finitas V 1, . . . , V m e U1, . . . , Un de espaços vetoriais sobre o mesmo corpo K podemos, pela

construção descrita acima, definir os espaços vetoriais produto

A = (

V 1 ⊗K · · · ⊗K V m )

⊗K (

U1 ⊗K · · · ⊗K Un )

e B = V 1 ⊗K · · · ⊗K V m ⊗K U1 ⊗K · · · ⊗K Un .

Esses dois espaços são isomorfos, com o isomorfismo C : A → B dado por

C

( (

v1 ⊗K · · · ⊗K vm )

⊗K (

u1 ⊗K · · · ⊗K un ) )

:= v1 ⊗K · · · ⊗K vm ⊗K u1 ⊗K · · · ⊗K un , (2.47)

sendo estendido linearmente para os demais elementos. Esse isomorfismo é denominado isomorfismo canônico entre A e B. O isomorfismo canônico é relevante na definição da chamada álgebra tensorial, tal como descrito na Seção 2.5.1, página 128.

E. 2.90 Exerćıcio. Mostre que C : A → B, definido acima, é, de fato, um isomorfismo entre espaços vetoriais. 6

Se U é um espaço vetorial sobre um corpo K, vimos acima que U⊗Km ⊗K U⊗Kn e U⊗K(m+n) são canonicamente isomorfos. Observe que isso faz sentido mesmo quando m = 0 (ou n = 0, ou ambos), pois nesse caso U⊗Km = K, por convenção.

• Distributividade entre produtos tensoriais e somas diretas

Se U , V e W são espaços vetoriais sob um mesmo corpo K, então os espaços vetoriais C = U ⊗K (

V ⊕K W )

e

D = (

U ⊗K V )

⊕K (

U ⊗K W )

são isomorfos. Esse fato será importante na definição da álgebra tensorial, Seção 2.5.1,

página 128. O isomorfismo M : C → D é definido por

M

( n∑

a=1

ua ⊗K (

va ⊕K wa ) )

:=

( n∑

b=1

ub ⊗K vb )

⊕K (

n∑

c=1

uc ⊗K wc )

,

para todo n ∈ N e para todos ua ∈ U , va ∈ V e wa ∈ W , a = 1, . . . , n.

E. 2.91 Exerćıcio. Mostre que M : C → D, definida acima, é, de fato, um isomosfismo de espaços vetoriais. Para tal é necessário e suficiente provar que M é linear, sobrejetor e que M(κ) = 0 se e somente se κ = 0. Para provar que M é

sobrejetor, observe que todo elemento de D é da forma

n′∑

b=1

u′b ⊗K v′b

⊕K

n′′∑

c=1

u′′c ⊗K w′′c

. Definindo n ≡ n′ + n′′ e

uk ≡ {

u′k , k = 1, . . . , n ′,

u′′k−n′ , k = n ′ + 1, . . . , n ,

vk ≡ {

v′k , k = 1, . . . , n ′,

0 , k = n′ + 1, . . . , n , wk ≡

{ 0 , k = 1, . . . , n′,

w′′k−n′ , k = n ′ + 1, . . . , n ,

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 115/1507

para cada k = 1, . . . , n, teremos

n′∑

b=1

u′b ⊗K v′b

⊕K

n′′∑

c=1

u′′c ⊗K w′′c

 :=

( n∑

b=1

ub ⊗K vb )

⊕K (

n∑

c=1

uc ⊗K wc )

(verifique!) que é, evidentemente, um elemento da imagem de M. Determine M−1. 6

Devido ao fato de U ⊗K (

V ⊕KW )

e (

U ⊗K V )

⊕K (

U ⊗KW )

serem isomorfos, iremos por vezes identificá-los como

sendo o mesmo espaço. Evidentemente, há nisso um abuso de linguagem. Essa identificação permite-nos pictoriamente dizer que o produto tensorial é distributivo em relação à soma direta.

Observemos, por fim, que o exposto acima estende-se para somas diretas finitas, como formulado no seguinte exerćıcio:

E. 2.92 Exerćıcio. Sejam U e V j , j = 1, . . . , m, com m ∈ N, espaços vetoriais sobre o mesmo corpo K. Mostre que

U ⊗K

m⊕

j=1

V j

 ≃ m⊕

j=1

(

U ⊗K V j )

,

sendo que o śımbolo ≃ denota a relação de isomorfismo entre espaços vetoriais. O isomorfismo é dado por

M

n∑

a=1

ua ⊗K

m⊕

j=1

vja

 := m⊕

j=1

( n∑

a=1

ua ⊗K vja

)

,

para todo n ∈ N e para todos ua ∈ U , vja ∈ V j , a = 1, . . . , n, j = 1, . . . , m. Analogamente, mostre que 

m⊕

j=1

V j

⊗K U ≃ m⊕

j=1

(

V j ⊗K U )

,

com o isomorfismo dado por

M

n∑

a=1

m⊕

j=1

vja

⊗K ua

 := m⊕

j=1

( n∑

a=1

vja ⊗K ua )

,

para todo n ∈ N e para todos ua ∈ U , vja ∈ V j , a = 1, . . . , n, j = 1, . . . , m. 6

• Bases em produtos tensoriais Sejam U e V dois espaços vetoriais de dimensão finita sobre um mesmo corpo K (que omitiremos doravante), dotados

de bases {eU1 , . . . , eUm} e {eV1 , . . . , eVn }, respectivamente. Afirmamos que a coleção de vetores {eUi ⊗ eVj , i = 1, . . . , m, j = 1, . . . , n} forma uma base em U ⊗ V . De fato, se u ∈ U e v ∈ V são da forma u = ∑mi=1 uieUi e v =

∑n j=1 vje

V j , então u ⊗ v =

∑m i=1

∑n j=1 uivj e

U i ⊗ eVj . Como todos os elementos de U ⊗ V são obtidos como

combinação linear finita de elementos da forma u ⊗ v com u ∈ U e v ∈ V , conclúımos imediatamente que os mesmos podem ser escritos como combinação linear dos elementos eUi ⊗ eVj , como queŕıamos. Isso estabeleceu também que a dimensão de U ⊗ V é o produto da dimensão de U pela de V : dim(U ⊗ V ) = dimU dimV .

As considerações acima estendem-se sem maiores surpresas para produtos tensoriais de mais de dois espaços vetoriais sobre um mesmo corpo.

• Representações tensoriais de grupos Sejam U e V dois espaços vetoriais de dimensão finita sobre um mesmo corpo K (que omitiremos doravante), dotados

de bases {eU1 , . . . , eUm} e {eV1 , . . . , eVn }, respectivamente. Seja G um grupo e sejam πU e πV representações de G em U e V , respectivamente. As representações πU e πV permitem definir uma representação de G em U ⊗ V denominada representação produto tensorial e denotada por πU⊗V , a qual é definida como segue. Se g ∈ G, u ∈ U e v ∈ V , então

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 116/1507

define-se πU⊗V (g) ( u⊗ v

) por

( πU (g)u

) ⊗ ( πV (g)v

) , sendo πU⊗V (g) estendido linearmente para os demais elementos de

U ⊗ V .

Um elemento t de U ⊗ V pode ser escrito da forma t = m∑

i=1

n∑

j=1

tij e U i ⊗ eVj , com tij sendo as componentes de t. Para

g ∈ G, a ação de πU⊗V (g) sobre t ∈ U ⊗ V é dada por

πU⊗V (g)t := m∑

i=1

n∑

j=1

tij

(

πU (g)eUi

)

⊗ (

πV (g)eVj

)

.

Escrevendo, em notação matricial para πU (g) e πV (g),

πU (g)eUi =

m∑

a=1

πU (g)ai e U a e π

V (g)eVj =

n∑

b=1

πV (g)bj e U b ,

obtem-se

πU⊗V (g)t :=

m∑

i=1

n∑

j=1

t′ab

(

πU (g)eUa

)

⊗ (

πV (g)eVb

)

,

onde, para todos 1 ≤ a ≤ m e 1 ≤ b ≤ n,

t′ab :=

m∑

a=1

n∑

b=1

πU (g)ai π V (g)bj tij . (2.48)

As grandezas t′ab são as novas componentes de t após a transformação produzida por π U⊗V (g). É freqüente em livros de

F́ısica definir-se a noção de tensor (de rank 2) como sendo uma quantidade que se transforma segundo (2.48) por uma transformação induzida por um grupo (por exemplo, pelo grupo de rotações ou pelo grupo de Lorentz). Estritamente falando, um tensor não pode ser definido dessa forma, pois (2.48) é uma propriedade derivada, requerendo de uma definição prévia da noção de produto tensorial, tal como apresentamos acima. Ainda assim, no que concerne ao interesse da F́ısica, (2.48) captura em muitos casos o aspecto mais importante da noção de tensor.

2.3.5.1 Duais Algébricos e Produtos Tensoriais

• Isomorfismo entre (U ⊗ V )′ e (U ′)⊗ (V ′) no caso de dimensão finita Sejam U e V dois espaços vetoriais de dimensão finita sobre um mesmo corpo K e sejam U ′, respectivamente, V ′ seus

espaços duais. Se ℓ ∈ U ′ e µ ∈ V ′, podemos definir um funcional linear em U ⊗ V ≡ U ⊗K V , que denotaremos como ℓ× µ, por

(ℓ × µ) (

N∑

a=1

ua ⊗ va )

:=

N∑

a=1

ℓ(ua)µ(va) (2.49)

para todos ∑N

a=1 ua ⊗ va ∈ U ⊗ V . Que ℓ × µ é um funcional linear em U ⊗ V é um fato de demonstração elementar, deixado como exerćıcio.

Se considerarmos agora elementos gerais de U ′ ⊗ V ′ da forma ∑Na=1 ℓa ⊗ µa a aplicação Φ : U ′ ⊗ V ′ → (U ⊗ V )′

Φ

( N∑

a=1

ℓa ⊗ µa )

:=

N∑

a=1

ℓa × µa

define uma aplicação linear de U ′⊗V ′ em (U⊗V )′. Essa aplicação é injetora e sobrejetora. Para provar que é sobrejetora, seja {eU1 , . . . , eUm} uma base em U e {ℓU1 , . . . , ℓUm} sua base dual canônica e, respectivamente, seja {eV1 , . . . , eVn } uma base em V e {ℓV1 , . . . , ℓVn } sua base dual canônica. Seja ω ∈ (U ⊗ V )′. Todo elemento de U ⊗ V é da forma m∑

i=1

n∑

j=1

αije U i ⊗ eVj e, portanto,

ω

m∑

i=1

n∑

j=1

αije U i ⊗ eVj

 =

m∑

i=1

n∑

j=1

αijω ( eUi ⊗ eVj

) .

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 117/1507

Ao mesmo tempo, vale

ℓUa × ℓVb

m∑

i=1

n∑

j=1

αije U i ⊗ eVj

 = m∑

i=1

n∑

j=1

αijℓ U a

( eUi

) ℓVb

( eVj

) =

m∑

i=1

n∑

j=1

αijδiaδjb = αab ,

e, portanto,

ω

m∑

i=1

n∑

j=1

αije U i ⊗ eVj

 =

m∑

i=1

n∑

j=1

ω ( eUi ⊗ eVj

) ( ℓUi × ℓVj

)

m∑

i=1

n∑

j=1

αije U i ⊗ eVj

 ,

implicando

ω = m∑

i=1

n∑

j=1

ω ( eUi ⊗ eVj

) ( ℓUi × ℓVj

) = Φ

m∑

i=1

n∑

j=1

ω ( eUi ⊗ eVj

) ℓUi ⊗ ℓVj

 .

Para toda ω ∈ (U ⊗ V )′, provando a sobrejetividade de Φ. Observe-se agora que se

Φ

m∑

i=1

n∑

j=1

µijℓ U i ⊗ ℓVj

 = Φ

m∑

i=1

n∑

j=1

νijℓ U i ⊗ ℓVj

 ,

teremos m∑

i=1

n∑

j=1

µij ( ℓUi × ℓVj

) =

m∑

i=1

n∑

j=1

νij ( ℓUi × ℓVj

)

e calculando ambos os lados em eUa ⊗ eVb obtem-se µab = νab para todos a = 1, . . . , m e b = 1, . . . , n, estabelecendo a injetividade de Φ.

Estabelecemos com isso que os espaços vetoriais (U ⊗ V )′ e (U ′)⊗ (V ′) são isomorfos caso U e V sejam de dimensão finita. Naturalmente, as considerações de acima se deixam generalizar para produtos tensoriais finitos de espaços de dimensão finita sobre um mesmo corpo. Assim, se Ui, i = 1, . . . , N , são espaços vetoriais sobre um mesmo corpo K, cada qual com dimensão mi, teremos que (U1 ⊗ · · · ⊗ UN )′ e (U1)′ ⊗ · · · ⊗ (UN )′ são espaços vetoriais isomorfos.

2.3.5.2 Produtos Tensoriais de um mesmo Espaço Vetorial. Espaços Simétrico e Anti-

Simétrico

Seja U um espaço vetorial sobre um corpoK (que suporemos, por simplicidade, tendo caracteŕıstica 0). Os procedimentos acima permitem, para cada n ∈ N, definir o produto tensorial U⊗Kn, que passaremos a denotar por U⊗n omitindo o sub-́ındice K dos śımbolos ⊗ e ⊕. Lembremos que adotamos por convenção que U⊗0 = K e U⊗1 = U .

Para n ≥ 2 podemos definir uma representação Pn do grupo de permutações de n elementos, Sn, em U⊗n, da seguinte forma: se π é um elemento de Sn definimos Pn(π) como sendo o operador linear que a cada vetor da forma u1 ⊗ · · · ⊗ un associa o vetor uπ(1) ⊗ · · · ⊗ uπ(n). Isso significa que Pn(π) age em vetores gerais de U⊗n na forma

Pn(π)

( l∑

k=1

αk u k 1 ⊗ · · · ⊗ ukn

)

= l∑

k=1

αk Pn(π) ( uk1 ⊗ · · · ⊗ ukn

) =

l∑

k=1

αk u k π(1) ⊗ · · · ⊗ ukπ(n) ,

onde os αk’s são elementos de K. É elementar constatar que Pn(π)Pn(π ′) = Pn(ππ

′) para todos π, π′ ∈ Sn e que Pn(id) = 1, id sendo a identidade (elemento neutro) de Sn. Isso confirma que Pn é uma representação de Sn em U⊗n.

Para n = 0 e n = 1 convencionamos que Sn é o grupo trivial (contendo apenas a identidade) e que em ambos os casos Pn(id) = 1, o operador identidade.

Definimos o operador de simetrização e o operador de anti-simetrização agindo em U⊗n, n ≥ 2, por

Sn := 1

n!

π∈Sn

Pn(π) e An := 1

n!

π∈Sn

sinal(π)Pn(π) , (2.50)

respectivamente, onde sinal(π) é o sinal, ou paridade, de π ∈ Sn. Para n = 0 e n = 1 definimos S0 = A0 = 1 e S1 = A1 = 1, o operador identidade.

A seguinte proposição contém as propriedades algébricas mais relevantes dos operadores Sn e An.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 118/1507

Proposição 2.5 Com as definições e convenções acima, valem as seguintes afirmações:

1. SnPn(π) = Pn(π)Sn = Sn para todo n ≥ 0 e todo π ∈ Sn. 2. AnPn(π) = Pn(π)An = sinal(π)An para todo n ≥ 0 e todo π ∈ Sn. 3. S2n = Sn para todo n ≥ 0. 4. A2n = An para todo n ≥ 0. 5. SnAn = AnSn = 0 para todo n ≥ 2. Para n = 0 e n = 1 valem SnAn = AnSn = 1.

Os fatos que S2n = Sn e A 2 n = An dizem-nos que Sn e An são projeções. 2

Prova. Que SnPn(π) = Pn(π)Sn = Sn vale para n = 0 e n = 1 é evidente. Seja n ≥ 2. Teremos,

SnPn(π ′) =

1

n!

π∈Sn

Pn(π)Pn(π ′) =

1

n!

π∈Sn

Pn(ππ ′)

π′′=ππ′ =

1

n!

π′′∈Sn

Pn(π ′′) = Sn .

Na terceira igualdade acima usamos o fato que, para cada π′ a aplicação π 7→ ππ′ ≡ π′′ é bijetora em Sn e, portanto, somar sobre todo π ∈ Sn equivale a somar sobre todo π′′ ∈ Sn. A prova de que Pn(π′)Sn = Sn é análoga.

Que AnPn(π) = Pn(π)An = An vale para n = 0 e n = 1 é evidente. Seja n ≥ 2. Teremos,

AnPn(π ′) =

1

n!

π∈Sn

sinal(π)Pn(π)Pn(π ′) = sinal(π′)

1

n!

π∈Sn

sinal(ππ′)Pn(ππ ′)

π′′=ππ′ =

sinal(π′)

n!

π′′∈Sn

sinal(π′′)Pn(π ′′) = sinal(π′)An .

Na segunda igualdade acima usamos o fato que, sinal(ππ′) = sinal(π)sinal(π′). A prova de que Pn(π ′)An = sinal(π

′)An é análoga.

Que S2n = Sn para n = 0 e n = 1 é evidente pela definição. Para n ≥ 2, segue as definições e do obtido acima que

S2n = 1

n!

π∈Sn

SnPn(π) = 1

n!

π∈Sn

Sn =

(

1

n!

π∈Sn

1

)

Sn = Sn ,

pois Sn possui n! elementos.

Que A2n = An para n = 0 e n = 1 é evidente pela definição. Para n ≥ 2, segue as definições e do obtido acima que

A2n = 1

n!

π∈Sn

sinal(π)AnPn(π) = 1

n!

π∈Sn

An =

(

1

n!

π∈Sn

1

)

An = An .

Que para n = 0 e n = 1 valem SnAn = AnSn = 1 é evidente pela definição. Para n ≥ 2 provemos que∑ π∈Sn

sinal(π) = 0. De fato,

π∈Sn

sinal(π) π=π′π′′

= ∑

π′′∈Sn

sinal(π′π′′) = sinal(π′) ∑

π′′∈Sn

sinal(π′′) = sinal(π′) ∑

π∈Sn

sinal(π) .

Na primeira igualdade escolhemos π′ ∈ Sn e definimos π′′ := (π′)−1π. A aplicação π → (π′)−1π ≡ π′′ é bijetora e, portanto, somar sobre todo π ∈ Sn equivale a somar sobre todo π′′ ∈ Sn. Escolhendo π′ de forma que sinal(π′) = −1 (isso sempre é posśıvel se n ≥ 2) obtemos na última igualdade que ∑π∈Sn sinal(π) = 0.

Assim, para n ≥ 2, segue das definições e do obtido acima que

SnAn = 1

n!

π∈Sn

sinal(π)SnPn(π) = 1

n!

π∈Sn

sinal(π)Sn =

(

1

n!

π∈Sn

sinal(π)

)

Sn = 0 .

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 119/1507

A prova que AnSn = 0 para n ≥ 2 é análoga.

As imagens das projeções Sn e An são dois subespaços de U ⊗n denotados por (U⊗n)S e (U

⊗n)A, respectivamente, e denominados subespaço simétrico e subespaço anti-simétrico, respectivamente. Para n = 0 e para n = 1 os subespaços simétrico e anti-simétrico coincidem com K e U , respectivamente. Como Sn e An são projeções, os elementos de (U

⊗n)S são invariantes pela ação de Sn e os elementos de (U

⊗n)A são invariantes pela ação de An. Os elementos de (U ⊗n)S são

denominados vetores simétricos e os de (U⊗n)A são denominados vetores anti-simétricos.

Notação. A imagem por n!An de elementos da forma u1 ⊗ · · · ⊗ un, com uk ∈ U para todo k, será denotada por u1 ∧K · · · ∧K un, ou simplesmente por u1 ∧ · · · ∧ un:

u1 ∧ · · · ∧ un := n!An ( u1 ⊗ · · · ⊗ un

) =

π∈Sn

sinal(π)uπ(1) ⊗ · · · ⊗ uπ(n) . (2.51)

Os elementos de (U⊗n)A são, portanto, combinações lineares finitas de elementos da forma u1 ∧ · · · ∧ un. Exemplificamos. Para n = 2, S2

( u1 ⊗ u2

) = 12

( u1 ⊗ u2 + u2 ⊗ u1

) é um elemento do subespaço simétrico

( U⊗2

)

S e

u1 ∧ u2 := 2!A2 ( u1 ⊗ u2

) = u1 ⊗ u2 − u2 ⊗ u1 é um elemento do subespaço anti-simétrico

( U⊗2

)

A . Para n = 3,

S3 ( u1 ⊗ u2 ⊗ u3

) =

1

3!

(

u1 ⊗ u2 ⊗ u3 + u3 ⊗ u1 ⊗ u2 + u2 ⊗ u3 ⊗ u1 + u1 ⊗ u3 ⊗ u2 + u2 ⊗ u1 ⊗ u3 + u3 ⊗ u2 ⊗ u1 )

é um elemento do espaço simétrico ( U⊗3

)

S , enquanto que

u1∧u2∧u3 := 3!A3 ( u1⊗u2⊗u3

) = u1⊗u2⊗u3+u3⊗u1⊗u2+u2⊗u3⊗u1−u1⊗u3⊗u2−u2⊗u1⊗u3−u3⊗u2⊗u1

é um elemento do espaço anti-simétrico ( U⊗3

)

A . Acima, os uk’s são elementos de U .

E. 2.93 Exerćıcio. Mostre que u1 ∧ · · · ∧ un = sinal(π)uπ(1) ∧ · · · ∧ uπ(n) (2.52)

Sugestão: use que AnPn(π) = sinal(π)An.

Conclua que se dois dos vetores de u1, . . . , un forem iguais, então u1 ∧ · · · ∧ un = 0. Conclua disso que se os vetores u1, . . . , un não forem linearmente independentes, então u1 ∧ · · · ∧ un = 0. 6

O exerćıcio que seque indica algumas das conseqüências dos resultados do Exerćıcio E. 2.93 no caso em que U tem dimensão finita.

E. 2.94 Exerćıcio. Justifique as afirmações que seguem. Se U é um espaço de dimensão finita m então, segue do exposto no Exerćıcio E. 2.93 que u1∧· · ·∧un = 0 sempre que n > m e que, portanto, (U⊗n)A = {0}, o espaço vetorial trivial, sempre que n > m.

Se m é a dimensão de U e {e1, . . . , em} uma base em U , então todo elemento a ∈ U se escreve na forma a = ∑m

k=1 α kek.

Como todos os elementos de ( U⊗l

)

A , l = 0, . . . , m, são combinações lineares finitas de elementos da forma a1 ∧ · · · ∧ al,

com aj ∈ U , ∀j ∈ {1, . . . , l}, conclúımos que os elementos da forma ek1 ∧ · · · ∧ ekl com k1 < . . . < kl compõe uma base em

( U⊗l

)

A .

Um simples argumento combinatório demonstra que há ( m l

) l-uplas (k1, . . . , kl) com kj ∈ {1, . . . , m} para todo j e

com k1 < · · · < kl e, portanto, ( U⊗l

)

A tem dimensão

( m l

) = m!l!(m−l)! . Assim, todo elemento α de

( U⊗l

)

A pode ser escrito

na forma

α = ∑

1≤k1<...<kl≤m

αk1···kl ek1 ∧ · · · ∧ ekl = m∑

k1=1

· · · m∑

kl=1

αk1···kl l!

ek1 ∧ · · · ∧ ekl ,

com αk1···kl ∈ K, sendo que na última igualdade assumimos que as quantidades αk1···kl são anti-simétricas por permutações de seus ı́ndices, ou seja, satisfazem αkπ(1)···kπ(l) = sinal(π)αk1···kl para todo π ∈ Sl e todos k1, . . . , kl ∈ {1, . . . , m}. 6

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 120/1507

2.3.5.3 O Produto Tensorial de Módulos. Derivações

• O produto tensorial de dois módulos sobre uma álgebra associativa Vamos aqui a uma definição que nos será importante. Sejam M e N dois bimódulos sobre uma álgebra associativa

A, ambos supostos serem espaços vetoriais sobre o corpo dos complexos. Conforme a sub-seção anterior podemos definir o espaço vetorial M ⊗C N . Entretanto, em muitos casos é necessário definir um outro tipo de produto tensorial entre M e N .

Para tal seja X = M ⊗C N e definamos em F (X) o conjunto de relações

R := {r ∈ F (X)| r = (ma)⊗C n−m⊗C (an), com a ∈ A, m ∈ M, n ∈ N} . (2.53)

Definamos então R = R(M ⊗C N) como o subgrupo gerado por R e o produto tensorial

M ⊗A N := F (M ⊗C N)/R(M ⊗C N) . (2.54)

Podemos fazer de M ⊗A N um módulo, digamos à direita, sobre A tomando o produto

a · (m⊗A n) := (ma)⊗A n = m⊗A (an) . (2.55)

O sub-́ındice A aposto ao śımbolo ⊗ serve para recordar que um elemento da álgebra associativa A pode ser passado de um lado para outro do śımbolo ⊗, tal como na última igualdade em (2.55).

Faremos uso do assim definido produto tensorial M ⊗A N adiante. O mais importante para nós será a identidade (ma)⊗A n = m⊗A (an) válida em todo M ⊗AN para todo a ∈ A. Uma outra construção que também irá interessar-nos é a seguinte. Seja M um bimódulo sobre uma álgebra associativa A e tomemos Vn = M

⊗An ≡ M ⊗A · · · ⊗A M ︸ ︷︷ ︸

n vezes

. Com os

conceitos apresentados anteriormente temos definida a soma direta ⊕

n∈N

M⊗An.

• Derivações Seja A uma álgebra sobre C com identidade e e seja M um bimódulo sobre A. Uma aplicação linear δ : A → M é

dita ser uma derivação de A em M se satisfaz a regra de Leibniz39:

δ(ab) = aδ(b) + δ(a)b , (2.56)

para todos a, b ∈ A. Vamos a alguns exemplos.

Exemplo 1. Seja A uma álgebra sobre C com unidade e e M = A⊗C A com os seguintes produtos de bimódulo:

a · (b ⊗ c) := (ab)⊗ c, (2.57)

(b ⊗ c) · a := b⊗ (ca) . (2.58)

Deixa-se ao leitor verificar a associatividade dos produtos de bimódulo nesse caso. Defina-se

δ(a) := a⊗ e− e⊗ a . (2.59)

Deixa-se ao leitor verificar a validade da regra de Leibniz nesse exemplo. Note-se também que, por essa definição, δ(e) = 0.

Exemplo 2. Seja A uma álgebra sobre C com unidade e e M = A⊗C A com os seguintes produtos de bimódulo:

a · (b⊗ c) := (ab)⊗ c , (2.60)

(b⊗ c) · a := b⊗ (ca)− (bc)⊗ a . (2.61) 39Gottfried Wilhelm von Leibniz (1646–1716).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 121/1507

Deixa-se ao leitor verificar a associatividade dos produtos de bimódulo nesse caso. Defina-se

δ(a) := e⊗ a . (2.62)

Deixa-se ao leitor verificar a validade da regra de Leibniz nesse exemplo. Note-se também que, por essa definição, δ(e) = e⊗ e 6= 0. Exemplo 3. Exemplo importante de derivações pode ser visto em álgebras de Lie. Seja A uma álgebra de Lie vista como um bimódulo sobre si mesma. Seja z um elemento fixo da álgebra e seja a aplicação dz : A → A dada por dz(a) = [z, a]. É fácil verificar (faça!) usando a identidade de Jacobi (2.13) que

dz([a, b]) = [dz(a), b] + [a, dz(b)]

para todo a, b ∈ A. Assim, tem-se que a cada z ∈ A é associada uma derivação dz.

2.4 Anéis e Álgebras. Estruturas e Construções Básicas

2.4.1 Ideais em Anéis e Álgebras Associativas

A noção de ideal, introduzida por Dedekind40 e depois aprofundada e generalizada por Hilbert41 e Noether42, desempenha um papel central no estudo de álgebras e anéis. Apesar de algumas definições gerais que seguem aplicarem-se tanto para anéis quanto para anéis não-associativos vamos nos restringir, por simplicidade, aos primeiros.

2.4.1.1 Ideais em Anéis

• Subgrupo gerado por subconjunto de um anel e alguma notação Seja A um anel e, como tal, dotado de uma operação de produto “·” (śımbolo esse que, por simplicidade, omitiremos

no que segue) e de uma operação de soma “+” em relação à qual é um grupo Abeliano, segundo as definições da Seção 2.1.6.1, página 73.

Se B ⊂ A é um subconjunto não-vazio de A, o conjunto G [B] ⊂ A definido por

G [B] := {

m1b1 + · · ·+mnbn , n ∈ N , mk ∈ Z e bk ∈ B para todo k = 1, . . . , n }

,

e formado por todas as somas finitas de múltiplos inteiros de elementos de B, é o menor subgrupo de A que contém B, o chamado subgrupo gerado pelo subconjunto B de A.

É de se observar que se B e C são subconjuntos não-vazios de A, então G [B∪C] contém G [B] e G [C] como subgrupos. Se B e C são subconjuntos não-vazios de A denotamos por BC o conjunto de todos os elementos de A que são da

forma bc com b ∈ B e c ∈ C: BC :=

{

bc , com b ∈ B e c ∈ C }

.

Com isso, é fácil ver que G [B]G [C] ⊂ G [BC]. Se B, C e D são subconjuntos não-vazios de A denotamos por BCD os conjuntos (BC)D = B(CD) (essa igualdade

dando-se em função da assumida associatividade de A):

BCD := {

bcd , com b ∈ B , c ∈ C e d ∈ D }

.

• Ideais à esquerda, à direita e bilaterais em anéis Seja A um anel. Um subconjunto L de A que seja um subgrupo de A em relação à operação “+” é dito ser um ideal

à esquerda de A se al ∈ L para todo a ∈ A e todo l ∈ L. Um subconjunto R de A que seja um subgrupo de A em relação 40Julius Wilhelm Richard Dedekind (1831–1916). 41David Hilbert (1862–1943). 42Amalie (ou Emmy) Noether (1882–1935).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 122/1507

à operação “+” é dito ser um ideal à direita de A se ra ∈ L para todo a ∈ A e todo r ∈ R. Um subconjunto B de A é dito ser um bi-ideal ou um ideal bilateral de A for simultaneamente um ideal à direita e um ideal à esquerda de A.

Naturalmente, se A é um anel, A é um ideal bilateral de si mesmo, assim como {0} é um ideal bilateral (trivial) de A.

É claro também que se L é um ideal à esquerda de um anel A, então L é um módulo à esquerda sobre A e analogamente para ideais à direita e ideais bilaterais.

• Homomorfismos e ideais bilaterais Sejam A e B dois anéis e seja φ : A → B um homomorfismo. Então, Ker(φ) = {a ∈ A| φ(a) = 0} é um ideal bilateral

de A. De fato, 0 ∈ Ker(φ), se a, a′ ∈ Ker(φ) então φ(a+ a′) = φ(a) + φ(a′) = 0 e se a ∈ Ker(φ), então −a ∈ Ker(φ) pois φ(−a) = −φ(a) = 0, provando que Ker(φ) é um subgrupo de A. Fora isso, se b ∈ Ker(φ), então para todo a ∈ A vale φ(ab) = φ(a)φ(b) = φ(a)0 = 0 e, analogamente, para todo c ∈ A vale φ(bc) = φ(b)φ(c) = 0φ(c) = 0.

A afirmação feita acima, que Ker(φ) é um ideal bilateral, apesar de elementar, tem aplicações e conseqüências em diversas áreas.

• Intersecções de ideais Seja A um anel e sejam Lλ com λ ∈ Λ (Λ sendo um conjunto arbitrário de ı́ndices) uma famı́lia de anéis à esquerda

de A. É muito fácil verificar pelas definições (faça-o!) que ⋂

λ∈Λ Lλ é também um ideal à esquerda de A. Afirmação análoga vale para ideais à direita e ideais bilaterais.

• Ideais gerados por subconjuntos de um anel Seja C ⊂ A um subconjunto não-vazio de um anel A. Então, a intersecção de todos os ideais à esquerda de A que

contém C é também um ideal à esquerda, que é dito ser o ideal à esquerda gerado pelo conjunto C. Definições análogas valem para ideais à direita e ideais bilaterais.

Denotaremos por IE [A, C] (ou simplesmente por IE [C], quando o anel A for sub-entendido) o ideal à esquerda gerado por C ⊂ A. Analogamente, denotamos por ID[A, C] (ou simplesmente por ID[C]) e por IB[A, C] (ou simplesmente por IB [C]) os ideais à direita e bilaterais, respectivamente, gerados por C ⊂ A.

No caso de anéis associativos é posśıvel explicitar mais os elementos de ideais gerados por conjuntos.

Proposição 2.6 Seja C ⊂ A um subconjunto não-vazio de um anel associativo A. Tem-se que:

1. IE [ A, C

] = G

[ (AC) ∪ C

] , ou seja, o ideal à esquerda gerado por C, IE

[ A, C

] , consiste de todos os elementos

de A formados por somas finitas de produtos de elementos de A com elementos de C (nessa ordem) mais somas finitas de elementos de C com coeficientes inteiros. Naturalmente, se A é unital, então IE

[ A, C

] = G

[ AC

] .

2. ID [ A, C

] = G

[ (CA) ∪ C

] , ou seja, o ideal à direita gerado por C, ID

[ A, C

] , consiste de todos os elementos

de A formados por somas finitas de produtos de elementos de C com elementos de A (nessa ordem) mais somas finitas de elementos de C com coeficientes inteiros. Naturalmente, se A é unital, então IE

[ A, C

] = G

[ CA

] .

3. IB [ A, C

] = G

[ (ACA) ∪ (AC) ∪ (CA) ∪ C

] . Naturalmente, se A é unital, então IE [A, C] = G [ACA]. 2

Prova. É evidente que G [ (AC)∪C

] é um ideal à esquerda de A e que contém C e, portanto, IE

[ A, C

] ⊂ G

[ (AC)∪C

] .

Por outro lado, IE [ A, C

] , por ser um ideal à esquerda de A que contém C, necessariamente contém todos os elementos

de AC e de C e o subgrupo gerado por tais elementos (um ideal de A é um subgrupo de A), ou seja, IE [A, C] deve conter todos os elementos de G

[ (AC) ∪ C

] . Isso estabelece que IE

[ A, C

] e G

[ (AC) ∪ C

] são iguais. Os dois outros

casos são análogos.

E. 2.95 Exerćıcio. Complete os detalhes faltantes da demonstração acima. 6

• Ideais principais Se A é um anel e a ∈ A, os ideais gerados pelo conjunto de um elemento C = {a} são denominados por alguns autores

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 123/1507

os ideais principais gerados por a.

Denotamos por aA o conjunto aA := {aa′| a′ ∈ A} e por Aa o conjunto Aa := {a′a| a′ ∈ A}. É muito fácil constatar que IE [{a}], o ideal principal à esquerda gerado por a, coincide com Aa e que ID[{a}], o ideal principal à direita gerado por a, coincide com aA.

Observe-se que o conjunto AaA := {a′aa′′| a′, a′′ ∈ A} não um ideal de A, por não ser um subgrupo de A.

• Somas de ideais Se L1 e L2 são dois ideais à esquerda de um anel A então sua soma, definida por L1+L2 := {l1+l2 , l1 ∈ L1 e l2 ∈ L2}

é também, como facilmente se verifica, um ideal à esquerda de A. Esse ideal é dito ser a soma dos ideais L1 e L2. Afirmação análoga vale tanto para somas de dois ideais à direita quanto para somas de ideais bilaterais.

• Estrutura de reticulado em anéis Seja A um anel. Para dois ideais à esquerda L1 e L2 de A defina-se as operações L1∧L2 := L1∩L2 e L1∨L2 := L1+L2.

A coleção de todos os ideais à esquerda de A é um reticulado (para a definição, vide página 59 e seguintes) em relação a essas duas operações. Afirmação análoga vale tanto para a coleção de todos os ideais à direita de A quanto para a coleção de todos os ideais bilaterais de A.

E. 2.96 Exerćıcio. Prove as afirmações de acima. 6

• Produtos de ideais Se L é um ideal à esquerda de A o conjunto G

[ LC

] é igualmente um ideal à esquerda de A, denominado o ideal

produto de L por C. Analogamente, se R é um ideal à direita de A o conjunto G [ BR

] é igualmente um ideal à direita

de A, denominado o ideal produto de B por R. Por fim, se L é um ideal à esquerda de A e R é um ideal à direita de A, então G

[ LR

] é um ideal bilateral de A, denominado o bi-ideal produto de L por R.

• Quocientes de anéis por ideais bilaterais Vamos agora a uma das mais importantes construções ligadas à noção de anel, a de anel quociente de um anel por um

seu ideal bilateral. Essa construção guarda forte semelhança à de grupo quociente, introduzida na Seção 2.2.2, página 91.

Seja A um anel e B um ideal bilateral em A. Podemos definir em A uma relação de equivalência declarando a ∼ a′ se a− a′ ∈ B para a, a′ ∈ A.

Por essa definição é evidente que a ∼ a para todo a ∈ A. É também evidente que se a ∼ a′ então a′ ∼ a para todos a, a′ ∈ A. Por fim, se a ∼ a′ e a′ ∼ a′′, então a − a′′ = (a − a′) + (a′ − a′′) ∈ B, pois a − a′ ∈ B, a′ − a′′ ∈ B e B é um subgrupo de A, provando que a ∼ a′′. Isso estabeleceu que “∼”, definida acima, é, de fato, uma relação de equivalência em A. Assim, A particiona-se em classes de equivalência por essa relação de equivalência. Seja [a] a classe de equivalência de um elemento a ∈ A. Podemos fazer da coleção das classes de equivalência, que denotaremos por A/B, um anel definindo

[a1] + [a2] := [a1 + a2] , e [a1] [a2] := [a1a2] .

a1, a2 ∈ A. Antes de mostrar que essas operações fazem de A/B um anel, é preciso provar que elas estão bem definidas enquanto operações entre classes. Mas, de fato, se a1, a2 ∈ A e b1, b2 ∈ B, tem-se (a1+b1)+(a2+b2) = a1+a2+(b1+b2), e como b1+ b2 ∈ B, segue que a soma [a1]+ [a2] não depende do particular representante tomado das classes [a1] e [a2], o resultado sendo sempre um elemento da classe [a1 + a2]. Analogamente, (a1 + b1)(a2 + b2) = a1a2 +(a1b2 + b1a2 + b1b1). Como a1b2 + b1a2 + b1b1 ∈ B (note que a propriedade de bi-lateralidade do ideal B é usada aqui), segue que o produto [a1][a2] não depende do particular representante tomado das classes [a1] e [a2], o resultado sendo sempre um elemento da classe [a1a2].

É evidente pelas definições que [a1] + [a2] = [a2] + [a1] para todos [a1], [a2] ∈ A/B. É também fácil ver que [0] = B. Logo, [0] é o elemento neutro de A/B pela operação de soma. Cada [a] ∈ A/B, tem no elemento [−a] seu inverso aditivo, pois a + [−a] = [a − a] = [0]. Logo A/B é um grupo comutativo para a operação “+”. Agora, para todos [a1], [a2] e [a3] ∈ A/B vale

( [a1][a2]

) [a3] = [a1a2][a3] = [a1a2a3] = [a1]

( [a2][a3]

) , provando que o produto é associativo. Por fim,

[a1] ( [a2] + [a3]

) = [a1][a2 + a3] = [a1(a2 + a3)] = [a1a2 + a1a3] = [a1a2] + [a1a3] = [a1][a2] + [a1][a3]

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 124/1507

e ( [a2] + [a3]

) [a1] = [a2 + a3][a1] = [(a2 + a3)a1] = [a2a1 + a3a1] = [a2a1] + [a3a1] = [a2][a1] + [a3][a1] ,

estabelecendo a distributividade do produto na soma. Isso demonstrou que A/B é um anel.

O anel A/B é denominado anel quociente de A pelo ideal bilateral B, ou anel fator de A por B. Diversas estruturas algébricas importantes são constrúıdas na forma de quocientes de anéis por ideais bilaterais e teremos a oportunidade de apresentar algumas.

Notemos, por fim, que se A possui uma identidade 1, então [1] é a identidade de A/B, pois, para todo [a] ∈ A/B vale [a][1] = [a1] = [a]. Fora isso, se A é comutativo, A/B também o é, pois [a][b] = [ab] = [ba] = [b][a] para todos a, b ∈ A. A rećıproca não é necessariamente verdadeira: A/B pode ser comutativo sem que A o seja.

• Anéis gerados por relações Seja A um anel. É por vezes muito importante construir um novo anel a partir de A identificando alguns elementos

selecionados de A. Se, por exemplo, a e b são elementos distintos de A pode ser de nosso interesse impor que valha uma relação como a = b, ou como a2 = b, ou ainda como aba = b3, ou várias delas simultaneamente. Isso equivale a impor que alguns elementos de A (como os elementos a − b, ou a2 − b ou ainda aba − b3, nos exemplos acima) sejam nulos. Combinando alguns ingredientes apresentados acima uma tal construção é posśıvel.

Seja A um anel e seja C um subconjunto não-vazio de A. Seja IB[A, C] ≡ IB[C] o ideal bilateral gerado por C e seja o anel A/IB[C]. Pela construção, se x ∈ A/IB[C] então [x] = [0]. Como C ⊂ IB[C], segue que se c ∈ C, vale [c] = [0]. Como se vê, essa construção permite o efeito desejado se impor serem nulos certos elementos de A, a saber os de C (e todos os demais de IB [C], os quais são da forma de somas finitas de elementos como c ou aca

′, com a, a′ ∈ A e c ∈ C).

O anel A/IB[C] é dito ser o anel gerado pelo subconjunto C ⊂ A, ou o anel gerado pelo conjunto de relações C ⊂ A. O anel A/IB[C] será por vezes denotado por R[A, C] ou simplesmente por R[C], quando A for sub-entendido.

Um exemplo relevante de uma tal construção é o seguinte. Seja A um anel não-comutativo. Podemos construir um anel comutativo a partir de A considerando o conjunto C = {ab−ba, com a, b ∈ A} e construindo o anel R[A, C] = A/IB [C]. Os elementos de R[A, C] são classes [a] com a ∈ A. Para todos a, b ∈ A teremos que [a][b] − [b][a] = [ab − ba] = [0], pois ab− ba ∈ C ⊂ IB [C], que é a classe do elemento 0. Com isso, vê-se que R[A, C] é um anel comutativo, por vezes denominado a Abelianização do anel A.

E. 2.97 Exerćıcio. Seja o anel Z, formado pelos inteiros, com as operações usuais de soma e produto. Seja C = {n}, com n um inteiro positivo. Mostre que R[Z, {n}] coincide com Zn. 6

Construções como a do anel gerado por um subconjunto C são particularmente potentes quando combinadas à construção da álgebra tensorial de espaços vetoriais, que introduziremos na Seção 2.5, página 128.

• Ideais próprios, primos e maximais e algumas de suas propriedades Vamos agora a algumas definições úteis. Seja A um anel.

Um ideal I de A é dito ser um ideal próprio se I for um subconjunto próprio de A. É fácil constatar que se A é um anel com identidade 1, então um ideal I é próprio se e somente se 1 6∈ I. Essa observação elementar tem conseqüências diversas sobre propriedades estruturais de ideais, como veremos adiante.

Um ideal próprio de I de A é dito ser um ideal primo se para todos a e b ∈ A para os quais valha ab ∈ I tem-se ou que a ∈ I ou que b ∈ I (ou ambos).

Um ideal próprio M de A é dito ser um ideal maximal se não houver em A nenhum outro ideal próprio que contém M .

Proposição 2.7 Se A é um anel comutativo com uma unidade 1, então todo ideal maximal de A é um ideal primo. 2

Prova. Como A é comutativo, todo ideal de A é bilateral. Sejam a, b ∈ A tais que ab ∈ M . Se a ∈ M a prova está completa. Vamos então supor que a 6∈ M . O conjunto Aa é um ideal, pois para todo a′ ∈ A vale a′ab ∈ a′M ⊂ M . Fora isso, Aa não é um subconjunto de M pois, como A é unital, Aa contém o elemento 1a = a 6∈ M . Assim, a soma Aa+M é um ideal bilateral de A que contém M como subconjunto próprio e que deve conter a unidade, pois se assim não fosse

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 125/1507

seria um ideal próprio de A que contém M propriamente, contrariando a maximalidade de M . Logo, existem a′ ∈ A e m ∈ M tais que a′a+m = 1. Logo, a′ab+mb = b. Agora, a′ab ∈ M e mb = bm ∈ M . Logo, b ∈ M .

As proposições que seguem contém informações importantes sobre a relação entre ideais primos, ideais maximais e quocientes.

Proposição 2.8 Seja A um anel comutativo com unidade e P um ideal primo em A. Então A/P é um anel de integri- dade. 2

Prova. Vimos acima que a comutatividade de A implica a comutatividade de A/P e que A/P é unital, pois A o é, a unidade sendo [1]. Tudo o que precisamos é provar que A/P não tem divisores de zero. Suponhamos que A/P tenha divisores de zero, ou seja, que existam [a] 6= [0] e [b] 6= [0] tais que [a][b] = [0]. Isso significa que [ab] = [0], ou seja, que ab ∈ I. Pela hipótese, isso significa ou que a ∈ I (o que implica [a] = [0]) ou que b ∈ I (o que implica [b] = [0]) ou ambos. Isso é uma contradição e com ela completa-se a demonstração.

A seguinte proposição é empregada na teoria dos anéis e álgebras comutativas e na topologia algébrica.

Proposição 2.9 Seja A um anel comutativo com unidade e M um ideal maximal em A. Então A/M é um corpo. 2

Prova. Vimos acima que a comutatividade de A implica a comutatividade de A/M e que A/M é unital, pois A o é, a unidade sendo [1]. Vimos também (Proposição 2.7) que M é um anel primo e, portanto, A/M é um anel de integridade (Proposição 2.8). Tudo o que precisamos é provar que todo elemento não-nulo [a] de A/M tem uma inversa.

Primeiramente, notemos que se a ∈ A tem uma inversa a−1, então [a−1] é a inversa de [a], pois [a][a−1] = [aa−1] = [1]. Vamos então considerar elementos a ∈ A que não tenham inversa em A. A condição que [a] seja um elemento não-nulo de A/M significa que a 6∈ M .

Fixado um tal a, consideremos o conjunto aA. O fato de a não ter inversa em A equivale a dizer que 1 6∈ aA. O conjunto aA é um ideal à direita, mas também um ideal à esquerda, pois, devido à comutatividade de A, vale aA = Aa. Assim, aA é um ideal bilateral que não contém 1. Notemos também que aA não é um subconjunto de M pois, como A é unital, aA contém o elemento a1 = a 6∈ M .

A soma M + aA é igualmente um ideal bilateral de A, mas M + aA contém o elemento 1 pois, se assim não fosse, M + aA seria um ideal bilateral próprio de A que contém M propriamente (já que aA não é um subconjunto de M), contrariando a hipótese que M é maximal. Assim 1 ∈ M + aA, o que significa que existem m ∈ M e a′ ∈ A tais que m+ aa′ = 1, ou seja, aa′ = 1−m, o que implica [aa′] = [1] e, portanto, [a][a′] = [1]. Isso prova que [a] tem uma inversa multiplicativa, a saber, [a]−1 = [a′].

2.4.1.2 Ideais em Álgebras Associativas

As definições e construções de acima, sobre ideais em anéis, podem ser estendidas para o contexto de álgebras associativas. Lembrando que toda álgebra associativa é um anel, um ponto relevante a considerar é a estrutura linear introduzida pelo corpo de escalares K com os quais podemos multiplicar os vetores da álgebra em questão. Aqui não repetiremos todas as construções de acima no mesmo ńıvel de detalhe, por tal ser claramente dispensável, e nos ateremos apenas aos fatos mais importantes para os desenvolvimentos ulteriores. Vamos primeiramente às definições adequadas de ideais em álgebras.

• subespaço gerado por subconjunto de uma álgebra associativa e alguma notação Seja A uma álgebra associativa sobre um corpo K. Como tal, A é dotada de uma operação associativa de produto

“·” (śımbolo esse que, por simplicidade, omitiremos no que segue) e de uma operação de soma “+” em relação à qual é um grupo Abeliano, sendo também um espaço vetorial sobre K.

Se B ⊂ A é um subconjunto não-vazio de A, o conjunto E [B] ⊂ A definido por

E [B] := {

α1b1 + · · ·+ αnbn , n ∈ N , αk ∈ K e bk ∈ B para todo k = 1, . . . , n }

,

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 126/1507

e formado por todas as combinações lineares finitas de elementos de B com coeficientes em K, é o menor subespaço de A que contém B, o chamado subespaço gerado pelo subconjunto B de A.

É de se observar que se B e C são subconjuntos não-vazios de A, então E [B∪C] contém E [B] e E [C] como subespaços. Analogamente ao caso de anéis, se B e C são subconjuntos não-vazios de A denotamos por BC o conjunto de todos

os elementos de A que são da forma bc com b ∈ B e c ∈ C: BC := {

bc, com b ∈ B e c ∈ C }

. Com isso, é fácil ver

que E [B]E [C] ⊂ E [BC]. Se B, C e D são subconjuntos não-vazios de A também denotamos por BCD os conjuntos (BC)D = B(CD) (essa igualdade dando-se em função da assumida associatividade de A): BCD :=

{

bcd, com b ∈ B, c ∈ C e d ∈ D

}

.

• Ideais à esquerda, à direita e bilaterais em álgebras associativas Seja A uma álgebra associativa sobre um corpo K. Um subconjunto L de A que seja um subespaço vetorial sobre K

de A é dito ser um ideal algébrico à esquerda de A se al ∈ L para todo a ∈ A e todo l ∈ L. Um subconjunto R de A que seja um subespaço vetorial sobre K de A é dito ser um ideal algébrico à direita de A (ou simplesmente um ideal à direita de A) se ra ∈ L para todo a ∈ A e todo r ∈ R. Um subconjunto B de A é dito ser um bi-ideal algébrico ou um ideal bilateral algébrico de A for simultaneamente um ideal à direita e um ideal à esquerda de A. Por vezes omitiremos o qualificativo “algébrico” e falaremos apenas de ideais à esquerda ou à direita ou bilaterais, tal como no caso de anéis.

• Homomorfismos e ideais algébricos bilaterais Sejam A e B duas álgebras associativas e seja φ : A → B um homomorfismo algébrico. Então, Ker(φ) = {a ∈

A| φ(a) = 0} é um ideal bilateral algébrico de A. A prova dessa importante afirmação é análoga à do caso de anéis e os detalhes são deixados como exerćıcio.

• Intersecções de ideais Seja A uma álgebra associativa e sejam Lλ com λ ∈ Λ (Λ sendo um conjunto arbitrário de ı́ndices) uma famı́lia de

anéis algébricos à esquerda de A. É muito fácil verificar pelas definições (faça-o!) que ⋂

λ∈Λ Lλ é também um ideal algébrico à esquerda de A. Afirmação análoga vale para ideais algébricos à direita e ideais algébricos bilaterais.

• Ideais algébricos gerados por subconjuntos de uma álgebra associativa Assim como no caso de anéis, a noção de ideais algébricos gerados por subconjuntos de uma álgebra associativa

permite construções de grande relevância.

Seja C ⊂ A um subconjunto não-vazio de uma álgebra associativa A. Então, a intersecção de todos os ideais algébricos à esquerda de A que contém C é também um ideal algébrico à esquerda, que é dito ser o ideal algébricos à esquerda gerado pelo conjunto C. Definições análogas valem para ideais algébricos à direita e ideais algébricos bilaterais.

Denotaremos por IE [A, C] (ou simplesmente por IE [C], quando a álgebra A for sub-entendida) o ideal algébrico à esquerda gerado por C ⊂ A. Analogamente, denotamos por ID[A, C] (ou simplesmente por ID[C]) e por IB[A, C] (ou simplesmente por IB[C]) os ideais algébricos à direita e bilaterais, respectivamente, gerados por C ⊂ A.

No caso de álgebras associativas é posśıvel explicitar mais os elementos de ideais algébricos gerados por conjuntos.

Proposição 2.10 Seja C ⊂ A um subconjunto não-vazio de uma álgebra associativa A. Tem-se que:

1. IE [ A, C

] = E

[ (AC) ∪ C

] , ou seja, o ideal algébrico à esquerda gerado por C, IE

[ A, C

] , consiste de todos os

elementos de A formados por combinações lineares finitas com coeficientes em K de produtos de elementos de A com elementos de C (nessa ordem) mais combinações lineares finitas com coeficientes em K de elementos de C. Naturalmente, se A é unital, então IE

[ A, C

] = E

[ AC

] .

2. ID [ A, C

] = E

[ (CA) ∪ C

] , ou seja, o ideal algébrico à direita gerado por C, ID

[ A, C

] , consiste de todos os

elementos de A formados por combinações lineares finitas com coeficientes em K de produtos de elementos de C com elementos de A (nessa ordem) mais combinações lineares finitas com coeficientes em K de elementos de C. Naturalmente, se A é unital, então IE

[ A, C

] = E

[ CA

] .

3. IB [ A, C

] = E

[ (ACA) ∪ (AC) ∪ (CA) ∪ C

] . Naturalmente, se A é unital, então IE [A, C] = E [ACA]. 2

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 127/1507

A prova é análoga ao caso de anéis e deixada como exerćıcio.

• Somas de ideais algébricos Se L1 e L2 são dois ideais algébricos à esquerda de uma álgebra associativa A então sua soma, definida por L1+L2 :=

{l1 + l2 , l1 ∈ L1 e l2 ∈ L2} é também, como facilmente se verifica, um ideal algébrico à esquerda de A. Esse ideal é dito ser a soma dos ideais algébricos L1 e L2. Afirmação análoga vale tanto para somas de dois ideais algébricos à direita quanto para somas de ideais algébricos bilaterais.

• Estrutura de reticulado Seja A uma álgebra associativa. Para dois ideais algébricos à esquerda L1 e L2 de A defina-se as operações L1∧L2 :=

L1 ∩L2 e L1 ∨L2 := L1 +L2. A coleção de todos os ideais algébricos à esquerda de A é um reticulado (para a definição, vide página 59 e seguintes) em relação a essas duas operações. Afirmação análoga vale tanto para a coleção de todos os ideais algébricos à direita de A quanto para a coleção de todos os ideais algébricos bilaterais de A.

E. 2.98 Exerćıcio. Prove as afirmações de acima. 6

• Produtos de ideais algébricos Se L é um ideal algébrico à esquerda de A o conjunto E

[ LC

] é igualmente um ideal algébrico à esquerda de A,

denominado o ideal algébrico produto de L por C. Analogamente, se R é um ideal algébrico à direita de A o conjunto E [ BR

] é igualmente um ideal algébrico à direita de A, denominado o ideal algébrico produto de B por R. Por fim, se L

é um ideal algébrico à esquerda de A e R é um ideal algébrico à direita de A, então E [ LR

] é um ideal algébrico bilateral

de A, denominado o bi-ideal algébrico produto de L por R.

• Quocientes de álgebras associativas por ideais bilaterais É bastante claro ao leitor que com as definições acima podemos reproduzir as construções que realizamos no caso

de anéis, pois álgebras associativas são anéis e subespaços de álgebras são também subgrupos das mesmas em relação à operação de adição. De particular importância é a construção de quocientes. Se A é uma álgebra associativa e B é um ideal bilateral algébrico de A, então nossas construções prévias permitem definir o anel A/B composto das classes caracteŕısticas [a], com a ∈ A, sendo a relação de equivalência em A dada por a ∼ a′ se a − a′ ∈ B. Podemos fazer de A/B uma álgebra através da estrutura linear

α1[a1] + α2[a2] := [α1a1 + α2a2] ,

definida para todos α1, α2 ∈ K e todos a1, a2 ∈ A. Primeiramente precisamos provar que a expressão acima está bem definida enquanto operação entre classes. Porém, se a1, a2 ∈ A e b1, b2 ∈ B, então α1(a1 + b1) + α2(a2 + b2) = α1a1 + α2a2 + (α1b1 + α2b2). Como α1b1 + α2b2 ∈ B (pois B é um subespaço de A), segue que α1[a1] + α2[a2] não depende do particular representante adotado das classes [a1] e [a2], fornecendo sempre a classe [α1a1 + α2a2].

Isso estabelece que o anel A/B é uma álgebra associativa em relação sobre o corpo K, denominada álgebra quociente da álgebra associativa A com o ideal bilateral algébrico B, ou álgebra fator de A por B.

• Álgebras geradas por relações Seja A uma álgebra associativa. É por vezes muito importante construir um nova álgebra associativa a partir de

A identificando alguns elementos selecionados de A. Se, por exemplo, a e b são elementos distintos de A pode ser de nosso interesse impor que valha uma relação como a = b, ou como a2 = b, ou ainda como aba = b3, ou várias delas simultaneamente. Isso equivale a impor que alguns elementos de A (como os elementos a− b, ou a2− b ou ainda aba− b3, nos exemplos acima) sejam nulos. Combinando alguns ingredientes apresentados acima uma tal construção é posśıvel.

Seja A uma álgebra associativa e seja C um subconjunto não-vazio de A. Seja IB [A, C] ≡ IB [C] o ideal algébrico bilateral gerado por C e seja a álgebra associativa A/IB[C]. Pela construção, se x ∈ A/IB[C] então [x] = [0]. Como C ⊂ IB [C], segue que se c ∈ C, vale [c] = [0]. Como se vê, essa construção permite o efeito desejado se impor serem nulos certos elementos de A, a saber os de C (e todos os demais de IB[C], os quais são da forma de somas finitas de elementos como c ou aca′, com a, a′ ∈ A e c ∈ C).

A álgebra associativa A/IB[C] é dito ser a álgebra gerada pelo subconjunto C ⊂ A, ou a álgebra gerada pelo conjunto

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 128/1507

de relações C ⊂ A. A álgebra associativa A/IB[C] será por vezes denotado por A [A, C] ou simplesmente por A [C], quando A for sub-entendido.

Um exemplo relevante de uma tal construção é o seguinte. Seja A uma álgebra associativa não-comutativa. Podemos construir uma álgebra associativa comutativa a partir de A considerando o conjunto C = {ab − ba, com a, b ∈ A} e construindo a álgebra A [A, C] = A/IB [C]. Os elementos de A [A, C] são classes [a] com a ∈ A. Para todos a, b ∈ A teremos que [a][b]− [b][a] = [ab− ba] = [0], pois ab− ba ∈ C ⊂ IB[C], que é a classe do elemento 0. Com isso, vê-se que A [A, C] é uma álgebra associativa e comutativa, por vezes denominado a Abelianização da álgebra associativa A.

Construções como a da álgebra gerada por um subconjunto C são particularmente potentes quando combinadas à construção da álgebra tensorial de espaços vetoriais, que introduziremos na Seção 2.5, página 128.

2.5 Álgebras Tensoriais e Álgebras Exteriores

Seja U um espaço vetorial sobre um corpo K. Na Seção 2.3.5, página 112, definimos o produto tensorial U⊗Kn que aqui iremos denotar simplificadamente por U⊗n (doravante omitiremos o sub-́ındice K dos śımbolos ⊗ e ⊕). Pela convenção adotada naquela seção, temos U⊗n = K quando n = 0. Agregando a isso a definição de somas diretas de coleções arbitrárias de espaços vetoriais, apresentada na Seção 2.3.4, página 111, podemos definir o espaço vetorial

T (U) :=

∞⊕

n=0

U⊗n .

Na Seção 2.3.5.2, página 117, definimos também os espaços simétrico e anti-simétrico (U⊗n)S e (U ⊗n)A, respectiva-

mente. Com eles, podemos analogamente definir os espaços

TS(U) :=

∞⊕

n=0

( U⊗n

)

S e TA(U) :=

∞⊕

n=0

( U⊗n

)

A

que são os subespaços simétrico e anti-simétrico de T (U), respectivamente. Acima, para n = 0 convencionamos que ( U⊗0

)

S =

( U⊗0

)

A = K e para n = 1 convencionamos que

( U⊗1

)

S =

( U⊗1

)

A = U .

2.5.1 Álgebras Tensoriais

Lembremos que, de acordo com a definição de soma direta, cada vetor v de T (U) é da forma v0 ⊕ v1 ⊕ v2 ⊕ · · · , com vk ∈ U⊗n para todo k, mas somente um número finito de vk’s é não-nulo. É função disso, é posśıvel definir

em T (U) um produto que o transforma em uma álgebra associativa: para a ∈ ∞⊕

n=0

U⊗n e b ∈ ∞⊕

n=0

U⊗n da forma

a = ∑

k

αk a k 0 ⊕ ak1 ⊕ ak2 ⊕ · · · e b =

l

βl b l 0 ⊕ bl1 ⊕ bl2 ⊕ · · · , as duas somas sendo finitas, com αk ∈ K e βl ∈ K e com

aki ∈ U⊗i, blj ∈ U⊗j para todos k, l, i e j, definimos o produto a b por ( ∑

k

αk a k 0 ⊕ ak1 ⊕ ak2 ⊕ · · ·

)( ∑

l

βl b l 0 ⊕ bl1 ⊕ bl2 ⊕ · · ·

)

:= ∑

k, l

αkβl

(

ak0 ⊕ ak1 ⊕ ak2 ⊕ · · · )

⊗ (

bl0 ⊕ bl1 ⊕ bl2 ⊕ · · · )

= ∑

k, l

αkβl

∞⊕

p=0

[ p

q=0

akq ⊗ blp−q

]

=

∞⊕

p=0

[ p

q=0

( ∑

k

αk a k q

)

⊗ ( ∑

l

βl b l p−q

)]

,

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 129/1507

Acima, usamos diversas vezes as propriedades de distributividade estabelecidas no Exerćıcio E. 2.92, página 115. Os elementos akq ⊗ blp−q são definidos pelo isomorfismo canônico: se

x = ∑

r

χr x r 1 ⊗ · · · ⊗ xrm ∈ U⊗m e y =

s

ξs y s 1 ⊗ · · · ⊗ ysn ∈ U⊗n

com as somas sendo finitas e χr, ξs ∈ K para todos r, s, então

x⊗ y ≡ ∑

r

s

χrξs x r 1 ⊗ · · · ⊗ xrm ⊗ ys1 ⊗ · · · ⊗ ysn ∈ U⊗(m+n) .

Aqui, usamos o isomorfismo canônico U⊗m⊗U⊗n → U⊗(m+n) (vide (2.47)) para identificar (

xr1⊗· · ·⊗xrm )

⊗ (

ys1⊗· · ·⊗ysn )

e xr1 ⊗ · · · ⊗ xrm ⊗ ys1 ⊗ · · · ⊗ ysn. Observe-se que, devido ao fato de que apenas uma coleção finita de componentes aki e b

l j ser não-nula, então apenas

uma coleção finita de elementos da forma

p ∑

q=0

akq ⊗ blp−q, com p = 0, . . . , ∞, será não-nula também (Exerćıcio E. 2.99),

provando que o produto acima realmente resulta em elementos de T (U) e, portanto, define um produto em T (U).

E. 2.99 Exerćıcio. Sejam ai ∈ U⊗i e bj ∈ U⊗j para todos i, j = 0, 1, . . . , ∞. Mostre que se ai = 0 para todo i > M e

bj = 0 para todo j > N , então

p ∑

q=0

aq ⊗ bp−q = 0 para todo com p > M +N . 6

O espaço vetorial T (U) torna-se, assim, uma álgebra, denominada álgebra tensorial de U . Essa álgebra é associativa e unital, como se vê nos próximos exerćıcios.

E. 2.100 Exerćıcio. Mostre que o produto definido acima é associativo. Para tal, observe que, para x = x1 ⊗ · · · ⊗ xm, y = y1 ⊗ · · · ⊗ yn e z = z1 ⊗ · · · ⊗ zo o isomorfismo canônico mapeia

(

x⊗ y )

⊗ z e x⊗ (

y ⊗ z )

em x⊗ y ⊗ z. 6

E. 2.101 Exerćıcio. Seja e ∈ T (U) da forma e := 1 ⊕ 0 ⊕ 0 ⊕ · · · , onde 1 é a unidade do corpo K. Mostre, usando a definição de produto dada acima, que 1 b = b para todo b ∈ T (U). 6

Álgebras tensoriais são objetos de enorme importância e diversos outros tipos de álgebra podem ser constrúıdas a partir da mesma ou de modo semelhante à mesma.

2.5.2 Álgebras Exteriores

Álgebras exteriores são um tipo especial de álgebras de Grassmann e ocorrem de forma importante na Topologia Di- ferencial e na Geometria Diferencial, especialmente no estudo das chamadas formas diferenciais, introduzidas por Élie Cartan43. O tratamento que faremos aqui é geral e não se especializa a estruturas diferenciáveis.

Na Seção 2.3.5.2, página 117, definimos o espaço (U⊗n)A como o subespaço de U ⊗n constitúıdo pela imagem do

operador de anti-simetrização An. Sejam p, q ∈ N0. Se x ∈ (U⊗p)A e y ∈ (U⊗q)A, então x e y são (evidentemente) elementos de U⊗p e U⊗q, respectivamente, e, portanto, o produto tensorial x ⊗ y (como introduzido acima) define um elemento de U⊗(p+q). Se x ∈ (U⊗p)A e y ∈ (U⊗q)A, defina-se o produto ∧p, q : (U⊗p)A × (U⊗q)A →

( U⊗(p+q)

)

A por

x ∧p, q y := (p+ q)!

p!q! Ap+q

( x⊗ y

) . (2.63)

Note-se que, por essa definição valerá no caso p = 0 que x ∈ K e, portanto, x∧0, qy := Aq ( x⊗y

) = Aq

( xy

) = xAq

( y ) = xy.

Analogamente, no caso q = 0 teremos y ∈ K e, portanto, x ∧p, 0 y := Ap ( x⊗ y

) = Ap

( yx

) = yAp

( x ) = yx.

43Élie Joseph Cartan (1869–1951).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 130/1507

Se x e y são da forma x = x1 ∧ · · · ∧ xp e y = y1 ∧ · · · ∧ yq, então, usando (2.51) e (2.52), segue que ( x1 ∧ · · · ∧ xp

) ∧p, q

( y1 ∧ · · · ∧ yq

) =

(p+ q)!

p!q!

π∈Sp

σ∈Sq

sinal(π)sinal(σ) Ap+q

(

xπ(1) ⊗ · · · ⊗ xπ(p) ⊗ yσ(1) ⊗ · · · ⊗ yσ(q) )

= (p+ q)!

p!q!

π∈Sp

σ∈Sq

Ap+q

(

x1 ⊗ · · · ⊗ xp ⊗ y1 ⊗ · · · ⊗ yq )

= (p+ q)! Ap+q

(

x1 ⊗ · · · ⊗ xp ⊗ y1 ⊗ · · · ⊗ yq )

= x1 ∧ · · · ∧ xp ∧ y1 ∧ · · · ∧ yq . (2.64) Essa igualdade torna evidente que para x, y e z da forma x = x1 ∧ · · · ∧ xp ∈ (U⊗p)A, y = y1 ∧ · · · ∧ yq ∈ (U⊗q)A e z = z1 ∧ · · · ∧ zr ∈ (U⊗r)A, vale (

x ∧p, q y ) ∧p+q, r z = x ∧p, q+r

( y ∧q, r z

) . (2.65)

Devido à linearidade dos produtos ∧p, q (vide (2.63)), a relação (2.65) estende-se para todos x ∈ (U⊗p)A, y ∈ (U⊗q)A e z ∈ (U⊗r)A.

Para x ∈ (U⊗p)A, y ∈ (U⊗q)A é importante compararmos x ∧p, q y e y ∧q, p x, ambos elementos de (U⊗(p+q))A. Por (2.64), temos que

( x1 ∧ · · · ∧ xp

) ∧p, q

( y1 ∧ · · · ∧ yq

) = x1 ∧ · · · ∧ xp ∧ y1 ∧ · · · ∧ yq

= (−1)pqy1 ∧ · · · ∧ yq ∧ x1 ∧ · · · ∧ xp

= (−1)pq ( y1 ∧ · · · ∧ yq

) ∧q, p

( x1 ∧ · · · ∧ xp

) .

Conseqüentemente, vale x ∧p, q y = (−1)pq y ∧q, p x (2.66)

para todos x ∈ (U⊗p)A e y ∈ (U⊗q)A. É evidente por essa relação que se p for ı́mpar, teremos x ∧p, p x = 0 para todo x ∈ (U⊗p)A. Isso não é necessariamente verdade para p par. Porém, segue de (2.64) e do comentado no Exerćıcio E. 2.93, página 119, que

( x1 ∧ · · · ∧ xp

) ∧p, p

( x1 ∧ · · · ∧ xp

) = x1 ∧ · · · ∧ xp ∧ x1 ∧ · · · ∧ xp = 0 para todo p ∈ N.

• A álgebra exterior de U Podemos agora proceder de forma análoga ao que fizemos ao transformar T (U) em uma álgebra associativa e unital,

usando os produtos ∧p, q para fazer também de TA(U) uma álgebra associativa. Para a ∈ ∞⊕

n=0

(U⊗n)A e b ∈ ∞⊕

n=0

(U⊗n)A

da forma a = ∑

k

αk a k 0 ⊕ ak1 ⊕ ak2 ⊕ · · · e b =

l

βl b l 0 ⊕ bl1 ⊕ bl2 ⊕ · · · , as duas somas sendo finitas, com αk ∈ K e βl ∈ K

e com aki ∈ (U⊗i)A, blj ∈ (U⊗j)A para todos k, l, i e j, definimos o produto a ∧ b por ( ∑

k

αk a k 0 ⊕ ak1 ⊕ ak2 ⊕ · · ·

)

∧ ( ∑

l

βl b l 0 ⊕ bl1 ⊕ bl2 ⊕ · · ·

)

:= ∑

k, l

αkβl

(

ak0 ⊕ ak1 ⊕ ak2 ⊕ · · · )

∧ (

bl0 ⊕ bl1 ⊕ bl2 ⊕ · · · )

= ∑

k, l

αkβl

∞⊕

p=0

[ p

q=0

akq ∧q, p−q blp−q

]

=

∞⊕

p=0

[ p

q=0

( ∑

k

αk a k q

)

∧q, p−q ( ∑

l

βl b l p−q

)]

.

A associatividade do produto assim definido decorre diretamente de (2.65) e sua demonstração é deixada como exerćıcio. O espaço vetorial TA(U) torna-se, assim, uma álgebra associativa denominada álgebra exterior de U . Essa álgebra é unital, como se depreende do próximo exerćıcio.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 131/1507

E. 2.102 Exerćıcio. Seja e ∈ TA(U) da forma e := 1 ⊕ 0 ⊕ 0 ⊕ · · · , onde 1 é a unidade do corpo K. Mostre, usando a definição de produto dada acima, que 1 ∧ b = b para todo b ∈ TA(U). 6

É importante também reconhecer que U é isomorfo ao subespaço de TA(U) definido por 0⊕U⊕0⊕0⊕· · · e que para esse subespaço temos

( 0⊕u⊕0⊕· · ·

) ∧ ( 0⊕u⊕0⊕0⊕· · ·

) = 0⊕0⊕ (u∧1, 1u)⊕0⊕0⊕· · · = 0, pois u∧1, 1 u = u∧u = 0

para todo u ∈ U . Decorre disso que TA(U) é uma álgebra de Grassmann (vide definição na Seção 2.1.7.4, página 79).

• O caso de espaços de dimensão finita De particular importância para a Topologia Diferencial e para a Geometria Diferencial é o caso em que U é um espaço

de dimensão finita m. Seja {e1, . . . , em} uma base em U . Pelo comentado no Exerćıcio E. 2.94, página 119, vale aqui

TA(U) = K⊕ U ⊕ ( U⊗2

)

A ⊕ · · · ⊕

( U⊗m

)

A ,

pois (U⊗n)A = {0}, o espaço vetorial trivial, sempre que n > m. Pelo mesmo Exerćıcio E. 2.94, cada espaço ( U⊗l

)

A tem uma base composta por vetores da forma ek1 ∧ · · · ∧ ekl com kj ∈ {1, . . . , m} para todo j e com k1 < . . . < kl e, conseqüentemente,

( U⊗l

)

A tem dimensão

( m l

) = m!l!(m−l)! . Portanto, TA(U) tem dimensão

∑m l=0

m! l!(m−l)! = 2

m.

2.6 Tópicos Especiais

Esta seção é formada por alguns assuntos independentes que, embora relevantes, não se enquadram na exposição que pretend́ıamos ter nas seções anteriores.

2.6.1 O Grupo de Grothendieck

Vamos aqui descrever uma construção que permite obter um grupo Abeliano a partir de um semi-grupo Abeliano dado. Um grupo constrúıdo por esse procedimento é chamado de grupo de Grothendieck44 associado ao semi-grupo Abeliano em questão. Grupos de Grothendieck desempenham um papel importante em várias áreas da Matemática, como por exemplo na chamada K-teoria.

Seja um semi-grupo Abeliano S (não necessariamente dotado de um elemento neutro) cujo produto denotamos pelo śımbolo +.

Consideremos em primeiro lugar o produto Cartesiano S × S e vamos introduzir lá uma relação de equivalência da seguinte forma: dois pares (a, b) e (a′, b′) ∈ S × S são equivalentes, (a, b) ∼ (a′, b′), se existir pelo menos um elemento p ∈ S tal que

a+ b′ + p = a′ + b+ p . (2.67)

Vamos mostrar que isso define de fato uma relação de equivalência. Em primeiro lugar é claro que (a, b) ∼ (a, b) para qualquer par (a, b) ∈ S2 = S × S, dado que aqui, para verificar (2.67), basta tomar qualquer elemento p ∈ S. Em segundo lugar é evidente que se (a, b) ∼ (a′, b′) então (a′, b′) ∼ (a, b). Finalmente, vamos mostrar que se (a, b) ∼ (c, d) e (c, d) ∼ (e, f) então (a, b) ∼ (e, f). Por hipótese existem p e p′ ∈ S tais que

a+ d+ p = b+ c+ p e c+ f + p′ = d+ e+ p′ .

Daqui extráımos que (a+ d+ p) + (c+ f + p′) = (b+ c+ p) + (d+ e+ p′) ,

ou seja, que a+ f + p′′ = b+ e+ p′′ ,

onde p′′ = d + c + p + p′. Essa relação diz precisamente que (a, b) ∼ (e, f), completando a prova de que temos assim uma relação de equivalência em S2.

44Alexander Grothendieck (1928-).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 132/1507

Vamos considerar agora o conjunto K(S) := S2/ ∼ de todas as classes de equivalência definidas acima. Como é usual, denotaremos por [(a, b)] a classe à qual pertence o par (a, b) ∈ S2. Vamos construir em K(S) uma estrutura de grupo Abeliano, cujo produto também denotaremos por +. Dadas duas classes [(a, b)] e [(c, d)] definimos

[(a, b)] + [(c, d)] := [(a+ c, b+ d)] .

Note-se que por essa definição tem-se (verifique!)

[(a, b)] + [(c, d)] = [(c, d)] + [(a, b)]

para todo a, b, c, d ∈ S, pelo fato de a operação de soma ser Abeliana em S. A primeira coisa a fazer é mostrar que essa definição independe dos elementos tomados nas classes. Para isto basta

provar que se (a′, b′) ∼ (a, b) então (a+ c, b+ d) ∼ (a′ + c, b′ + d). Se (a′, b′) ∼ (a, b) então existe p ∈ S tal que

a+ b′ + p = a′ + b+ p .

Somando-se c+ d a ambos os lados tiramos

(a+ c) + (b′ + d) + p = (a′ + c) + (b+ d) + p

que é precisamente a afirmativa que (a+ c, b+ d) ∼ (a′ + c, b′ + d). É igualmente fácil verificar que para quaisquer x, y ∈ S tem-se que (x, x) ∼ (y, y) e que, portanto, [(x, x)] = [(y, y)].

Vamos provar que há em K(S) um elemento neutro. Este é precisamente a classe e := [(x, x)] com x ∈ S arbitrário. Note-se que, para qualquer par (a, b) ∈ S2 teremos

[(a, b)] + [(x, x)] = [(a+ x, b+ x)] = [(a, b)] ,

pois (a+ x+ b) + p = (b + x+ a) + p para qualquer p ∈ S. Falta-nos provar a associatividade do produto e a existência de uma inversa para cada elemento de K(S). Para a

associatividade, notemos que

[(a, b)] + (

[(c, d)] + [(e, f)] )

:= [(a, b)] + [(c+ e, d+ f)] = [(a+ c+ e, b+ d+ f)] ,

(

[(a, b)] + [(c, d)] )

+ [(e, f)] := [(a+ c, b+ d)] + [(e, f)] = [(a+ c+ e, b+ d+ f)] .

Para provar a existência de inversa notemos que para cada par (a, b) ∈ S2 podemos tomar [(a, b)]−1 := [(b, a)] pois

[(a, b)] + [(a, b)]−1 = [(a, b)] + [(b, a)] = [(a+ b, a+ b)] = e .

Isso mostrou que K(S) tem uma estrutura de grupo Abeliano. Este é o chamado grupo de Grothendieck associado ao semi-grupo Abeliano S.

Como de costume, denotaremos [(a, b)]−1 por −[(a, b)]. Assim, −[(a, b)] = [(b, a)].

E. 2.103 Exerćıcio. Seja o monóide Abeliano N0 dos números naturais contendo o 0 com a soma usual. Mostre que K(N0) ≃ Z. 6

O exerćıcio acima indica a possibilidade de se definir os números inteiros a partir dos naturais. Os inteiros seriam, por definição, o grupo de Grothendieck do monóide Abeliano dos naturais com a operação de soma usual.

E. 2.104 Exerćıcio. Seja o monóide Abeliano N, dos números naturais, com o produto dado pela multiplicação usual. Mostre que K(N) ≃ Q+, o grupo dos racionais positivos (sem o zero) com o produto dado pela multiplicação usual. 6

O exerćıcio acima indica a possibilidade de se definir os números racionais positivos a partir dos naturais. Os racionais seriam, por definição, o grupo de Grothendieck do monóide Abeliano dos naturais com a operação de produto usual.

Para cada elemento a de um monóide Abeliano M podemos associar um elemento de K(M) por M ∋ a 7→ [a] := [(a, 0)] ∈ K(M). É fácil ver que todo elemento [(a, b)] de K(M) pode ser escrito da forma [(a, b)] = [a] − [b] e que [a]− [b] = [a′]− [b′] se e somente se existir p ∈ M com a+ b′ + p = a′ + b+ p.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 133/1507

E. 2.105 Exerćıcio. Aplique a construção de Grothendieck para o semi-grupo R+, definido à página 67. Mostre que o grupo assim obtido possui apenas um elemento. 6

2.6.2 Grupóides

Um grupóide é definido da seguinte forma. É dado um conjunto C e um subconjunto C0 ⊂ C, o qual é a imagem de duas funções unárias p e c (chamadas de “partida” e “chegada”), ou seja, p : C → C0, c : C → C0. Os elementos de C0 são pontos fixos de p e de c, ou seja,

c(α) = α e p(α) = α

para todo α ∈ C0 (aqui denotaremos os elementos de C por letras gregas). Define-se em C × C um subconjunto (ou seja, uma relação em C), que denotaremos por RC , da seguinte forma:

RC := {(α, β) ∈ C2| p(α) = c(β)} .

É também dada uma função binária RC → C, que denotaremos por “·” e que denominaremos “produto”, a qual satisfaz as seguintes hipóteses:

1. Associatividade: α · (β · γ) = (α · β) · γ sempre que os produtos estejam definidos, ou seja, se (β, γ), (α, β · γ), (α, β) e (α · β, γ) forem todos elementos de RC

2. Para todo (α, β) ∈ RC temos p(α · β) = p(β). 3. Para todo (α, β) ∈ RC temos c(α · β) = c(α). 4. Para todo α ∈ C temos α · p(α) = α. 5. Para todo α ∈ C temos c(α) · α = α.

Fora isso, existe para cada α ∈ C uma assim chamada inversa bilateral α−1 ∈ C, a qual satisfaz α · α−1 = c(α) e α−1 · α = p(α). Note que, por essa definição, tem-se que, para todo α0 ∈ C0, α0 · α−10 = α−10 · α0 = α0.

Estes ingredientes definem um grupóide. Note-se que um grupóide não necessariamente contém um “elemento neutro” (vide exemplos).

• Exemplo de grupóide: Caminhos Este exemplo é um protótipo da definição de grupóide acima, ou seja, aquela possivelmente foi criada tendo o mesmo

como exemplo-guia.

Seja I o intervalo fechado [0, 1] e vamos considerar o conjunto C de todas as funções cont́ınuas de I em um espaço topológico Hausdorff qualquer (por exemplo R2). Um elemento γ de C é uma curva orientada cont́ınua em R2 que tem um ponto de partida γ(0) e um ponto de chegada γ(1).

Podemos introduzir uma relação de equivalência em C da seguinte forma: duas curvas α e β ∈ C são equivalentes (α ∼ β) se existir uma bijeção cont́ınua b : I → I com b(0) = 0, b(1) = 1, tal que α = β ◦ b. Vamos denominar por C as classes de equivalência de C pela relação de equivalência acima: C := C/ ∼.

O conjunto C0 é o subconjunto de C formado pelas classes de equivalência de curvas constantes: [α] ∈ C0 ⇐⇒ α(t) = α(t′), ∀t, t′ ∈ I.

Definimos as funções unárias p e c da seguinte forma: p([γ]) é a classe de equivalência da curva constante que a todo t ∈ I associa o ponto γ(0) de R2, o ponto de partida de γ; c([γ]) é a classe de equivalência da curva constante que a todo t ∈ I associa o ponto γ(1) de R2, o ponto de chegada de γ.

Dados dois elementos em C queremos agora definir o seu produto. A idéia a ser seguida é que o produto de duas curvas é definido apenas quando o ponto de chegada da primeira coincide com o ponto de partida da segunda e resulta em uma curva única unindo o ponto de partida da primeira com o ponto de chegada da última. Matematicamente isso é feito definindo-se o produto [β] · [α] como sendo a classe de equivalência da curva β ∗ α definida pela composição

β ∗ α(t) := {

α(2t), para 0 ≤ t ≤ 1/2 β(2t− 1), para 1/2 < t ≤ 1 .

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 134/1507

Claramente β ∗ α só é um elemento de C (ou seja, uma curva cont́ınua) se α(1) = β(0). Por fim a inversa bilateral de [α] é definida como sendo a classe [α−1], onde α−1(t) = α(1 − t). Deixamos para o leitor como exerćıcio mostrar que a estrutura definida acima é a de um grupóide.

Notemos que para a composição ∗ acima não vale a associatividade: (α ∗ β) ∗ γ 6= α ∗ (β ∗ γ), se ambos os lados estiverem definidos (por que?). No entanto, as curvas (α∗β)∗γ e α∗(β∗γ) são equivalentes no sentido da definição acima e de tal forma que para o produto “·” definido nas classes C vale a associatividade [α] · ([β] · [γ]) = ([α] · [β]) · [γ], se ambos os lados estiverem definidos (por que?). Essa é a razão de termos feito a construção nas classes C e não diretamente em C. Esse fato já deve ser familiar ao leitor que conheça o conceito de grupo de homotopia de espaços topológicos. O grupóide apresentado acima e o grupo de homotopia são, aliás, fortemente aparentados e ao leitor sugere-se pensar sobre qual a conexão entre ambos.

• Exemplo de grupóide: Relações de equivalência Seja K um conjunto no qual haja uma relação de equivalência R ⊂ K ×K. Tomamos C = R e C0 = {(x, x), x ∈

K} ⊂ R. Definimos

1. p((x, y)) := (x, x), ∀x, y ∈ K com x ∼ y. 2. c((x, y)) := (y, y), ∀x, y ∈ K com x ∼ y. 3. Produto: (x, y) · (y, z) := (x, z), ∀x, y, z ∈ K com x ∼ y ∼ z. 4. Inversa bilateral: (x, y)−1 := (y, x).

É fácil de se verificar (faça-o!) que a estrutura assim definida é a de um grupóide.

2.6.3 Quatérnios

Vamos nesta seção tratar brevemente de um tipo de álgebra que possui algumas aplicações interessantes na teoria de grupos e outros lugares, a chamada álgebra dos quatérnios.

Para a motivação, comecemos com alguns comentários. Dado um espaço vetorial como R2 há várias maneiras de definir no mesmo um produto de modo a fazer do mesmo uma álgebra. Por exemplo, podemos definir em R2 o produto

(x1, x2) · (y1, y2) = (x1y1, x2y2) , (2.68)

que é associativo e comutativo, como também o produto

(x1, x2) · (y1, y2) = (x1y1 − x2y2, x1y2 + x2y2) , (2.69)

que é igualmente associativo e comutativo (Exerćıcio. Verifique).

O produto (2.68) faz de R2 uma álgebra isomorfa a R ⊗ R, ou seja, a duas cópias da álgebra usual dos números reais. O produto (2.69) faz de R2 uma álgebra isomorfa à dos números complexos C (em verdade, a álgebra dos números complexos é definida como sendo a álgebra R2 com o produto (2.69)!).

Em R3 podemos definir igualmente vários tipos de produtos, tais como o produto

(x1, x2, x3) · (y1, y2, y3) = (x1y1, x2y2, x3y3) , (2.70)

que é igualmente associativo e comutativo; o produto

(x1, x2, x3) · (y1, y2, y3) = (x1y1, x2y2 − x3y3, x2y3 + x3y2) , (2.71)

também associativo e comutativo ou ainda um produto como

(x1, x2, x3) · (y1, y2, y3) = (x2y3 − x3y2, x3y1 − x1y3, x1y2 − x2y1) , (2.72)

que não é nem associativo nem comutativo. O produto (2.70) faz de R3 uma álgebra isomorfa a R⊗R⊗R (três cópias da álgebra dos reais). O produto (2.71) faz de R3 uma álgebra isomorfa a R⊗ C e o produto (2.72) é o bem conhecido produto vetorial.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 135/1507

O que se pode então fazer em R4? Naturalmente poder-se-ia definir em R4 várias álgebras imitando o que fizemos acima. Por exemplo, com o produto

(x1, x2, x3, x4) · (y1, y2, y3, y4) = (x1y1, x2y2, x3y3, x4y4) , (2.73)

R4 torna-se uma álgebra associativa e comutativa isomorfa a R⊗R⊗R⊗R. Com o produto

(x1, x2, x3, x4) · (y1, y2, y3, y4) = (x1y1 − x2y2, x1y2 + x2y1, x3y3 − x4y4, x3y4 + x4y3) , (2.74)

R4 torna-se uma álgebra associativa e comutativa isomorfa a C⊗ C. Com o produto

(x1, x2, x3, x4) · (y1, y2, y3, y4) = (x2y3 − x3y2, x3y1 − x1y3, x1y2 − x2y1, x4y4) (2.75)

R4 torna-se uma álgebra não-associativa e não-comutativa isomorfa a R3 ⊗ R, com o produto vetorial na componente R3.

Há também outros produtos que são meras variantes das listadas acima (ache algumas). Existe, porém, um outro produto não-trivial, denominado produto quaterniônico, que faz de R4 uma álgebra associativa mas não-comutativa e com unidade. Esse produto foi descoberto por W. R. Hamilton45. A história da descoberta desse produto em R4, feita em 16 de outubro 1843, numa tentativa de generalizar a álgebra dos números complexos para mais que duas dimensões, é bastante pitoresca e representou um marco na história da Álgebra por ser o primeiro exemplo de uma álgebra associativa mas não-comutativa (a descoberta de Hamilton antecede a introdução da álgebra das matrizes e a introdução do produto vetorial). Esse produto é o seguinte:

(x0, x1, x2, x3) · (y0, y1, y2, y3) =

(x0y0 − x1y1 − x2y2 − x3y3, x0y1 + y0x1 + x2y3 − x3y2, x0y2 + y0x2 + x3y1 − x1y3, x0y3 + y0x3 + x1y2 − x2y1) . (2.76)

E. 2.106 Exerćıcio. Mostre que o produto acima é associativo. Sugestão: paciência. 6

O espaço vetorial R4 dotado do produto acima é denominado álgebra dos quatérnios ou álgebra quaterniônica e é denotada freqüentemente por H (em honra a Hamilton). A álgebra H é associativa mas não é comutativa. H tem uma unidade, a saber, o vetor (1, 0, 0, 0) ∈ R4.

E. 2.107 Exerćıcio. Mostre que H não é uma álgebra comutativa. 6 E. 2.108 Exerćıcio. Mostre que (1, 0, 0, 0) é a unidade de H. 6

Há uma maneira melhor de representar o produto quaterniônico que a expressão (2.76). Vamos escrever os vetores da base canônica de R4 como

e0 = (1, 0, 0, 0) , e1 = (0, 1, 0, 0) , e2 = (0, 0, 1, 0) , e3 = (0, 0, 0, 1) ,

de modo que todo x ∈ R4 pode ser escrito na forma x = x0e0 +x1e1 + x2e2 + x3e3. O produto quaterniônico pode então ser definido pelo produto dos elementos da base canônica, que segue as seguintes regras:

1. e0 é a unidade da álgebra: x · e0 = e0 · x = x para todo x ∈ R4.

2. (e1) 2 = (e2)

2 = (e3) 2 = −e0.

3. eiej = −ejei para todo i 6= j com i, j = 1, 2, 3.

4. e1e2 = e3, e2e3 = e1 e e3e1 = e2.

45William Rowan Hamilton (1805–1865). W. R. Hamilton foi também o inventor do chamado formalismo Hamiltoniano da Mecânica Clássica.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 136/1507

E. 2.109 Exerćıcio. Verifique que essas regras reproduzem perfeitamente (2.76). 6

Além de ser de manipulação mais simples, essas regras permitem representar a álgebra quaterniônica de um modo talvez mais familiar, a saber, em termos de certas matrizes complexas 2× 2.

• Quatérnios e álgebras de matrizes 2× 2 Sejam a e b dois números complexos e seja M(a, b) a matriz

M(a, b) =

( a b

−b a

)

,

onde z é o complexo conjugado de z ∈ C. É fácil de se ver que o conjunto de todas as matrizes dessa forma é uma álgebra:

M(a, b)M(c, d) = M(ac− bd, ad+ bc) .

E. 2.110 Exerćıcio. Verifique! 6

Existe um isomorfismo entre a álgebra dos quatérnios e essa álgebra de matrizes 2×2. Basta associar (bijetivamente!) a cada quádrupla (x0, x1, x2, x3) a matriz M(x0 − ix3, x2 + ix1):

x = (x0, x1, x2, x3) ←→

x0 − ix3 x2 + ix1

−x2 + ix1 x0 + ix3

 =: M(x) . (2.77)

É fácil verificar então (faça!) que o produto quaterniônico é respeitado por essa associação:

M(x)M(y) = M(x · y) ,

onde, acima, x · y é o produto quaterniônico de x e y ∈ R4. Note-se que por essa associação tem-se

M(x) = M(x0e0 + x1e1 + x2e2 + x3e3) = x0M(e0) + x1M(e1) + x2M(e2) + x3M(e3),

com M(e0) = 1, M(e1) = iσ1 , M(e2) = iσ2 , M(e3) = −iσ3 ,

onde 1 = ( 1 0 0 1

)

, σ1 =

( 0 1 1 0

)

, σ2 =

( 0 −i i 0

)

e σ3 =

( 1 0 0 −1

)

,

as três últimas sendo as chamadas matrizes de Pauli46, que satisfazem

1. (σ1) 2 = (σ2)

2 = (σ3) 2 = 1,

2. σiσj = −σjσi para todo i 6= j e

3. σ1σ2 = iσ3, σ2σ3 = iσ1, σ3σ1 = iσ2.

E. 2.111 Exerćıcio. Verifique essas propriedades. 6

• Sub-álgebras AbelianasH possui algumas sub-álgebras Abelianas. E. 2.112 Exerćıcio. Mostre que H1 := {x ∈ R4, x = x0e0 +x1e1 = (x0, x1, 0, 0)} é uma sub-álgebra Abeliana de H que é isomorfa à álgebra C dos complexos. 6

46Wolfgang Ernst Pauli (1900–1958).

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 137/1507

E. 2.113 Exerćıcio. Mostre o mesmo para H2 := {x ∈ R4, x = x0e0 + x2e2 = (x0, 0, x2, 0)} e H3 := {x ∈ R4, x = x0e0 + x3e3 = (x0, 0, 0, x3)}. 6

E. 2.114 Exerćıcio. Será posśıvel fazer de R4 um espaço vetorial complexo? Seja α ∈ C e considere para x ∈ R4 o produto do escalar α pelo vetor x definido por

α · x = (Re(α)e0 + Im(α)e1) · x , onde o produto do lado direito é o o produto quaterniônico. Mostre que isso faz de R4 um espaço vetorial sobre o corpo dos complexos. Para isto verifique as propriedades definidoras de um espaço vetorial listadas à página 71. 6

E. 2.115 Exerćıcio. No exerćıcio anterior há outros produtos do escalar α pelo vetor x que podem ser considerados:

α · x = (Re(α)e0 + Im(α)e2) · x ,

ou α · x = (Re(α)e0 + Im(α)e3) · x ,

ou mesmo α · x = x · (Re(α)e0 + Im(α)e1)

etc. Mostre que todos esses seis produtos de escalares α ∈ C por vetores x ∈ R4 fazem de R4 um espaço vetorial sobre o corpo dos complexos. 6

• H é um anel de divisão É fácil ver que a álgebra dos quatérnios é um anel de divisão (vide página 81), ou seja, todo x ∈ R4, x 6= 0, tem uma

inversa em relação ao produto quaterniônico. Do isomorfismo M definido em (2.77) acima vê-se que

det(M(x)) = det (M(x0 + ix1, x2 + ix3)) = (x0) 2 + (x1)

2 + (x2) 2 + (x3)

2

e, portanto, M(x) tem uma matriz inversa sempre que x 6= 0. De fato, definindo-se para x = x0e0 + x1e1 + x2e2 + x3e3 ∈ R4 o conjugado quaterniônico

x = x0e0 − x1e1 − x2e2 − x3e3

e do fato facilmente constatável que47

x · x = (x0)2 + (x1)2 + (x2)2 + (x3)2 ∈ R

é fácil ver que para x 6= 0 tem-se x−1 =

( 1

x · x

)

x ∈ R4 ,

ou seja x−1 · x = x · x−1 = e0.

E. 2.116 Exerćıcio. Verifique. 6

Note que por H ser um anel de divisão, H não tem divisores de zero: x · y = 0 se e somente se x = 0 ou y = 0. • Norma quaterniônica

Em uma álgebra A uma função N : A → R+ que satisfaça

N(a · b) = N(a)N(b)

para todo a, b ∈ A e N(a) = 0 ⇐⇒ a = 0 é dita ser uma norma algébrica. 47Com um abuso de linguagem identificamos aqui ((x0)2 + (x1)2 + (x2)2 + (x3)2)e0 ∈ R4 com (x0)2 + (x1)2 + (x2)2 + (x3)2 ∈ R.

JCABarata. Curso de F́ısica-Matemática Versão de 8 de julho de 2008. Caṕıtulo 2 138/1507

Em R e C tem-se a norma algébrica N(z) = |z|, o módulo ou valor absoluto de z. H também possui uma norma algébrica. Para x ∈ R4 a expressão

N(x) = x · x define48 uma norma algébrica em H. E. 2.117 Exerćıcio. Verifique que a mesma satisfaz N(x · y) = N(x)N(y). 6

Há um teorema devido a Hurwitz49 que afirma que há apenas quatro álgebras que são álgebras de divisão50 e possuem uma norma algébrica: R, C, H e a chamada álgebra dos octônions, da qual não falaremos aqui. Esta última, por sinal, não é associativa.

A álgebra H possui várias outras propriedades interessantes, mas vamos encerrar aqui nossa exposição introdutória. O leitor interessado poderá encontrar mais sobre H nos bons livros de álgebra, especialmente nos mais antigos.

48Vide nota de rodapé 47, página 137. 49Adolf Hurwitz (1859–1919). 50Vide definição à página 81

Até o momento nenhum comentário
Esta é apenas uma pré-visualização
3 mostrados em 85 páginas