DESCRIÇÃO DA ÁREA DE MÉTODOS NUMÉRICOS EM ESTUDO

Interpolação Polinomial

A interpolação consiste em determinar uma função (iremos considerar polinómios), que assume valores conhecidos em certos pontos (que chamaremos nós de interpolação). A classe de funções escolhida para a interpolação é a priori arbitrária, e deve ser adequada às caracteristicas que pretendemos que a função possua.

A interpolação polinomial pode-se revelar desadequada se os nós de interpolação não forem escolhidos convenientemente (o que leva ao uso de nós de Chebyshev...). De um modo geral, o conjunto das funções interpoladoras é determinado por um número finito de parâmetros (no caso dos polinómios, são os seus coeficientes...) que deverá ser igual ao número de condições impostas (ou seja, ao número de nós), para que haja apenas uma solução. Nos casos que veremos, a determinação dos parâmetros, que definem a função interpoladora, irá levar-nos à resolução de um sistema linear.

Se considerarmos a interpolação polinomial, podemos evitar a resolução desse sistema, usando as fórmulas de Lagrange ou de Newton, que reduzem significativamente o número de operações envolvido.

Consideremos um conjunto de pontos (designados nós de interpolação)
x₀ , ... , x_n , a que estão associados os valores de uma função f₀ , ... , f_n, respectivamente.
Pretendemos encontrar um polinómio p tal que

p ( x_i ) = f_i

para i = 0, ..., n.

O polinómio de 3º grau interpola a função em 4 pontos

Escrevendo p( x ) = a₀ + a₁ x + ... + a_m x^m, obtemos o sistema

a₀ + a₁ x₀ + ... + a_m x₀^m = f₀

...

a₀ + a₁ x_n + ... + a_m x_n^m = f_n

e para que este sistema seja possível e determinado é pelo menos necessário que m=n.
Obtemos assim o sistema linear :

é
ê
ê
ê
ê
ë

1	x₀	...	x₀ⁿ
1	x₁	...	x₁ⁿ
...			...
1	x_n	...	x_nⁿ

ù
ú
ú
ú
ú
û

é
ê
ê
ê
ê
ë

a₀

a₁

...

a_n

ù
ú
ú
ú
ú
û

é
ê
ê
ê
ê
ë

f₀

f₁

...

f_n

ù
ú
ú
ú
ú
û

em que a matriz do sistema é conhecida como Matriz de Vandermonde.
A existência e unicidade do polinómio interpolador é equivalente a assegurar que o
sistema é possível e determinado para quaisquer x₀ , ... , x_n distintos.

Teorema:
Dados n+1 nós, x₀ , ... , x_n e os respectivos valores f₀ , ... , f_n,
existe um e um só, polinómio interpolador de grau <n, para esses valores.

dem: Unicidade:
Supondo que existem dois polinómios interpoladores p e q de grau < n, então o polinómio p(x) - q(x) tem grau < n e n+1 raízes, já que, sendo polinómios interpoladores, verificam :

p ( x_i ) = f_i = q ( x_i )

para i = 0, ..., n.
Consequentemente, como tem n+1 raízes e grau < n, o polinómio p(x)-q(x) terá que ser nulo, logo p=q .

Existência:
Podemos mostrar a existência, construindo os

Polinómios de Lagrange

Dados n+1 nós de interpolação x₀ , ... , x_n, definimos para cada i = 0, ..., n o polinómio de Lagrange l_i(x) de grau n tal que :

l_i(x_j) =

ì
í
î

1, se i=j

0 , c.c.

Podemos deduzir uma expressão explícita dos polinómios de Lagrange.
Fixando i e variando j = 0, ..., n , obtemos:

x_jé raiz de l_i se i ¹ j, implica

l_i (x) = C_i

n
P
j=0, j ¹ i

(x - x_j)

E a constante C_i pode determinar-se, pois l_i(x_i) = 1, o que implica

C_i = 1 /

n
P
j=0, j ¹ i

(x_i - x_j)

Consequentemente:

l_i (x) =

n
P
j=0, j ¹ i

x - x_j

x_i- x_j

para i = 0, ..., n .

· Agora, basta considerar a Fórmula Interpoladora de Lagrange:

p_n( x ) = f₀ l₀(x) + ... + f_n l_n(x)

que nos dá a expressão do polinómio interpolador, pois é fácil verficar que p_n ( x_i ) = f_i .

· Fórmula Interpoladora de Newton

Trata-se de uma fórmula alternativa para o cálculo do polinómio interpolador, baseada numa construção sucessiva a partir dos polinómios de graus inferiores. Para estabelecer essa fórmula convém introduzir a noção de diferença dividida.
Diferenças divididas
As diferenças divididas são razões incrementais e constituem aproximações discretas de derivadas, desde que se utilizem pontos suficientemente próximos. No caso que nos interessa, iremos utilizar os nós de interpolação que podem estar bastante afastados. Veremos que para funções regulares é possível estabelecer uma relação entre o valor de uma diferença dividida e a derivada num certo ponto.
A diferença dividida de 1ª ordem é definida de uma forma geral por:
f [ x_i, x_j] = ( f_i - f_j ) / ( x_i - x_j )
e uma diferença dividida de ordem k, pode ser obtida a partir das anteriores :
f [ x_i , ... , x_i+k] = ( f [ x_i+1, ... , x_i+k ] - f [ x_i, ... , x_i+k-1 ] ) / ( x_i+k - x_i )

· (a regra subjacente é que no denominador vai ficar a diferença entre os nós, que não são comuns às diferenças divididas do numerador).

· Observação: Qualquer permutação da ordem dos nós não altera o resultado.
Ou seja, por exemplo, f [ x₁, x₂ , x₃ ] = f [ x₂, x₃ , x₁ ]

· Nota: Podemos considerar os valores f_i como diferenças divididas de ordem zero, e reparamos que isso é coerente com a definição da diferença de 1ª ordem.

Dedução da fórmula de Newton
Começamos por considerar que conhecemos a expressão do
polinómio p_n-1(x) de grau <n-1 que interpola os nós x₀ , ... , x_n-1.
O polinómio p_n(x) de grau < n, que interpola os nós x₀ , ... , x_n-1, x_n,
pode-se escrever na forma:
p_n(x) = p_n-1(x) + q_n(x)
em que q_n(x) é um polinómio de grau <n que tem n raizes, pois
q_n( x_i ) = 0
para i = 0, ..., n-1, logo
q_n( x_i ) = C_n ( x - x₀) ... ( x - x_n-1) .

· Resta determinar o valor do coeficiente C_n .
Proposição: O coeficiente C_n , que é o coeficiente do termo xⁿ do polinómio interpolador p_n
(nos nós x₀ , ... , x_n), é a diferença dividida f [ x₀ , ... , x_n ].
dem:
Consideremos os polinómios interpoladores
p_n-1 que interpola os nós x₀ , ... , x_n-1 com coeficiente C_n-1
q_n-1 que interpola os nós x₁ , ... , x_ncom coeficiente C*_n-1
Reparamos que definindo

q(x) =

(x - x₀) q_n-1(x) -(x - x_n) p_n-1(x)

(x_n-x₀)

temos p_n(x) =q(x) porque têm grau n e coincidem nos nós de interpolação x₀ , ... , x_n(o polinómio interpolador é único).
Com efeito,
q(x₀) = p_n-1(x₀) = f₀ = p_n(x₀),
...
q(x_i) = (-x₀q_n-1(x_i) + x_np_n-1(x_i)) / (x_n-x₀) = 1 f_i = p_n(x_i),
...
q(x_n) = q_n-1(x_n) = f_n = p_n(x_n),
Agora basta reparar que o coeficiente C_n será dado por (C*_n-1- C_n-1)/(x_n-x₀), ou seja, de forma semelhante ao que acontece nas diferenças divididas. Como C*_n-1 e C_n-1 também seriam obtidos de forma semelhante, por indução podemos mostrar o resultado.

· Fórmula de Newton
Portanto, podemos agora escrever

p_n(x) = p_n-1(x) + f [ x₀ , ... , x_n ] (x - x₀) ... ( x - x_n-1)

· e podemos obter sucessivamente, a partir do polinómio interpolador de grau zero p₀(x) = f₀ :

p₁(x) = f₀ + f [ x₀ , x₁ ] ( x - x₀)

p₂(x) = f₀ + f [ x₀ , x₁ ] ( x - x₀) + f [ x₀ , x₁, x₂ ] ( x - x₀) ( x - x₁)

... etc ...

Deduzimos assim a Fórmula Interpoladora de Newton :

p_n(x) = f₀+

n
S
k=1

f [x₀, ... , x_k] (x - x₀) ... (x - x_k-1)

· Número de operacões:
Se resolvermos o sistema linear, como vimos no Capítulo II, é necessário efectuar um total de ~2 n³/3 operações. Usando a Fórmula de Lagrange ou a Fórmula de Newton reduzimos para ~3 n²/2. A F. Lagrange usa mais multiplicações+divisões que a F. Newton, que, por sua vez, usa mais somas+subtracções.

· Erro de Interpolação

Caso haja um conhecimento suplementar da função que pretendemos interpolar (para além do valor nos nós de interpolação), por exemplo, se tivermos majorações do valor da derivada de ordem n, num intervalo que contenha os nós, podemos estabelecer majorações para o erro de interpolação.

· O erro de interpolação, num certo ponto x, é :

e_n( x ) = f( x ) - p_n( x )

· É claro, que se x fôr um dos nós, o erro é zero! Caso contrário, podemos considerar esse valor x como um novo nó, e pensar no polinómio interpolador p_n+1 . Já vimos que

p_n+1( y ) = p_n( y ) + f[ x₀, ... , x_n, x ] ( y - x₀ ) ... ( y - x_n )

· Considerando y = x, e como x é um novo nó de interpolação, p_n+1( x ) = f ( x ), e obtemos :

· f( x ) = p_n( x ) + f[ x₀ , ... , x_n, x ]( x - x₀ ) ... ( x - x_n )

ou seja, temos a fórmula de erro

e_n ( x ) = f [ x₀ , ... , x_n, x ] ( x - x₀ ) ... ( x - x_n )

· Esta fórmula é útil do ponto vista teórico, como também veremos mais tarde, no caso da integração.
Vamos, no entanto, aproveitar uma relação entre as diferenças divididas e as derivadas, para estabelecer uma outra fórmula.

· Teorema :
Consideremos n+1 nós de interpolação x₀ , ... , x_n distintos entre si,
incluídos no intervalo [x₀, x_n], onde a função f é de classe Cⁿ.
Então

$x em ]x₀, x_n [ : f [x₀ , ..., x_n] =

f⁽ⁿ⁾(x)

· Este teorema pode ser aplicado à fórmula do erro anterior, e obtemos o seguinte corolário:

· Corolário :
Seja V um intervalo que contenha os nós x₀ , ... , x_n e ainda o ponto x.
Se a função f fôr de classe Cⁿ⁺¹( V )
então temos a seguinte fórmula para o erro de interpolação:

$x em V : e_n(x) =

f⁽ⁿ⁺¹⁾(x)

(n+1)!

n
P
k=0

(x - x_k )

· Terminamos este parágrafo, com um exemplo de uma função em que a aproximação, por interpolação polinomial, pode conduzir a maus resultados.
Com efeito, se considerarmos a função f (x) = (1 + 25 x² )^-1, e pensarmos em interpolá-la no intervalo [-1, 1], usando nós igualmente espaçados, ao aumentarmos o número de nós, em vez de obtermos uma melhor aproximação, vamos obter uma aproximação cada vez pior, nas extremidades do intervalo!

·
Exemplo de Runge: f(x) = (1 + 25 x² )^-1
usando 11 nós de interpolação igualmente espaçados

· Este problema pode ser resolvido, escolhendo nós de interpolação adequados (nós de Chebyshev).

· Nós de Chebyshev
Como o erro de interpolação é dado por e_n ( x ) = f [ x₀ , ... , x_n, x ] ( x - x₀ ) ... ( x - x_n ), se a parte relativa à diferença dividida varia com a função, e não pode ser controlada a priori, a parte relativa ao produto dos termos, ou seja,
|w(x)| = |( x - x₀ ) ... ( x - x_n )|
poderá ser minimizada para certos nós x₀,...,x_n tendo como objectivo a aproximação num intervalo específico.

· Iremos considerar o intervalo [-1,1].
A solução que minimiza o valor de w(x) é dada pelos nós de Chebyshev, que são os zeros dos polinómios de Chebyshev:

T_n(x) = cos( n arccos(x)).
T_n é um polinómio de grau n e tem n raízes no intervalo [-1,1], dadas por
t_k= cos((2k+1)p/(2n)) com k = 0,..., n-1.
Estes t_ksão os denominados nós de Chebyshev e temos
T_n+1(x) = 2ⁿ( x - t₀ ) ... ( x - t_n )
o que pode ser provado usando a fórmula recursiva T_n+1(x) = 2 x T_n(x)-T_n-1(x), que provaremos depois.

· Como |T_n+1(x)| < 1, concluímos que

|( x - t₀ ) ... ( x - t_n )| < 2^-n
e este é o valor mínimo que poderá ser obtido com n+1 nós.

· Informação retirada do site: http://www.math.ist.utl.pt/~calves/cursos/Interpola.HTM

Método dos Mínimos Quadrados

Neste parágrafo vamos estudar a aproximação de funções numa perspectiva diferente da interpolação. Por exemplo, se tivermos apenas os valores da função em certos pontos, não vamos exigir que a função aproximadora interpole a função dada nos pontos. Exigimos apenas que essa função aproximadora tome valores (nesses pontos) de forma a minimizar a distância aos valores dados... falamos em minimizar, no sentido dos mínimos quadrados!

Isto é importante em termos de aplicações, já que podemos ter valores obtidos, experimentalmente, com uma certa incerteza. Ao tentar modelizar essa experiência, com uma certa classe de funções, seria inadequado exigir que a função aproximadora interpolasse esses pontos.

Um caso simples, em que se aplica esta teoria é o caso da regressão linear, em que tentamos adaptar a um conjunto de pontos e valores dados, a "melhor recta", que (neste caso) será a recta que minimiza a soma quadrática das diferenças entre os valores dados ao valores da recta, nesses pontos.

Regressão Linear: Neste caso pretendemos encontrar a função do tipo a + b x
(... ou seja, a recta) que "melhor se adapta" aos valores dados.

Esta é uma perspectiva discreta, em que o conjunto de valores dados é finito.
Podemos também pensar num caso contínuo, em que apesar de conhecermos a função, não apenas em certos pontos, mas em todo um intervalo, estamos interessados em aproximar essa função (... no sentido dos mínimos quadrados) por funções de uma outra classe, mais adequada ao problema que pretendemos resolver. Por exemplo, podemos estar interessados em determinar qual a "melhor recta" que aproxima a função sin(x) no intervalo [0, 1] ...

A recta que melhor aproxima sin(x) no intervalo [0,1],
no sentido dos mínimos quadrados

Caso Discreto
Consideremos, de novo, um conjunto de pontos x₀ , ... , x_n a que estão associados, respectivamente, os valores f(x₀) , ... , f(x_n) .

Temos que considerar agora uma classe de funções, entre as quais vamos tentar encontrar a que "melhor aproxima" aquele conjunto de valores, nos pontos dados.

Vamo-nos concentrar em funções da forma:

g(x) = a₀f₀(x) + ... + a_mf_m(x)

em que f₀, ..., f_m são funções base (linearmente independentes), e são conhecidas.

Neste caso, apenas teremos que determinar os parâmetros a₀ , ... , a_n , de forma a que a soma quadrática das diferenças entre os f( x_i ) e os g( x_i ) seja mínima.
Faz pois sentido introduzir a distância || f - g || em que

|| u ||² =

n
S
i=0

u( x_i)²

a que está associada o produto interno

( u, v ) =

n
S
i=0

u( x_i) v( x_i)

A norma e o produto interno estão bem definidos para funções que assumem quaisquer valores
nos pontos x₀ , ... , x_n. Convém-nos trabalhar com estas noções, já que aquilo que iremos ver, de seguida, será exactamente igual no caso contínuo, apenas a norma e o produto interno serão diferentes (substituiremos o somatório por um integral...).

Pretende-se pois encontrar os parâmetros a₀ , ... , a_n que minimizem a distância entre f e g , ou, o que é equivalente, minimizem :

Q = || f - g ||² = ( f - g , f - g )

Para obtermos esse mínimo, começamos por procurar os valores a₀ , ... , a_m tais que todas as derivadas parciais de Q sejam nulas, isto é:

¶Q/¶a_j (a₀ , ..., a_m) = 0, (para j = 0,..., m)

Calculamos a derivada parcial, usando as propriedades da derivação do produto interno :

mq-12

Por outro lado

¶g/¶a_j = ¶/¶a_j ( a₀f₀ + ... + a_mf_m) = f_j

e assim obtemos, para cada j de 0 até m :

( f - g , f_j) = 0

Podemos ainda substituir a expressão de g e obtemos um sistema linear :

m
S
i=0

a_i(f_i, f_j) = ( f , f_j), para cada j = 0, ... ,m

designado por sistema normal, que escrevemos matricialmente :

Teorema: Se as funções base f₀ , ... , f_m forem linearmente independentes, a matriz do sistema normal é definida positiva.
dem:
Seja S a matriz do sistema e v um vector não nulo.
Temos (Sv)_i= (f₀, f_j)v₀+...+(f_m, f_j) v_m= (f₀v₀+...+ f_mv_m, f_j) = (u , f_j),
definindo u = f₀v₀+...+ f_mv_m, que é uma função não nula, porque as funções f_j são linearmente independentes.
Assim, v^TSv = (u, f₀)v₀+...+ (u, f_m) v_m= (u, f₀v₀+...+ f_mv_m ) = (u, u) = || u ||²> 0,
e concluímos que S é definida positiva, e é obviamente simétrica (no caso de ser considerado um produto interno nos números complexos, a matriz seria hermitiana e ainda definida positiva).

Exemplo: No caso de considerarmos a aproximação através de funções polinomiais,
temos como funções base, f₀ = 1, ... ,f_m = x^m, e assim obtemos:

Observações: 1) A matriz Hessiana de Q coincide justamente com a matriz do sistema normal. Fica assim justificado que a solução do sistema normal, tratando-se de um ponto crítico de Q, e como a matriz Hessiana é definida positiva, seja o mínimo do funcional Q. 2) Como a matriz é simétrica e definida positiva, um método apropriado para resolver o sistema normal é o método de Cholesky. 3) No caso discreto, sendo os elementos da matriz do sistema normal

(f_i, f_j) = f_i(x₀) f_j(x₀)+ ... + f_i(x_n) f_j(x_n)

podemos reparar que se trata de um produto na forma X^TX , em que X é a matriz (n+1) x (m+1) :

X =

é
ê
ê
ë

f₀(x₀)	....	f_m(x₀)
....	....
f₀(x_n)	....	f_m(x_n)

ù
ú
ú
û

No caso polinomial, esta matriz X é a matriz de Vandermonde.

Caso Contínuo
Vamos considerar agora que conhecemos a função f não apenas em alguns pontos, mas sim num determinado intervalo [a, b] . Mais uma vez estamos interessados em aproximar f por funções da forma

g(x) = a₀f₀(x) + ... + a_mf_m(x)

ou seja, com dependência linear dos parâmetros.

A única diferença existente, face ao caso discreto, está na norma e no produto interno :

|| u ||² =

b
ó
õ
a

u(x)²dx

a que está associada o produto interno

( u, v ) =

b
ó
õ
a

u(x) v(x)dx

Tudo se deduz de forma semelhante, e obtemos também um sistema normal, cuja única diferença está no significado dos produtos internos.

Exemplo:
No caso em que consideramos como funções base, os polinómios, f₀(x)= 1, ... ,f_m(x)= x^m, obtemos agora o sistema normal

Esta matriz designa-se Matriz de Hilbert, e é extremamente mal condicionada. Com efeito, já para m = 3 obtemos Cond₁ = 28375, e para m = 4 já atinge 943656, continuando a crescer fortemente! Temos, assim, problemas de condicionamento e consequentemente de instabilidade numérica, para este tipo de matrizes.

Observação (dependência não linear):
Quando não há dependência linear dos coeficientes, há duas possibilidades a considerar:
(i) Método exacto. Efectuamos ainda a derivação ¶Q/¶a_j mas isso irá levar à resolução de um sistema não linear.
(ii) Método aproximado. Quando possível, por transformação de variável, reduzimos a forma da função a aproximar ao caso linear, e aí usamos o método linear descrito acima, regressando às variáveis anteriores por transformação inversa.
Um exemplo habitual, é considerar g(x) = a e^bx.
Assim, como queremos que f(x) ~ g(x), usamos log(f(x)) ~ log(g(x)) = log(a)+ b x.
Definindo F(x) = log(f(x)), A=log(a), B=b, procedemos à aproximação habitual de F usando os mínimos quadrados (neste caso regressão linear) e tendo encontrado os valores A e B, usamos transformação inversa para obter a= e^A, b=B.

Observação: (interpretação geométrica):
Existe uma analogia geométrica entre o método dos mínimos quadrados e a determinação do ponto de um plano que se encontra a menor distância de um outro, exterior ao plano, como representamos na figura seguinte.

Através de um produto interno podemos falar na projecção ortogonal, e relembramos que, exigir:

( f - g , f_j ) = 0

significa exigir que f - g seja ortogonal a todos os f_j .

Polinómios ortogonais

Consideramos uma situação um pouco diferente, no caso contínuo, em que pretendemos minimizar uma distância entre uma função f e uma função g, da forma g(x)=a₁f₁(x)+...+a_nf_n(x), e em que essa distância é dada agora por

distância(f, g) = || f - g||_w

onde a norma || .||_w é dada por

|| u ||_w² =

ó
õ

w(x) u(x)² dx

e onde w>0 é uma função que representa um peso. Este peso pretende colocar em maior evidência a aproximação numa certa parte do intervalo. Assim, por exemplo, se estivermos interessados em aproximar uma função f no intervalo [-1,1] por funções g, de forma a que nos interesse que a aproximação nas extremidades do intervalo seja mais relevante do que a que é feita no interior, podemos considerar o peso de Chebyshev,

w(x) = 1 / Ö(1-x²)

que será infinito nas extremidades no intervalo e mínimo no ponto médio.

Notamos que a norma || .||_w resulta do produto interno no intervalo [a, b] dado por

( u , v)_w =

ó
õ

w(x) u(x) v(x) dx .

Toda a dedução efectuada para o produto interno habitual (com w(x)=1) pode ser efectuada para este novo produto interno, obtendo também um sistema normal. De seguida iremos ver como podemos reduzir o sistema normal a um sistema com uma matriz diagonal, no caso em que pretendemos aproximar f por polinómios, usando funções base que são polinómios ortogonais.

Podemos obter os polinómios ortogonais aplicando o processo de ortogonalização de Gram-Schmidt à base canónica dos polinómios.
No entanto, podemos ver que há um processo mais simples, baseado na seguinte fórmula de recorrência.

Teorema:
Dados dois polinómios q₀ , q₁ tais que (q₀, q₁)_w = 0, então a sucessão de polinómios definida pela fórmula de recorrência

q_k+1 (x) = (x-

(x q_k, q_k)_w

|| q_k||_w²

) q_k(x) -

|| q_k||_w²

|| q_k-1||_w²

q_k-1(x)

é uma base de polinómios ortogonais para o produto interno (.,.)_w .
Demonstração:
Por indução, admitimos que:
q₀ , ... , q_k são polinómios ortogonais, de grau 0, ..., k (respectivamente),
e escrevemos q_k+1 (x) = c₀ q₀(x)+ ... + c_k q_k(x) + q_k(x)x .
Pretendemos encontrar os c_i tais que (q_k+1, q_j)_w = 0, para qualquer j < k.
(i) Ora, para j=k, como admitimos que (q_k, q_i)_w = 0 para i < k-1, obtemos
0 = (q_k+1, q_k)_w = (x q_k, q_k)_w + c_k (q_k, q_k)_w ,
o que implica c_k = - (x q_k, q_k)_w/ (q_k, q_k)_w .
(ii) De forma semelhante, para j=k-1, temos
0 = (q_k+1, q_k-1)_w = (x q_k, q_k-1)_w + c_k-1 (q_k-1, q_k-1)_w
e notamos que (x q_k, q_k-1)_w = (q_k, x q_k-1)_w = (q_k, q_k)_w
porque q_k(x) = x q_k-1(x)+p_k-1(x), em que p_k-1(x) é um polinómio de grau < k-1,
e portanto (q_k, q_k)_w - (q_k, x q_k-1)_w = (q_k, p_k-1)_w = 0.
Isto implica c_k-1 = - (q_k, q_k)_w/ (q_k-1, q_k-1)_w .
(iii) Para quaisquer outros j< k-2, temos
0 = (q_k+1, q_j)_w = (x q_k, q_j)_w + c_j (q_j, q_j)_w
Como (x q_k, q_j)_w= (q_k, x q_j)_w= 0, pois x q_j(x) tem grau < k-1,
e como (q_j, q_j)_w= ||q_j||_w² ¹ 0, concluímos que c_j=0.
Obtemos assim, q_k+1 (x) = c_k-1 q_k-1(x)+ c_k q_k(x) + q_k(x)x.

Observação:
Para simplificar, considerámos os polinómios na forma
q_k+1 (x) = c₀ q₀(x)+ ... + c_k q_k(x) + q_k(x)x
o que condiciona a escolha da constante do monómio de grau k+1 a ser igual ao valor considerado em q₁.
Poderíamos ter considerado, mais geralmente,
q_k+1 (x) = c₀ q₀(x)+ ... + c_k q_k(x) + c_k+1 q_k(x)x
mas isso apenas altera o valor dos polinómios por uma constante, o que em nada influi na ortogonalidade.

Exemplos:

1 - Polinómios de Legendre (w(x)=1, no intervalo [-1,1])
Consideramos w(x)=1 e começando com
P₀(x) = 1, P₁(x) = x
temos (P₀,P₁) = 0, e como (P₀,P₀) = 2, (P₁,P₁) = 2/3, (x P₁,P₁) = 0, obtemos
P₂(x) = (x- 0)P₁(x)-1/3 P₀(x) = x² - 1/3.
De forma semelhante, poderíamos obter P₃(x) = x³ - (3/5)x, etc...
Calculando (P_k, P_k) e (xP_k, P_k) obteríamos a fórmula de recorrência

P_n+1(x) = x P_n(x) - n² P_n-1(x) / (4n²-1).

Normalmente, é comum aparecerem os polinómios de Legendre multiplicados por uma outra constante. Essa constante pode ser escolhida de forma a que a sua norma seja unitária, ou simplesmente por uma questão de convenção. É habitual considerar-se

P_n+1(x) =

(2n+1) x P_n(x) - n P_n-1(x)

n+1

obtendo-se a lista

P₀(x) = 1,

P₁(x) = x,

P₂(x) = (3x² - 1)/2,

P₃(x) = (5x³-3x)/2, ...

notando que a única diferença com os valores obtidos pela outra fórmula reside apenas em multiplicar P₂ por 3/2 e P₃ por 5/2.

2 - Polinómios de Chebyshev (w(x) = 1/ Ö(1-x²), no intervalo [-1,1])
Consideramos agora w(x) = 1/ Ö(1-x²) e começamos com T₀(x) = 1, T₁(x) = x.
Da mesma forma, com constantes apropriadas, podemos deduzir

T_n+1(x) =

2 x T_n(x) - T_n-1(x)

obtendo-se a lista

T₀(x) = 1,

T₁(x) = x,

T₂(x) = 2x² - 1,

T₃(x) = 4x³-3x, ...

Informação retirada do site: http://www.math.ist.utl.pt/~calves/cursos/mmq.htm

Voltar ao inicio

Hosted by www.Geocities.ws