Matemática Financeira - Universidade Nova de Lisboa

Transcrição

Distribuiç ã o Estimada:
[email protected], 2.4, 2111.D
0.00002
0.000015
0.00001
5. ´ 10-6
50 000
100 000
150 000
200 000
Colecção Métodos Estocásticos
para a Matemática Financeira III
Matemática Financeira
Notas de Lições
Manuel L. Esquı́vel
Professor Associado
de
Probabilidade e Processos Estocásticos
April 4, 2013
O Modelo Binomial
MF0910
26 de Novembro de 2009
1 Modelo a um Perı́odo
Apresentamos seguidamente o modelo binomial a um perı́odo. A nossa apresentação
segue de perto a de Tomas Björk na obra de consulta obrigatória para uma iniciação
bem sucedida à matemática financeira actual [Björk 98]. No entanto, o leitor beneficiará, certamente, com outras leituras sobre este tema para as quais são indicadas na
bibliografia algumas referências. Para descrevermos o modelo binomial a um perı́odo
consideramos os seguintes pressupostos e notações.
• Designamos o tempo pela variável t. Representar-se-á por t = 0 a data de hoje,
que será o inı́cio do perı́odo e, por t = 1 a data de amanhã, a data final do perı́odo.
• Consideramos que o mercado é constituı́do por dois activos transaccionáveis que
descriminamos a seguir.
– A obrigação (bond1 ), designando-se por Bt o preço da obrigação à data t;
– A acção (stock), designando-se por St o preço da acção à data t.
• Pressupomos também que a dinâmica dos preços dos activos, isto é, a evolução dos
preços está definida do modo a seguir descrito.
– A obrigação tem uma dinâmica determinı́stica dada por:
(
B0 = 1
preço à data t = 0
B1 = 1 + R preço à data t = 1
onde R representa a taxa de juro spot para o perı́odo ou, alternativamente,
R é a taxa de juro paga pelo banco por um depósito numa conta bancária.
– A acção tem uma dinâmica aleatória, isto é, definida por um processo estocástico. Note-se que esta designação deve ser entendida genericamente.


S0 = s (preço à data t = 0
s · u com probabilidade pu

S1 =
s · d com probabilidade pd
1
De modo geral indicaremos as denominações financeiras em lı́ngua Inglesa para mais cómoda referência do leitor à literatura internacional sobre este tema.
1
Capı́tulo I
Modelo Binomial
Secção: 2
Assim sendo, temos que a dinâmica do activo com risco admite a representação
seguinte.
S1 = s · Z
onde Z é uma variável aleatória tal que:
(
u com probabilidade pu
Z=
d com probabilidade pd
• Podemos assim indicar a seguinte representação esquemática para as dinâmicas dos
activos. Supondo que d < u e pu + pd = 1, que é condição para que P = (pu , pd )
represente uma probabilidade, tem-se para o activo sem risco,
Bt : 1 −→ 1 × (1 + R)
e para o activo com risco:
su com probabilidade pu e u ∼ up ∼↑
S0 = s
@
@
@
R
@
sd com probabilidade pd e d ∼ down ∼↓.
Fica deste modo definido o contexto em que se desenrolará o nosso estudo do modelo
binomial a um perı́odo.
2 Carteiras (Portfolios) e Arbitragem
Nesta secção estudar-se-á uma noção fundamental no contexto dos modelos de mercados
financeiros, a noção de carteira. Esta noção, que modela um conjunto de investimentos
com determinada coerência, será determinante na obtenção de um preço adequado para
produtos financeiros derivados.
2.1 A noção de carteira
Comecemos com a definição formal de carteira.
Definição 1. Uma carteira no mercado de activos (B, S) é dada por h = (x, y) em que
se tem
• x é o número (quantidade) de obrigações detidas na carteira;
• y é o número (quantidade) de acções detidas na carteira.
MF0910
2
Capı́tulo I
Modelo Binomial
Secção: 2
Observação 1. Tanto x como y podem ser negativos. O significado desta possibilidade
é o seguinte. Por exemplo, se x = 3 detemos três obrigações o que se denomina por long
position no activo sem risco; se y = −2 vendemos duas acções o que se denomina por
short position no activo sem risco (veja-se [Etheridge 02][p. 2]).
2.2 Hipóteses sobre o modelo binomial a um perı́odo
Convem precisar algumas hipóteses simplificadoras sobre o funcionamento do mercado
deste modelo. Estas hipóteses podem aparecer como irrealistas, no sentido em não se
aplicam aos mercados reais, mas simplificam significativamente o estudo do modelo.
• São permitidas carteiras com posições não inteiras e com sinal arbitrário, isto é,
h = (x, y) ∈ R2
• O bid-ask spread é nulo, isto é, a diferença entre o preço de compra e o preço de
venda dos activos é nula.
• Os custos de transacção são nulos.
• Há liquidez completa do mercado, isto é, a compra e venda de quaisquer quantidades é sempre possı́vel.
Observação 2. Note-se que dada uma carteira h = (x, y), o seu valor de mercado verifica
o seguinte.
Em t = 0 é determinı́stico;
Em t = 1 é estocástico uma vez que depende do valor de B e S e este último é
estocástico.
A cada carteira corresponde um valor determinado de forma natural em função dos
preços dos activos.
Definição 2. O processo valor da carteira h, denominado Vth é definido, para t ∈
{0, 1}, por:
Vth = x · Bt + y · St .
Isto é,
(
V0h = x + y · s
V1h = x · (1 + R) + y · s · Z
Descreve-se seguidamente uma eventualidade que, a ocorrer, significa que o mercado
não é eficiente.
Definição 3. Uma carteira de arbitragem, no modelo binomial a um perı́odo, é toda
a carteira h = (x, y) tal que se verifica:
V0h = 0 e ainda, V1h > 0 com probabilidade um .
MF0910
3
Capı́tulo I
Modelo Binomial
Secção: 2
Observação 3. Uma carteira de arbitragem é, por esta definição, um processo quase certo
de de realizar proveitos sem investimento. Nesse caso, o mercado tem uma deficiência
grave. É sempre possı́vel ganhar arbitrariamente muito. Uma tal possibilidade nos
mercados contraria a noção de funcionamento eficiente em que as leis da oferta e da
procura conduzem, em permanência, o mercado a alcançar equilı́brios.
O resultado seguinte caracteriza, com uma condição simples sobre os parâmetros do
modelo, os mercados em que não existem oportunidades de arbitragem.
Proposição 1. Num mercado satisfazendo as hipóteses descritas acima o mercado é
livre de arbitragem se e só se:
d ≤ (1 + R) ≤ u
(1)
Demonstração. Suponha-se que se verifica
(1 + R) > u isto é s(1 + R) > s · u
Então ter-se-á que
s(1 + R) > s · d
e logo, é sempre mais rentável investir em obrigações do que em acções. Seja, agora,
a carteira h = (s, −1), isto é, vendemos a acção (short position) e investimos tudo na
obrigação (long position). Calcule-se o valor desta carteira. Temos
(
s(1 + R) − su > 0 se Z = u
V0h = 0 e V1h = s(1 + R) − sZ =
s(1 + R) − sd > 0 se Z = d .
Logo, V1h > 0 com probabilidade um. Em consequência, há uma oportunidade de
arbitragem.
Suponha-se agora verificada a condição 1. Considere-se uma carteira h arbitrária tal
que V0h = 0, isto é, tal que x + ys = 0, isto é ainda, x = −ys. Então ter-se-á:
V1h
(
ys(u − (1 + R)) se Z = u
=
ys(d − (1 + R)) se Z = d
Suponha-se que y > 0. Então, h é uma carteira de arbitragem se e só se:
u > (1 + R) d > (1 + R)
o que é impossı́vel tendo em conta a condição 1. Faz-se o mesmo raciocı́nio para y < 0
e a conclusão segue imediatamente.
Observação 4. Impõe-se a seguinte interpretação da cadeia de desigualdades na condição 1.
Num mercado livre de arbitragem, o retorno na acção não pode dominar sempre o retorno na obrigação e o retorno na obrigação não pode dominar sempre o retorno na
acção.
MF0910
4
Capı́tulo I
Modelo Binomial
Secção: 2
2.3 Medidas de Martingala
Para efeito de uma utilização futura relembremos este resultado simples da geometria
elementar dos conjuntos convexos.
Proposição 2. Sejam d, z, u números reais tais que d < u. Tem-se então que:
d ≤ z ≤ u ⇔ ∃λ ∈ [0, 1] tal que z = λu + (1 − λ) · d .
Demonstração. Considere-se a função f (λ) := λu + (1 − λ)d definida para λ ∈ [0, 1].
0
Trata-se de uma função continuamente derivável, com função derivada dada por f (λ) =
u − v > 0. Tem-se que f é estritamente crescente, logo injectiva sobre [0, 1]. Como
se tem f (0) = d e f (1) = u, se se verificar d < 1 + R < u, pelo carácter injectivo de
f , existe necessariamente λ0 ∈]0, 1[ tal que f (λ0 ) = 1 + R. Para determinarmos λ0
podemos observar que a variável λ representa a proporção de proximidade de f (λ) a d.
Com efeito, recorde-se que f (0) = d. Em consequência deveremos ter:
λ0 =
(1 + R) − d
.
u−d
(2)
Como se tem
u − (1 + R)
,
u−d
verifica-se imediatamente, com um cálculo trivial que f (λ0 ) = 1 + R.
1 − λ0 =
(3)
Observação 5. Em consequência do resultado acima sobre os conjuntos convexos tem-se
então que:
∃qu , qd ≥ 0 , qu + qd = 1, 1 + R = qu · u + qd · d .
Com efeito, basta considerar:
qu =
(1 + R) − d
u − (1 + R)
e qd =
.
u−d
u−d
Associemos, agora, ao par (qu , qd ) uma probabilidade Q do modo seguinte.
Q[Z = u] = qu , Q[Z = d] = qd .
Se EQ for a esperança matemática relativamente a Q temos
1
1
1
EQ [S1 ] =
[qu su + qd sd] =
· s · (1 + R) = s
1+R
1+R
1+R
e logo
s=
1
EQ [S1 ] .
1+R
Isto é, o preço (s) hoje, isto é à data t = 0, é o valor esperado (EQ (S1 )) do preço amanhã,
descontado à taxa R, ou seja multiplicado por 1/(1 + R) mas atenção, o valor esperado
é calculado em relação à medida Q. Esta medida foi construı́da supondo ausência de
arbitragem. Uma medida de probabilidade com esta propriedade é denominada medida
neutra face ao risco, medida ajustada ao risco ou ainda medida de martingala
MF0910
5
Capı́tulo I
Modelo Binomial
Secção: 2
Definição 4. A medida Q é uma medida de martingala para o modelo binomial a
um perı́odo, se e só se a seguinte condição se verifica:
S0 =
1
EQ [S1 ]
1+R
(4)
A proposição seguinte mostra que uma caracterização do modelo binomial a um
perı́odo e sem arbitragem é a existência de uma medida de martingala.
Proposição 3. O modelo de mercado é livre de arbitragem se e só se existe uma medida
de martingala.
Demonstração. Suponhamos que com Q = (qu , qd ), sendo qu + qd = 1, se verifica a
condição 4 do enunciado. Temos então que:
S0 =
1
1
1
EQ [S1 ] =
EQ [S0 · Z] =
[qu S0 u + qd S0 d] .
1+R
1+R
1+R
Supondo S0 6= 0 termos então:
1 + R = qu · u + qd · d
(5)
o que mostra que d ≤ 1 + R ≤ u. Tal como como já sabemos, esta relação é equivalente
à ausência de arbitragem. Suponhamos que o mercado é livre de arbitragem, o que é
equivalente à condição d ≤ 1 + R ≤ u pela proposição 1. Pela proposição 2 sabemos
então que:
∃qu , qd ∈ [0, 1], qu + qd = 1 , 1 + R = qu · u + qd · d .
Considerando a probabilidade Q definida pelo par (qu , qd ) virá a partir da fórmula 5 que
S0 =
1
1
[qu S0 u + qd S0 d] =
EQ [S1 ] ,
1+R
1+R
pelo que a probabilidade Q é uma medida de martingala.
Proposição 4. Para o modelo binomial a medida de martingala Q é dada pelo vector
de (qu , qd ) ∈ R2 definido por:
qu =
(1 + R) − d
u − (1 + R)
e qd =
.
u−d
u−d
(6)
Demonstração. As fórmulas definindo o par (qu , qd ) são exactamente as fórmulas 2 e 3.
2.4 Produtos financeiros derivados no modelo binomial
Um produto financeiro derivado derivative tem o seu cash flow definido a partir de um
outro activo denominado o activo subjacente.
Definição 5. Um direito contingente (contingent claim) ou ainda um derivado
financeiro é uma qualquer variável aleatória função do preços da acção à data t = 1.
MF0910
6
Capı́tulo I
Modelo Binomial
Secção: 2
Observação 6. Um direito contingente X = φ(S1 ) é um contrato que paga X unidades
monetárias a quem o possuir à data t = 1. A função φ é a função contrato.
Exemplo 1. Uma call option com strike price K. Consideremos a seguintes hipótese:
s·d<K <s·u.
Se acontecer que S1 > K, então:
• compra-se a acção ao preço K
• vende-se a acção ao preço su com lucro su − K
Na eventualidade alternativa, isto é, se se verificar que S1 < K, então:
• a opção não tem valor.
Logo, podemos concluir que o direito contingente X = φ(S1 ) se pode representar por:
(
su − K se Z = u
X=
0 se Z = d
tendo-se então a função de contrato φ dada por:
(
φ(u) = su − K
φ(d) = 0
Em consequência, com notações já conhecidas tem-se que:
X = (S1 − K)+ .
Podemos agora considerar dois problemas fundamentais.
• Qual é o preço justo para um direito contingente?
• Na eventualidade de sermos parte tomadora ou emissora de um direito contingente como é que cobrimos o risco eventual associado a essa posição tomadora ou
emissora?
Observemos que se Π(t, X) for o preço de X no instante t então Π(1, X) está determinado uma vez que necessariamente, atendendo à definição de X, temos que Π(1, X) = X.
Temos pois que determinar qual o valor de Π(0, X). Para esse efeito vamos considerar a
possibilidade de reproduzir o cash flow gerado pelo direito contingente por meio de uma
carteira adequada.
Definição 6. Um direito contingente é atingı́vel (reachable) se e só se existe uma
carteira h tal que o valor desta carteira à data t = 1 iguala certamente X, isto é:
V1h = X com probabilidade igual a 1.
Quando assim é, h é uma carteira de cobertura (hedging portfolio) ou uma carteira
réplica (replicating portfolio) Um mercado em que todos os direitos contingentes podem
ser replicados ou cobertos diz-se um mercado completo.
MF0910
7
Capı́tulo I
Modelo Binomial
Secção: 3
Observação 7. O conceito de carteira réplica de um direito contingente X, permite-nos
intuir qual deverá ser o preço a pagar por este direito. Com efeito, se X for replicável
então não há qualquer diferença em deter o direito contingente X ou a carteira réplica
visto que, em qualquer caso, à data t = 1 se verifica sempre V1h = X. Em consequência,
o preço justo do direito deverá ser V0h ou seja o valor à data t = 0 da carteira h.
A proposição seguinte confirma esta observação.
Proposição 5. Seja X atingı́vel com carteira réplica h. Se o preço em t = 0 de X for
diferente de V0h , então há oportunidades de arbitragem.
Demonstração. Suponhamos que se tem V0h > Π(0, X). A ideia consiste em, à data
t = 0, vender o mais caro (a carteira que é composta de activos transaccionáveis) comprar
o mais barato (o direito contingente X) e colocar a diferença no activo sem risco. À data
t = 1 os cash flows gerados pelo direito contingente e pela carteira compensam-se mas
continuamos a ter o que investimos no activo sem risco. Esta ideia pode-se representar
na tabela seguinte. Note-se que a uma posição short corresponde uma venda e logo uma
entrada e a uma posição long corresponde uma compra e logo uma saı́da, pelo que por
exemplo, na segunda coluna Π(0, X) está multiplicado por −1.
Posição short na carteira
Posição long no direito
Posição no activo sem risco
Cash flow total (soma nas colunas)
Data t = 0
+V0h
−Π(0, X)
−(V0h − Π(0, X))
0
Data t = 1
−V1h
+Π(0, X)
(V0h − Π(0, X)) · (1 + R)
(V0h − Π(0, X)) · (1 + R)
Pode pois constatar-se que sem investimento inicial foi possı́vel realizar os lucros certos
(V0h − Π(0, X)) · (1 + R) havendo assim uma possibilidade de arbitragem.
Proposição 6. Se o mercado no modelo binomial for livre de arbitragem então, o mercado é completo.
Demonstração. Para X = φ(Z) mostre-se que existe uma carteira h = (x, y) tal que
V1h = X com probabilidade um, isto é:
V1h = φ(u) se (Z = u)
e também,
V1h = φ(d) se (Z = d)
isto é, ainda, solução para o sistema
(
(1 + R)x + suy = φ(u)
(1 + R)X + sdy = φ(d)
Como u < d temos que existe a solução única do sistema com duas equações lineares e
duas incógnitas, que nos define a carteira réplica.
x=
1
uφ(d) − dφ(u)
1 φ(u) − φ(d)
·
ey= ·
.
1+R
u−d
s
u−d
(7)
Em consequência, X é atingı́vel e como X é arbitrário o mercado é completo.
MF0910
8
Capı́tulo I
Modelo Binomial
Secção: 3
3 Apreçamento Neutro Face ao Risco
Em consequência da proposição 6 é possı́vel apreçar qualquer direito contingente X.
Com efeito, pelo princı́pio geral do apreçamento que temos vindo a aplicar e que diz que
é equivalente deter o direito contingente ou a carteira de cobertura desse direito, virá:
Π(0, X) = V0h ,
como pela proposição 6 se tem que:
x=
1
uφ(d) − dφ(u)
1 φ(u) − φ(d)
·
y= ·
1+R
u−d
s
u−d
virá que:
Π(0, X) = V0h = x + sy =
1 uφ(d) − dφ(u) φ(u) − φ(d)
=
+
=
1+R
u−d
u−d
1 ((1 + R) − d)φ(u) (u − (1 + R))
+
φ(d) =
=
1+R
u−d
u−d
1
1
[qu φ(u) + qd φ(d)] =
EQ [X].
=
1+R
1+R
Note-se que a fórmula Π(0, X) = 1/(1 + R) EQ [X] diz-nos que o preço à data t = 0 de X
é o valor esperado de X, relativamente à medida de probabilidade neutra face ao risco,
descontado relativamente à taxa de juro do activo sem risco.
Podemos pois concluir resumindo os resultados até agora obtidos na proposição seguinte.
Proposição 7. Se o modelo binomial for livre de arbitragem então o preço livre de
arbitragem de um activo contingente X é dado por:
Π(0, X) =
1
EQ [X]
1+R
onde a medida de martingala Q é definida univocamente pela relação:
S0 =
1
EQ [S1 ]
1+R
Temos que Q = (qu , qd ) com:
qu =
(1 + R) − d
u − (1 + R)
e qd =
.
u−d
u−d
e a carteira de cobertura h = (x, y) é dada por:
x=
MF0910
1
uφ(d) − dφ(u)
1 φ(u) − φ(d)
·
e y= ·
1+R
u−d
s
u−d
9
Capı́tulo I
Modelo Binomial
Secção: 3
Observação 8. O cálculo do preço livre de arbitragem processa-se como se o mundo fosse
neutro face ao risco (veja-se [Hull 00][p. 205]). Qualquer agente do mercado é indiferente
ao risco e a sua expectativa para o retorno do activo com risco é que este retorno seja
igual a R.
Exemplo 2. Consideremos, neste exemplo demonstrativo os seguintes dados:
• O movimento de subida do preço do activo com risco é caracterizado por:
u = 1.2 e pu = 0.6 .
O movimento de descida do preço do activo com risco é caracterizado por:
d = 0.8
pd = 0.4
A dinâmica dos preços é pois descrita por:
(
120 com probabilidade 0.6
S0 = 100 −→ S1 =
80 com probabilidade 0.4
• A taxa de juro do activo sem risco é dada por:
R=0
Suponhamos que calculávamos o valor esperado descontado segundo a probabilidade
P. Terı́amos então:
1
EP [S1 ] = 1 × [120 × 0.6 + 80 × 0.4] = 104
1+R
Observação 9. Podemos em consequência observar que:
• dado que o preço hoje, que é igual a 100, é inferior a este valor 104, pode concluir-se
que o mercado tem aversão ao risco.
• dado que: 0.8 < 1 < 1.2 sabemos que o mercado é livre de arbitragem.
Considere-se agora uma call option com preço de exercı́cio K = 110. O direito
contingente X é dado por


120 − 110 = 10 se S1 = 120
X = (S1 − K)+ =
ou


0 se S1 = 80
A questão a que temos de responder é pois, qual o preço justo para esta call option?
A primeira resposta possı́vel é a de que o preço é o valor esperado, descontado,
segundo a probabilidade P que dá:
1
× [10 × 0.6 + 0 × 0.4] = 6 .
1+0
MF0910
10
Capı́tulo I
Modelo Binomial
Secção: 4
A segunda resposta possı́vel é a que corresponde a efectuarmos o apreçamento por via
da probabilidade de martingala. Temos deste modo:
qu =
(1 + 0) − 0.8
0, 2
=
= 0.5 logo qd = 0.5
1.2 − 0.8
0, 4
e
1
[10 × 0.5 + 0 × 0.5] = 5 .
1+0
Observe-se que o preço livre de arbitragem é inferior ao preço obtido na primeira resposta.
De acordo com a proposição a carteira de cobertura é a seguinte.
1
1.2 × 0 − 0.8 × 10
1 10 − 0
1
x=
= −20 e y =
·
= .
1+0
0.4
100
0.4
4
A interpretação destes resultados é a seguinte. Para constituir a carteira de cobertura
da call option X:
Π(0, X) =
• contrai-se um empréstimo de 20 unidades monetárias
• e compra-se 25% de uma acção
Tem-se então que o valor desta carteira é dado à data t = 0,
1
V0h = −20 + × 100 = 5
4
e à data t = 1 por,
(
−20 + 41 × 120 = 10 se S1 = 120
V1h =
−20 + 91 × 80 = 0 se S1 = 80
Mostrando-se assim que se trata efectivamente de uma carteira réplica.
Observação 10 (Comentário Fundamental). O preço livre de arbitragem é o preço justo
e adequado. Com efeito, suponhamos que o preço de mercado, à data t = 0, da opção era
seis unidades monetárias. Vendendo uma call option por seis unidades monetárias podese aplicar cinco unidades monetárias na carteira de cobertura e colocar uma unidade
monetária em obrigações no activo sem risco. Em t = 1, com a carteira, cobria-se as
exigências da call option vendida e dispunha-se de uma unidade monetária em obrigações.
Deste modo o mercado ofereceria uma oportunidade de arbitragem.
A existência de um preço justo e adequado para todo o direito contingente num
modelo binomial a um perı́odo e livre de arbitragem decorre da existência de uma carteira
de cobertura;
Tal como foi visto na proposição 6, o carácter completo do modelo binomial decorre
da existência de um sistema de duas equações construı́das a partir de dois activos
descrevendo dois estados do mundo. Há nesta observações como que um meta-teorema:
um modelo será completo se o número de activos for igual ao número de estados do
mundo.
Este último resultado sugere uma das limitações do modelo binomial a mais do que
um perı́odo obtido por sobreposição de modelos binomiais a um perı́odo numa árvore
binária arbitrŕia. Com efeito, se exigirmos uma adequação à distribuição de preços real
deveremos ter um número de perı́odos significativo, isto é por exemplo a 20 perı́odos
teremos de ter 220 ' 106 activos para o mercado ser completo.
MF0910
11
Capı́tulo I
Modelo Binomial
Secção: 4
4 O modelo binomial multi-perı́odo
Nesta secção estudar-se-á um modelo que se obtem pela concatenação de modelo binomiais idênticos a um perı́odo. Trata-se de um modelo simples que já permite aplicações
práticas relevantes. Consideramos um horizonte temporal T ∈ N que corresponde ao
número de perı́odos do modelo. Indicamos por t ∈ {0, · · · , T } as sucessivas datas correspondentes ao inı́cio de cada perı́odo. O mercado é composto por dois activos, nomeadamente, um activo com risco, a acção com o preço à data t dado por St e um activo
sem risco, a obrigação, com o preço à data t dado por Bt . Considera-se no mercado uma
taxa de juro determinı́stica para o activo sem risco que é indicada por R. A evolução
temporal dos preços dos activos é descrita pelas respectivas dinâmicas.
Seja S0 o preço do activo com risco à data t = 0. A evolução do preço do activo com
risco nos primeiros três perı́odos está esquematizada na figura seguinte.
S0 u 3
S0 u 2
@
@
@
@
R
S0 u
S0 u 2 d
@
@
@
@
R
S0
S0 ud
@
@
@
@
@
@
R
@
@
R
S0 v
S0 ud2
@
@
@
@
R
S0 d 2
@
@
@
@
R
MF0910
12
S0 d 2
Capı́tulo I
Modelo Binomial
Secção: 4
Formulemos agora as leis de evolução dos activos. O activo sem risco evolui seguindo
a lei descrita pelas seguintes fórmulas.
(
B0 = 1
Bn+1 = (1 + R)Bn
Trata-se de um retorno aditivo. O activo com risco tem a sua dinâmica descrita pelas
relações seguintes.
(
S0 = s
Sn+1 = Sn · Zn ,
em que Z0 , Z1 , . . . , ZT −1 são variáveis aleatórias independentes e identicamente distribuı́das com Z com a distribuição descrita por:
P[Z = u] := pu = 1 − P[Z = d] := 1 − pd
Tal como no modelo binomial a um perı́odo podemos definir a noção de carteira.
Definição 7. Uma carteira ((portfolio) ou um processo carteira é um processo estocástico tal que:
h ≡ ht = (xt , yt ) para t = 1, · · · , T ,
tal que,
ht = ht (S0 , S1 , · · · , St−1 ) com h0 ≡ h1
O processo valor correspondente à carteira h é definido por:
Vth = xt (1 + R) + yt St t = 1, · · · , T .
A interpretação desta definição é a seguinte.
• xt representa a quantidade de dinheiro (obrigação) investida no banco à data t − 1,
data inicial do perı́odo, e conservada assim até à data t data final do perı́odo.
• yt representa a quantidade do activo com risco compradas à data t−1 e conservada
assim até à data t.
• A carteira, quando é constituı́da usa, apenas, a informação disponı́vel até à data
t − 1.
• Vth é o valor de mercado da carteira h à data t, carteira constituı́da e detida desde
a data t − 1 .
Impõe-se, no modelo binomial multiperı́odo restringir as carteiras úteis. Esta restrição pode ser entendida como limitando o número de activos nos quais existirá investimento. Com efeito, um consumo pode ser entendido como um investimento se o bem
consumido for como tal considerado.
Definição 8. A carteira h é autofinanciada se e só se a seguinte condição é verificada:
∀t = 0, . . . , T − 1
MF0910
xt · (1 + R) + yt · St = xt+1 + yt+1 · St .
13
(8)
Capı́tulo I
Modelo Binomial
Secção: 4
Podemos interpretar esta definição do modo seguinte.
• A condição 8 exprime um equilı́brio de balanço contabilı́stico. Em cada data t o
valor de mercado da carteira definida por (xt , yt ), carteira que foi constituı́da na
data t − 1, é igual ao valor dispendido na compra da nova carteira (xt+1 , yt+1 )
constituı́da na data t (e detida até à data t + 1).
• Assim sendo, a variação no valor do processo carteira fica a dever-se apenas à
variação do valor dos dois activos que nela estão incluı́dos e não à entrada (ou
saı́da) de capital para consumo ou investimento noutros activos.
Tal como no modelo a um perı́odo, temos que impor ao mercado a ausência de
possibilidades de arbitragem o que deverá implicar um funcionamento eficiente deste
mercado.
Definição 9. Uma possibilidade de arbitragem é um processo carteira autofinanciado h tal que se verificam as seguintes propriedades:
1. V0h = 0
2. P[VTh ≥ 0] = 1
3. P[VTh > 0] > 0
O estudo já feito no modelo a um perı́odo pode ser imediatamente utilizado no
modelo multiperı́odo.
Proposição 8 (Condição necessária de não existência de arbitragem). Para um modelo
livre de arbitragem verificam-se as condições expressas na seguinte cadeia de desigualdades.
d ≤ (1 + R) ≤ µ .
Demonstração. A demonstração é idêntica à do caso a um perı́odo considerando uma
sub-árvore qualquer, nomeadamente, a sub-árvore inicial.
Observação 11. Veremos adiante que esta condição é necessária e suficiente para a
ausência de arbitragem.
No que vai seguir-se faremos, pois, a seguinte hipótese. Supomos que d < u e que
d ≤ (1 + R) ≤ u.
Definição 10. A probabilidade de martingala Q = (qu , qd ) é definida pela relação:
1
EQ [St+1 | St = s] .
(9)
1+R
Esta definição é a generalização natural da definição do modelo a um perı́odo uma vez
que no modelo multiperı́odo, que estamos a estudar, todas as árvores são semelhantes.
s=
Proposição 9. A probabilidade de martingala Q, definida acima, é única e é dada, tal
como no modelo binomial a um perı́odo, por:
qu =
MF0910
(1 + R) − d
u − (1 + R)
e qd =
.
u−d
u−d
14
(10)
Capı́tulo I
Modelo Binomial
Secção: 4
Demonstração. A observação da figura acima 4, mostra-nos que podemos considerar
apenas o primeiro perı́odo pelo que a relação 9é equivalente a
s=
1
EQ [S1 | S0 = s]
1+R
e esta fórmula foi demonstrada anteriormente no modelo binomial a um perı́odo.
Definição 11. Um direito contingente é uma variável aleatória X dada por X = φ(ST )
onde
φ : R −→ R
é a função contrato.
Observação 12. Podemos interpretar esta definição desta forma. O detentor de um
direito contingente X recebe o montante X à data t = T . Note-se que os direitos
contingentes considerados são simples, isto é,
X = X(ST ) ,
o que quer dizer que dependem apenas do preço do activo no instante final. Tal como no
modelo a um perı́odo, podem formular-se agora os dois problemas fundamentais relativos
aos direitos contingentes.
• Determinar (Π(t, X))t=0,··· ,T o processo de preços justos para o direito contingente
X.
• Determinar a melhor cobertura possı́vel do risco associado à emissão ou subscrição
um direito contingente.
Vamos utilizar o método das carteiras réplicas. Impõe-se, por isso, definir os direitos
contingentes replicáveis.
Definição 12. Um direito contingente é atingı́vel se e só se existe uma carteira autofinanciada h tal que
VTh = X com probabilidade 1.
Quando assim é h é uma carteira de cobertura ou carteira réplica do activo X. Se
todos os direitos contingentes forem atingı́veis o modelo de mercado é dito completo.
Observação 13 (Princı́pio de apreçamento). Tal como no modelo binomial a um perı́odo,
se X é atingı́vel com carteira réplica h o preço justo para X é dado por:
∀t ∈ {0, · · · , T } Π(t, X) = Vth .
Com efeito, suponhamos X atingı́vel com processo carteira h. A t fixo suponhamos
dispor do montante Vth . Investindo Vth na carteira h, como a carteira é auto-financiada
podemos reconstituı́-la em cada data u > t até que à data t = T a carteira terá o
valor (aleatório) VTh . Como VTh = X com probabilidade um, temos que h e X são
financeiramente equivalentes pelo que devem ter o mesmo preço. Se tal não for o caso
pode mostrar-se que existem oportunidades de arbitragem tal como foi feito no modelo
binomial a um perı́odo.
MF0910
15
Capı́tulo I
Modelo Binomial
Secção: 4
Proposição 10. Seja X atingı́vel com carteira réplica h. Se à data t for possı́vel comprar
X a um preço mais barato que Vth (ou vender a um preço mais caro que Vth )então existe
uma oportunidade de arbitragem.
Demonstração. A ideia da demostração é idêntica à que foi usada no modelo binomial
a um perı́odo. Compra-se X vendendo Vth e espera-se até T realizando proveitos certos.
No modelo binomial multiperı́odo todos os direitos contingentes podem ser apreçados
por meio de carteiras réplica.
Proposição 11. O modelo binomial multiperı́odo é completo.
Demonstração. Esta demonstração deverá ser realizada como exercı́cio. Para o efeito
dever-se-á estudar um exemplo e formalizar seguidamente a demonstração.
Exemplo 3. Propomo-nos agora estudar um exemplo numérico. Os dados são os seguintes
T = 3, S0 = 10, u = 1.2, d = 0.8, pu = 0.6 e pd = 0.4 Consideramos R = 0.
Seja uma call option europeia com data de exercı́cio T = 3 e preço de exercı́cio
K = 10.
Representemos na árvore binomial a evolução dos preços do activo com risco correspondente a estes dados. Na coluna da direita representamos ainda o cash flow correspondente à call option.
X = (ST − K)+ = max(S3 − 10, 0)
MF0910
16
Capı́tulo I
Modelo Binomial
Secção: 4
17.3
7.3
@
R
@
11.5
1.5
14.4
@
@
12
@
@
@
R
@
9.6
10
@
@
@
@
@
R
@
@
R
@
7.7
8
0
@
@
@
R
@
6.4
@
@
@
R
@
5.1
0
Podemos agora determinar, por indução retrógrada, os preços da call option em cada
data, preços que são dados pelos valores nessas datas de uma carteira réplica. Com efeito
ter-se-á para uma dada carteira réplica h que.
V3h = X ,
pelo que as duas coluna mais à direita, na figura seguinte, serão iguais.
MF0910
17
Capı́tulo I
Modelo Binomial
Secção: 4
7.3
7.3
@
R
@
1.5
1.5
4.4
@
@
2.6
@
@
@
R
@
0.8
1.5
@
@
@
@
@
R
@
@
R
@
0.4
0
0
0
0
@
@
@
R
@
0
@
@
@
R
@
Seguidamente, apliquemos a definição da probabilidade de martingala. Deveremos
ter que
1
s=
EQ [S3 | S2 = s]
1+R
Portanto para o nodo superior correspondente a t = 2 deveremos ter
s = qu 7.3 + qd 1.5 = 0.5 × 7.3 + 0.5 × 1.5 = 4.4
onde qu = qd = 0.5 foram obtidas com as fórmulas 10. Procedendo de igual modo para
os outros nodos teremos a árvore preenchida como na figura.
Podemos assim concluir que Π(0, X) = 1.5. Este valor é o preço da call option à
data t = 0.
Implementou-se no programa Excel no ficheiro ArvoreBinAula.xls este processo de
apreçamento permitindo-nos, assim, estudar em detalhe a constituição da carteira e a
verificação de que a carteira permite replicar os cash flows da call option.
4.1 Conclusões
Podemos agora concluir resumindo em duas proposições o estudo do modelo binomial
multiperı́odo.
MF0910
18
Capı́tulo I
Modelo Binomial
Secção: 5
Proposição 12 (Algoritmo Binomial). Seja um direito contingente X = φ(ST ) atingı́vel
com carteira réplica h. Se St (k) = suk dt−k k = 0, · · · , t onde k representa o número de
movimentos ascendentes de amplitude u e, portanto, (t, k) representa o nodo k à data t,
então temos:
Vt (h) =
1
[qu Vt+1 (h + 1) + qd Vt+1 (h)] e VT (h) = φ(suh dT −h ) ,
1+R
com
qu =
u − (1 + R)
(1 + R) − d
e qd =
.
u−d
u−d
(11)
e
xt (h) =
uVt+1 (h) − dVt+1 (h + 1)
1
1
Vt+1 (h + 1) − Vt+1 (h)
, yt (h) =
·
.
1+R
u−d
St−1 (h − 1)
u−d
Sendo que o preço livre de arbitragem para K é dado por V0h (X) no instante zero.
Demonstração. Por indução aplicando os resultados anteriores.
Proposição 13 (Apreçamento). O preço livre de arbitragem em t = 0 do direito contingente X é dado por:
1
Π(0, X) =
EQ [X]
(1 + R)T
Sendo Q = (qu , qd ) a medida de martingala definida por 11 tem-se que:
T X
1
T
Π(0, X) =
quh qdT −h φ(suh dT −h )
T
h
(1 + R)
h−0
Demonstração. Se y for o número de movimentos ascendentes na árvore pode escrever-se:
X = φ(ST ) = φ(suy dT −y ) .
Como y tem distribuição binomial tem-se que se verifica a fórmula acima.
Proposição 14 (Condições para a ausência de arbitragem). No modelo binomial multiperı́odo, a condição d < (1 + R) < u é equivalente à ausência de arbitragem.
Demonstração. Seja h um processo carteira auto-financiado tal que:
h
i
h
i
P VTh ≥ 0 = 1 e P VTh > 0 > 0
É certo que então
V0h =
h i
1
Q
E
VTh > 0.
(1 + R)T
Logo h não é uma carteira livre de arbitragem.
MF0910
19
Capı́tulo I
Modelo Binomial
Secção: 5
5 Sobre as aplicações práticas
O modelo binomial pode ser utilizado tanto para apreçar direitos contingentes como para
constituir carteiras de cobertura para esses activos. Para esse efeito, os parâmetros do
modelo devem ser determinados de acordo com os dados reais relativos aos preços do
activo subjacente. Indicamos sumariamente uma forma de o fazer que pode ser estudada
em detalhe nas obras [Hull 00][p. 338–404] e [Beninga 97][p. 161–178]. Tomemos r a
taxa de juro para o activo sem risco calculada em contı́nuo para um intervalo de tempo
[0, U ]. Temos então que :
1 + R = exp(r∆t)
em que R é a taxa de retorno aditiva do activo sem risco para um perı́odo e ∆t = U/T em
que, relembramos, T é o número de perı́odos. Seja σ a variância de Z. Pode mostrar-se
que se tem então, aproximadamente e considerando u = 1/d uma convenção proposta
por Cox, Ross e Rubinstein, que:
u = eσ
√
∆t
d = e−σ
√
∆t
,
sendo qu e qd dados pelas fórmulas habituais.
Referências
[Bannock & Manser] G. Bannock, W. Manser, The Penguin international dictionary of
finance, Penguin books, 1995.
[Barreto 96] I. Barreto, Manual de Finanças, Abril/ControlJornal, 1996.
[Beninga 97] S. Beninga, Financial Modelling, The MIT Press, 1997.
[Baxter & Rennie96] M. Baxter, A. Rennie, Financial Calculus, Cambridge University
Press, 1996.
[Berck & Sydsaeter 93] P. Berck, K. Sydsaeter, Manual de Matemática para Economistas, McGraw-Hill, 1993.
[Björk 98] T. Björk, Arbitrage Theory in Continuous Time, Oxford University Press,
1998.
[Bouleau 98] N. Bouleau, Martingales et marchés financiers, Éditions Odile Jacob, 1998.
[Dana & Jeanblanc 03] R.-A. Dana, M. Jeanblanc Financial Markets in Continuous
Time, Springer Verlag, 2003.
[Elliot & Kopp 99] R. J. Elliot, P. Ekkehard Kopp, Mathematics of Financial Derivatives, Springer, 1999.
[Etheridge 02] A. Etheridge, A course in financial calculus, CAmbridge University Press,
2002.
MF0910
20
Capı́tulo I
Modelo Binomial
Secção: 5
[Hull 00] J. C Hull, Options Futures and other derivatives, fourth edition, Prentice-Hall
International Inc., 2000.
[Pliska 97] S. R. Pliska, Introduction to Mathematical Finance, Blackwell Publishers,
1997.
[Quintart & Zisswiller 94] A. Quintart, R. Zisswiller, Teoria Financeira, Caminho. 1994.
[Musiela & Rutkowski 97] M. Musiela, M. Rutkowski, Martingale methods in financial
modelling, Springer, 1997.
[Shiryaev 99] A. N. Shiryaev, Essentials of Stochastic Finance, World Scientific, 1999.
MF0910
21
Modelos Discretos de Mercados Financeiros
MF0910
1 Modelos para mercados finitos
1.1 Introdução e motivação
Suponhamos um contrato que nos dá o direito, mas não a obrigação, de comprar a um
dado preço K, denominado preço de exercı́cio e numa determinada data T , denominada
data de exercı́cio, um activo financeiro denominado activo subjacente, cujo preço corrente
S0 é conhecido. Um tal contrato denomina-se uma call option. Suponhamos ainda que
a taxa de juro sem risco, por exemplo, a taxa de juro de uma conta bancária, é constante
e dada por R. Suponhamos ainda que o preço do activo financeiro na data de exercı́cio
poderá tomar apenas dois valores S u e S d , com probabilidades, respectivamente, pu e pd .
O problema fundamental colocado nesta situação é o de determinar um preço justo para
o contrato que acabámos de descrever. Com efeito, uma vez que este contrato dá ao seu
possuidor um direito na data de exercı́cio, ainda que opcional, tem um valor corrente
que procuramos determinar. Para tornarmos concreta a situação, suponhamos que:
S0 = 280 , K = 280 , S u = 320 , S d = 260 .
Vamos adoptar um modelo em que há dois estados do mundo Ω = {ω1 , ω2 }. Seja o preço
do activo financeiro, à data T , dado por:
ST (ω1 ) = S u = 320 e ST (ω2 ) = S u = 260 .
1.1.1
O método das probabilidades naturais ou subjectivas
Vamos supor que um dado investidor encara o mercado como um bear market, isto é,
tal que:
P[{ω1 }] = 0.2 = 1 − P[{ω2 }] .
Observação 1. Note que um urso é considerado um animal pachorrento e que quando
ataca, ataca com uma pata num movimento descendente. Talvez por isto, a denominação
de bear market, para um mercado com fraca probabilidade de fazer subir os preços, está
bem atribuı́da.
Encarando ST como uma variável aleatória temos, obviamente, que:
ST = 320I{ω1 } + 260I{ω2 } .
1
Capı́tulo II
Modelos Discretos
Secção: 1
Determinemos CT , o cashflow gerado pelo contrato, ou seja, o payoff terminal ou à data
de exercı́cio. Se se verificar ST = 320 então, o contrato pode ser exercido, compra-se o
activo pelo preço de exercı́cio 280 e vende-se o activo no mercado com uma receita de
320 − 280 = 40; se se verificar que ST = 320 então, o contrato não deverá ser exercido
sendo o cahhflow nulo. É óbvio, pois, que:
CT = 40I{ω1 } isto é CT (ω1 ) = 40 e CT (ω2 ) = 0 ,
isto é, temos a expresão importante seguinte para o payoff terminal da call option:
CT = max(ST − K, 0) = (ST − K)+ .
Utilizemos, para o apreçamento, o princı́pio do valor esperado actualizado do payoff
terminal. Então, Π(0) o preço corrente da call option virá:
Π(0) = EP [
CT
1
]=
(P[{ω1 }]CT (ω1 ) + P[{ω2 }]CT (ω2 )) = 7.62 .
1+R
1+R
Vamos supor, agora, que um outro investidor encara o mercado como um bull market,
isto é, tal que:
P[{ω1 }] = 0.8 = 1 − P[{ω2 }] .
Observação 2. Note que um touro é considerado um animal agressivo e que quando
ataca, ataca com um movimento ascendente da cabeça e dos chifres. Talvez por isto, a
denominação de bull market, para um mercado com grande probabilidade de fazer subir
os preços, está bem atribuı́da.
Utilizando o princı́pio do valor esperado actualizado do payoff terminal, para apreçar
a call option, virá:
Π(0) = EP [
CT
1
]=
(P[{ω1 }]CT (ω1 ) + P[{ω2 }]CT (ω2 )) = 30.48 .
1+R
1+R
Observação 3. Note-se que o método que empregámos usando as probabilidades naturais
ou subjectivas, (na medida em que estas probabilidades dependem da atitude de cada
investidor), não fornece um preço único para o contrato uma vez que, tal como vimos,
o preço depende destas probabilidades subjectivas. Uma tal solução para o problema
do apreçamento deixa muito a desejar na medida em que escolhendo adequadamente as
probabilidades poderemos obter, praticamente, qualquer valor num dado intervalo para
o preço do contrato.
1.1.2
O método das carteiras réplicas
Segundo [6], o método das carteiras réplicas foi introduzido por Sharpe em 1978 e Rendleman & Barter em 1979, isto é, praticamente, cinco anos após a contibuição fundamental
de Black, Scholes e Merton. Este método consiste em realizar uma carteira com uma
certa quantidade do activo financeiro subjacente e com uma certa quantidade de dinheiro numa conta bancária, de tal forma que o valor da carteira na data de exercı́cio
coincida com o payoff terminal do contrato. Neste sentido, a carteira replica ou reproduz
o contrato. A carteira Φ aparece, pois, definida inicialmente como um par de números
Φ = Φ0 = (α0 , β0 ), em que:
MF0910
2
Capı́tulo II
Modelos Discretos
Secção: 1
• a quantidade α0 representa o número de acções do activo subjacente;
• a quantidade β0 representa o número de unidades monetárias na conta bancária.
Observação 4. Note-se que:
• Consideramos que a taxa de juro activa é igual à taxa de juro passiva.
• Admitimos que (α0 , β0 ) ∈ R2 . Tal significa, para α0 < 0, que constituı́mos uma
posição short (curta) no activo subjacente recebendo dinheiro por uma venda não
concluı́da dado não termos em nossa posse o activo que vendemos. Admitir β0 < 0
significa que contraı́mos um empréstimo em unidades monetárias no montante |β0 |.
• Após constituição da carteira, na data inicial, a composição desta não se altera até
à data terminal. Designemos por 0 a data inicial e, por Vt (Φ), o valor da carteira
Φ nas datas t = 0 e t = T . É óbvio que o valor da carteira numa dada data se
obtem adicionando os termos (um para o activo subjacente e outro para a conta
bancária) que resultam do produto quantidade pelo preço, nessa data, do activo
considerado. Assim sendo:
V0 (Φ) = α0 × S0 + β0 e VT (Φ) = α0 × ST + β0 (1 + R) .
Pela descrição que fizémos acima de carteira réplica deveremos ter que:
CT = VT (Φ) .
Note-se que se trata de uma igualdade entre variáveis aleatórias pelo que se tem de facto:
CT (ωi ) = VT (Φ)(ωi ) i = 1, 2 .
Reescrevendo esta expressão, tomando em conta a definição de VT (Φ), temos o sistema
de equações:
(
VT (Φ)(ω1 ) = α0 × ST (ω1 ) + β0 (1 + R) = CT (ω1 )
VT (Φ)(ω2 ) = α0 × ST (ω2 ) + β0 (1 + R) = CT (ω2 ) .
Com os dados concretos que tomámos este sistema pode escrever-se,
(
α0 × 320 + β0 × 1.05 = 40
α0 × 260 + β0 × 1.05 = 0 ,
tendo este sistema a solução única dada por:
α0 =
2
e β0 = −165.08 .
3
A nossa carteira (α0 , β0 ) constitui-se, pois, da seguinte forma. Por cada call option
em que estamos short temos α0 = 2/3 unidades de activo subjacente e contraı́mos um
empréstimo de β0 = −165.08 unidades monetárias. Por construção, a carteira assim
constituı́da permite reproduzir o payoff terminal do contrato.
MF0910
3
Capı́tulo II
Modelos Discretos
Secção: 1
Na posse desta carteira réplica é possı́vel agora apreçar o contrato usando o princı́pio de não arbitragem que se pode enunciar, neste contexto, na forma seguinte:
se dois produtos têm o mesmo valor à data T então deverão ter o mesmo valor à data
inicial zero. Desta forma, o preço do contrato será o custo inicial de constituição da
carteira réplica ou seja, ainda, o investimento inicial necessário apara adquirir a carteira
réplica. Temos pois:
Π(0) = V0 (Φ) = α0 × S0 + β0 =
2
× 280 − −165.08 = 21.59 .
3
Observação 5. Em consequência do que expusémos podemos observar que:
• O preço do contrato aparece definido univocamente pois depende apenas de α0 e
β0 que ficaram determinados como solução de um sistema de equações algébricas.
• O preço obtido não depende das probabbilidades subjectivas, ou seja, não depende
da forma sob a qual cada agente avalia a evolução mais provável do mercado.
• Na determinação do preço do contrato usámos, apenas, o preço de exercı́cio do
contrato, o preço corrente do activo financeiro subjacente, as variações deste activo
ao longo do tempo e, a taxa de juro de uma conta bancária ou de um activo sem
risco.
1.1.3
O método das medidas martingalas
Suponhamos que é possı́vel encontrar uma medida de probabilidade P∗ sobre o espaço
de probabilidade Ω = (ω1 , ω2 ), munido da álgebra -σ maximal, tal que P∗ coincida
com a probabilidade natural nos conjuntos de probabilidade nula e tal que S ∗ , o preço
actualizado à taxa de juro R seja uma P∗ martingala. Temos, então, que sendo S ∗ o
preço actualizado à taxa de juro R dado por:
S0∗ =
S0
ST
ST
= S0 e ST∗ =
=
,
0
1
(1 + R)
(1 + R)
(1 + R)
a condição de martingala exprime-se por:
∗
S0∗ = EP [ST∗ ] .
(1)
Uma medida verificando a consição (1) é denominada medida de martingala ou ainda, por
razões óbvias, medida neutra face ao risco. Determinemos, com os dados concretos,
a solução do problema de apreçamento que já encontrámos por outros dois métodos.
Podemos dizer que P∗ é determinada por p∗ ∈]0, 1[ tal que, por exemplo p∗ =
∗
P [{ω1 }], uma vez que necessariamente virá: 1 − p∗ = P∗ [{ω2 }]. Podemos reescrever
a fórmula (1) na seguinte forma:
S0∗ =
1
× (p∗ × ST (ω1 ) + (1 − p∗ ) × ST (ω2 )) ,
1+R
o que resolvendo em ordem a p∗ nos dá:
p∗ = P∗ [{ω1 }] =
MF0910
(1 + R) × S0 − ST (ω2 )
ST (ω1 ) − ST (ω2 )
4
Capı́tulo II
Modelos Discretos
Secção: 1
e. por conseguinte,
1 − p∗ = P∗ [{ω2 }] =
ST (ω1 ) − (1 + R) × S0
.
ST (ω1 ) − ST (ω2 )
Para apreçarmos o contrato usamos o princı́pio do valor esperado actualizado do payoff
terminal, mas relativamente à medida neutra face ao risco. Logo para apreçar a call
option virá, para Π∗ (0) o preço, neutro face ao risco, do contrato:
∗
Π∗ (0) = EP [
=
+
CT
∗ (ST − K)
] = EP [
]=
1+R
1+R
1
(p∗ × CT (ω1 ) + (1 − p∗ ) × CT (ω2 )) = 21.59.
1+R
Observação 6. Note-se que o preço obtido com este método coincide com o preço obtido
para o contrato pelo método da carteira réplica. Esta coincidência é um facto geral que
será explorado no que vai seguir-se.
1.2 Pressupostos probabilı́sticos
Consideremos um espaço de probabilidade finito (Ω, F, P). A tı́tulo de interpretação
temos como pressuposto que há k ∈ N estados do mundo podendo então escrever-se que:
Ω = {ω1 , . . . , ωk } .
Consideramos um horizonte temporal N ∈ N∗ , que poderá ser interpretado como
a data maturidade ou de exercı́cio dos contratos relativos a produtos financeiros e o
conjunto de datas ou instantes dado por:
T := {0, 1, . . . , N } .
O fluxo de informação disponı́vel é-nos dado por uma filtração F = (Fn )n∈T sobre
(Ω, F, P), isto é uma sequência
F0 ⊆ F1 , . . . , ⊆ FN ,
de subálgebras σ de F em que, Fn pode ser interpretada como o conjunto da informação
disponı́vel à data n ∈ {0, 1, . . . , N }.
Observação 7. Usualmente e, salvo aviso em contrário, consideramos em vigor as seguintes hipóteses:
• F0 = {∅, Ω}.
• FN = F = P(Ω).
• ∀ω ∈ Ω P[{ω}] > 0 .
MF0910
5
Capı́tulo II
Modelos Discretos
Secção: 1
1.3 O mercado
Consideramos que no mercado existem d + 1 activos com d ∈ N∗ dados pelos respectivos
preços à data n ∈ {0, 1, . . . , N }. Representaremos estes preços pela sequência de variáveis
aleatórias positivas:
Sn0 , Sn1 , . . . , Snd ,
mensuráveis relativamente a Fn , isto é tal que para j ∈ {0, 1, . . . , d} se tenha (Snj )0≤n≤N
processo estocástico adaptado.
Observação 8. Sn := (Sn0 , Sn1 , . . . , Snd ) ∈ Rd+1 é o vector dos preços à data n.
1.3.1
O activo sem risco
Consideramos que um dos activos, o que é representado pelo processo (Sn0 )0≤n≤N , tem
uma dinâmica ou, evolução ao longo do tempo, dada por:
S00 ≡ 1 , ∀n ∈ {1, 2, . . . , N } Sn0 = (1 + r)n ,
em que r é a taxa de juro do activo sem risco.
Observação 9. A quantidade,
1
,
Sn0
é o factor de desconto da data n à data 0 isto é, se βn for investida à data 0 no activo
sem risco então, poderemos recuperar uma unidade monetária à data n.
βn :=
Observação 10. Por oposição ao activo sem risco, os activos representados pelos processos
(Snj )0≤n≤N para 0 < j ≤ (d + 1) são activos com risco. Em geral não especificaremos
a dinâmica dos activos com risco. No caso particular do modelo binomial é especificada
uma dinâmica, binomial, do activo com risco.
1.4 Estratégias ou carteiras
1.4.1
Noção intuitiva de carteira
No passado, a posse de um tı́tulo de participação de uma empresa era formalizada por
um documento impresso, geralmente, numa folha de papel única. Para preservar um
conjunto desses documentos usava-se um portfolio ou carteira.
1.4.2
Descrição de uma carteira no modelo
Consideramos que a quantidade de tı́tulos do activo i detidos à data n depende dos
estados do mundo e é, por isso, representada por uma variável aleatória:
Φin para i = 0, 1, . . . , d e n ∈ {0, 1, . . . , N } .
Definição 1. Ao processo estocástico Φ := (Φ0n , Φ1n , . . . , Φdn )0≤n≤N chamamos carteira
sse Φ for previsı́vel, isto é, se se verificar que:
(
Φ0n ∈ mF0
Φ0n ∈ mFn−1 para n ≥ 1 .
MF0910
6
Capı́tulo II
Modelos Discretos
Secção: 1
Observação 11. Note-se que para n ≥ 1, o conjunto das posições da carteira no instante n, representado pelo vector (Φ0n , Φ1n , . . . , Φdn ), é decidido com base da informação
disponı́vel à data n − 1.
1.4.3
Valor e valor descontado de uma carteira
Para determinar o valor de uma certa carteira numa dada data, é necessário efectuar,
para cada activo, o produto da quantidade detida desse activo pelo preço, à data, do
activo e, em seguida, somar os termos assim obtidos para cada activo. Justifica-se pois
a seguinte definição.
Definição 2. Processo valor e valor descontado de uma carteira.
1. O processo estocástico V (Φ) = (Vn (Φ))0≤n≤N , processo valor da carteira Φ, é
dado, para n = 0, 1, . . . , N , por:
Vn (Φ) = Φn · Sn =
d
X
N
Φin Sni = Φ0n Sn0 + · · · + ΦN
n Sn .
i=0
2. O processo estocástico Ṽ (Φ) = (Ṽn (Φ))0≤n≤N , processo valor descontado da
carteira Φ, é dado, para n = 0, 1, . . . , N , por:
Ṽn (Φ) := βn Vn (Φ) ,
onde βn é o factor de desconto definido acima.
Observação 12. Note-se que,
βn Vn (Φ) = βn (Φn · Sn ) =
d
X
Φin βn Sni = Φn · S̃n ,
i=0
onde se tem que,
S̃n = 1, βn Sn1 , . . . , βn Snd ,
é o preço à data n descontado à data 0.
1.4.4
Carteiras autofinanciadas
Admitimos que o processo de gestão das carteiras é o seguinte. Constituı́mos a carteira à
data zero. Numa data posterior qualquer, vendemos e compramos activos que mantemos
até à data seguinte, altura em que voltamos a vender e a comprar activos; em qualquer
data não é permitida a entrada ou saı́da de capitais que não seja para efeitos de venda ou
compra de activos da carteira. Este processo corresponde no modelo à noção de carteira
autofinanciada.
Definição 3. Uma carteira Φ diz-se autofinanciada sse:
∀n ∈ {0, 1, . . . , N − 1} Φn · Sn = Φn+1 · Sn .
MF0910
7
(2)
Capı́tulo II
Modelos Discretos
Secção: 1
Observação 13. Para melhor se entender o significado desta definição fundamental atentese que:
1. Se suposermos que d = 1, isto é, a existência de, apenas, um activo para além do
activo sem risco a condição (2) acima pode escrever-se:
Φ0n Sn0 + Φ1n Sn1 = Φ0n+1 Sn0 + Φ1n+1 Sn1 .
Como consequência desta igualdade fica claro que, se à data n + 1, decidirmos
aumentar a quantidade do activo sem risco na carteira, teremos que diminuir a
quantidade do activo com risco na carteira uma vez que os preços dos activos
permanecem os mesmos na condição.
2. A condição (2) pode ainda ler-se:
∀n{0, 1, . . . , N − 1} (Φn+1 − Φn ) · Sn = 0 .
(3)
Esta outra forma admite a seguinte leitura: dados os preços à data n, a recomposição da carteira faz-se sem entradas ou saı́das de capital; os cash-flows na recomposição são apenas os que decorrem de compras de activos financiados exclusivamente por vendas de activos.
3. A partir da condição (2) tem-se, ainda, que:
Φn · Sn = Φn+1 · Sn ⇐⇒Φn+1 · Sn+1 − Φn · Sn = Φn+1 · Sn+1 − Φn+1 · Sn ⇐⇒
⇐⇒Vn+1 (Φ) − Vn (Φ) = Φn+1 (Sn+1 − Sn ) .
(4)
Podemos pois afirmar que uma dada carteira é autofinanciada sse a variação de
valor da carteira entre duas datas consecutivas se deve apenas à variação de preço
dos activos entre essas datas.
Apresentamos de seguida uma caracterização fundamental das carteiras autofinanciadas.
Teorema 1. São equivalentes:
1. A carteira Φ é autofinanciada;
2. ∀n ∈ {1, . . . , N } Vn (Φ) = V0 (Φ) +
Pn
j=1 Φj (Sj
− Sj−1 ) ;
3. Sendo S̃j := βj Sj , ∀n ∈ {1, . . . , N } Ṽn (Φ) = V0 (Φ) +
Pn
j=1 Φj (S̃j
− S̃j−1 ) .
Demonstração. Suponhamos que se verifica a condição 2. Tem-se então:
Vn+1 (Φ) − Vn (Φ) =V0 (Φ) +
n+1
X
Φl (Sl − Sl−1 ) −
l=1
V0 (Φ) +
n
X
!
Φl (Sl − Sl−1 )
=
l=1
=Φn+1 (Sn+1 − Sn ) ,
MF0910
8
Capı́tulo II
Modelos Discretos
Secção: 1
pelo que se tem que a carteira Φ é auto-fianciada. Suponhamos, agora, que a carteira Φ
é autofinanciada. Podemos, então, escrever que:
Vn+1 (Φ) − Vn (Φ) = Φn+1 (Sn+1 − Sn ) = Φn+1 ∆Sn+1
Vn (Φ) − Vn−1 (Φ) =
Φn (Sn − Sn−1 )
········· =
·········
= Φn ∆Sn
= ·········
V2 (Φ) − V1 (Φ) =
Φ2 (S2 − S1 )
= Φ2 ∆S2
V1 (Φ) − V0 (Φ) =
Φ1 (S1 − S0 )
= Φ1 ∆S1 ,
pelo que somando membro a membro as igualdades acima se pode obter imediatamente:
Vn+1 (Φ) − Vn (Φ) =
n+1
X
Φl (Sl − Sl−1 ) =
l=1
n+1
X
Φl ∆Sl ,
l=1
e esta é exactamente a condição 2. Para demosntrar a equivalência entre as condições
1 e 3 pode repetir-se a demonstração com S̃l = βl Sl dado que a condição sobre uma
carteira para que esta seja autofinanciada é invariante por desconto ou actualização ou
seja: a carteira Φ é autofinanciada sse:
∀n ∈ {0, 1, . . . , N − 1} Φn S̃n = Φn+1 S̃n .
Observação 14. Note-se que a expressão
Ṽn (Φ) = V0 (Φ) +
n
X
Φj (S̃j − S̃j−1 ) ,
j=1
na condição 2 do teorema, pode interpretar-se da forma seguinte: Ṽn (Φ), o valor descontado de uma carteira autofinanciada Φ, depende da riqueza inicial V0 (Φ) e, da carteira
dada por:
(Φ1n , Φ2n , . . . , Φdn )0≤n≤N ,
isto é, onde não aparece a quantidade referente ao activo sem risco. Com efeito pode
observar-se também que:
0
∆S̃j0 = S̃j0 − S̃j−1
=
1 0
1
Sj −
S0 = 1 − 1 = 0 .
βj
βj−1 j−1
A interpretação dada na observação anterior põe em evidência um facto importante
que é explicitado na proposição seguinte e que pode ser visto como uma proposição
recı́proca da constatação feita na observação.
Proposição 1. Dado o processo (φ1n , . . . , φdn )0≤n≤N , previsı́vel e V0 ∈ mF, existe um
processo previsı́vel (φ0n )0≤n≤N , tal que a carteira Φ := (φ0 , . . . , φd ) é autofinanciada e
V0 (Φ) = V0 .
MF0910
9
Capı́tulo II
Modelos Discretos
Secção: 1
Demonstração. Pela proposição e dado que Φ é autofinanciada:
Ṽn (Φ) =Φ0n + Φ1n S̃n1 + · · · + Φdn S̃nd = (def. valor descontado)
n
X
=V0 +
Φj · ∆S̃j = (proposição 3)
j=1
=V0 +
n X
Φ1j ∆S̃j1 + · · · + Φdj ∆S̃jd = (Φj · ∆S̃j = . . . )
j=1
Logo, verifica-se que:
Φ0n = V0 +
n X
Φ1j ∆S̃j1 + · · · + Φdj ∆S̃jd − Φ1n S̃n1 + · · · + Φdn S̃nd
j=1
= V0 +
n−1
X
Φj · ∆S̃j + Φ1n ∆S̃n1 + · · · + Φdn ∆S̃nd − Φ1n S̃n1 + · · · + Φdn S̃nd
j=1
= V0 +
n−1
X
1
d
Φj · ∆S̃j + Φ1n (−S̃n−1
) + · · · + Φdn (−S̃n−1
)
j=1
pelo que Φ está bem definido e é previsı́vel, tal como foi anunciado.
1.5 Estratégias admissı́veis e arbitragem
Observação 15. Os valores que tomam as componentes Φin de uma dada carteira Φ =
(Φ0 , . . . , Φd ), têm sinal arbitrário. Com efeito:
• Φ0n < 0 : pode ser interpretado como tendo nós tomado emprestado |Φ0n | no activo
sem risco.
• Φin < 0 para i ≥ 1: pode ser interpretado como sendo a carteira curta (short) na
quantidade |Φin | no activo sem risco indexado por i.
• Carteiras curtas em activos com risco e empréstimos são admitidos desde que o
valor da carteira seja não negativo em qualquer data.
Definição 4. Uma estratégia ou carteira Φ é admissı́vel sse se verificar:
1. Φ é autofinanciada.
2. ∀n ∈ {0, 1, . . . , N } Vn (Φ) ≥ 0 .
Observação 16. De acordo com esta definição, com uma dada carteira admissı́vel um
investidor deve poder pagar as suas dı́vidas (nos activos com e sem risco) em qualquer
data.
A noção intuitiva de arbitragem pode ser descrita como a possibilidade de criar uma
proveito certo, sem risco, a partir de um custo inicial nulo.
MF0910
10
Capı́tulo II
Modelos Discretos
Secção: 1
Definição 5. Uma estratégia, ou carteira, Φ é uma carteira de arbitragem sse se
verificar:
1. Φ é admissı́vel;
2. V0 (Φ) = 0 e
VN (Φ) 6≡ 0 isto é, VN (Φ) é uma variável aleatória não nula.
Observação 17. Uma estratégia de arbitragem é pois uma carteira admissı́vel com valor
inicial nulo e com valor terminal não nulo.
1.6 Tranformação de uma martingala por um processo previsı́vel
Relembramos nesta secção alguns resultados releventes da teoria das martingalas, para
os modelos finitos de mercados financeiros.
Seja F := (Fn )0≤n≤N uma filtração sobre o espaço de probabilidade (Ω, F, P).
Definição 6. Um processo H := (Hn )0≤n≤N é um processo F previsı́vel se se verificar:
H0 ∈ mF0 e ∀n ∈ {1, . . . , N } Hn ∈ mFn .
Teorema 2. Seja M := (Mn )0≤n≤N uma F martingala e H := (Hn )0≤n≤N um processo
F previsı́vel (e limitado). Então, o processo X := (Xn )0≤n≤N definido por:
(
X0 := H0 M0
Xn := H0 M0 + H1 ∆M1 + · · · + Hn ∆Mn 1 ≤ n ≤ N ,
onde ∆Mi := Mi − Mi−1 , é uma F martingala.
Observação 18 (Comentário importante). Pela proposição (3) vemos que se os preços
descontados (S̃n )0≤n≤N formarem uma martingala e, sendo Φ a carteira um processo
previsı́vel então o processo valor actualizado (Ṽn (Φ))0≤n≤N é uma martingala. Logo
podemos concluir que:
E[ṼN (Φ)] = E[V0 (Φ)] ,
isto é, o valor esperado final da riqueza gerada por uma estratégia autofinanciada é igual
ao valor esperado da riqueza inicial.
Demonstração. Por construção o processo X é soma de processos adaptados pelo que é
um processo adaptado. Note-se que X0 ∈ mF0 visto que H0 , M0 ∈ mF0 . Como H é
limitado tem-se que:
E[| Xn |] < +∞ .
Para verificarmos a propriedade de martingala observamos, apenas, que:
E[Xn+1 − Xn | Fn ] = E [Hn+1 (Mn+1 − Mn ) | Fn ] (visto que: Hn+1 ∈ mFn )
= Hn+1 E[Mn+1 − Mn | Fn ] (visto que: E[Mn+1 | Fn ] = Mn ) .
Logo, X é uma martingala.
MF0910
11
Capı́tulo II
Modelos Discretos
Secção: 1
Proposição 2. Seja M := (Mn )0≤n≤N um processo F adaptado de variáveis aleatórias
integráveis. São equivalentes:
1. M é uma F martingala;
2. Para qualquer processo previsı́vel e limitado H = (Hn )0≤n≤N , verifica-se:
"
E
N
X
#
Hn ∆Mn = 0 .
n=1
Demonstração. Verifiquemos que a condição é necessária. Seja H0 ≡ 0 e (Hn )0≤n≤N
uma qualquer sequência previsı́vel, relativamente a F, limitada, de variáveis aleatórias.
Pela proposição 2 o processo X definido por:
(
X0 := 0
Pn
Xn :=
i=1 Hi ∆Mi
1≤n≤N ,
é uma F martingala. Dado que uma martingala tem valor médio constante, tem-se que:
"
E
n
X
#
Hi ∆Mi = E[Xn ] = E[X0 ] = 0 .
i=1
Verifiquemos que a condição é suficiente. Seja j ∈ {0, 1, . . . , N − 1} fixo e A ∈ Fj
arbitrário. Seja por definição,
(
IA
Hn =
0
n=j+1
n 6= j + 1
ou seja, tem-se a seguinte definição:
H0
0
H1
0
...
...
Hj−1
0
Hj
IA
Hj+1
0
Hj+2
0
...
...
HN
0
O processo (Hn )0≤n≤N é previsı́vel e obviamente limitado. Em consequência da condição
admitida por hipótese:
"
0=E
N
X
#
Z
Hi ∆Mi = E [IA (Mj+1 − Mj )] =
(Mj+1 − Mj )dP .
A
i=1
Tem-se, pois, pela definição de esperança condicional e atendendo a que A é arbitrário:
E [Mj+1 − Mj | Fj ] = 0 para j = 0, 1, . . . N − 1 ,
isto é, M é uma martingala.
MF0910
12
Capı́tulo II
Modelos Discretos
Secção: 1
1.7 Mercados financeiros viáveis
Podemos formalizar a noção de mercado considerando o processo de preços e o conjunto
de todas as carteiras autofinanciadas.
Definição 7. Um mercado financeiro diz-se viável sse não existirem carteiras de arbitragem isto é sse for impossı́vel gerar lucros certos a partir de um investimento incial
nulo.
Observação 19.
• Para P probabilidade e A ∈ F um qualquer acontecimento, sabemos que P[A] ∈ [0, 1] exprime a confiança que temos na realização do acontecimento
A. P[A] = 0 diz-nos que o acontecimento A é impossı́vel. dadas duas probabilidades P e P∗ , podemos considerar P equivalente a P∗ se e só se P e P∗ coincidem
sobre os acontecimentos de probabilidade nula. A coincidência sobre os acontecimentos de probabilidade nula deve ser um denominador comum a todos os agentes
de mercado.
• Dado que Ω é finito e que F = P(Ω) temos que se A ∈ F então, necessariamente,
A = ∪qi=1 {ωi } onde q é o número de elementos de A. Nestas condições tem-se
que P[A] = 0 se e só se para todo o i = 1, . . . , q se tem P[{ωi }] = 0. Como, por
hipótese, para qualquer ω em Ω se tem que P[{ω}] = 0 temos finalmente que:
P∼
= P∗ ⇔ ∀ω ∈ Ω P∗ [{ω}] = 0 .
Com efeito:
P∼
= P∗ ⇔ ∀A ∈ F (P[A] = 0 ⇔ P∗ [A] = 0) ⇔ (P[A] > 0 ⇔ P∗ [A] > 0) .
É notável que a existência de uma medida de probabilidade relativamente à qual o
processo de preços descontados seja uma martingala caracterize os mercados viáveis.
Teorema 3 (Primeiro teorema fundamental sobre o apreçamento de activos). Um o
mercado é viável sse existir uma medida de probabilidade P∗ , equivalente a P∗ tal que o
processo de preços actualizados seja uma martingala relativamente a P∗ .
Definição 8. Uma medida de probabilidade verificando a condição do teorema diz-se
uma medida neutra face ao risco ou uma medida de martingala.
Demonstração. Suponhamos que existe uma medida P∗ equivalente a P tal que o processo de preços actualizados seja uma martingala relativamente à medida P∗ . Para uma
qualquer carteira Φ autofinanciada e limitada:
∀n ≥ 1 Ṽn (Φ) = V0 +
n
X
Φj ∆S̃j ,
j=1
em consequência do teorema 1. Logo (Ṽn (Φ))0≤n≤N é uma martingala relativamente a P∗
pelo teorema 2. Suponhamos agora Φ admissı́vel tal que V0 (Φ) = 0. Pelas propriedades
das martingalas tem-se que:
E∗ [ṼN (Φ)] = E∗ [V0 (Φ)] = 0 .
MF0910
13
Capı́tulo II
Modelos Discretos
Secção: 1
Como se tem que ṼN (Φ) ≥ 0, dado que Φ é admissı́vel e
E∗ [ṼN (Φ)] =
r
X
ṼN (Φ)(ωi ) P∗ [{ωi }] = 0 ,
i=1
com ṼN (Φ)(ωi ) ≥ 0 e P∗ [{ωi }] > 0, terá que ser ṼN (Φ) ≡ 0. Em consequência, não há
carteiras de arbitragem.
1.8 Mercados completos
Consideramos num modelo de mercado financeiro contratos conferindo direitos com
exercı́cio opcional caracterizados pelo correspondente cashflow ou payoff. Neste contexto um direito contingente pode definir-se da seguinte forma.
Definição 9. Um direito contingente é uma variável aleatória, não negativa, FN mensurável.
Os exemplos seguintes são fundamentais.
Exemplo 1. Call option europeia: o cash-flow deste direito contingente sobre, por
exemplo, o activo com preço S1 = (Sn1 )0≤n≤N , depende de um parâmetro, o preço de
exercı́cio K e é definido por:
(
1 ≥K
1 −K
se SN
SN
1
(5)
h := (SN
− K)+ =
1 ≤K
0
se SN
Exemplo 2. Put option europeia: o cash-flow deste activo contingente é definido por:
1
h := (K − SN
)+
(6)
Observação 20.
1. Um direito contingente h depende apenas do valor do activo subjacente à data de exercı́cio isto é, tem-se que:
h = h(SN ) .
2. Noutro tipo de produtos financeiros derivados pode ter-se:
h = h(S0 , S1 , . . . , SN ) ,
tal como, por exemplo, no caso das opções asiáticas em que o preço de exercı́cio é
um valor médio do preço do subjacente calculado entre a data de exercı́cio e uma
data anterior.
Definição 10. Um direito contingente h é atingı́vel sse existe uma estratégia admissı́vel
cujo valor à data N seja exactamente h.
Teorema 4. Num mercado viável é condição suficiente para que um direito contingente
h seja atingı́vel que exista uma carteira autofinanciada Φ, cujo valor na data de maturidade seja h.
MF0910
14
Capı́tulo II
Modelos Discretos
Secção: 1
Observação 21. Neste teorema substitui-se a hipótese da carteira ser admissı́vel, na
definição acima, pela hipótese mais fraca da carteira ser autofinanciada.
Demonstração. Seja Φ uma carteira autofinanciada tal que VN (Φ) = h e P∗ uma probabilidade de martingala. Uma tal probabilidade existe dado que o mercado é viável.
(Ṽn (Φ))0≤n≤N é uma martingala relativamente a P∗ uma vez que é transformação de
martingala do processo de preços descontados que é uma martingala devido à definição
de P∗ . Tem-se pois que:
∀n ∈ {0, 1, . . . , N } Ṽn (Φ) = E∗ [ṼN (Φ) | Fn ] .
0 ≥ 0 tem-se que Ṽ (Φ) ≥ 0, para 0 ≤ n ≤ N em consequência
Como ṼN (Φ) = h/SN
n
das propriedades da noção de esperança condicional, verificando-se pois que Vn (Φ) ≥ 0,
sendo então a estratégia admissı́vel.
Definição 11. Um mercado financeiro diz-se completo sse todo o direito contingente
é atingı́vel.
Observação 22. Assumir que um mercado é completo é uma hipótese restritiva cuja
motivação económica não é tão óbvia como a hipótese de não arbitragem.
Teorema 5 (Segundo teorema fundamental no apreçamento de activos). Um mercado
viável é completo sse existir uma medida de martingala P∗ única, i.e. se existir uma
única medida de probabilidade equivalente a P, relativamente à qual o processo de preços
descontados seja uma martingala.
Demonstração. Suponhamos o mercado viável e completo. Para h ≥ 0, h ∈ mFN , existe
uma carteira admissı́vel tal que VN (Φ) = h. Como Φ é autofianciada temos que:
N
X
h
VN (Φ)
=
=
Ṽ
(Φ)
=
V
+
Φj · ∆S̃j .
0
N
0
0
SN
SN
j=1
(7)
Suponha-se que F0 = {∅, Ω} e sejam P∗1 e P∗2 duas medidas de martingala tem-se então
que para i = 1, 2:
E∗i [ṼN (Φ)] = E∗i [V0 (Φ)] ( propriedades de martingala)
= V0 (Φ)( dado que F0 = {∅, Ω}) .
Em consequência da fórmula 7 tem-se que:
E∗1 [
h
h
] = E∗2 [ 0 ] .
0
SN
SN
Como h ∈ mFN é arbitrária tem-se que P∗1 ≡ P∗2 sobre FN . Supondo F = FN temos o
resultado anunciado.
MF0910
15
Capı́tulo II
Modelos Discretos
Secção: 2
1.9 Apreçamento e cobertura de direitos contingentes em mercados completos
Consideremos um mercado viável e completo denotando-se por P∗ a única medida de
martingala. Seja h ∈ mFN , h ≥ 0 um direito contingente. Seja Φ uma carteira admissı́vel e réplica de h.
Dado que (Ṽn (Φ))0≤n≤N é P∗ martingala tem-se que:
V0 (Φ) = E∗ [ṼN (Φ) | F0 ] = E∗ [ṼN (Φ)] = E∗ [
h
0 ].
SN
Mais geralmente, para n = 0, 1, . . . , N tem-se que:
Vn (Φ) = Ṽn (Φ) · Sn0 = Sn0 · E∗ [
h
0 | Fn ] ,
SN
isto é:
∀n ∈ {0, . . . , N } Vn (Φ) =
Sn0
∗
·E
h
0 | Fn
SN
.
(8)
Pode pois afirmar-se que o valor de uma carteira réplica de h é completamente determinado por h é pois natural que num mercado viável e completo o preço livre de arbitragem
de um direito contingente h seja dado pela fórmula 8.
Com efeito Vn (Φ) é a riqueza necessária à data n para replicar h à data N seguindo
a estratégia admissı́vel Φ.
0 ] e seguir reSe à data zero o investidor vender o direito contingente por E∗ [h/SN
constituindo a carteira Φ, pode gerar o valor h à data N . Está por isso perfeitamente
coberto (hedged).
Exemplo 3. Considere um mercado com dois activos um com risco e o outro sem risco
e tal que N = 1. Considere um direito contingente h sobre o activo com risco e Φ uma
carteira réplica de h. O quadro seguinte demonstra que se o preço à data zero do direito
contingente não for exactamente V0 (Φ), então existe no mercado uma oportunidade
de arbitragem. Suponha, por exemplo, que Π(0, h) o preço de h à data zero verifica
Π(0, h) < V0 (Φ).
Posição short
Posição long
Total no Activo sem risco
Data 0
V0 (Φ)
−Π(0, h)
V0 (Φ) − Π(0, h)
Data 1
VN (Φ) = h
−Π(0, h) = −h
(V0 (Φ) − Π(0, h))(1 + R) > 0
2 O modelo de Cox Ross Rubinstein
No enquadramento definido até agora consideramos:
• a existência de apenas um activo com risco i.e. d = 1;
• denotamos o preço do activo com risco por (Sn )0≤n≤N .
MF0910
16
Capı́tulo II
Modelos Discretos
Secção: 2
• a dinâmica do activo sem risco é dada por:
∀n ∈ {0, . . . , N } Sn0 = (1 + r)n ,
com r ∈ R∗+ .
• a dinâmica do activo com risco é dada por
S0 ∈ R∗+
e
Sn+1
(
Sn (1 + a)
=
Sn (1 + b)
(9)
para −1 < a < b.
Exercı́cio 1 (Uma concretização). .
1. Represente graficamente (para N = 3) a árvore de evolução dos preços do activo
com risco e mostre que pode identicar Ω o conjunto dos estados do mundo com
{(1 + a), (1 + b)}N .
2. Verifique que:
∀ω = (y1 , . . . yN ) ∈ Ω ∀i ∈ {0, . . . , N − 1} yi+1 =
Si+1
(ω) .
Si
Consideramos ainda como hipóteses:
• F0 = {∅, Ω}
∀n ∈ {1, . . . , N } Fn := σ(S1 , . . . , Sn ).
• F = P(Ω)
• A probabilidade inicial sobre Ω está definida a menos de equivalência, i.e.:
∀ω ∈ Ω P[{ω}] > 0 .
Definição 12. Seja, por definição, para cada n = 1, . . . , N
Tn :=
Sn
Sn−1
Exercı́cio 2.
1. Mostre que L(T1 , . . . , TN ) ≡ P i.e. que a lei do N -uplo de variáveis
aleatórias (T1 , . . . , TN ) é, exactamente, P.
2. Mostre que
∀n ∈ {1, . . . , N } Fn = σ(T1 , . . . , Tn )
Exercı́cio 3. Mostre que se o processo dos preços descontados (S̃n )0≤n≤N é P martingala
então:
∀n ∈ {0, . . . , N − 1} E[Tn+1 | Fn ] = 1 + r .
MF0910
17
Capı́tulo II
Modelos Discretos
Secção: 2
Exercı́cio 4. Mostre que se o mercado for livre de arbitragem então, r ∈]a, b[.
Exercı́cio 5. Mostre que se a condição r ∈]a, b[ não for satisfeita então há oportunidades
de arbitragem.
Exercı́cio 6. Suponha-se que r ∈]a, b[ e seja:
b−r
.
b−a
p :=
1. Mostre são equivalentes
(a) (S̃n )0≤n≤N é P martingala
(b) (Tn )1≤n≤N é uma sucessão iid e
P[T1 = 1 + a] = p = 1 − P[T1 = 1 + b]
2. Conclua que, sob a hipótese feita acima (r ∈]a, b[) o mercado é livre de arbitragem
e completo.
Exercı́cio 7. Seja Cn (respectivamente Pn ) o preço à data n de uma Call (respectivamente Put) Option europeia sobre o activo com risco com preço de exercı́cio K e data
de maturidade N .
1. Mostre a relação de paridade Call-Put:
Cn − Pn = Sn − K(1 + r)−(N −n) .
2. Mostre que Cn = c(n, Sn ) onde:
c(n, x) = (1 + r)−(N −n) ×


N
−n
X
(N − n)!
pj (1 − p)N −n−j x(1 + a)j (1 + b)N −n−j − K +  .
×
(N − n − j)!j!
j=0
2.1 Questão de desenvolvimento
Suponha-se no contexto de um mercado a um perı́odo (N = 1), num espaço de probabilidade com uma infinidade numerável de estados do mundo e com uma infinidade de
activos d = +∞
Seja Ω = {1, 2, . . . , }, F0 = {∅, Ω} e F1 = F a σ-álgebra gerada pelos subconjuntos
finitos de Ω. Seja a probabilidade P definida sobre (Ω, F) por:
∀k ∈ Ω P[{k}] = 2−k .
Seja para cada activo i ∈ {1, 2, . . . , } a sucessão dos preços Sni , para n = 0, 1 definida
pela diferença:


ω=i
1
i
i
(S1 − S0 )(ω) = −1 ω = i + 1


0
i 6= ω 6= i + 1
MF0910
18
Capı́tulo II
Modelos Discretos
Secção: 2
Exercı́cio 8.
1. Suponha que B0 = B1 P
= 1. Mostre que para uma carteira Φ =
(φi )i∈{1,2,...,} que verifique a condição +∞
i=1 | φi |< +∞ o valor da carteira V1 (Φ),
à data 1, pode ser dado por:
V1 (Φ) = φ0 +
+∞
X
φi S1i = V0 (Φ) +
i=1
se for V0 (Φ) = φ0 +
P+∞
i=1
+∞
X
φi (S1i − S0i ) ,
i=1
φi .
2. Suponha que V0 (Φ) = 0 e que V1 (Φ) ≥ 0. Mostre que V1 (Φ) = 0 P quase certamente.
3. Mostre que se existir uma medida de martingala P∗ então:
E∗ S1i − S0i = 0 ,
e conclua que P∗ [{i}] = P∗ [{i + 1}].
4. Mostre que o mercado com as caracterı́sticas que acabou de utilizar é livre de arbitragem e exprima uma conclusão dos resultados obtidos nas alı́neas anteriores.
Referências
[1] S. Beninga Financial Modeling, The MIT press, 1997.
[2] T. Björk An introduction to Arbitrage Theory in Continuous Time, Oxford University
Press, 1998.
[3] R. J. Elliot, P. Ekkehard Kopp Mathematics of Financial Markets, Springer Verlag,
1999.
[4] John C. Hull Options Futures and other Derivatives, fourth edition, Prentice Hall
International, Inc., 2000.
[5] D. Lamberton, & B. Lapeyre, Introduction to Stochastic Calculus Applied to Finance,
Chapman & Hall 1996.
[6] M. Musiela, & M. Rutkowski, Martingale Methods in Financial Modelling, Springer
Verlag, 1997.
[7] S. R. Pliska, Introduction to Mathematical Finance, Blackwell Publishers, 1997.
[8] A. N. Shiryaev, Essentials of Stochastic Finance, World Scientific, 1999.
MF0910
19
As Árvores Trinomiais nos Modelos de Mercados Financeiros
FCT/UNL, Matemática Financeira 07-08
MLE
1 Introdução
Faz-se uma apresentação sumária do modelo trinomial. As questões colocadas poderão,
talvez, vir a ser aprofundadas no âmbito duma dissertação de mestrado.
2 O modelo trinomial
O modelo trinomial é muito semelhante ao modelo binomial, havendo no entanto algumas diferenças. No modelo trinomial consideram-se também dois activos primários. A
obrigação (bond ), activo sem risco cuja lei de evolução do respectivo preço é dada por:
(
B0 = 1
Bn+1 = (1 + R)Bn n ≥ 0 ,
em que R ≥ 0 é a taxa de juro sem risco, determinı́stica, associada a um dado perı́odo
de tempo ∆t que deveremos ter sempre o máximo cuidado em explicitar 1 . A acção
(stock ), activo com risco cuja lei de evolução do respectivo preço é dada por:
(
S0 > 0
Sn+1 = Zn+1 Sn n ≥ 0 ,
em que (Zn )n≥1 é uma amostra de


u com
Z = s com


d com
uma variável aleatória trinomial Z tal que:
probabilidade pu
probabilidade ps
probabilidade pd = 1 − (pu + ps )
e que representa o retorno da acção no perı́odo ∆t 2 . Os parâmetros do modelo, sob a
probabilidade natural, são descritos, evidentemente, por Θ = (R, u, s, d, pu , ps ).
Chamamos a atenção do leitor para o seguinte. A árvore que descreve o modelo
trinomial de acordo com (Hull 00)[p. 405] é a seguinte.
1
2
Por exemplo a taxa pode ser: diária, semanal, mensal, anual, etc.
De facto, por definição, o retorno aditivo é dado por (S1 − S0 )/S0 = Z − 1.
1
MF0708
Árvores Trinomiais
Subsecção: 3.0
S0 u 3
- S u2
0
S0 u 2
@
@
@
S0 u
- S0 u
@
@
@
R
@
@
@
@
S0
-
S0
@
R
S0
@
@
@
@
@
R
@
R
S0
@
@
@
@
@
S0 u
S0 d
@
R
- S0 d
@
R
- S0 d
@
@
@
@
@
@
@
R
@
R
- S d2
0
S0 d 2
@
@
@
@
R
S0 d 3
Pode ver-se que neste caso particular são feitas as seguintes hipóteses.
(
s=1
d = 1/u
3 Questões em aberto
Ficam por elucidar as seguintes questões. O leitor corajoso poderá tentar verificar se as
sugestões propostas respondem ou não às questões.
1. O modelo trinomial é livre de arbitragem? Uma primeira ideia seria copiar a
Primeira versão
2
MF0708
Subsecção: 3.0
construção da medida de martingala no caso trinomial. Terı́amos:
S0 =
1
EQ [S1 ] = pu S0 u + ps S0 s + (1 − pu − ps )S0 d
1+R
ou seja, com pu , ps ∈ [0, 1]:
1 + R = pu u + ps s + (1 − pu − ps )d ,
isto é, 1 + R combinação convexa dos três pontos d < s < u. Observe-se que se
ps = 0 então 1 + R ∈ [d, u] por ser combinação convexa de d e u. Em qualquer
caso como d < s < u tem-se que s = αu + (1 − α)d pelo que
1 + R = (pu + αps )u + [(1 − pu − ps ) + (1 − α)ps ]d
com (pu + αps ) + [(1 − pu − ps ) + (1 − α)ps ] = 1 pelo que 1 + R ∈ [d, u].
2. Será que a condição de não arbitragem é, na mesma, 1+R ∈ [d, u]? A demonstração
deve ir pela mesma via que no caso binomial.
3. Como fazer o apreçamento e a cobertura? É de esperar que se tenha para X =
Φ(ST ) a fórmula de apreçamento usual, a saber,
Π(0, X) =
1
1
EQ [X] =
EQ [Φ(ST )] .
(1 + R)T
(1 + R)T
(1)
Sendo que se estivermos a considerar T perı́odos e se Y = (Yu , Ys , Yd ) for uma
variável trinomial de parâmetros T e Q = (qu , qs , qd ) 3 então ter-se-à que:
X = Φ(ST ) = Φ(S0 uYu sYs dYd ) .
(2)
Em consequência das fórmulas 1 e 2 deverá vir:
X
T!
q k q l q m Φ(S0 uk sl dm ) ,
Π(0, X) =
k! l! m! u s d
k+l+m=T
o que justificaria o cálculo de Monte Carlo efectuado na aula prática e descrito no
ficheiro Mathematica da aplicação prática.
4. O modelo trinomial é completo? Queremos uma carteira réplica formada por dois
activos. No caso do modelo binomial sabemos (ver a proposição 6 das notas de
aula) que se o modelo for livre de arbitragem então é completo. No caso do modelo
trinomial temos que resolver o sistema


(1 + R)x + S0 uy = φ(u)
(1 + R)x + S0 sy = φ(s)


(1 + R)x + S0 dy = φ(d)
o que em geral é impossı́vel (três equações e duas incógnitas (x, y)). Uma alternativa é considrar uma carteira réplica com um terceiro activo. Outra aproximação
é investigar o apreçamento em mercados não completos.
3
Q represetará a probabilidade neutra face ao risco.
Primeira versão
3
MF0708
Subsecção: 3.1
5. Se o modelo trinomial não for completo, como construir uma carteira de cobertura?
Mais uma vez a ideia seria escolher um activo adicional no mercado.
6. Como efectuar a calibração do modelo? A literatura propõe várias expressões 4 .
Um exemplo comum, para o caso particular que é descrito na figura apresentada,
é:
u = eσ
√
2∆t
, s = 1, d = e−σ
√
2∆t
Su = S · u, Ss = S, Sd = S · d
√
!2
eR∆t/2 − e−σ ∆t/2
√
√
pu =
eσ ∆t/2 − e−σ ∆t/2
√
!2
eσ ∆t/2 − eR∆t/2
√
√
pd =
eσ ∆t/2 − e−σ ∆t/2
ps = 1 − pu − pd ,
sendo σ a volatilidade estimada a partir dos dados. Um outro exemplo de parametrização é apresentado em (Hull 00)[p. 405]. Poder-se-ia tentar uma aproximação
semelhante à que seguimos no modelo binomial para o caso geral?
7. É sabido que o modelo binomial tem boas propriedades de convergência podendose, num dos limites possı́veis, obter os preços de Black-Scholes. Que tipo de preços
com modelos contı́nuos se podem obter num limite do modelo trinomial? Se pudermos obter distribuições limite não Gaussianas a utilização do modelo trinomial
geral poderá encontrar amplas aplicações.
3.1 Aplicação prática
No ficheiro Mathematica distribuı́do estudamos o caso geral descrito acima e o caso
particular com os parâmetros semelhantes aos que foram utilizados para estudar o modelo
binomial no caso das opções sobre o PSI-20.
Referências
[Broadie et al 98] Mark Broadie, Paul Glasserman (editors) , Hedging with Trees, Risk
Books, 1998.
4
Veja-se, por exemplo, (Kamrad et al 91).
Primeira versão
4
MF0708
Subsecção: 3.1
[Kamrad et al 91] Kamrad, B. and P. Ritchken, Multinomial Approximating Models
for Options with k-State Variables, Management Science 37, No. 12 (1991), pp.
1640-1652.
Primeira versão
5
Árvores Trinomiais
Estudam-se as árvores trinomiais gerais. O caso tradicional (Hull página 405) é o caso em que s=1 e u=1/d. A ideia de
usar árvores trinomiais é que permitem resultados muito mais variados que o modelo binomial.
<< Statistics`DiscreteDistributions`
<< Statistics`ContinuousDistributions`
<< Graphics`Graphics`
<< Statistics`HypothesisTests`
<< Statistics`ConfidenceIntervals`
Árvore trinomial geral
A um período
pu = .6; ps = .2; pd = 1 - Hpu + psL; u = 1.0223; s = 1.009; d = 0.888581;
S0 = 100; T = 130; K = 105; R = .041 ê 360;
nRep = 10000;
Esta função fTri permite gerar uma variável aleatória trinomial
fTri@u_, s_, d_, pu_, ps_, a_D :=
If@0 § a < pu, u, 0D + If@pu <= a < pu + ps, s, 0D +
If@pu + ps <= a § pu + ps + pd, d, 0D
alea = Table@Random@D, 8k, 1, nRep<D;
TriAlea = Table@S0 * fTri@u, s, d, pu, ps, alea@@kDDD, 8k, 1, nRep<D;
TrinomialTrees.nb
2
Histogram@TriAleaD
6000
5000
4000
3000
2000
1000
90
92
94
96
98
100
102
Ü Graphics Ü
8Mean@TriAleaD, StandardDeviation@TriAleaD<
899.2488, 5.27412<
Árvore trinomial geral multi-período
MulAlea = Table@Random@D, 8k, 1, nRep * T<D;
MulTriAlea =
Table@S0 * Product@fTri@u, s, d, pu, ps, MulAlea@@kDDD,
8k, 1 + Hm - 1L * T, m * T<D, 8m, 1, nRep<D;
TrinomialTrees.nb
3
Histogram@MulTriAleaD
600
500
400
300
200
100
50
100
150
200
Ü Graphics Ü
8Skewness@MulTriAleaD, Kurtosis@MulTriAleaD<
81.75705, 7.85363<
Pode constatar-se que não é aceitável supor que a distribuição limite quando T cresce é normal neste caso.
Direito Contingente ou Derivado
X@S_, K_D := Max@S - K, 0D
PreXis = Table@X@MulTriAlea@@kDD, KD, 8k, 1, Length@MulTriAleaD<D;
PriceCall = H1 ê H1 + RL ^ TL * Mean@PreXisD
0.655796
TrinomialTrees.nb
4
Árvore trinomial particular
A um período
Os dados são quase os mesmos que os que foram usados no modelo binomial no casso da opção sobre o Psi-20. O
objectivo é permitir recuperar o resultado da Call option calculada no modelo binomial quando s=1, ps=0.
pu = 0.499431; ps = .0005; pd = 1 - Hpu + psL; u = 1.01142; s = 1;
d = 1 ê u; S0 = 7307.99; T = 30; K = 7161.83; R = .041 ê 360;
nRep = 10000;
alea2 = Table@Random@D, 8k, 1, nRep<D;
TriAlea2 = Table@S0 * fTri@u, s, d, pu, ps, alea2@@kDDD, 8k, 1, nRep<D;
Histogram@TriAlea2D
5000
4000
3000
2000
1000
7225
7250
7275
7300
7325
7350
Ü Graphics Ü
8Mean@TriAlea2D, StandardDeviation@TriAlea2D<
87308.24, 82.9775<
7375
TrinomialTrees.nb
5
Árvore trinomial particular multi-período
MulAlea2 = Table@Random@D, 8k, 1, nRep * T<D;
MulTriAlea2 =
Table@S0 * Product@fTri@u, s, d, pu, ps, MulAlea2@@kDDD,
8k, 1 + Hm - 1L * T, m * T<D, 8m, 1, nRep<D;
Histogram@MulTriAlea2D
1400
1200
1000
800
600
400
200
6000
6500
7000
7500
8000
8500
9000
Ü Graphics Ü
8Skewness@MulTriAlea2D, Kurtosis@MulTriAlea2D<
80.195504, 2.9831<
Direito Contingente ou Derivado no caso particular
PreXis2 = Table@X@MulTriAlea2@@kDD, KD, 8k, 1, Length@MulTriAlea2D<D;
PriceCall2 = H1 ê H1 + RL ^ TL * Mean@PreXis2D
272.545
O Integral Estocástico
FCT/UNL, Matemática Financeira
MLE
1 Introdução
Consideremos a evolução de bactérias num meio apropriado de cultura. Uma forma
de descrever essa evolução pode consistir em considerar a concentração definida como
o número de bactérias por unidade de volume em função do tempo. Representamos a
concentração por βt . Uma hipótese plausı́vel é a de que havendo condições adequadas em espaço e alimentos - a variação da concentração é proporcional à concentração. Uma
forma de traduzir esta hipótese num modelo matemático simples consiste em escrever:
dβt
= αβt .
dt
(1)
Admitindo que à data t = 0 a concentração de bactérias vale β0 temos que a equação
diferencial acima admite como solução:
βt = β0 exp(αt) .
Esta forma adoptada para traduzir matematicamente o fenómeno da evolução da concentração de bactérias num meio adequado pode ser considerada simplista dado que
pressupõe uma uniformidade na evolução que, raramente, se observa. Uma alternativa
pode ser considerar que as condições em que decorre o fenómeno de evolução admitem uma decomposição numa tendência forte mas que é perturbada por um ruı́do de
fundo com caracterı́sticas aleatórias. Podem considerar-se neste contexto dois tipos de
modelos: modelos a tempo discreto e modelos a tempo contı́nuo.
1.1 Um modelo a tempo discreto
Suponha-se então que à evolução descrita acima na fórmula 1 se sobrepõe um termo
aditivo Θ(t) representando o ruı́do ou a incerteza das condições no instante t. A evolução
passa a ser dada pela fórmula:
dβt
= αβt + Θ(t) .
dt
Esta fórmula admite a representação
βt+∆t − βt
≈ αβt + Θ(t) ,
∆t
1
Capı́tulo IV
Integral Estocástico
Secção: 1
considerando a aproximação usual para a derivada. Supondo que ∆t 6= 0 tem-se ainda,
βt+∆t − βt ≈ αβt ∆t + Θ(t)∆t ,
que é equivalente a:
βt+∆t ≈ (1 + α∆t)βt + Θ(t)∆t .
Supondo ∆t = 1 e que a data inicial é t = 0 tem-se como modelo
∀n ∈ N∗ βn+1 = (1 + α)βn + Θ(n) .
É usual considerar que Θ(n), o termo correspondente ao ruı́do, se pode escrever como:
Θ(n) = θn ,
em que a sucessão (n )n∈N representa uma sucessão de variáveis aleatórias independentes
e identicamente distribuı́das (iid), centradas e com variância comum igual à unidade. O
modelo que assim se obtem pode ser representado por
∀n ∈ N∗ βn+1 = (1 + α)βn + θn
(2)
em que α e θ são parâmetros - a serem objecto de estimação e calibração em caso de
aplicação do modelo - e com
i
E[n ] = 0, V[n ] = 1, L(n ) ≡ L(m ), m 6= n ⇒ n ↔ m ,
(3)
define um processo autoregressivo de ordem um que é bem conhecido e sobre o qual se
dispõe de muita informação (veja-se, por exemplo, [Dacunha-Castelle (I)][p. 132, 158,
176], [Dacunha-Castelle (II)][p. 140, 141]).
Exercı́cio 1 (Existência do ruı́do branco em tempo discreto). Mostre que existe um espaço de probabilidade e um ruı́do branco sobre este espaço; isto é, uma sucessão de variáveis aleatórias - definidas sobre
este espaço de probabilidade - independentes e identicamente distribuı́das - eventualmente com uma dada
distribuição prescrita - centradas e com variância comum igual à unidade.
1.2 Um modelo a tempo contı́nuo
Suponhamos que pretendemos encontrar um modelo a tempo contı́nuo semelhante ao
modelo descrito pela fórmula 2 e pelas hipóteses ou condições 3. Formalmente deverı́amos
ter
dβt = αβt dt + Θ(t)dt
ou ainda, com Θ(t)dt = θt ,
dβt = αβt dt + θt ,
em que se deveriam verificar as seguintes condições,
i
E[t ] = 0, V[t ] = 1, L(s ) ≡ L(t ), s 6= t ⇒ s ↔ t .
MF0910
2
21 de Dezembro de 2009
Capı́tulo IV
Secção: 1
Isto é (t )t≥0 seria um processo estocástico de variáveis iid, centradas e com a variância
igual à unidade. Pode mostrar-se que um processo satisfazendo estas condições não pode
ter funções mensuráveis como trajectórias (veja-se [Øksendal 98][p. 21]). É-se, assim,
levado a procurar uma outra interpretação ou modelo em tempo contı́nuo. Para tal,
recordemos que existe um processo estocástico (Wt )t∈[0,+∞[ , de variáveis gaussianas, com
trajectórias contı́nuas - o processo de Wiener, também denominado processo browniano
- e incrementos independentes. Esta última propriedade permite-nos tentar interpretar
a equação diferencial com ruı́do
dβt
= αβt + Θ(t) ,
dt
ou a fórmula aproximada por discretização
βt+∆t − βt
≈ αβt + Θ(t) ,
∆t
pela expressão seguinte
βt+∆t − βt ≈ αβt ((t + ∆t) − t) + θ(t)(Wt+∆t − Wt ) ,
de uma forma semelhante à que usámos para o modelo a tempo discreto. Considerando
agora,
0 = t0 ≤ t1 = (t0 + ∆t) ≤ t2 ≤ · · · ≤ tn−1 ≤ tn = t = (t0 + n∆t) ,
pode escrever-se por superposição de termos com a forma dada pela expressão anterior
que:
n−1
n−1
n−1
X
X
X
βt − β0 =
(βti+1 − βti ) =
αβti ∆t +
θ(t)(Wti+1 − Wti ) .
i=0
i=0
i=0
Passando ao limite quando ∆t tende para zero virá:
βt = β0 + lim
∆t→0
n−1
X
αβti ∆t +
i=0
n−1
X
!
θ(t)(Wti+1 − Wti )
.
i=0
Pn−1
αβti ∆t) pode ser interpretado - sob hipóteses
Pode observar-se que o termo lim∆t→0 ( i=0
de regularidade adequadas - como umP
integral de Riemann ou de Lebesgue mas o que
n−1
θ(t)(Wti+1 − Wti ) ? Se fosse possı́vel interé que se pode dizer do termo lim∆t→0 i=0
pretá-lo também como um integral poderı́amos ter um modelo, em tempo contı́nuo, para
o crescimento populacional na presença de ruı́do. A evolução dos efectivos da população
seria descrita pela fórmula,
Z t
Z t
βt = β0 + (Lebesgue)
αβ(u)du + (?)
θ(u)dWu ,
0
0
em notação integral ou, na notação diferencial associada naturalmente à notação integral,
dβt = αβt dt + θt dWt .
MF0910
3
Capı́tulo IV
Secção: 2
No que vai seguir-se estudaremos a noção de integral estocástico introduzida por K.
Ito1 em três artigos datados de 1944, 1946 e 1951 (veja-se [Itô] para uma apresentação
sintética dos trabalhos deste autor). Esta noção permitir-nos-á dar um sentido à expressão
Z t
θ(u)dWu ,
0
de tal modo que muitas aplicações úteis poderão ser estudadas em grande profundidade
com recurso a esta noção.
2 O Integral Estocástico de Ito
Seja (Ω, F, P) um espaço de probabilidade, G = (Gt )t∈R+ uma filtração sobre este espaço
de probabilidade.
Definição 1. Um processo B = (Bt )t∈R+ , com trajectórias contı́nuas, é um G
processo browniano se e só se:
1. B é G adaptado, isto é:
∀t ∈ R+ Bt ∈ mGt ;
2. Os incrementos de B são G independentes, isto é:
i
∀s, t ∈ R+ s ≤ t ⇒ (Bt − Bs ) ↔ Gs ;
3. Os incrementos de B são estacionários, isto é:
∀s, t ∈ R+ s ≤ t ⇒ L(Bt − Bs ) ≡ L(Bt−s − B0 ) .
Exemplo 1. O principal exemplo de processo browniano que devemos ter presente no
que vai seguir-se é o do processo browniano usual relativamente à sua filtração natural.
Definição 2. F = (Ft )t∈R+ , a filtração natural associada ao processo
browniano B é, por definição:
∀t ∈ R+ Ft := σ({Bs : s ≤ t})∼ .
Trata-se da filtração formada pelas σ álgebras Ft , geradas em cada instante t pelas variáveis aleatórias Bs em que s ≤ t, completadas relativamente aos conjuntos de
probabilidade nula. Assim sendo, em cada uma das σ álgebras Ft todos os conjuntos P
desprezáveis pertencem a Ft e têm probabilidade nula.
1
Kiyosi Itô, matemático japonês nascido em 1915.
MF0910
4
Capı́tulo IV
Secção: 2
Exercı́cio 2. Mostre que se B é um G processo browniano então B é um F processo browniano, isto é,
B é um processo browniano relativamente à sua filtração natural F.
Consideramos seguidamente a definição de um espaço de processos relevante para
o integral estocástico. Trata-se de definir uma classe de processos que podem ser integrados relativamente ao processo browniano tendo o integral estocástico resultante boas
propriedades.
Definição 3. Seja (Ω, F, P) um espaço de probabilidade completo. Para S, T ∈
R+ , S < T e para H filtração sobre (Ω, F, P), o espaço N([S, T ], H) é o espaço dos
processos estocásticos Ψ = (ψt )t∈R+ que verificam as três condições seguintes.
1. Os processos Ψ são mensuráveis relativamente à álgebra σ produto
B([0, +∞) ⊗ F.
2. Os processos Ψ são adaptados relativamente a H = (Ht )t≥0 , isto é, são
tais que
∀t ≥ 0, ψt ∈ mHt .
3. Os processos Ψ verificam a condição de integrabilidade local:
Z T
2
ψt dt < +∞ .
E
S
Definição 4. Por definição temos ainda o espaço de processos localmente integráveis:
\
N(H) :=
N([S, T ], H) .
S,T ∈R+ ,S<T
Numa primeira etapa da definição do integral de Ito consideraremos que as funções
integrandas pertencem ao espaço N(F) em que F é a filtração associada ao processo G
browniano definido acima.
Para futura comodidade na escrita é conveniente precisar a seguinte notação relativa
aos processos mensuráveis localmente de quadrado integrável relativamente à medida
produto natural.
Definição 5. Sejam S, T ∈ R+ tais que S < T e seja L2[S,T ] (λ ⊗ P) o espaço dos
processos estocásticos
Ψi= (ψt )t∈R+ , mensuráveis relativamente a B([0, +∞[) ⊗
hR
T 2
F e tais que E S ψt dt < +∞.
Exercı́cio 3. Mostre que N([S, T ], H) é um subespaço vectorial de L2[S,T ] (λ ⊗ P).
MF0910
5
Capı́tulo IV
Secção: 2
Observação 1. Note que se definir para Ψ = (ψt )t∈R+ ∈ L2[S,T ] (λ ⊗ P), a norma de Ψ
como
Z T
1/2
2
|| Ψ ||L2 (λ⊗P) := E
ψt dt
,
[S,T ]
S
se tem que
L2[S,T ] (λ ⊗ P), || · ||L2
[S,T ]
(λ⊗P)
,
é um espaço de Banach, isto é um espaço vectorial normado completo (veja-se [Williams][p.
65]).
Definição 6. Seja G = (Gt )t∈R+ uma filtração. Chamamos função Gelementar a toda a função que se possa representar sob a forma:
φn (t, ω) =
+∞
X
ej (ω) I[j2−n ,(j+1)2−n [ (t) ,
j=0
em que n ∈ N∗ , ej (ω) ∈ mGj2−n e ej (ω) ∈ L2 (P).
Uma representação gráfica de uma função elementar mostra-nos que estas funções
são funções em escada cujos degraus são variáveis aleatórias. Com uns segundos de
reflexão esta imagem permite uma justificação intuitiva da propriedade seguinte.
Proposição 1. As funções G-elementares pertencem ao espaço N(G).
Demonstração. Seja S, T ∈ R+ , S < T . É imediato verificar que as funções elementares definem processos estocásticos bastando para esse efeito aplicar as propriedades
das funções mensuráveis e o teorema de Fubini. Para verificar que as funções elementares são processos estocásticos adaptados seja t0 ∈ R+ qualquer. Dado que a famı́lia
([i2−n , (i + 1)2−n [)i∈N forma uma partição de R+ , existe i = i(t0 ) ∈ N, único, tal que
t0 ∈ [i(t0 )2−n , (i(t0 ) + 1)2−n [. Como i(t0 )2−n ≤ t0 e por isso Gi(t0 )2−n ⊂ Gt0 :
φn (t0 , ω) = ei(t0 ) (ω) ∈ mGt0 .
MF0910
6
Capı́tulo IV
Secção: 2
Para verificar a propriedade de integrabilidade tem-se então que:
Z
E
T
φ2n (t, ω) dt =
S



! 
Z T X
+∞
+∞
X

= E
ej I[j2−n ,(j+1)2−n [ (t)
ei I[i2−n ,(i+1)2−n [ (t) dt =
S

Z
= E
T
j=0

T
=E
S
=
=
+∞
X
i=0
+∞
X
E[e2i ]
=
=
i=0
+∞
X


ej ej I[j2−n ,(j+1)2−n [∩[i2−n ,(i+1)2−n [ (t) dt =
j=0 i=0
+∞
X
!
e2i I[i2−n ,(i+1)2−n [ (t)
#
dt =
i=0
Z
T
(4)
I[i2−n ,(i+1)2−n [ (t) dt =
S
E[e2i ]
Z
E[e2i ]
Z
i=0
+∞
X
+∞ X
+∞
X

S
"Z
i=0
+∞
I[S,T ]∩[i2−n ,(i+1)2−n [ (t) dt =
−∞
+∞
I[sup(S,i2−n ),inf(T,(i+1)2−n [) (t)) dt =
−∞
E[e2i ] sup(inf(T, (i + 1)2−n ), sup(S, i2−n )) − sup(S, i2−n ) .
i=0
=
+∞
X
E[e2i ] (T ∧ (i + 1)2−n ) ∨ (S ∨ i2−n )) − (S ∨ i2−n ) .
i=0
Na última soma acima só não são nulas as parcelas em que [i2−n , (i + 1)2−n [∩[S, T ] 6= ∅
(verificar!). Trata-se pois de uma soma finita de parcelas que são limitadas, logo é uma
quantidade limitada.
O exercı́cio seguinte mostra que a cada processo estocástico adaptado é possı́vel
associar uma sucessão natural de funções elementares. Veremos adiante que esta sucessão
tem boas propriedades de aproximação.
Exercı́cio 4. Seja Y = (Yt )t∈[0,+∞[ um processo estocástico adaptado a uma dada filtração G e tal que,
para cada t ∈ [0, +∞[, a variável aleatória Yt é de quadrado integrável. Mostre que:
Yen (t, ω) :=
+∞
X
Yj 2−n (ω)I[j 2−n ,(j+1) 2−n [ (t)
j=0
é uma função G elementar.
MF0910
7
Capı́tulo IV
Secção: 2
2.1 O integral de Ito das funções elementares
Seja G = (Gt )t≥0 uma filtração sobre um espaço de probabilidade completo (Ω, F, P).
Considere-se, B = (Bt )t≥0 um G processo browniano. De acordo com o exercı́cio 2, B é
um F processo browniano relativamente à sua filtração natural dada pela definição 2.
Definição 7. Um processo browniano B = (Bt )t≥0 diz-se standard se:
B0 = 0, E[Bt ] = 0, E[Bt2 ] = t .
Salvo aviso em contrário, supomos que os processos brownianos que consideraremos
em seguida, são standard. Vamos procurar dar um sentido à expressão
Z
T
f (t, ω)dBt (ω) ,
S
quando f pertence ao espaço de processos estocásticos N(G). Para tal começamos por
definir o integral de Ito das funções G elementares.
Para se ter uma definição de integral estocástico que seja um operador linear com
propriedades calculatórias naturais pode propor-se que seja válida a cadeia de igualdades
seguinte.
Z
T
Z
+∞
I[j2−n ,(j+1)2−n [ (t)dBt (ω) =
I[S,T ]∩[j2−n ,(j+1)2−n [ (t)dBt (ω) =
−∞
S
Z
+∞
=
I[sup(S,j2−n ),inf(T,(j+1)2−n )[ (t)dBt (ω) =
−∞
(
BT ∧(j+1)2−n − BS∨j2−n
=
0
se [S ∨ j2−n , T ∧ (j + 1)2−n [6= ∅
no caso contrário
= B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n
Observação 2. O leitor é convidado a verificar que se tem:
B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n =


B(j+1)2−n ∨S − Bj2−n = 0





B(j+1)2−n ∨S − BS = B(j+1)2−n − BS
= BT ∨j2−n − Bj2−n = BT − Bj2−n



B(j+1)2−n ∨j2−n − Bj2−n = B(j+1)2−n − Bj2−n




BT ∨j2−n − Bj2−n = 0
se
se
se
se
se
j2−n < (j + 1)2−n ≤ S
j2−n ≤ S ≤< (j + 1)2−n ≤ T
S ≤ j2−n ≤ T ≤< (j + 1)2−n
S ≤ j2−n < (j + 1)2−n ≤ T
T ≤ j2−n < (j + 1)2−n .
Em consequência pode sempre adoptar-se a notação prática seguinte (veja-se [Øksendal 98][p.
23]):

j · 2−n se S ≤ j2−n ≤ T

(n)
t j = tj = S
se j2−n < S


T
se j2−n > S
MF0910
8
Capı́tulo IV
Secção: 2
tendo-se, com esta notação, que
Z
T
I[j2−n ,(j+1)2−n [ (t)dBt (ω) = Btj+1 − Btj
S
Recomendamos fortemente ao leitor o uso desta notação. Tal faremos, por exemplo, em
algumas das demonstrações seguintes.
Atendendo mais uma vez à linearidade e continuidade que se pretende para o integral
estocástico sai naturalmente a definição seguinte.
Definição 8. Tem-se, por definição que o integral de Ito da função G
elementar φn , relativamente ao processo G browniano B, é:
Z
T
φn (t, ω)dBt (ω) :=
S
+∞
X
ej (ω) B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n =
j=0
=
+∞
X
(5)
ej (ω) Btj+1 − Btj
.
j=0
Observação 3. Note-se que a no membro à direita na definição acima figura uma variável
aleatória bem definida. Com efeito, por um argumento semelhante ao que foi já utilizado
acima a soma interveniente é uma soma finita.
Para obter a extensão do integral de Ito ao espaço de processos N(G) o resultado
seguinte é essencial.
Teorema 1 (Isometria de Ito). Seja φn uma qualquer função elementar limiRT
tada. Então S φn (t, ω)dBt (ω) o integral estocástico de φn relativamente ao
processo browniano é uma variável aleatória que pertence a L2 (P) e verifica-se:
Z T
Z T
2
2
E (
φn (t, ω)dBt (ω)) = E
φn (t, ω)dt ,
(6)
S
S
o que é equivalente, de acordo com as notações introduzidas no exercı́cio 3 e na
observação 1, a
Z
T
||
S
φn dBt ||L2 (P) =|| φn ||L2
[S,T ]
(λ⊗P)
.
(7)
Observação 4. Note-se que de acordo com o que se verificou na fórmula 4 o membro da
direita na igualdade 6 (ou na igualdade 7) é finito.
Demonstração. A demonstração decorre de um cálculo simples que utiliza apenas as
MF0910
9
Capı́tulo IV
Secção: 2
propriedades essenciais do processo browniano.
" Z
2 #
φn (t, ω)dBt (ω)
=(a)
T
E
S


+∞
X
= E 
ej (ω) (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n ) ×
j=0
+∞
X
×
!#
ei (ω) (B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n )
=(b)
i=0
=
+∞
X
E
ej (ω)ei (ω) (B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n ) ×
i<j
× B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n
+
+∞
X
E
+
B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n ×
j<i
× ej (ω)ei (ω) (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n +
+∞ h
X
2 i
+
E e2j (ω) (B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n
=(c)
i=j
=
=
+∞
X
i=0
+∞
X
E e2i (ω) E (B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n )2 =(d)
E e2j (ω) (T ∧ (i + 1)2−n ) ∨ (S ∨ i2−n ) − S ∨ i2−n ) =(e)
i=0
Z
T
=E
φ2n (t, ω)dt
S
As justificações para as igualdades são as seguintes.
(a) Substituição do integral estocástico pela expressão dada por definição em 5 e expressão geral para o quadrado de uma soma.
(b) Associação da soma sobre todos os pares de ı́ndices (i, j) ∈ N × N, segundo os três
casos i < j, j < i e i = j.
(c) Os dois primeiros termos da soma são nulos. Por exemplo, para o primeiro tem-se
que sendo i < j, vem que ti+1 ≤ tj , pelo que
ej (ω)ei (ω) (B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n )
é mensurável relativamente a Gtj ; como B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n é inMF0910
10
Capı́tulo IV
Secção: 2
dependente de Gtj tem-se que o primeiro termo da soma vale:
+∞
X
E ej (ω)ei (ω) (B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n ) ×
i<j
× E B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n = 0 ,
dado que E[B(T ∧(j+1)2−n )∨(S∨j2−n ) ] = E[BS∨j2−n ]. O mesmo tipo de argumento
pode ser dado para o segundo termo da soma. Por último, tem-se que ei é mensurável relativamente a Gti e B(T ∧(i+1)2−n )∨(S∨i2−n ) − BS∨i2−n é independente de
Gti .
(d) Uma vez que para s ≤ t se tem que E[(Bt − Bs )2 ] = t − s dado que o processo B
é standard.
(e) Pela expressão deduzida na sequência de fórmulas 4.
Observação 5. Considerando o operador linear IST , que a uma dada função elementar
φn associa o respectivo integral estocástico IST (φn ), a fórmula 7 pode interpretar-se da
seguinte forma.
|| IST (φn ) ||L2 (P) =|| φn ||L2 (λ⊗P) .
Isto significa que IST é uma isometria - isto é, um operador linear limitado que preserva
as distâncias - de N([S, T ], F) em L2 (P).
2.2 A extensão de um operador linear limitado
O exercı́cio seguinte que pode ser encarado como revisão de matérias estudadas noutra
disciplina, dá a ideia geral do processo a seguir para a definição do integral de Ito no
caso geral. A leitura é facultativa.
Exercı́cio 5. Sejam (E, || · ||E ) e (F, || · ||F ) dois espaços de Banach, D ⊂ E uma parte densa de E e
I uma aplicação de D em F linear e contı́nua.
1. Mostre que para z ∈ E existe (xn )n∈N sucessão de pontos de E convergente para z em E e que
(I(xn ))n∈N é uma sucessão de Cauchy em F .
˜ := limn→+∞ I(xn ) e que a aplicação I˜ assim definida é uma extensão
2. Mostre que pode definir I(z)
linear e contı́nua de I.
Resolução: Aconselha-se o leitor a tentar trabalhar o exercı́cio antes de estudar
esta resolução.
1. Seja (B(z, 1/n))n∈N∗ uma sucessão de bolas abertas centradas em z e de raio 1/n e,
para cada n, escolha-se um ponto xn ∈ B(z, 1/n) ∩ D que, por ser D denso em E,
existe certamente. A sucessão assim construı́da satisfaz o enunciado do exercı́cio
dado que por ser I linear contı́nua se tem para n e m arbitrários:
|| I(xn ) − I(xm ) ||F ≤||| I ||| · || xn − xm ||E .
MF0910
11
Capı́tulo IV
Secção: 2
Como a sucessão (xn )n∈N , por ser convergente é de Cauchy, a sucessão (I(xn ))n∈N
também é.
2. Sejam (x1n )n∈N e (x2n )n∈N duas sucessões de pontos de D convergentes para z
e I˜1 (z) := limn→+∞ I(x1n ) e I˜2 (z) := limm→+∞ I(x2m ) os respectivos limites.
Observe-se que:
|| I˜1 (z) − I˜2 (z) ||F =|| I˜1 (z) − I(x1n ) + I(x1n ) − (I˜2 (z) − I(x2n ) + I(x2n )) ||F ≤
≤|| I˜1 (z) − I(x1n ) ||F + || I˜2 (z) − I(x2n ) ||F + || I(x1n ) − I(x2n ) ||F .
Como limn→+∞ || I˜1 (z) − I(x1n ) ||F = 0 e limn→+∞ || I˜2 (z) − I(x2n ) ||F = 0 e se tem
que
|| I(x1n ) − I(x2n ) ||F ≤||| I ||| || x1n − x2n ||E ≤||| I |||
|| x1n − z ||E + || z − x2n ||E ,
e se tem naturalmente que limn→+∞ || x1n − z ||E = 0 e limn→+∞ || z − x2n ||E = 0
fica demonstrado que I˜ está bem definida. Com efeito, a imagem de I˜ num dado
ponto não depende da sucessão escolhida para a construir. Observe-se ainda que:
˜ ||F =|| lim I(xn ) ||F =
|| I(z)
n→+∞
= lim || I(xn ) ||F ≤||| I ||| ·
n→+∞
lim || xn ||E =
n→+∞
=||| I ||| · || z ||E ,
pelo que I˜ sendo limitada é contı́nua.
♦
2.3 O teorema de Ito
Considere-se, mais uma vez, G = (Gt )t≥0 uma filtração sobre um espaço de probabilidade
completo (Ω, F, P). e B = (Bt )t≥0 um G processo browniano standard. Relembremos
que, de acordo com o exercı́cio 2, B é um F processo browniano relativamente à sua
filtração natural que é, por definição, Ft := σ({Bs : s ≤ t})∼ .
MF0910
12
Capı́tulo IV
Secção: 2
Teorema 2 (Existência do Integral de Ito). Seja f ∈ N(F), e S, T ∈ R+ com
S < T.
1. Existe (φfn )n∈N uma sucessão de funções G elementares tal que:
Z
T
φfn (t, ω))2 dt
(f (t, ω) −
lim E
n→+∞
=0.
S
RT
2. Existe I = IST (f ) = S f (t, ω)dBt (t, ω) uma variável aleatória pertencente
a L2 (P), denominada integral de Ito de f relativamente ao processo
browniano dada por:
IST (f )
T
Z
T
Z
f (t, ω)dBt (ω) =L2 (P) lim
=
n→+∞ S
S
φfn (t, ω)dBt (ω) ,
tendo-se que I não depende da sucessão (φfn )n∈N .
3. Verifica-se ainda o resultado denominado isometria de Ito:
Z T
Z T
2
2
E (
f (t, ω)dBt (ω)) = E
f (t, ω)dt .
S
(8)
S
Demonstração. Suponhamos demonstrada a alı́nea (1) do enunciado. Seja então (φfn )n∈N
uma sucessão de funções G elementares tal que:
lim || f − φfn ||L2
n→+∞
[S,T ]
(λ⊗P) =
0.
Seja, para cada n ∈ N, a variável aleatória em L2 (P) definida por
Z
T
ψn :=
φn dBt .
S
Observe-se que a sucessão (ψn )n∈N é uma sucessão de Cauchy em L2 (P). Com efeito, por
aplicação do resultado relativo à isometria de Ito (fórmula 6) na igualdade assinalada
com o subı́ndice (a), tem-se que para m, n ∈ N:
|| ψn −
ψm ||2L2 (P)
Z
T
(φfn
=||
−
φfm )dBt
S
Z
||2L2 (P) =
T
=E
(φfn
−
φfm )2 dt
S
Z
E (
T
(φfn
−
φfm )dBt )2
=(a)
S
=|| φfn − φfn ||2L2
[S,T ]
(λ⊗P)
.
As hipóteses feitas sobre a sucessão (φfn )n∈N implicam que esta sucessão é de Cauchy em
L2[S,T ] (λ ⊗ P) uma vez que é convergente neste espaço. Em consequência verifica-se que:
lim
m,n→+∞
MF0910
|| ψn − ψm ||2L2 (P) =
lim
m,n→+∞
13
|| φfn − φfn ||2L2
[S,T ]
(λ⊗P) =
0,
Capı́tulo IV
Secção: 2
pelo que a sucessão (ψn )n∈N é de Cauchy em L2 (P). Como este espaço é completo existe
uma variável aleatória IST (f ) ∈ L2 (P) tal que a sucessão (ψn )n∈N converge para IST (f )
em L2 (P), isto é:
lim || IST (f ) − ψn ||L2 (P) = 0 ,
n→+∞
ou ainda, tal como se anunciou no enunciado,
" Z
T
φfn dt
f dBt −
lim E
n→+∞
T
Z
2 #
=0.
S
S
Para demonstrar a alı́nea 3 do enunciado basta observar que tendo:
|| IST (f ) ||L2 (P) =|| IST (f ) − ψn + ψn ||L2 (P) ≤|| IST (f ) − ψn ||L2 (P) + || ψn ||L2 (P)
e que limn→+∞ || IST (f ) − ψn ||L2 (P) = 0 e,
lim || ψn ||L2 (P) = lim || φn ||L2
n→+∞
n→+∞
f ||L2
(λ⊗P)
,
|≤|| f − φfn ||L2
(λ⊗P)
,
[S,T ]
(λ⊗P) =||
[S,T ]
uma vez que
| || f ||L2
[S,T ]
(λ⊗P)
− || φfn ||L2
[S,T ]
(λ⊗P)
[S,T ]
sai que:
|| IST (f ) ||L2 (P) ≤|| f ||L2
[S,T ]
(λ⊗P)
.
Para a desigualdade em sentido contrário observe-se do mesmo modo que,
|| IST (f ) ||L2 (P) =|| IST (f ) − ψn + ψn ||L2 (P) ≥| || IST (f ) − ψn ||L2 (P) − || ψn ||L2 (P) |
pelo que passando ao limite, com uma argumentação idêntica à já usada acima, se tem,
|| IST (f ) ||L2 (P) ≥|| f ||L2
[S,T ]
(λ⊗P)
.
Exercı́cio 6. Inspirando-se no exercı́cio 5, mostre que a definição do integral estocástico de f na demonstração acima não depende da sucessão aproximante (φfn )n∈N de funções elementares.
As propriedades do processo browniano utilizadas nas demonstrações acima mostram
que é possı́vel uma primeira extensão da noção de integral estocástico a um espaço de
processos ligeiramente mais geral.
MF0910
14
Capı́tulo IV
Secção: 3
Definição 9. Seja (Ω, F, P) um espaço de probabilidade completo e seja B =
(Bt )t≥0 um processo browniano standard sobre este espaço. Para S, T ∈ R+ ,
S < T e para H filtração sobre (Ω, F, P), o espaço O([S, T ], B, H) é o espaço dos
processos estocásticos Ψ = (ψt )t∈R+ que verificam as quatro condições seguintes.
1. O processo browniano standard B é uma H martingala.
2. Os processos Ψ são mensuráveis relativamente à álgebra σ produto
B([0, +∞) ⊗ F.
3. Os processos Ψ são adaptados relativamente a H = (Ht )t≥0 , isto é, são
tais que
∀t ≥ 0, ψt ∈ mHt .
4. Os processos Ψ verificam a condição de integrabilidade local:
Z T
2
E
ψt dt < +∞ .
(9)
S
Exercı́cio 7. Mostre que a construção do integral de Ito, que acabou de efectuar se mantem válida para
o espaço O([S, T ], B, H) de processos estocásticos definido acima.
Exercı́cio 8. Com as notações usadas no exercı́cio 4, supunha que Y = (Yt )t∈[0,+∞[ é um processo do
espaço N(F). Mostre que ((Yen )t )t≥0 é uma sucessão aproximante de Y = (Yt )t∈[0,+∞[ .
3 Propriedades do Integral de Ito
Uma primeira propriedade importante do integral de Ito verificada para processos suficientemente gerais é a de que o integral estocástico tem valor médio constante e nulo.
Teorema 3. Seja F a filtração natural associado ao processo browniano usual.
Seja N(F) o espaço dos processos localmente integráveis a relativamente à filtração F. Para f ∈ N(F) fixo, seja o processo (It )t≥0 dado para T > 0 por
Z
∀t ∈ [0, T ] It :=
t
fs dBs
0
Então E[It ] = 0.
a
MF0910
Segundo a definição 4.
15
Capı́tulo IV
Secção: 3
Demonstração. A prova decorre das propriedades do processo browniano. Consideremos
primeiramente uma função elementar φn (t, ω) qualquer.
T
Z
E


+∞
X
φn (t, ω)dBt (ω) = E 
ej (ω) (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n ) =(a)
S
=
+∞
X
j=0
E ej (ω) (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n ) =(b)
j=0
=
+∞
X
E E ej (ω) (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n ) | FS∨j2−n =(c)
j=0
=
+∞
X
E ej (ω)E (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n ) | FS∨j2−n =(d)
j=0
=
+∞
X
E ej (ω)E (B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n ) =(e) 0 .
j=0
Com as justificações seguintes.
(a) Apesar da indexação indicar o contrário, trata-se de uma soma finita pelo que a
esperança da soma é a soma das esperanças sem necessidade de qualquer hipótese
adicional.
(b) Pela propriedade da tower law das esperanças condicionais.
(c) Pelas propriedades da esperança condicional e dado que ej ∈ mFj2−n e, naturalmente, Fj2−n ⊆ FS∨j2−n
(d) Uma vez que B(T ∧(j+1)2−n )∨(S∨j2−n ) − BS∨j2−n é independente de FS∨j2−n , pelas
propriedades da esperança condicional.
(e) Dado que consideramos um processo browniano os incrementos têm média nula.
Para um processo f ∈ N(F) arbitrário, seja então (φfn )n∈N uma sucessão de funções G
elementares tal que:
lim || f − φfn ||L2 (λ⊗P) = 0 .
n→+∞
[S,T ]
o que implica de acordo com o teorema 2 que
" Z
2 #
Z t
t
lim E
f dBs −
φfn ds
=0.
n→+∞
0
0
No caso de f ser um processo limitado o resultado segue imediatamente em consequência
do teorema da convergência dominada de Lebesgue. No caso geral procede-se por truncatura.
MF0910
16
Capı́tulo IV
Secção: 4
Uma das propriedades mais importantes do integral de Ito é a que assegura que um
processo definido por um integral de Ito é modificável num processo com trajectórias
contı́nuas. Esta propriedade é muito semelhante à propriedade de continuidade do integral de Riemann função do limite superior de integração.
Teorema 4. Com as mesmas notações do teorema 3, (It )t≥0 é um processo
que admite uma versão com trajectórias contı́nuas, isto é, existe (Jt )t≥0 tal que
quase certamente em ω ∈ Ω, J· (ω)é uma função contı́nua (na variável t ∈ [0, T ])
e tal que:
∀t ∈ [0, T ] P [Jt = It ] = 1 .
Demonstração. A demonstração deste teorema não é muito complicada embora seja
tecnicamente exigente numa primeira aproximação.
Uma segunda propriedade importantes do integral de Ito é a que descreve o carácter
de martingala de um processo definido por um integral de Ito.
Teorema 5. Com as mesmas notações do teorema anterior tem-se que (It )t≥0
é uma F-martingala e verifica-se por isso a desigualdade de Doob:
"
#
Z T
1
2
fs ds .
∀λ > 0 ∀t ∈ [0, T ] P sup |It | ≥ λ ≤ 2 P
λ
0≤t≤T
0
Demonstração. A demonstração deste resultado que reproduzimos seguidamente é simples e esclarecedora (veja-se [Itô][p. 186]). Seja T fixo qualquer. Seja (φfn )n∈N uma
sucessão de funções elementares, de acordo com a alı́nea 1 do teorema 2, aproximante
de f isto é tal que:
lim f − φfn 2
=0.
(10)
n→+∞
L[0,T ] (λ⊗P)
Rt
Definindo os integrais estocásticos das funções aproximantes I(n)t := 0 (φfn )s dBs , temse pelo teorema da construção do integral de Ito 2.3 que para cada t fixo se verifica
limn→+∞ kIt − I(n)t kL2 = 0. Pelas propriedades da esperança condicional tem-se, para
P
s > t fixos e para todo o n ≥ 1, que:
E[Is | Ft ] = E[Is − I(n)s + I(n)s | Ft ] = E[Is − I(n)s | Ft ] + E[I(n)s | Ft ] =
= E[Is − I(n)s | Ft ] + I(n)t .
Uma vez que pelos teoremas de convergência da esperança condicional se verifica que
limn→+∞ E[Is − I(n)s | Ft ] =L2 0 e que limn→+∞ I(n)t =L2 It , o resultado anunciado no
P
P
teorema sai verificado.
MF0910
17
Capı́tulo IV
Secção: 4
4 A fórmula de Ito
Definição 10. Um processo estocástico (Xt )t≥0 é um processo de Ito se e só
se admite uma representação na forma
Z t
Z t
Xt = X0 +
us ds +
vs dBs
0
0
ou na representação diferencial usual:
dXt = ut dt + vt dBt
em que se tem que (vt )t≥0 ∈ N(F) e (ut )t≥0 é tal que para cada t se tem
Z t
P
|us | ds < +∞ ∀t ≥ 0 = 1 .
0
Observação 6. Podem considerar-se como processos de Ito os processos em que se verifica
apenas que:
Z t
P
vs2 ds < +∞ ∀t ≥ 0 = 1 .
0
em vez da condição de integrabilidade local mais forte dada pela fórmula 9.
O teorema seguinte mostra-nos como aplicar as regras do cálculo diferencial próprias
à aproximação de Ito.
Teorema 6 (Fórmula de Ito I). Seja (Xt )t≥0 um processo de Ito admitindo a
representação
dXt = ut dt + vt dBt
Seja g ∈ C 2 ([0, +∞[×R) e para cada t ≥ 0,
Yt := g(t, Xt ) .
Então, para (Yt )t≥0 tem-se a denominada fórmula de Ito:
dYt =
∂g
∂g
1 ∂2g
(t, Xt )dt +
(t, Xt )dXt +
(t, Xt )(dXt )2
∂t
∂x
2 ∂x2
(11)
em que (dXt )2 = (ut dt + vt dBt )2 = vt2 dt com a tabela de multiplicação dada por
dt · dt = dt · dBt = dBt · dt = 0 dBt · dBt = dt .
(12)
Observação 7. Pode observar-se que os primeiros dois termos da fórmula 11 correspondem à diferencial usual. Para além destes dois termos surge um termo inesperado de
segunda ordem que resulta das propriedades especiais do processo browniano.
MF0910
18
Capı́tulo IV
Secção: 5
Demonstração. Um esquema geral da demonstração da fórmula de Ito pode ser estudado
na obra [Øksendal 98][p. 47]. As demonstrações rigorosas requerem o uso de técnicas de
processos estocásticos maia avançadas.
Corolário 1 (Fórmula de Ito II). Sob as hipóteses do teorema 6 tem-se ainda que (Yt )t≥0
admite a representação:
2
∂g
∂g
∂g
21 ∂ g
dYt =
(t, Xt ) dt + vt (t, Xt )dBt
(t, Xt ) + ut (t, Xt ) + vt
(13)
2
∂t
∂x
2 ∂x
∂x
sendo por isso também um processo de Ito.
Demonstração. A fórmula 13 resulta da fórmula 11 aplicando a tabela de multiplicação 12.
Observação 8. Para aplicar a fórmula de Ito, quer na diferenciação quer na integração,
deverá ter-se presente a seguinte metodologia geral.
1. Identificar exactamente o processo correspondente a (Xt )t≥0 através da sua representação diferencial, isto é, indicar os processos (ut )t≥0 e (vt )t≥0 .
2. Identificar a função g que verifica Yt = g(t, Xt ).
3. Procure que as escolhas do processo (Xt )t≥0 e da função g não compliquem muito
os cálculos das derivadas parciais.
Rt
Exemplo 2. Determine-se 0 Bs dBs . Uma escolha natural é pôr: Xt = Bt e logo dXt =
dBt e g(t, x) = (1/2)x2 . Ter-se-á Yt = (1/2)Bt2 donde resulta por aplicação da fórmula
de Ito:
Z t
1
1 2
1
dYt = Bt dBt + dt ⇔ Bt =
Bs dBs + t .
2
2
2
0
Exemplo 3. Supondo que para t ≥ 0 se tem Yt = exp(σBt + µt) com µ ∈ R e σ ∈]o, +∞[,
diferenciando o processo pode mostrar-se que se trata de um processo de Ito. Com efeito
se for Xt = σBt + µt e logo dXt = σdBt + µdt e se g(t, x) = exp(x), tem-se pela fórmula
de Ito que:
1 2
dYt = Yt σdBt + µ + σ dt
2
5 Outras aplicações da fórmula de Ito
Nesta secção detalhamos algumas aplicações importantes da fórmula de Ito.
5.1 Cálculo de Esperanças Matemáticas
A fórmula de Ito tem uma aplicação natural em Matemática Financeira quando se
utiliza para o cálculo de valores esperados envolvendo o processo browniano (vejase [Björk 98][p. 40]). O método geral para determinar E[Y ] pode ser assim descrito.
MF0910
19
Capı́tulo IV
Secção: 5
1. Representar Y sob a forma Y = Zt0 em que Z é um processo estocástico de Ito,
segundo a definição 10.
2. Pela fórmula de Ito determinar os processos (µt )t≥0 e (σt )t≥0 tais que:
t
Z
Z
t
σs dBs
µs ds +
Zt = z0 +
0
0
Rt
3. Pelo teorema 3 uma vez que E[ 0 σs dBs ] tem-se que
Z
E[Y ] = E[Zt0 ] = z0 + E
t
t
Z
µs ds = z0 +
0
E [µs ] ds
0
se o processo (µt )t≥0 for suficientemente regular.
4. Sob reserva de ser possı́vel calcular E[µs ] ter-se-á a resposta ao problema da determinação do valor esperado desejado.
Alguns exercı́cios das aulas práticas tiram partido desta metodologia.
5.2 Difusões e Operadores
Seja um processo de Ito (Xt )t≥0 dado na sua forma diferencial por:
dXt = µ(Xt )dt + σ(Xt )dBt ,
sendo µ e σ funções reais de variável real regulares tais que o operador diferencial
Lµ,σ = µ(x)
d
1
d2
+ σ 2 (x) 2
dx 2
dx
está bem definido num espaço de funções não trivial
2
que denominaremos H.
Definição 11. Uma função φ ∈ H é uma função própria do operador Lµ,σ
se e só se
∃λ 6= 0 Lµ,σ (φ) = λφ
(14)
sendo λ o valor próprio associado à função própria φ.
2
Tipicamente será um subespaço do espaço das funções de quadrado integrável.
MF0910
20
Capı́tulo IV
Secção: 6
Proposição 2. Seja o processo Yt := e−λt φ(Xt ), definido para t ≥ 0 em que φ
é uma função própria de Lµ,σ .
1. Então (Yt )t>0 é um processo de Ito, mais concretamente,
dYt = e−λt φ0 (Xt )σ(Xt )dBt .
(15)
2. Sob a condição
Z
T
∀S, T ∈ [0, +∞[ E
2 φ (Xt )σ(Xt ) dt < +∞ ,
−λt 0
e
S
o processo (Yt )t>0 é uma martingala.
Demonstração. A demonstração da fórmula 15 faz-se por aplicação imediata da fórmula
de Ito usando a relação dada pela fórmula 14 .
Observação 9. O problema da determinação das funções e valores próprios do operador
Lµ,σ (φ) pode fazer-se usando a teoria de Sturm-Liouville. Com efeito, uma estratégia
geral para colocar a equação diferencial
1
µ(x)y 0 (x) + σ 2 (x)y 00 = λy
2
na forma de um operador de Sturm-Liouville consiste
em dividir a equação por σ 2 (x)/2,
Rx
2 (t)dt
2µ(t)/σ
multiplicando pelo factor integrante p(x) := e
e efectuar as operações de
forma a colocar a equação na forma:
d
d
p(x) y(x) + (q(x) − λρ(x))y(x) = 0 ,
dx
dx
(com q(x) = 0) e ρ(x) = (2/σ 2 (x))p(x)) forma esta que pode ser tratada usando a teoria
geral dos operadores de Sturm-Liouville (veja-se por exemplo, [Zettl 05]).
6 Sobre as referências bibliográficas
O leitor poderá tirar enorme proveito da consulta das referências bibliográficas clássicas
sobre o integral estocástico. O estudo do cálculo estocástico em toda a profundidade
requer algum domı́nio da teoria moderna dos processos estocásticos, em particular, do
processo browniano. Apresentamos seguidamente alguns comentários sobre a bibliografia
referida com vista a encorajar leituras adicionais.
1. [Björk 98] mostra o que é preciso saber de cálculo estocástico para entender a
matemática financeira moderna.
2. [Øksendal 98] é a leitura recomendada para uma primeira aproximação.
MF0910
21
Capı́tulo IV
Secção: 7
3. [Karatzas 91] é recomendado para um estudo completo e profundo.
4. [Lamberton 96] é uma aproximação expedita e eficaz para quem pretende utilizar o cálculo estocástico na matemática financeira. a secção sobre as equações
diferenciais estocásticas é particularmente recomendada.
5. [Chung et al 90] e [Protter 90] são adequados para quem deseje uma aproximação
mais geral à integração estocástica.
6. [Durrett 96] estabelece a ligação às equações nas derivadas parciais.
7. [Klebaner 98] tem aplicações do cálculo estocástico à Biologia e à Engenharia e à
Fı́sica.
7 Exercı́cios
7.1 Generalidades
Exercı́cio 9. Sendo W = (Wt )t≥0 o processo de Wiener, mostre que:
ˆ
˜
1. E [Wt ] = 0, E Wt2 = t, ∀t ≥ 0.
2. E [Wt Ws ] = min(t, s), ∀t, s ≥ 0.
ˆ
˜
3. E (Wt − Ws )2 = t − s, t ≥ s.
ft = Wt0 +t − Wt0
Exercı́cio 10. Sejam W = (Wt )t≥0 o processo de Wiener e t0 ≥ 0 fixo. Prove que W
é um processo de Wiener.
Exercı́cio 11. Seja Bt um processo de Wiener em R tal que B0 = 0
1. Mostre, usando propriedades conhecidas, que:
1
∀u ∈ R E[eiuBt ] = exp(− u2 t) .
2
2. Usando o desenvolvimento de Taylor da função exponencial nos dois membros da igualdade acima,
compare os termos com a mesma potência em u e deduza que:
E[Bt4 ] = 3t2
e, mais geralmente que:
∀k ∈ N E[Bt2k ] =
(2k)! k
t .
2k k!
3. Uma outra justificação do resultado anterior é a seguinte. Mostre que:
Z
1
x2
E[f (Bt )] = √
f (x) exp(− )dx ,
2t
2πt R
para todas as funções f tais que o integral à direita converge. Aplique então este resultado à
função f (x) = x2k e use integração por partes e indução em k.
MF0910
22
Capı́tulo IV
Secção: 7
7.2 Integral de Ito, Tempos de Paragem e Martingalas
Exercı́cio 12. Mostre que com Bt o processo browniano e considerando B0 = 0. Então
Z t
1
1
Bs dBs = Bt2 − t.
2
2
0
Exercı́cio 13. Mostre directamente usando a definição do integral de Ito que:
Z t
Z t
sdBs = tBt −
Bs ds .
0
0
Indicação: Considere que B0 = 0 e que:
X
X
X
∆(sj Bj ) =
sj ∆(Bj ) +
Bj+1 ∆(sj ) .
j
j
j
Exercı́cio 14. Mostre directamente usando a definição do integral de Ito que:
Z t
Z t
1
Bs2 dBs = Bt3 −
Bs ds .
3
0
0
Indicação: Considere que B0 = 0.
Exercı́cio 15. Seja X = (Xt )t∈[0,+∞[ um processo estocástico e seja HtX = Ht para t ∈ [0, +∞[, a
σ-álgebra gerada pela famı́lia de variáveis aleatórias {Xt : 0 ≤ s ≤ t}. Isto é, HX = (Ht )t∈[0,+∞[ é a
filtração associada ao processo estocástico X.
1. Mostre que se X é uma martingala relativamente a uma dada filtração N = (Nt )t∈[0,+∞[ então X
é também uma martingala relativamente à filtração que lhe está associada HX .
2. Mostre que se X é uma martingala relativamente a HX então:
∀t ∈ [0, +∞[ E[Xt ] = E[X0 ] .
Exercı́cio 16. Mostre que o processo de Wiener W = (Wt )t≥0 é uma martingala com respeito à filtração
Ft = σ ({Ws ; s ≤ t}) .
Exercı́cio 17. Verifique quais os processos seguintes são ou não martingalas:
1.
Xt = Bt + 4t ,
2.
Xt = Bt2 ,
3.
Xt = t2 Bt − 2
Z
t
sBs ds ,
0
4.
Xt = Bti × Btii ,
onde Bti e Btii são processos brownianos independentes.
Exercı́cio 18. Mostre directamente que:
Mt = Bt2 − t ,
é uma martingala relativamente à filtração do processo browniano.
MF0910
23
Capı́tulo IV
Secção: 7
Exercı́cio 19. Mostre que:
Mt = Bt3 − 3tBt ,
é uma martingala relativamente à filtração do processo browniano.
Exercı́cio 20. Seja ∆ = {s(1), s(2), . . . s(n)} uma subdivisão do intervalo [t, u] em R+ isto é, tal que:
t = s(1) < s(2) < · · · < s(n) = u. Seja δ(∆) o passo da subdivisão ∆ definido por:
δ(∆) =
|s(i + 1) − s(i)| .
sup
1≤i≤n−1
Seja r2 (∆) a variação quadrática do processo browniano em ∆ dada por:
r2 (∆) =
n−1
X
(Bs(i+1) − Bs(i) )2 .
i=1
Seja r1 (∆) a variação (simples) do processo browniano em ∆ dada por:
r1 (∆) =
n−1
X
|Bs(i+1) − Bs(i) | .
i=1
1. Mostre que E[r2 (∆)] = u − t .
P
2
2
2. Mostre que E[(r2 (∆))2 ] = 2 n−1
i=1 (s(i + 1) − s(i)) + (u − t) .
Indicações: Poderá usar que:
• E[(Bs(i+1) − Bs(i) )4 ] = 3(s(i + 1) − s(i))2 .
• Os incrementos do processo browniano são independentes.
3. Mostre que E[(r2 (∆) − (u − t))2 ] = E[(r2 (∆))2 ] − (u − t)2 e conclua que em L2 (P):
lim r2 (∆) = u − t .
δ(∆)→0
4. Mostre que existe uma sucessão de partições (∆n )n∈N tal que, salvo talvez num conjunnto de
probabilidade nula:
lim r2 (∆n ) = u − t .
n→+∞
2
Indicação: A convergência em L (P) implica a existência de uma sucessão convergente salvo talvez
num conjunnto de probabilidade nula.
5. Mostre que se ∆n = {s(1, n), s(2, n), . . . s(k(n), n)} com u = s(1, n) < · · · < s(k(n), n) = t então:
k(n)
sup r1 (∆) ≥
∆
X
Pk(n)
|Bs(i+1,n) − Bs(i,n) | ≥
i=1
|Bs(i+1,n) − Bs(i,n) |2
.
sup1≤i≤k(n) |Bs(i+1,n) − Bs(i,n) |
i=1
6. Conclua que salvo talvez num conjunto de probabilidade nula:
sup r1 (∆) = sup
∆
∆
n−1
X
|Bs(i+1) − Bs(i) | = +∞ .
i=1
Exercı́cio 21. Mostre que qualquer função constante não negativa é um stopping time.
Exercı́cio 22. Mostre que se T é um stopping time de (Ft )t≥0 então para
∀t ≥ 0{T < t} ∈ Ft .
MF0910
24
Capı́tulo IV
Secção: 7
Exercı́cio 23. Se T é um stopping time e a > 0 uma constante então T + a é um stopping time.
Exercı́cio 24. Mostre que se T e S são stopping times então também o são
T ∧ S e T ∨ S.
Exercı́cio 25. Prove que FT é uma σ−álgebra e que T é FT −mensurável. Mostre que se ∀ω ∈
Ω T (ω) = a para a ≥ 0 constante, então FT = Fa
Exercı́cio 26. Mostre que para quaisquer dois stopping times T e S e para qualquer A ∈ FS , temos
A ∩ {S ≤ T } ∈ FT . Em particular, se S ≤ T em Ω então FS ⊆ FT .
Exercı́cio 27. Dados S e T stopping times. Mostre que FT ∧S = FT ∩ FS .
Exercı́cio 28. Sejam Bt o processo browniano, ∆tk = tk+1 − tk e ∆Bk = Btk+1 − Btk com 0 = t0 <
t1 < . . . < tn = t. Mostre que
!2 #
" n
n
X
X
E
(∆Bk )2 − t
=2
(∆tk )2
k=1
k=1
e conclua que
n
X
(∆Bk )2 → t quando ∆tk → 0 (n → ∞)
k=1
em L .
2
7.3 Fórmula de Ito
Exercı́cio 29. Use a fórmula de Ito para escrever os seguintes processos estocásticos na forma diferencial
habitual:
dXt = u(t, ω)dt + v(t, ω)dBt .
1. Xt = (Bt )2 .
2. Xt = 2 + t + exp(Bt ).
Exercı́cio 30. Use a fórmula de Ito para demonstrar que:
Z t
Z t
1
Bs2 dBs = Bt3 −
Bt ds, B0 = 0.
3
0
0
Exercı́cio 31. Sejam Xt e Yt dois processos de Ito dados na forma diferencial habitual por:
dXt = σ(t, ω)dt + µ(t, ω)dBt , dYt = ρ(t, ω)dt + ν(t, ω)dBt .
Mostre usando a fórmula de Ito e o facto
Xt Yt =
1
((Xt + Yt )2 − Xt2 − Yt2 ) ,
2
que:
d(Xt Yt ) = Xt dYt + Yt dXt + µ(t, ω)ν(t, ω)dt .
MF0910
25
Capı́tulo IV
Secção: 7
Exercı́cio 32. Sejam Xt e Yt dois processos de Ito. Mostre que
d(Xt Yt ) = Xt dYt + Yt dXt + dXt dYt
e conclua com a seguinte fórmula de integração por partes:
Z t
Z t
Z
Xs dYs = Xt Yt − X0 Y0 −
Ys dXs −
0
0
t
dXs dYs .
0
Exercı́cio 33. Seja θ(t, ω) ∈ N([0, T ]) onde N([0, T ]) é o espaço das funções integrandas para as quais
o integral de Ito foi definido inicialmente. Seja para t ∈ [0, T ]:
Z t
Z
1 t 2
θ(s, ω)dBs −
Zt = exp(
θ (s, ω)ds) .
2 0
0
1. Use a fórmula de Ito para mostrar que dZt = Zt θ(t, ω)dBt .
2. Conclua que Zt é uma martingala para t ∈ [0, T ] se se verificar que Zt θ(t, ω) ∈ N([0, T ]).
Exercı́cio 34.
1. Para c e α constantes seja Xt = exp(ct + αBt ). Mostre que:
dXt = (c +
1 2
α )Xt dt + αXt dBt .
2
2. Para c e α1 , . . . , αn constantes e (Bti )i∈{1,...,n} famı́lia de n processos brownianos independentes
seja:
n
X
Xt = exp(ct +
αi Bti )
i=1
Mostre que:
dXt = (c +
n
n
X
1X 2
αi )Xt dt + Xt (
αi dBti ) .
2 i=1
i=1
Exercı́cio 35. Seja Xt um integral de Ito dXt = v(t, ω)dBt .
1. Dê um exemplo que mostre que Xt2 não é em geral uma martingala.
2. Mostre que
Mt = Xt2 −
Z
t
|v(s, ω)|2 ds ,
0
é uma martingala.
Exercı́cio 36. Sejam Bt1 e Bt2 dois processos brownianos independentes. Escreva na forma diferencial
o processo bidimensional definido por:
`
´ `
´
Zt = Zt1 , Zt2 = Bt1 Bt2 , exp(Bt1 )Bt2 .
Exercı́cio 37. Suponha-se que Xt satisfaz a equação
dXt = αXt dt + σXt dWt
e que Yt satisfaz a equação
dYt = γYt dt + δYt dVt ,
onde V é um processo de Wiener independente de W . Defina-se Z por Z = XY e obtenha o desenvolvimento diferencial de Z.
Nota: Se X descreve o processo do preço de uma acção da IBM em dólares e Y a taxa de conversão
escudos/dólares então Z descreve a dinamica do preço da acção da IBM em escudos.
MF0910
26
Capı́tulo IV
Secção: 7
Exercı́cio 38. Seja Xt o processo solução da equação:

dXt = (αXt + β) dt + (σXt + ρ) dWt
X0
=0
`
´
Façamos St = exp( α − σ 2 /2 t + σWt ).
1. Escreva a equação diferencial que St−1 satisfaz.
`
´
2. Prove que d Xt St−1 = St−1 ((β − σρ)dt + ρdWt ).
3. Obtenha a representação explicita de Xt .
Exercı́cio 39. O processo de Ornstein-Ulhenbeck é a solução da equação:

dXt = −cXt dt + σdBt
X0
= x0
1. Mostre que Xt = x0 e−ct + σe−ct
Rt
0
ecs dBs .
2. Calcule E [Xt ] e V [Xt ].
Indicação: Aplique a fórmula de Ito à função f (t, Xt ) = Xt exp(ct).
Exercı́cio 40. O movimento browniano geométrico é a solução da equação:

X0
= x0
“
”
2
1. Mostre que Xt = x0 exp( α − σ2 t + σWt ).
2. Mostre que E [Xt ] = x0 exp(αt).
Indicação: Aplique a fórmula de Ito à função f (t, Xt ) = ln(Xt ).
Exercı́cio 41. Mostre que o processo exp(Wt − (1/2)t) é a solução da equação:

dXt = Xt dWt
X0
=1
Indicação: Aplique a fórmula de Ito à função f (t, x) = exp(x − (1/2)t).
Exercı́cio 42. Mostre que o processo exp(2Wt − t) é a solução da equação:

dXt = Xt dt + 2Xt dWt
X0
=1
Indicação: Aplique a fórmula de Ito a uma função f (t, x) escolhida adequadamente.
Exercı́cio 43. Suponha que o processo Xt é a solução da equação:

X0
=1
Considere o processo Yt = Xtβ . Determine a equação diferencial estocástica satisfeita por Yt .
MF0910
27
Capı́tulo IV
Secção: 7
7.4 O Modelo de Black-Scholes
Exercı́cio 44 (Paridade put-call). Considere uma carteira contendo três posições relativas ao mesmo
activo, nomeadamente uma acção com o preço S, uma opção put com valor Vp e uma posição curta
numa opção call com valor Vc .
1. Admitindo que ambas as opções têm a mesma data de exercı́cio T , que não há dividendos, que o
mercado é livre de arbitragem e que não há custos de transacção mostre directamente que:
∀t ∈ [0, T ] S + Vp − Vc = KE −r(T −t)
em que K é o preço de exercı́cio (strike price) e r é a taxa de juro sem risco.
2. Mostre usando as fórmulas de Black-Scholes para as opções put e call que a fórmula da paridade
put-call é satisfeita.
Exercı́cio 45 (Volatilidade implı́cita). Considere a fórmula de apreçamento de Black-Scholes para um
derivado X representada na forma Π(t, X) = f (St , t, T, K, r, σ) com as notações habituais. Suponha que
para uma certa escolha St , t, T, K, r conhece Π(t, X).
1. Mostre que é possı́vel determinar σ = σ((St , t, T, K, r) de forma a que se verifique a fórmula de
Black-Scholes.
2. Considere t, T, r fixos. Usando dados reais para, pelo menos, dois activos distintos do mesmo
mercado, para pelo menos cinco valores distintos de K e para os correspondentes preços dos
activos determine as volatilidades σ = σ((St , t, T, K, r) de forma a que se verifique a fórmula de
Black-Scholes.
3. Represente graficamente, para cada activo, σ em função de K e compare os gráficos entre si e
com as hipóteses que assumiu no modelo dede Black-Scholes.
Exercı́cio 46. Considere que no modelo de Black-Scholes a evolução dos preços dos activos é dada pelas
equações:
dSt = µSt dt + σSt dBt ,
dβt = rβt dt
onde (Bt )t∈R+ é um processo browniano usual.
1- Mostre que:
(2.1)
St+∆t = St exp(σ(Bt+∆t − Bt ) + (µ − 12 σ 2 )∆t)
e conclua que os retornos logarı́tmicos do activo em questão são normais com média e variância definidas.
2- Usando a fórmula (2.1) mostre que:
µ−
E[ln(St+∆t /St )]
1 2
σ =
,
2
∆t
σ2 =
V[ln(St+∆t /St )]
∆t
onde E[X] e V[X] representam a média e a variância da variável aleatória X.
3- Considere os seguintes dados para a evolução dos preços (St )t∈{0,...,11} em que os preços são dados
mensalmente.
t
St
t
St
0
6 900
6
6 021
1
6 710
7
5 536
2
6 535
8
5 419
3
6 281
9
5 641
4
6 232
10
5 380
5
6 098
11
5 216
Determine µ e σ.
4- Determine o preço de uma call option europeia, no instante t = 11 sobre o activo representado por St ,
com taxa nominal de 3,6% ao ano, maturidade de 3 meses e preço de Execı́cio de 5 500.
MF0910
28
Capı́tulo IV
Secção: 7
Exercı́cio 47. Para c e α constantes, seja Xt = exp (ct + αBt ). Use a fórmula de Ito para mostrar que
«
„
1
dXt = c + α2 Xt dt + αXt dBt
2
equações:
dβt = rβt dt
1- Mostre que:
(2.1)
µ−
E[ln(St+∆t /St )]
1 2
σ =
,
2
∆t
σ2 =
V[ln(St+∆t /St )]
∆t
mensalmente.
t
St
t
St
0
3 478
6
4 065
1
3 587
7
4 154
2
3 760
8
4 187
3
3 613
9
4 357
4
3 690
10
4 473
5
4 014
11
4 600
Determine µ e σ.
4- Determine o preço de uma put option europeia, no instante t = 11 sobre o activo representado por St ,
com taxa nominal de 3,6% ao ano, maturidade de 4 meses e preço de Execı́cio de 4 500.
equações:
dβt = rβt dt
1- Mostre que:
(2.1)
µ−
E[ln(St+∆t /St )]
1 2
σ =
,
2
∆t
σ2 =
V[ln(St+∆t /St )]
∆t
mensalmente.
t
St
t
St
MF0910
0
6 900
6
6 021
1
6 710
7
5 536
2
6 535
8
5 419
29
3
6 281
9
5 641
4
6 232
10
5 380
5
6 098
11
5 216
Capı́tulo IV
Secção: 7
Determine µ e σ.
4- Usando a fórmula de Black-Scholes determine uma volatilidade implı́cita para a qual a fórmula de
apreçamento de uma Call Option europeia dá um preço de 4, dado que o preço do activo subjacente
é 45, o preço de Execı́cio é 50, a taxa de juro sem risco mensal é 0.4% e que a maturidade é 3 meses.
Sugestão: Poderá usar uma interpolação linear.
Referências
[Bass 1995] Bass, R. F. (1995 )Probabilistic Techniques in Analysis. Springer Verlag.
[Bass 1998] Bass, R. F. (1998) Diffusions and Elliptic Operators. Springer Verlag.
[Bertoin] Bertoin, J. (1996) Lévy Processes. Cambridge University Press.
[Björk 98] Björk, T. (1998), Arbitrage Theory in Continuous Time, Oxford University
Press.
[Brzeźniak] Brzeźniak, Z.; Zastawniak, T. (1999) Basic Stochastic Processes. Springer
Verlag.
[Chung et al 90] Chung, K. L.; Williams R. J. (1990) Introduction to Stochastic Integration. Second Edition, Birkhäuser.
[Dacunha-Castelle (I)] Dacunha-Castelle, D.; Duflo, M. (1983) Probabilités et Statistiques. Volume I, Masson.
[Dacunha-Castelle (II)] Dacunha-Castelle, D.; Duflo, M. (1983) Probabilités et Statistiques. Volume II, Masson.
[Durrett 96] Durrett, R. (1996) Stochastic Calculus. CRC Press.
[Itô] Itô, K. (1961) Lectures on Stochastic Processes. Tata Institute of Fundamental
Research Bombay.
[Karatzas 91] Karatzas, I.; Shreve, S. E. (1991) Brownian Motion and Stochastic Calculus. Second Edition, Springer Verlag.
[Klebaner 98] Klebaner, F. C. (1998) Introduction to Stochastic Calculus with Applications. Imperial College Press.
[Lamberton 96] Lamberton, D.; Lapeyre, B. (1996) Introduction to Stochastic Calculus
Applied to Finance. Chapman & Hall.
[Øksendal 98] Øksendal, B. (1998) Stochastic Differential Equations. Fifth edition,
Springer.
[Protter 90] Protter, P. (1990) Stochastic Integration and Differential Equations. Springer Verlag.
[Shiryaev] Shiryaev, A. N. (1999) Essentials of Stochastic Finance, World Scientific.
MF0910
30
Capı́tulo IV
Secção: 7
[Williams] Williams, D. (1991) Probability with Martingales. Cambridge University
Press.
[Zettl 05] Zettl, A. (2005) Sturm-Liouville Theory, American Mathematical Society.
MF0910
31
NOTAS DE LIÇÕES PARA TEORIA DO INVESTIMENTO
MODELO DE BLACK-SCHOLES E APREÇAMENTO
1. Notações
Seja (Ω, F, P) um espaço de probabilidade, G = (Gt )t∈R+ uma filtração sobre este espaço
de probabilidade.
Definição 1. O processo B = (Bt )t∈R+ é um G processo browniano se e só se:
(1) B é G adaptado, isto é:
∀t ∈ R+ Bt ∈ mGt ;
(2) Os incrementos de B são G independentes, isto é:
i
∀s, t ∈ R+ s ≤ t ⇐ (Bt − Bs ) ↔ Gs ;
(3) Os incrementos de B são estacionários (têm a mesma lei), isto é:
∀s, t ∈ R+ s ≤ t ⇐ L(Bt − Bs ) ≡ L(Bt+s − B0 ) .
Definição 2. F = (Ft )t∈R+ , a filtração natural associada ao processo browniano B
é, por definição:
∀t ∈ R+ Ft := σ({Bs : s ≤ t})∼ .
Exercı́cio 1. Mostre que se B é um G processo browniano então B é um F processo browniano, isto é, B é um processo browniano relativamente à sua filtração natural F.
Relembramos seguidamente as definições de dois espaços de processos relevantes para o
integral estocástico
Definição 3. Para T ∈ R+ e para H filtração, o espaço N([0, T ], H) é o espaço dos processos
estocásticos (φt )t∈R+ que são H adaptados tais que:
Z T
2
E
φt dt < +∞ .
0
Por definição temos ainda :
N(H) :=
\
N([0, T ], H) .
T ∈R∗+
Observação 1. É sabido que o integral estocástico relativamente ao processo B de um processo no espaço N(G) é uma martingala contı́nua1.
Se as hipóteses forem enfraquecidas temos um outro espaço útil.
1Veja-se, por exemplo [7][p. 33], [4][p. 38].
1
2
Definição 4. Para T ∈ R+ e para H filtração, o espaço M([0, T ], H) é o espaço dos processos
estocásticos (ψt )t∈R+ que são H adaptados tais que:
Z T
2
P
ψt dt < +∞ = 1 .
0
Por definição temos ainda :
\
M(H) :=
M([0, T ], H) .
T ∈R∗+
Observação 2. Em contraste com o que se afirmou na observação 1, o integral estocástico
relativamente ao processo B, considerado como G processo browniano, de um processo
no espaço M(G) não é, em geral, uma martingala, mas apenas uma martingala local
contı́nua2. Por razões que se prendem com o carácter técnico das definições não estudaremos
a noção de martingala local.
2. O modelo de mercado segundo Black-Scholes
Supomos dado um activo sem risco cujo preço se encontra especificado pela dinâmica
dβt = rβt dt , β0 = 1
e um activo com risco cujo preço é a solução da seguinte EDE:
dSt = µSt dt + σSt dBt , S0 ∈ R+ ,
em que r, µ e σ são parâmetros do modelo.
3. Carteiras
Definição 5. Uma carteira Φ = (φ1 , φ2 ) é um processo estocástico com valores em R2 tal
que φ1 = (φ1t )t∈R+ ∈ W(F) e tal que o processo φ2 = (φ2t )t∈R+ é F adaptado e verifica ainda:
Z T
∗
1 2
∀T ∈ R+ P
(φt ) dt < +∞ = 1 .
0
Definição 6. Sendo Φ uma carteira, V (Φ), o processo valor desta carteira é dado por:
∀t ∈ R+ Vt (Φ) = φ1 St + φ2 βt .
Definição 7. A carteira Φ é autofinanciada se e só se se verificar:
∀t ∈ R+ dVt (Φ) = φ1 dSt + φ2 dβt .
4. Medidas de Martingala
Definição 8. Uma medida de probabilidade Q sobre (Ω, F) diz-se equivalente à medida
de probabilidade P (o que se representa por P ∼ Q) se e só se:
∀F ∈ F P[F ] = 0 ⇔ Q[F ] = 0
Exercı́cio 2. Seja g ∈ mF tal que g > 0 e Qg definida por:
Z
∀F ∈ F Qg [F ] :=
g(ω)dP(ω) .
F
Mostre que P ∼ Qg .
2Veja-se, por exemplo [5][p. 116].
3
Exercı́cio 3. Mostre, utilizando o teorema de Radon-Nicodym que duas probabilidades P e
Q são equivalentes se e só se existe g ∈ mF tal que g > 0, verificando, por exemplo:
Z
g(ω)dP(ω) .
∀F ∈ F Q[F ] :=
F
O processo de preços descontados
S∗
= (St∗ )t∈R+ é definido por:
St
.
βt
O processo valor descontado, V ∗ (Φ) = (Vt∗ (Φ))t∈R+ , de uma dada carteira Φ, é
definido por:
Vt (Φ)
∀t ∈ R+ Vt∗ (Φ) :=
.
βt
∀t ∈ R+ St∗ :=
Definição 9. Uma medida de probabilidade Q, equivalente a P diz-se uma medida de
martingala para o processo de preços (MMP) se e só se o processo S ∗ é uma F
martingala para a probabilidade Q.
Exercı́cio 4. Mostre, utilizando o teorema de representação de martingalas3 que Q é MMP
se e só se existir B Q = (BtQ )t∈R+ um processo browniano relativamente à probabilidade Q e
um processo (ht )t∈R+ ∈ N(Ω, F, Q) tal que:
Z t
∗
∗
∀t ∈ R+ St = S0 +
hu dBuQ .
0
martingala generalizada para o processo de preços (MMgP)4 se e só se existir
B Q = (BtQ )t∈R+ um processo browniano relativamente à probabilidade Q e um processo
(ht )t∈R+ ∈ W(Ω, F, Q) tal que:
Z t
∗
∗
∀t ∈ R+ St = S0 +
hu dBuQ .
0
martingala para o mercado spot (MMM) se e só se, para qualquer carteira autofinanciada, o processo V ∗ (Φ) é uma F martingala para a probabilidade Q.
Exercı́cio 5. Mostre, utilizando o teorema de representação de martingalas 5 que Q é MMM
se e só se existir B Q = (BtQ )t∈R+ um processo browniano relativamente à probabilidade Q e
um processo (gt )t∈R+ ∈ N(Ω, F, Q) tal que:
Z t
∀t ∈ R+ Vt∗ (Φ) = V0∗ (Φ) +
gu dBuQ .
0
martingala generalizada para o mercado spot (MMgM) se e só se, para qualquer
carteira autofinanciada, existir B Q = (BtQ )t∈R+ um processo browniano relativamente à
probabilidade Q e um processo (gt )t∈R+ ∈ W(Ω, F, Q) tal que:
Z t
∗
∗
∀t ∈ R+ Vt (Φ) = V0 (Φ) +
gu dBuQ .
0
3Veja-se, por exemplo, [3][p. 187].
4Veja-se como justificação [2][p. 303], [3][p. 188] ou [8][p. 200].
5Veja-se para este teorema, por exemplo, [5][pgs. 171 e 177]
4
Teorema 1. Mostre que uma medida de probabilidade Q, equivalente a P é MMP (respectivamente MMgP) se e só se for MMM (respectivamente MMgM).
Demonstração. Mostre-se primeiramente, usando a fórmula de Ito, que:
dVt∗ (Φ) = φ1t dSt∗ .
(1)
A conclusão segue a partir das definições.
Com efeito, uma aplicação do exercı́cio 6 mostra-nos que:
1
1
1
1
∗
dVt (Φ) = d Vt (Φ) ×
=
× dVt (Φ) + Vt (Φ) × d( ) + d( ) × dVt (Φ) .
βt
βt
βt
βt
Pela fórmula de Ito, observamos que com g(t, x) = 1/x e Yt = g(t, βt ) se tem que:
dYt = d(
1
∂g
−1
−r
∂g
1 ∂2g
)=
(t, βt )(dβt )2 = 2 rβt dt =
dt ,
(t, βt )dt +
(t, βt )dβt +
2
βt
∂t
∂x
2 ∂x
βt
βt
uma vez que
∂g
(t, βt ) = 0 = (dβt )2 .
∂t
Por outro lado como a carteira é autofinanciada temos que:
1
1
1
−r
φ1t dSt + φ2t dβt e d( ) × dVt (Φ) = ( dt) × φ1t dSt + φ2t dβt = 0 .
× dVt (Φ) =
βt
βt
βt
βt
Em consequência temos que:
1
−r
dVt∗ (Φ) =
φ1t dSt + φ2t dβt + φ1t St + φ2t βt × ( dt) =
βt
βt
−rS
dS
t
t
+(
dt) = φ1t dSt∗ ,
= φ1t
βt
βt
observando que pelo exercı́cio já referido acima se tem que:
1
dSt
−rSt
∗
dSt = d St ×
=
+(
dt) .
βt
βt
βt
Exercı́cio 6 (Fórmula de integração por partes). Sejam Xt e Yt dois processos de Ito
admitindo as representações dXt = ut dt + vt dBt e dYt = rt dt + st dBt . Mostre, por aplicação
da fórmula de Ito a (Xt + Yt )2 Xt2 e a Yt2 , que:
d (Xt Yt ) = Xt dYt + Yt dXt + dhXY it ,
onde por convenção:
dhXY it = vt st dt .
Exercı́cio 7. Mostre que se for St∗ = St /βt e se dSt = µSt dt+σSt dBt , com µ ∈ R e σ ∈ R∗+
então:
∗
∗ µ−r
(2)
dSt = σSt
dt + dBt
σ
Teorema 2 (Girsanov). Seja (Ω, F, P) um espaço de probabilidade e (Bt )t∈R+ um processo
browniano neste espaço. Seja F = (Ft )t∈R+ a filtração naturalmente associada ao processo
browniano. Seja (γt )t∈[0,T ] um processo estocástico adaptado verificando:
Z
1 T 2
P exp(
γ dt) < +∞ = 1
2 0 t
e tal que o processo (Lt )t∈[0,T ] dado por:
Z
Lt = exp −
T
0
1
γt dBt −
2
Z
T
γt2
5
dt
0
seja uma martingala. Existe então uma medida de probabilidade única Q tal que:
(1) Q ∼ P
(2) A medida Q admite a seguinte representação:
Z T
Z
1 T 2
γ dt dP
dQ = Lt dP = exp −
γt dBt −
2 0 t
0
(3) O processo definido por dBtQ = γt dt + dBt é um processo browniano em relação ao
espaço (Ω, F, Q).
Observação 3. Uma condição suficiente para que o processo (Lt )t∈[0,T ] definido acima seja
uma martingala é a chamada condição de Novikov:
Z
1 T 2
EP exp(
γt dt) < +∞
2 0
Os exercı́cios seguintes retirados de [4][p. 76], têm por objectivo demonstrar o teorema
de Girsanov no caso de uma mudança para um drift (γt )t∈[0,T ] constante.
Exercı́cio 8 (Questão preliminar). Seja X uma variável aleatória real. Mostre que que X
é independente de uma dada σ álgebra B se e só se:
∀u ∈ R E eiuX | B = E eiuX q. c.
Exercı́cio 9 (Teorema de Girsanov: caso particular). Considere as notações do teorema 2.
Seja µ um número real e seja o processo (Lt )t∈[0,T ] definido por (Lt = exp −µBt − (µ2 /2)t .
(1) Mostre que (Lt )t∈[0,T ] é uma martingala relativamente à filtração F e que:
∀t ∈ [0, T ] EP [Lt ] = 1
(2) Seja, por definição e para t ∈ [0, T ], Pt := Lt P. Mostre que Pt e PT coincidem na σ
álgebra Ft .
(3) Seja Z uma variável aleatória limitada e mensurável relativamente à σ álgebra FT .
Mostre que:
EP [ZLT | Ft ]
t
EP [Z | Ft ] =
.
Lt
(4) Seja o Bµ = (Bµt )t∈R+ o processo estocástico construı́do a partir do processo browniano dado pela seguinte fórmula Btµ = µt + Bt . Mostre que:
t
∀u ∈ R ∀s, t ∈ [0, T ], s ≤ t EP [exp (iu(Btµ − Bsµ )) | Ft ] = e
−u2 (t−s)
2
.
Conclua usando o resultado obtido na questão preliminar anterior.
O teorema de Girsanov permite agora construir a medida de martingala única para os
preços descontados.
Proposição 1. A medida de martingala única para o processo dos preços descontados é
dada por:
r−µ
1 r−µ 2
(3)
dQ = exp
BT − (
) T dP .
σ
2 σ
6
Demonstração. Pondo, por definição,
µ−r
σ
e aplicando o teorema de Girsanov tem-se que a probabilidade Q definida na fórmula 3, que
é equivalente a P, torna o processo
µ−r
dt + dBt
dBtQ =
σ
um processo browniano relativamente a Q. Atendendo agora à fórmula 2, que se pode
escrever,
γt :=
dSt∗ = σSt∗ dBtQ
(4)
e, atendendo à regularidade St∗ temos que, pela definição, St∗ é uma martingala (local). Exercı́cio 10. Mostre que, no contexto da proposição anterior,
(1) o processo de preços admite a representação:
dSt = rSt dt + σSt dBtQ
e após comparar esta representação com a representação inicial comente as diferenças;
(2) as filtrações geradas pelos processos (Bt )t∈R , (St )t∈R , (St∗ )t∈R e (BtQ )t∈R coincidem.
Definição 13. Uma carteira Φ é admissı́vel se e só se:
(1) Φ é autofinanciada;
(2) (Vt∗ (Φ))t∈R é um processo estocástico de variáveis aleatórias não negativas e tal que:
sup Vt∗ (Φ) ∈ L2 (Q) .
(5)
t∈[0,T ]
O exercı́cio seguinte dá-nos uma forma de mostrar que uma dado integral estocástico define de facto uma martingala e fornecerá uma aplicação possı́vel para a condição 5, enunciada
na definição anterior.
Exercı́cio 11. Seja (ht )t∈[0,T ] um processo estocástico adaptado tal que:
Z T
2
P
ht dt < +∞ = 1 .
0
Seja por definição:
Z
∀t ∈ [0, T ] Mt :=
t
hs ds
0
e suponha que:
"
E
#
sup
Mt2
< +∞
t∈[0,T ]
Rt
(1) Considere a sucesssão τn := inf{t ≥ 0 : 0 h2s ds = n}. Mostre que τn é um tempo de
paragem e que
Z T ∧τn
2 2
E MT ∧τn = E
ht dt .
0
(2) Conclua que:
Z
E
0
T
h2t dt
< +∞ .
7
Definição 14. Um direito contingente com data de exercı́cio T é dado por h ∈ mFT que
representa o cashflow à data T .
Exemplo 1. Uma call option com strike price K é representada por h = f (ST ) em que
f (x) = (x − K)+ .
Definição 15. Um direito contingente h é replicável se e só se existir uma carteira admissı́vel tal que:
VT (Φ) = h .
Uma tal carteira é denominada carteira réplica do direito contingente h.
Exercı́cio 12. Mostre que se h é replicável então necessariamente h ∈ L2 (Q). Mostre que
esta última propriedade é verificada no caso de uma call option.
Teorema 3. Qualquer que seja o direito contingente h ≥ 0, h ∈ mFT , h ∈ L2 (P), h é
replicável e para qualquer carteira réplica Φ:
h
i
(6)
∀t ∈ [0, T ] Vt (Φ) = EQ e−r(T −t) h | Ft .
Demonstração. Pela fórmulas fundamentais 1 e 4 já demonstradas acima:
dVt∗ (Φ) = φ1t dSt∗ = σφ1t S ∗ dBtQ .
Temos pois, daod que a carteira é admissı́vel e em consequência do exercı́cio 11, que (Vt∗ )t∈R+
é uma martingala logo:
Vt∗ = EQ [VT∗ | Ft ]
isto é pelas definições,
h
i
Vt = EQ e−r(T −t) h | Ft .
Resta mostrar que h é replicável, isto é que que existe uma carteira Φ = (φ1 , φ2 ) tal que:
h
i
φ1t St + φ2t βt = EQ e−r(T −t) h | Ft .
Observando que o processo
Mt := EQ e−rT h | Ft ,
é uma martingala de quadrado integrável, que F = (Ft )t∈R+ é a filtração gerada pelo processos browniano (Bt )t∈R+ e também por (BtQ )t∈R+ , logo existe um processo adaptado (gt )t∈R+
tal que
Z 0
Q
2
E
(gt ) dt < +∞ e Mt = gt dBtQ .
T
Seja agora, por definição:
φ1t :=
gt
σSt∗
e φ2t := Mt − φ1 St∗ .
Então o processo Φ = (φ1 , φ2 ) é uma carteira autofinanciado e o processo valor desta carteira
é dado por:
h
i
Vt (Φ) = βt Mt = EQ e−r(T −t) h | Ft ,
logo (Vt (Φ))t∈R+ é um processo não negativo e VT (Φ) = h.
8
5. A fórmula de Black-Scholes
Um argumento semelhante ao que foi utilizado nos modelos a tempo discreto mostra que
num mercado livre de arbitragem o preço de um direito contingente replicável é determinado
pelo valor de uma carteira réplica qualquer. Com efeito assuma-se um mercado livre de
arbitragem e h um direito contingente replicável, denotando-se por Πt o preço de h à data
t. Seja Φ uma carteira réplica de h e seja (Vt (Φ))t∈R+ o processo valor de Φ.
O quadro seguinte demonstra que se o preço à data zero do direito contingente não for
exactamente V0 (Φ), então existe no mercado uma oportunidade de arbitragem. Suponha,
por exemplo, que se verifica Π(0, h) < V0 (Φ).
Data t = 0
Data t = T
Posição short na carteira
+V0 (Φ)
−VT (Φ)
Posição long no direito
−Π(0)
+Π(0, h)
Posição no activo sem risco
V0 (Φ) − Π(0) (V0 (Φ) − Π(0, h))erT
Cash flow total (soma nas colunas)
0
(V0 (Φ) − Π(0, h))erT
Observação 4. Este argumento para além de fazer uso da noção de oportunidade de arbitragem, noção que até agora ainda não foi definida, pressupõe que é possı́vel transaccionar
a carteira e o direito contingente.
Exercı́cio 13. O objectivo deste exercı́cio é demonstrar a fórmula de Black e Scholes para
o preço de uma opção de compra europeia.
(1) Mostre que Π0 , o preço à data zero de uma call option com data de exercı́cio T e
com preço de exercı́cio K é dado por:
Π0 = e−rT E (ST − K)+
√
(2) Mostre que se Z ∈ N(−1/2σ 2 T, σ 2 T ) então ST tem a lei da variável aleatória
S0 exp(Z + rT ) e que portanto, Π0 é dado por:
Π0 = e−rT E (S0 exp(Z + rT ))+
(3) Mostre que se for:
1
ϕ(x) := √
2π
(7)
Z
x
2
− v2
e
−∞
(ln( SK0 ) + (r − 12 σ 2 )T )
√
dv e vc :=
,
σ T
então temos para o preço da call option a fórmula denominada fórmula de BlackScholes:
√
Π0 = S0 ϕ(vc + σ T ) − Ke−rT ϕ(vc ) .
6. Estimação
Para aplicar o modelo de Black-Scholes torna-se necessário estimar os parâmetros do
modelo com especial relevo para a volatilidade σ. Um dos métodos utilizados consiste em
utilizar a informação contida no registo dos preços tal como mostra o exercı́cio seguinte.
Exercı́cio 14. Considere-se no modelo de Black-Scholes sendo a evolução dos preços dos
activos é dada pelas equações:
dβt = rβt dt
9
(1) Mostre que:
1 2
(8)
St+∆t = St exp σ(Bt+∆t − Bt ) + (µ − σ )∆t ,
2
e conclua que os retornos logarı́tmicos do activo em questão são normais com média
e variância definidas.
(2) Usando a fórmula 8 mostre que:
1
E[ln(St+∆t /St )]
V[ln(St+∆t /St )]
µ − σ2 =
, σ2 =
2
∆t
∆t
(3) Dê intervalos de confiança para os parâmetros que estimou.
7. A equação às derivadas parciais de Black-Scholes
Seja o modelo de Black-Scholes usual em que a dinâmica do activo com risco é regida
pela equação diferencial estocástica:
dSt = µSt dt + σSt dBt , S0 ∈ R+
e em que o activo sem risco (ou conta bancária) tem como dinâmica segue a equação diferencial ordinária:
dβt = rβt dt , β0 = 1 .
Seja uma carteira autofinanciada (at , bt )t≥0 cujo processo valor é dado por:
∀t ≥ 0 Vt = at St + bt βt .
Relembre que sendo a carteira autofinanciada se verifica: dVt = at dSt + bt dβt . Suponha que
a estratégia permite replicar o direito contingente C(St , t), isto é que:
∀t ≥ 0 Vt = C(St , t) .
Exercı́cio 15. O objectivo deste exercı́cio é obter a equação às derivadas parciais cuja
solução permite apreçar um direito contingente no modelo de Black-Scholes.
(1) Mostre, usando a fórmula de Ito que:
1 (2)
(1)
(1)
2 2
∀t ≥ 0 dC(St , t) = Ct (St , t) + Cx (St , t)St µ + Cxx (St , t)σ St dt
2
(9)
(1)
+ Cx (St , t)σSt dBt ,
onde se tem para a função de duas variáveis C(x, t):
∂C
∂C
∂2C
(2)
(x, t) , Cx(1) (x, t) =
(x, t) , Cxx
(x, t) =
(x, t) .
∂t
∂x
∂x2
(2) Mostre que sendo a estratégia auto-financiada e permitindo replicar C(St , t), se tem:
(1)
Ct (x, t) =
∀t ≥ 0 dC(St , t) = (bt rβt + at St µ) dt + at St σdBt .
(3) Mostre que se a decomposição de um processo estocástico de Ito na soma de um
integral em dt com um integral em dBt fôr única, virá então:
(1)
C(St , t) − St Cx (St , t)
β−t
e conclua que C(x, t) é solução da equação com derivadas parciais de Black-Scholes:
at = Cx(1) (St , t) , bt =
(10)
∂C
∂C
1 ∂2C
(x, t) − rC(x, t) +
(x, t)St r +
(x, t)σ 2 St2 = 0 .
∂t
∂x
2 ∂x2
10
Observação 5. No caso de uma opção de compra (call option) europeia com preço de exercı́cio
K tem-se que o valor do contrato é C(ST , T ) = (ST − K)+ onde C(x, t) é solução da
equação 10.
Resolução:[Exercı́cio 15]
(1) Pela fórmula de Ito vem que:
1 (2)
(1)
dC(St , t) = Ct (St , t) dt + Cx(1) (St , t) dSt + Cxx
(St , t)(dSt )2 .
2
Como dSt = (µdt + σdBt )St vem que (dSt )2 = σ 2 (St )2 dt e logo:
1 (2)
(1)
dC(St , t) = Ct (St , t) dt + Cx(1) (St , t)St µdt + Cx(1) (St , t)St σdBt + Cxx
(St , t)σ 2 St2 dt =
2
1 (2)
(1)
(St , t)σ 2 St2 dt + Cx(1) (St , t)St σdBt ,
= Ct (St , t) + Cx(1) (St , t)St µ + Cxx
2
tal como se pretendia.
(2) Seja agora Φ = (at , bt )t∈R+ uma carteira réplica do direito contingente C(St , t).
Tem-se então que:
dC(St , t) = dVt (Φ) = at dSt + bt dβt = (bt rβt + at St µ)dt + at St σdBt .
(3) Obserando que a representação de um processo de Ito como soma de um integral
usual e de um integral estocástico é única 6 tem-se que a carteira φ satisfaz necessa(1)
riamente a equação at St σ = Cx (St , t)St σ de onde se tira que:
at = Cx(1) (St , t) ,
uma vez que, por hipótese σ 6= 0 e que por construção St 6= 0. Dado que C(St , t) =
(1)
at St + bt βt = Cx (St , t)St + bt βt , vem que
(1)
C(St , t) − Cx (St , t)St
bt =
.
βt
Podemos usar mais uma vez o argumento da unicidade da decomposição de um
integral de Ito desta vez relativamente ao integral usual para concluir que:
1 (2)
(1)
bt rβt + at St µ = Ct (St , t) + Cx(1) (St , t)St µ + Cxx
(St , t)σ 2 St2 .
2
Se reportarmos nesta fórmula os valores encontrados para os processos da carteira
tem-se,
(1)
C(St , t) − Cx (St , t)St
βt + Cx(1) (St , t)St µ =
βt
1 (2)
(1)
Ct (St , t) + Cx(1) (St , t)St µ + Cxx
(St , t)σ 2 St2 ,
2
ou seja, tal como querı́amos:
1 (2)
(1)
Ct (St , t) − rC(St , t) + Cx(1) (St , t)St r + Cxx
(St , t)σ 2 St2 = 0 .
2
♦
6Veja-se [4][p. 43].
11
Referências
1. [Bjrk98] T. Björk, Arbitrage Theory in Continuous Time, Oxford University Press, 1998.
2. [Kllbr97] O. Kallenberg, Foundations of Modern Probability, Springer Verlag, 1997.
3. [Kleb98] F. C. Klebaner, Introduction to Stochastic Calculus with Applications, Imperial College Press,
1998.
4. [LmbLp96] D. Lamberton, B. Lapeyre, Introduction to Stochastic Calculus Applied to Finance, Chapman
& Hall, 1996.
5. [LptShr01] R. S. Lipster, A. N. Shiryaev Statistics of Random Processes, Vol. I, Second Edition, Springer
Verlag, 2001.
6. [MuRu97] M. Musiela, M. Rutkowski, Martingale Methods in Financial Modelling, Springer, 1997.
7. [Oksen98] B. Øksendal, Stochastic Differential Equations, fifth edition, Springer, 1998.
8. [RvYor99] D. Revuz , M. Yor, Continuous Martingales and Brownian Motion, Springer, 1999.
Estimação e Clibração de Modelos de Mercados Financeiros
FCT/UNL, Matemática Financeira 07-08
MLE
1 Introdução
Para aplicar um dado um modelo para os mercados financeiros há, pelo menos, duas
formas de proceder: a estimação e a calibração. Um modelo é caracterizado pelas leis
de evolução dos activos financeiros considerados como subjacentes ou primitivos. As leis
de evolução dependem de um vector de parâmetros Θ = (θ1 , . . . , θN ). Essas leis são,
geralmente, formuladas sob uma probabilidade natural que é a probabilidade observada.
Os resultados do modelo são, fundamentalmente, fórmulas para apreçamento livre de
arbitragem para activos financeiros secundários ou derivados e para as correspondentes
carteiras de cobertura. Estas fórmulas são, regra geral, calculadas por meio de uma
probabilidade de martingala, ou probabilidade neutra face ao risco, associada de forma
canónica ao modelo. O modelo formulado sob a probabilidade neutra face ao risco
0 ). De notar que, em geral,
depende de um outro vector de parâmetros Θ0 = (θ10 , . . . , θN
os preços calculados com a probabilidade natural não são preços livres de arbitragem.
Suponhamos conhecidos os dados relativos à evolução dos activos primários ou subjacentes, por exemplo, séries cronológicas de preços. Se aplicarmos os procedimentos
estatı́sticos usuais aos dados relativos à evolução dos activos para estimar Θ, sob a probabilidade natural ou observada, estamos a estimar o modelo. A estimação é, em regra,
um método de tipo histórico.
Suponhamos conhecidos os dados relativos a certos activos financeiros derivados, por
exemplo um conjunto de preços para um conjunto de activos. Se for possı́vel inverter,
(ainda que numericamente) as fórmulas dos preços desses activos derivados de modo a
obter Θ0 , o vector de parâmetros do modelo sob a probabilidade martingala ou neutra
face ao risco, estamos a calibrar o modelo. Com os resultados da calibração é possı́vel
apreçar, no quadro do modelo em estudo, outros activos financeiros derivados que não
os inicialmente considerados. A calibração é, em geral, um método de tipo implı́cito.
2 O modelo binomial
Nesta secção estudaremos o caso particular do modelo binomial. O leitor é fortemente
aconselhado a rever as suas notas de trabalho sobre este assunto.
1
MF0708
Estimação e Calibração
Subsecção: 2.1
No modelo binomial consideram-se dois activos primários. A obrigação (bond ), activo
sem risco cuja lei de evolução do respectivo preço é dada por:
(
B0 = 1
Bn+1 = (1 + R)Bn n ≥ 0 ,
em que R ≥ 0 é a taxa de juro sem risco, determinı́stica, associada a um dado perı́odo
de tempo ∆t que deveremos ter sempre o máximo cuidado em explicitar 1 . A acção
(stock ), activo com risco cuja lei de evolução do respectivo preço é dada por:
(
S0 > 0
Sn+1 = Zn+1 Sn n ≥ 0 ,
em que (Zn )n≥1 é uma amostra de uma variável aleatório de Bernoulli Z tal que:
(
u com probabilidade pu
Z=
d com probabilidade pd = 1 − pu
e que representa o retorno da acção no perı́odo ∆t 2 . Os parâmetros do modelo, sob a
probabilidade natural, são descritos, evidentemente, por Θ = (R, u, d, pu ).
2.1 Estimação
Seja P = (pu , pd ) a probabilidade natural que, relembramos, é a probabilidade observada
no modelo. Suponhamos conhecida (sn )n≥1 uma série de preços do activo primário
com risco num perı́odo fundamental τ determinado (suponhamos mensal para fixar as
ideias). Sabemos
grande
P pela lei forte dos grandes números que para N suficientemente
P [Z τ ] em
s
/s
pode
ser
tomado
como
boa
aproximação
para
E
mN = (1/N ) N
n=1 n+1 n
que Z τ é o retorno mensal. Podemos, pois, tomar EP [Z τ ] como a taxa de retorno
(média)
Da mesma forma poderemos considerar sN = (1/(N −
P mensal observada.
2 como boa aproximação para VP [Z τ ] a variância de Z τ . VP [Z τ ]
(s
/s
−m
1)) N
)
N
n=1 n+1 n
representará, pois, a volatilidade (média) mensal observada.
Tal como já referimos acima, supomos que se está a estudar o modelo binomial
tomando como perı́odo de referência uma fracção ∆t do perı́odo fundamental τ 3 Sabendo
que
(
uS0 com probabilidade pu
S1 =
dS0 com probabilidade pd = 1 − pu
tem-se, uma vez que o retorno médio no perı́odo ∆t deverá ser EP [Z] = EP [Z τ ]∆t que;
EP [S1 ] = EP [ZS0 ] = S0 EP [Z] = S0 (pu u + (1 − pu )d) = S0 EP [Z τ ]∆t
1
Por exemplo a taxa pode ser: diária, semanal, mensal, anual, etc.
De facto, por definição, o retorno aditivo é dado por (S1 − S0 )/S0 = Z − 1.
3
Se por exemplo estivermos interessados num perı́odo de referência diário teremos ∆t = τ /30 em que,
relembramos, τ é o perı́do fundamental que acima escolhemos, por exemplo, ser mensal.
2
Primeira versão
2
MF0708
Subsecção: 2.2
ou seja EP [Z τ ]∆t = pu u + (1 − pu )d o que implica que, necessariamente,
pu =
(1 + EP [Z τ ]∆t) − d
.
u−d
(1)
Da mesma forma virá relativamente à volatilidade no perı́odo ∆t, uma vez que se tem
pelas regras habituais VP [Z] = VP [Z τ ]∆t, que:
VP [S1 ] = VP [ZS0 ] = S02 VP [Z] = S02 ((pu u2 +(1−pu )d2 −(pu u+(1−pu )d)2 ) = S02 VP [Z τ ]∆t
ou seja:
VP [Z τ ]∆t = pu u2 + (1 − pu )d2 − (pu u + (1 − pu )d)2 .
(2)
Seja agora para maior comodidade no que vai seguir-se, µ = EP [Z τ ]∆t e σ 2 = VP [Z τ ]∆t.
Observe-se primeiramente que por substituição da fórmula 1:
pu u2 +(1−pu )d2 = d2 +(u2 −d2 )pu = d2 +(u2 −d2 )
(1 + µ) − d
= d2 = (u+d)(1+µ)−ud .
u−d
De novo, substituindo a fórmula 1 na fórmula 2 vem, desenvolvendo o quadrado e efectuando as contas, que:
(1 + µ) − d
u − (1 + µ) 2
2
(pu u + (1 − pu )d) =
u+
d = (1 + µ)2
u−d
u−d
Em consequência tem-se que
(u + d)(1 + µ) − ud − (1 + µ)2 = σ 2
ou seja, revertendo para as notações iniciais que:
(u + d)(1 + EP [Z τ ]∆t) − ud − (1 + EP [Z τ ]∆t)2 = VP [Z τ ]∆t
(3)
O problema da estimação ficará resolvido se encontrarmos uma solução para a equação 3
nas duas incógnitas u e d. Uma forma usual de proceder (Hull 00)[p. 214] consiste em
desenvolver o quadrado e desprezar as potências de ∆t de ordem superior a um, obtendose uma equação aproximada ou seja:
(u + d)(1 + EP [Z τ ]∆t) − ud − (1 + 2EP [Z τ ]∆t) ≈ VP [Z τ ]∆t
observando-se imediatamente que:
(
p
u = 1 + VP [Z τ ]∆t
p
d = 1 − VP [Z τ ]∆t
(4)
(5)
é uma solução possı́vel para a equação aproximada 4. Deste modo é possı́vel estimar os
valores de u e d que são compatı́veis com os dados observados.
Observe-se que no modelo binomial esta estimação não nos permite, em princı́pio,
determinar o preço livre de arbitragem de um derivado. Para esclarecermos este assunto
necessitamos estudar a calibração.
Primeira versão
3
MF0708
Subsecção: 2.2
2.2 Calibração
Seja Q = (qu0 , qd0 ) a probabilidade martingala ou neutra face ao risco associada ao
modelo binomial. Note-se que o modelo de evolução da acção sob esta probabilidade
neutra face ao risco é dado por:
(
u0 S0 com probabilidade qu0
S1 =
d0 S0 com probabilidade qd0 = 1 − qu0
em que u0 e v 0 representam as taxas de apreciação e depreciação da acção sob a probabilidade neutra face ao risco. Os parâmetros do modelo, sob a probabilidade neutra face
ao risco, são descritospor Θ0 = (R, u0 , d0 , qu0 ). Tal como na secção sobre a estimação,
supomos que Rτ é a taxa de juro sem risco num perı́odo de referência τ . No perı́odo de
tempo em que estudamos o modelo binomial denotado por ∆t, sabemos que Q é tal que:
S0 =
1
1
1
EQ [S1 ] =
EQ [S0 Z] =
S0 (qu0 u0 + (1 − qu0 )d0 )
τ
τ
1 + R ∆t
1 + R ∆t
1 + Rτ ∆t
o que implica necessariamente que:
q u0 =
(1 + Rτ ∆t) − d0
.
u0 − d0
(6)
Tal como anteriormente, substituindo 6 na fórmula da variância do retorno sob a probabilidade martingala, correspondente à fórmula 2, tem-se uma fórmula semelhante a 3,
ou seja:
qu0 (u0 )2 +(1−qu0 )(d0 )2 −(qu0 u0 +(1−qu0 )d0 )2 = (u0 +d0 )(1+Rτ ∆t)−u0 d0 −(1+Rτ ∆t)2 (7)
Observa-se agora imediatamente que os valores obtidos na fórmula 5 para solução da
equação aproximada 4 são tais que se for
(
p
u0 = 1 + VP [Z τ ]∆t
p
d0 = 1 − VP [Z τ ]∆t
então desprezando os termos em ∆t de ordem superior a um no lado esquerdo da
fórmula 7 virá que
qu0 (u0 )2 + (1 − qu0 )(d0 )2 − (qu0 u0 + (1 − qu0 )d0 )2 ≈ VP [Z τ ]∆t
Podemos pois concluir que no modelo binomial debaixo da probabilidade neutra face ao
risco:
1. u0 e v 0 , as taxas de apreciação e depreciação da acção sob a probabilidade neutra
face ao risco, podem ser consideradas idênticas a u e v, as taxas de apreciação e
depreciação da acção sob a probabilidade natural;
2. a variância do retorno da acção sob a probabilidade martingala coincide com a
variância do retorno da acção sob a probabilidade natural.
Primeira versão
4
MF0708
Subsecção: 4.0
Em consequência, ficou demonstrado que é possı́vel resolver o problema da calibração do
modelo binomial a partir dos dados históricos sendo, em seguida, possı́vel a determinação
do preço de qualquer activo financeiro derivado no modelo binomial desde que seja
possı́vel estimar a variância dos retornos do activo subjacente.
2.3 Aplicação prática
No ficheiro Mathematica em anexo aplicam-se os resultados estudados ao apreçamento
de uma call option sobre o ı́ndice Psi-20.
3 O modelo de Black-Scholes
(A completar)
4 Modelos de produtos de rendimento fixo
(A completar)
Referências
Primeira versão
5
Métodos das Probabilidades e da Estatı́stica para a
avaliação e cobertura do risco operacional
Manuel L. Esquı́vel
Resumo
No que vai seguir-se propõe-se uma primeira aproximação sobre as técnicas de
probabilidades e estatı́stica relevantes para o risco operacional. Procurou-se aflorar
sucinta mas rigorosamente alguns dos aspectos fundamentais destas técnicas: as
noções básicas subjacentes, o ajustamento dos modelos à severidade e à frequência,
a teoria dos valores extremos no ajustamento de caudas pesadas e na determinação
do Value at Risk. A tı́tulo de ilustração tratou-se um exemplo com auxı́lio do
software R e do software Mathematica que será apresentado na aula.
1 Introdução
De acordo com o documento [Basel 01][p. 2] o risco operacional é definido como o
risco de perdas directas ou indirectas resultando de falhas ou desadequações nos processos
internos e nas pessoas ou resultando de acontecimentos externos.
Uma equipa técnica que seja incumbida, por uma administração, de quantificar o
risco operacional deverá adoptar uma metodologia que produza resultados fiáveis e que
seja aceite pelos organismos de regulação externos à companhia. Actualmente, as metodologia mais praticadas admitem uma esquematização nos seguintes passos.
• Ajustar, testar e validar um modelo para a severidade dos eventos de risco operacional. Para a severidade dos eventos importa realçar que o ajustamento de uma
distribuição Gaussiana aos dados não faz sentido, na maior parte dos casos, devido
à existência de caudas pesadas na amostra. Tal pode, em geral, ser inferido pelo
cálculo da kurtosis da amostra. Embora muitas vezes se procure um ajustamento
com outras distribuições com caudas pesadas (Weibull ou Pareto, por exemplo)
nem sempre este tipo de ajustamentos tem em conta os dados extremais que de
facto são os mais relevantes para uma correcta previsão das medidas de risco. Nesse
contexto, pode ser muito importante a aplicação das técnicas da teoria dos valores
extremos.
• Ajustar, testar e, finalmente, validar um modelo para a frequência dos eventos.
• Determinar a distribuição das perdas agregadas usando os modelos da severidade
e da frequência de forma a poder projectar a curto e médio prazo as medidas de
1
Capı́tulo VI
Risco Operacional
Secção: 2
risco requeridas pela administração como, por exemplo, o VaR. Se se dispuser de
distribuições manejáveis para a severidade e para a frequência pode ser possı́vel a
determinação explı́cita da distribuição das perdas agregadas. Regra geral tal não
irá acontecer pelo que se terá de recorrer a métodos aproximados de entre os quais
se destaca a simulação.
Pressupõe-se que a base de dados sobre a qual se vai praticar a análise tem as
caracterı́sticas mais adequadas às técnicas a aplicar. Após a realização da análise, é indispensável uma apreciação muito crı́tica dos resultados obtidos com estes modelos para
garantir resultados sensatos e, sobretudo, explicáveis a não especialistas. As análises ganharão em ser feitas com o auxı́lio de software adequado por exemplo o R 1 . Se possı́vel, a
análise deveria ser efectuada independentemente em, pelo menos, dois softwares distintos
e os resultados obtidos comparados.
2 Probabilidades e Estatı́stica
Começamos por evocar algumas noções que são imprescindı́veis para o estudo das técnicas
quantitativas de análise e cobertura do risco operacional. Muitas destas noções são estudadas em disciplinas apropriadas nos cursos universitários de Matemática, Ciências
Actuariais, Economia, Finanças e Engenharias, entre outros.
2.1 Variáveis aleatórias
De forma intuitiva uma variável aleatória é apenas o resultado quantitativo da observação, numa dada população, de um fenómeno regido pelo acaso. Exemplos de
variáveis aleatórias são a idade ou o peso da população de uma cidade. Convencionamos representar uma variável aleatória pelas letras maiúsculas X, Y, Z, . . . . Habitualmente distinguem-se duas classes de variáveis aleatórias consoante o tipo de valores
que tomam. Assim, uma variável aleatória que tome como valores os números (reais)
a1 , a2 , . . . , an , . . . diz-se discreta enquanto que uma variável aleatória que possa tomar
todos os valores entre dois números a e b se diz contı́nua. O comportamento de uma
variável discreta X tomando como valores os números a1 , a2 , . . . , an , . . . é descrito pela
sucessão
P[X = ak ] ∈ [0, 1], k = 1, 2, . . . , n . . .
isto é a sucessão das probabilidades dos acontecimentos definidos por: X toma exactamente o valor ak . Por outro lado, o comportamento, a lei, ou a distribuição, de uma
variável contı́nua Y , é descrito pela função de distribuição de X definida por:
FY (y) := P[Y ≤ y] ∈ [0, 1], y ∈ R ,
isto é, tal que para cada número real y, FY (y) é dado pela probabilidade da variável Y
tomar valores inferiores ou iguais a y. En certos casos, muito importantes na prática, a
1
Veja-se a página http://cran.r-project.org/ .
MF0910
2
Capı́tulo VI
Risco Operacional
Secção: 2
função distribuição pode escrever-se como integral de uma função regular fY , a que se
dá o nome de densidade de probabilidade de Y , sob a forma:
Z y
FY (y) =
fY (u) du .
−∞
Neste caso, define-se para cada inteiro positivo r = 1, 2, . . . o momento de ordem r
da variável Y , quando existe, por:
E[Y r ] :=
Z
+∞
ur fY (u) du .
−∞
O valor esperado (ou valor médio) da variável Y , representado por E[Y ] é, quando
existe, o momento de ordem 1 e a variância de Y é dada, quando existe, por
p V[Y ] =
E[Y 2 ] − E[Y ]2 ; tanto a variância como o desvio padrão, definido por σ(Y ) = V[Y ] são
medidas clássicas de dispersão de uma variável aleatória em torno do correspondente
valor esperado.
2.2 Amostras, a kurtosis e caudas pesadas
Para uma amostra de dimensão n inteiro positivo X1 , X2 , . . . , Xn , composta de observações independentes e identicamente distribuı́das usamos a notação
Xn = (X1 , X2 , . . . , Xn ) ,
ou X = (X1 , X2 , . . . , Xn ), sem o ı́ndice n que identifica a dimensão da amostra, sempre
que não haja risco de confusão. Para o valor médio da amostra X usamos a notação:
n
1X
X=
Xi .
n
i=1
A partir do valor esperado amostral e da variância amostral pode definir-se um
indicador importante para o diagnóstico de dados no risco amostral.
Definição 1. A kurtosis da amostra X1 , X2 , . . . , Xn é definida por:
N
1
1 X
κ :=
(Xi − X)4
σ(X)4 N
i=1
em que σ(X) é o desvio padrão amostral.
A kurtosis pode ser encarada como uma medida do peso das caudas numa distribuição
de probabilidade. É frequente que uma amostra com um valor alto de kurtosis apresente
uma densidade com um pico pronunciado perto da média, decrescendo rapidamente e
apresentando caudas pesadas. Um valor de referência para a kurtosis é κ = 3 que
corresponde ao valor teórico para a distribuição normal.
MF0910
3
Capı́tulo VI
Risco Operacional
Secção: 2
O comportamento da cauda de uma definição de uma variável aleatória X é dado
pelo comportamento assimptótico de P[X ≥ x], isto é, pelo comportamento desta probabilidade quando x toma valores arbitrariamente grandes. No caso em que a distribuição
admite uma densidade tem-se que
Z +∞
P[X ≥ x] =
f (u) du
x
pelo que se procura caracterizar o comportamento da área delimitada por f e pelo
eixo das abcissas. Quando se compara o comportamento das caudas a referência é a
2
distribuição normal cuja cauda se comporta para x grande como e−γx (veja-se adiante
na secção 3 a observação 10).
2.3 As leis dos grandes números
Uma lei dos grandes números diz, grosso modo, que a média aritmética dos valores
de um dado número de observações independentes de uma variável aleatória é tão mais
próximo do valor esperado da variável aleatória quanto maior for o número de observações
considerado. O significado que se atribui à locução mais próximo determina se se trata
de uma lei dos grandes números forte ou fraca.
As leis dos grandes números são de uso constante em Probabilidades e Estatı́stica.
Exemplos desses usos serão apresentados seguidamente.
O enunciado seguinte da lei forte dos grandes números é de formulação simples mas
necessita a noção de acontecimento quase certo ou acontecimento com probabilidade um
que por ser intuitivamente acessı́vel não detalharemos mais.
Teorema 1 (Lei forte de Kolmogorov). Seja X1 , X2 , . . . Xn , . . . uma sucessão de variáveis aleatórias integráveis, independentes e com a mesma distribuição comum. Então,
com probabilidade um:
N
1X
lim
Xn = E[X1 ] .
N →+∞ n
n=1
Podem enfraquecer-se as hipóteses formuladas para a lei forte dos grandes números
no sentido de não exigir a mesma distribuição mas tão somente um valor esperado
comum e que as variâncias sejam uniformemente limitadas. Com essas hipóteses mais
fracas obtem-se um resultado semelhante ao da lei forte mas com uma outra noção de
convergência. Com efeito, a formulação rigorosa da lei fraca dos grandes números requer
a noção de convergência em probabilidade que é uma noção mais fraca que a noção de
convergência quase certa ou com probabilidade um. Esta noção de convergência consiste
em considerar que a probabilidade dos acontecimentos
{| Xn − X |> } = {ω ∈ Ω :| Xn (ω) − X(ω) |> } ,
em que > 0 é uma quantidade arbitrariamente pequena, tende para zero quando
a ordem n cresce indefinidamente. Note-se que os acontecimentos acima são também
dados por:
{| Xn − X |> } = {ω ∈ Ω : Xn (ω) < X(ω) − ou X(ω) + < Xn (ω)} ,
MF0910
4
Capı́tulo VI
Risco Operacional
Secção: 2
o que mostra que quando há convergência em probabilidade, a probabilidade de uma
dada observação Xn (ω) se encontrar fora do intervalo ]X(ω) − , X(ω) + [ é tão mais
pequena quanto n for grande e isto para qualquer > 0, arbitrariamente pequeno.
Definição 2. Uma sucessão X1 , X2 , . . . Xn , . . . de variáveis aleatórias converge em
probabilidade para uma variável aleatória X se e só se se verifica a seguinte condição:
∀ > 0
lim P [| Xn − X |> ] = 0
n→+∞
(1)
O enunciado seguinte tem um conjunto de hipóteses de fácil verificação mas suficientemente geral para poder ser aplicado a uma classe alargada de situações
Teorema 2 (Lei fraca). Seja X1 , X2 , . . . Xn , . . . uma sucessão de variáveis aleatórias
independentes e com o mesmo valor médio e tais que exista uma constante M > 0 tal
que as variâncias das variáveis da sucessão são majoradas por essa constante, isto é,
∀n ∈ N V[Xn ] ≤ M .
Então, entendendo-se o limite como limite em probabilidade:
N
1 X
lim
Xn = E[X1 ] .
N →+∞ N
n=1
Demonstração. A demonstração é uma consequência da desigualdade de Chebychev
dado que, por esta desigualdade,
"
#
"N
#
N
1 X
X
1
M
P (Xn − E[X1 ]) ≤
Xn − E[X1 ] > ≤ 2 V
−−−−−→ 0 ,
N
N N N →+∞
n=1
n=1
em consequência da hipótese feita sobre o comportamento assimptótico da sucessão de
variáveis aleatórias.
2.4 O teorema do limite central
Em traços largos, o teorema do limite central diz-nos que uma soma, convenientemente
normalizada, de variáveis aleatórias tem uma lei ou distribuição que é tão mais próxima
da lei normal quanto mais termos forem tomados na soma. É imediatamente perceptı́vel
o interesse de um tal resultado. Com efeito, a distribuição de uma soma de variáveis
aleatórias quaisquer, por exemplo um valor médio amostral, não é, em geral, conhecida;
se a distribuição limite ou assimptótica for reconhecidamente a distribuição normal,
por aplicação do teorema do limite central, muitos cálculos antes impossı́veis passam a
fazer-se com simplicidade. O conceito de mais próximo exigido neste contexto é o da
convergência em lei ou em distribuição.
Teorema 3 (Lévy-Lindbergh). Seja X1 , X2 , . . . Xn , . . . uma sucessão de variáveis aleatórias
independentes e com a mesma distribuição comum. Então, considerando a soma normalizada definida para cada N ≥ 1 por:
N
1 X Xn − E[X1 ]
p
SN := √
N n=1
V[X1 ]
MF0910
5
Capı́tulo VI
Risco Operacional
Secção: 2
com função de repartição FSN tem-se que
Z x
2
1
− u2
=0.
√
e
lim
sup
F
(x)
−
du
S
N
N →+∞ −∞<x<+∞ 2π −∞
Observação 1. Outras formulações do teorema limite central são possı́veis relaxando as
hipóteses feitas sobre a sucessão (veja-se, por exemplo, [Pestana 02][p. 987]).
2.5 Estimação de parâmetros pelo método dos momentos
Em linhas gerais, a estimação dos parâmetros de uma distribuição pelo método dos
momentos faz-se resolvendo, em ordem aos parâmetros, o sistema de equações que se
obtem igualando a a expressão teórica dos momentos, que deve envolver os parâmetros,
aos correspondentes momentos empı́ricos calculados a partir da amostra. Em princı́pio
haverá tantas equações como parâmetros. Um exemplo simples, o da distribuição exponencial (veja-se a subsecção 3.3 abaixo)é dado pela estimação do parâmetro δ da distribuição pelo método dos momentos. Se X tiver distribuição exponencial com parâmetro
δ então o primeiro momento é E[X] = δ e o primeiro momento amostral, dada a amostra
X = (X1 , X2 , . . . , Xn ), é a média X, pelo que δ̂, o estimador pelo método dos momentos
do parâmetro δ, é δ̂ = X.
No caso geral, consideremos que pretendemos estimar o parâmetro θ = (θ1 , θ2 , . . . , θk ) ∈
Θ de X _ G(θ), uma variável aleatória com distribuição G(θ) a partir de uma amostra
Xn = (X1 , X2 , . . . , Xn ). Observe-se que para r = 1, 2, . . . k se fθ representar a densidade
da distribuição G(θ) que o momento teórico de ordem r
r
Z
+∞
xr fθ (x)dx
Eθ [X ] =
−∞
é uma função de θ (e também de r). O algoritmo para obter o estimador de θ pelo
método dos momentos consiste em obter a solução θ̂ = (θ̂1 , θ̂2 , . . . , θ̂k ) ∈ Θ do sistema
de k equações:
n
1X r
(2)
Eθ [X r ] =
Xi r = 1, 2, . . . , k .
n
i=1
A justificação deste método resulta, por exemplo, da lei forte dos grandes números de
Kolmogorov. Com efeito, considerando X1 , X2 , . . . , Xm , . . . uma sucessão de variáveis
aleatórias independentes e identicamente distribuı́das com X, tem-se que:
m
1 X r com probabilidade 1
Xi −−−−−−−−−−−−−−−−−→ Eθ [X r ]
m→+∞
m
i=1
P
pelo que para uma dada amostra Xn = (X1 , X2 , . . . , Xn ) faz sentido identificar n1 ni=1 Xir
com Eθ [X r ] desde que n, a dimensão da amostra, seja significativamente grande. Pode
mostrar-se numa classe numerosa de modelos que o estimadores assim obtidos são (fortemente) consistentes (veja-se, por exemplo, [Ivchenko 90][p. 97]). Tal resulta da aplicação
do teorema das funções implı́citas, sob reserva de regularidade.
MF0910
6
Capı́tulo VI
Risco Operacional
Secção: 2
Observação 2. Naturalmente que este método só pode ser aplicado quando a distribuição
da variável do modelo admite os momentos necessários para o algoritmo descrito acima.
As estimativas dos parâmetros obtidas por este meio são pouco eficientes e são geralmente
utilizadas como valores iniciais para outros métodos mais eficientes.
2.6 Estimação de parâmetros pelo método da verosimilhança máxima
Em traços largos, este método para estimação de um parâmetro de uma lei admitindo
densidade baseia-se na ideia de que a densidade toma, num dado ponto, valores tanto
maiores quanto maior for a probabilidade de se observar esse ponto. Com efeito, para
X _ G(θ), uma variável aleatória com distribuição G(θ) admitindo fθ como densidade
tem-se que para qualquer > 0:
Z
x+
P[x − ≤ X ≤ x + ] =
fθ (u) du
x−
pelo que é natural admitir que para θ fixo, quanto maior for a probabilidade de X tomar
valores na vizinhança do ponto x maior serão os valores que fθ tomará nessa vizinhança.
Suponhamos que pretendemos estimar o parâmetro θ = (θ1 , θ2 , . . . , θk ) ∈ Θ a partir
de uma amostra Xn = (X1 , X2 , . . . , Xn ). Consideramos a verosimilhança Lθ definida
para uma qualquer realização da amostra (x1 , x2 , . . . , xn ) por:
Lθ (x1 , x2 , . . . , xn ) := fθ (x1 ) · fθ (x2 ) · · · · · fθ (xn ) =
n
Y
fθ (xi ) .
i=1
A verosimilhança Lθ não é mais que a densidade da lei da amostra Xn , isto é, a lei conjunta do vector aleatório (X1 , X2 , . . . , Xn ). Aplicando a ideia descrita acima, é razoável
supor que para uma dada realização da amostra (x1 , x2 , . . . , xn ), Lθ (x1 , x2 , . . . , xn ) será
tanto maior quanto mais perto estiver θ do verdadeiro valor do parâmetro da lei que regeu a obtenção daquela realização da amostra. O algoritmo para o método de estimação
dos parâmetros pelo método da verosimilhança máxima consiste assim em determinar θ̂
tal que quando (x1 , x2 , . . . , xn ) estão fixos, Lθ̂ (x1 , x2 , . . . , xn ) tome o valor máximo, isto
é:
θ̂ := Argmáxθ∈Θ Lθ (x1 , x2 , . . . , xn ) .
Para aplicar este algoritmo temos então de maximizar uma função de várias variáveis
reais (θ1 , θ2 , . . . , θk ) usando para o efeito os princı́pios do cálculo diferencial. Sob reserva
da regularidade, um ponto de verosimilhança máxima é um ponto estacionário, isto é,
verifica o sistema de equações:
∂
Lθ (x1 , x2 , . . . , xn ) = 0, r = 1, 2, . . . , k .
∂θr
sendo necessário verificar em seguida se o ponto estacionário assim obtido maximiza de
facto a função. Para um estudo das propriedades assimptóticas dos estimadores obtidos
com este método recomendamos [Ivchenko 90][p. 82–97] ou [Pestana 02][p. 510–520].
MF0910
7
Capı́tulo VI
Risco Operacional
Secção: 2
2.7 Testes de hipóteses
A metodologia estabelecida em Estatı́stica para testar uma hipótese a partir da observação de uma amostra de um fenómeno aleatório pode ser reduzida, nas suas linhas
gerais, aos seguintes passos (veja-se, por exemplo, [Pestana 02][p. 489] ou [Lewis 04][pp.
61–63]).
• A fixação da hipótese nula, geralmente representada por H0 . Esta hipótese é
o postulado que efectuamos sobre a distribuição da nossa amostra. O objectivo
do teste é rejeitar esta hipótese (note-se que quando não conseguimos rejeitar a
hipótese nula não a estamos a aceitar; a metodologia dos testes de hipótese em
Estatı́stica é assim baseada numa atitude de grande prudência).
• A escolha da estatı́stica do teste que é dada por nova variável aleatória T :=
g(X1 , . . . , XN ) construı́da a partir da amostra por imagem por uma função g, que
pode depender da dimensão N da amostra. Para poder efectuar o teste é imperativo ter informações sobre a distribuição da estatı́stica do teste: ou se conhece
a distribuição exacta ou se conhece uma distribuição limite da estatı́stica do teste
quando a dimensão da amostra N cresce indefinidamente.
• Convencionar um nı́vel de significância aceitável para o teste, geralmente representado por α e tomando na prática um dos dois valores α = 0.05 ou α = 0.01. O
nı́vel de significância corresponde à probabilidade de cometer um erro de primeira
espécie, isto é corresponde à probabilidade de rejeitar a hipótese nula no caso em
que esta é verdadeira. Naturalmente pretendemos esta probabilidade tão pequena
quanto possı́vel.
• A determinação da região crı́tica do teste usando para o efeito as informações
de que dispomos sobre a distribuição da estatı́stica do teste e o valor do nı́vel de
significância. Esta região crı́tica é tal que, quando se observa uma dada concretização da amostra x = (x1 , . . . , xn ) e o correspondente valor da estatı́stica do
teste T (x) = g(x1 , . . . , xn ) se T (x) pertencer à região crı́tica rejeita-se a hipótese
nula. No caso de uma hipótese nula simples e em que T toma valores reais, a cada
nı́vel de significância α corresponde uma região crı́tica definida por um valor crı́tico
Tα = FT← (1 − α); neste caso, a região crı́tica pode corresponder, por exemplo a
T (x) > Tα .
• O valor-p, que representa a probabilidade, condicional à hipótese nula considerada de observar na estatı́stica do teste um valor maior ou igual àquele que foi
efectivamente observado. Na maioria dos softwares para a estatı́stica este valor-p
é um dos resultados dos programas. Regra geral a tomada de decisão quanto à
eventual rejeição da hipótese nula efectua-se quando se observa um valor-p inferior
ao nı́vel de significância.
Exemplo 1 (Teste de Ajustamento de Kolmogorov-Smirnov). Trata-se de um teste que
se pode usar para testar a qualidade de um ajustamento permitindo decidir se uma dada
amostra provêm ou não de uma população com uma distribuição especı́fica. A ideia subjacente é a de comparar a distribuição empı́rica com a distribuição teórica. A justificação
MF0910
8
Capı́tulo VI
Risco Operacional
Secção: 3
teórica repousa sobre o facto da função de distribuição empı́rica ser assimptóticamente
gaussiana. Em consequência pode verificar-se que os valores crı́ticos não dependem da
distribuição que está a ser tomada em consideração na hipótese nula. Neste teste, a
hipótese nula é de que a amostra provêm de uma dada distribuição (Kolmogorov) ou
que duas amostras provêm da mesma distribuição (Smirnov). Representando por F a
distribuição teórica tomada na hipótese nula e tendo-se que a função de distribuição
empı́rica é dada, a partir da amostra X1 , . . . , XN , por:
F̂ (X1 , . . . , XN )(x) =
Número de elementos{i : Xi ≤ x}
.
N
A estatı́stica do teste é dada por:
DN (X1 , . . . , XN ) = sup | F̂ (X1 , . . . , XN )(x) − F (x) |
x∈R
Como DN converge para zero quando N cresce indefinidamente o princı́pio do teste é
o de decidir pela rejeição da hipótese nula se para uma dada concretização da amostra
(x1 , . . . xN ), a estatı́stica do teste DN (x1 , . . . xN ) é suficientemente pequena. Na tabela
seguinte figuram os valores crı́ticos correspondentes a três valores correntes do nı́vel de
significância, para o teste de Kolmogorov-Smirnov.
α
Valor crı́tico
10%
√
1.224/ N
5%
√
1.358/ N
1%
√
1.628/ N
Observação 3. Um teste relevante para o ajustamento de distribuições discretas (ou para
distribuições contı́nuas após transformação adequada) é o conhecido teste do χ2 . Outros
testes usados para aferir a qualidade de um ajustamento de distribuições contı́nuas são os
testes de Anderson-Darling e o de Cramer-Von Mises (veja-se, por exemplo, [Lewis 04][p.
86] ou [Ricci 05][p. 22]).
3 Severidade
A análise estatı́stica da severidade tira proveito das técnicas que foram abordadas acima.
Assim, muito sucintamente, referimos as etapas principais de uma modelização inicial
da severidade.
• Efectuar uma análise preliminar dos dados para determinar as principais caracterı́sticas destes incluindo a kurtosis.
• Após escolha reflectida de uma dada distribuição, efectuar a estimação dos parâmetros e procurar validar essa escolha por meio de testes adequados. Uma primeira
verificação de adequação passa pelos testes gráficos a que se poderão seguir os
testes de ajustamento referidos na subsecção 2.7.
• Na eventualidade dos resultados dos testes não serem favoráveis poder-se-á efectuar um ajustamento de uma distribuição de Pareto generalizada à cauda da distribuição observada utilizando as técnicas da teoria dos extremos. Poder-se-á ajustar
MF0910
9
Capı́tulo VI
Risco Operacional
Secção: 3
uma distribuição de tipo lognormal à parte da distribuição complementar à cauda.
Para a aplicação da teoria dos valores extremos existem já pacotes como o EVIR
para uso com o software R ou o Xtremes referido na bibliografia (veja-se [Reiss 01]).
Seguidamente resumiremos alguns factos notáveis relativos a algumas das distribuições mais utilizadas na modelização inicial da severidade. Muitas outras distribuições
podem ser usadas para esse efeito. Encorajamos o leito a consultar um qualquer texto
clássico de Estatı́stica ou, por exemplo, [Abell 99][pp. 231–273], se estiver interessado
numa exploração destas distribuições usando o software Mathematica. Para cada um
destes modelos clássicos indicamos os momentos e alguns dos estimadores que se podem
utilizar para os parâmetros dessas distribuições.
3.1 Gaussiana
X _ Gaussiana (µ, σ), a variável tem distribuição Gaussiana de parâmetros µ número
real, σ > 0 se a densidade de probabilidade se representa sob a forma
"
#
1
1 x−µ 2
fGaussiana (µ,σ) (x) = √
exp −
2
σ
2σπ
A função caracterı́stica é:
t2 σ 2
ϕGaussiana (µ,σ) (t) = exp iµt −
2
.
Os momentos são dados por:
E[X] = µ , V[X] = σ 2 .
Os estimadores dos parâmetros obtidos pelo método dos momentos (veja-se [Cruz 02][p.
50]), são para uma amostra X = (X1 , X2 , . . . Xn ):
v
u n
n
X
1 u
1X
µ̂ = X =
Xi , σ̂ = √ t (Xi − X)2
n
n
i=1
i=1
Observação 4. Devido à sua omnipresença na modelização Estatı́stica é uma primeira
escolha natural para distribuição modelo da severidade. Tal como já foi dito a propósito
do teorema limite central é o modelo natural de um fenómeno cujo resultado deriva da
soma dos resultados de um grande número de variáveis aleatórias independentes com
dispersões controladas.
3.2 Lognormal
X _ Lognormal(µ, σ), a variável tem distribuição lognormal ou logaritmicamente normal
de parâmetros µ número real, e σ > 0 se a densidade de probabilidade se representa sob
a forma
"
#
1
1 ln x − µ 2
fLognormal (µ,σ) (x) = √
exp −
, x>0.
2
σ
x 2σπ
MF0910
10
Capı́tulo VI
Risco Operacional
Secção: 3
Os momentos
k
E[X ] = exp
1 2 4
k σ + kµ , V[X] = exp(σ 4 + µ) exp(σ 4 ) − 1 .
2
Se Y _ Gaussiana (0, 1) então X := exp(σ 2 Y + µ é tal que X _ Lognormal (µ, σ). Em
consequência, o estimador pelo método dos momentos considerando-se Zi = ln Xi − µ é
(veja-se [Cruz 02][p. 51]):
v
u n
n
X
1X
1 u
µ̂ =
Zi = Z , σ̂ = √ t (Zi − Z)2 .
n
n
i=1
i=1
Observação 5. Dado que se obtém esta distribuição tomando a exponencial de uma
variável gaussiana é uma distribuição para variáveis aleatórias tomando valores positivos
que se justifica em modelos em que o resultado deriva do produto dos resultados de um
grande número de variáveis aleatórias independentes, não negativas e com dispersões
controladas.
3.3 Exponencial
X _ Exponencial (δ), a variável tem distribuição exponencial de parâmetro δ > 0 se a
densidade de probabilidade se representa sob a forma
h xi
1
fExponencial (δ) (x) = exp −
x≥0
δ
δ
A função caracterı́stica é
ϕExponencial (δ) (t) =
δ
.
δ − it
Os momentos são:
E[X k ] = δ k k! , V[X] = δ 2 .
Estimador pelo método dos momentos [Cruz 02][p. 52] 2 para θ = 0 que coincide com o
estimador pelo método da verosimilhança máxima [Pestana 02][p. 515]
n
1X
δ̂ =
Xi = X .
n
i=1
Observação 6. É uma distribuição de grande importância dado que serve para modelo
do tempo de espera entre duas ocorrências de um fenómeno aleatório. A propriedade de
ausência de memória representada pela fórmula seguinte
P[X > t + s | X > s] = P[X > t] ,
implica que num modelo regido pela distribuição exponencial é como que de cada vez
que ocorre o fenómeno aleatório, por exemplo no instante s tudo se passasse como se
tivéssemos iniciado a observação nesse instante.
2
Após correcção da gralha óbvia.
MF0910
11
Capı́tulo VI
Risco Operacional
Secção: 3
3.4 Weibull
X _ Weibull (α, β), a variável tem distribuição Weibull de parâmetros α e β > 0 se a
α α α−1
x
fWeibull (α,β) (x) = α x
exp −
β
β
Os momentos são:
E[X k ] = β k Γ
(
2 )
1
1
k
2
2
− 2 Γ
.
+ 1 , V[X] = β 2
Γ
α
α
α
α
α
Estimador pelo método da identificação dos percentis [Cruz 02][p. 53] onde
c=
ln ln 4
ln ln(4/3)
e p.25 (respectivamente p.75 ) é o percentil de ordem 25% (respectivamente, o percentil
de ordem 75%)
c ln(p.25 ) − ln(p.75 )
ln ln 4
β̂ =
α̂ =
.
c−1
ln(p.75 ) − ln(β̂)
Observação 7. Esta distribuição é muito utilizada para a modelização do tempo de vida
de objectos com muitas partes constituintes em que a falha do objecto ocorre quando
uma das suas partes constituintes falha.
3.5 Pareto
X _ Pareto (α, θ), a variável tem distribuição Pareto de parâmetros α > 0 e θ > 0 se a
αθα
fPareto (α,θ) (x) =
(x + θ)α+1
Dado que se tem
Z
Z
xfPareto (α,β) (x) dx =
e que
Z
Z
xfPareto (α,β) (x)dx =
θα (αx + θ)
αθα x
dx
=
(x + θ)α+1
(α − 1)(x + θ)α
αθα x2
1
θα (−2θ2 − 2αθx − (α − 1)αx2 )
dx
=
,
(x + θ)α+1
α2 − 3α + 2
(x + θ)α
os momentos são dados por:
(desde que α > 1) E[X] =
αθ2
θ
, (desde que α > 2) V[X] =
.
α−1
(α − 1)2 (α − 2)
Estimadores pelo método dos momentos [Cruz 02][p. 53]
Pn
2
Pn
2
Pn
Pn
2
i=1 xi
i=1 xi
i=1 xi
i=1 xi
−
−
n
n
n
n
α̂ = 2 Pn 2
Pn
2 , θ̂ = 2 Pn 2
Pn
2
i=1 xi
i=1 xi
i=1 xi
i=1 xi
−
2
−
2
n
n
n
n
MF0910
12
Capı́tulo VI
Risco Operacional
Secção: 4
Observação 8. Em controlo de qualidade usa-se a distribuição de Pareto para modelizar
perdas. Entre outros fenómenos que podem ser modelizados com as distribuições de
Pareto, para as caudas das distribuições respectivas, podemos referir as flutuações do
preço das acções e os rendimentos individuais.
3.6 Gama
X _ Gama (α, θ), a variável tem distribuição gama de parâmetros α > 0 e θ > 0 se a
densidade de probabilidade se representa sob a forma:
x
1 x α
fGama (α,θ) (x) =
exp −
x>0.
xΓ(α) θ
θ
A função caracterı́stica tem por expressão:
ϕGama (α,θ) (t) =
1
.
(1 − iθt)α
Os momentos são dados por:
E[X k ] = α(α + 1) . . . (α + k − 1)θk , V[X] = αθ2 .
Estimadores pelo método dos momentos ver [Cruz 02][p. 54] ou [Lewis 04][p. 46]
Pn
Pn
2
2
Pn
2
i=1 xi
i=1 xi
i=1 xi
−
n
n
n
Pn
α̂ = Pn 2 Pn
.
2 , θ̂ =
i=1 xi
i=1 xi
i=1 xi
−
n
n
n
Observação 9. Um dos usos da distribuição gama é o de representar a distribuição da
diferença entre o valor máximo e o valor mı́nimo de uma amostra de uma população
normal. Um outro uso é o de modelizar situações fı́sicas tais como tempos de espera.
Observação 10. Em [Cruz 02][p. 46] pode encontrar-se uma tabela que descreve a comparação dos comportamentos de cauda para um conjunto de distribuições relevantes e
que reproduzimos seguidamente.
Distribuição
P[X ≥ x]
Weibull α > 1
a
e−x , A > 1
Exponencial
e−x
Weibull α < 1
a
e−x
Lognormal
x−a ln x
Pareto, DVEG
x−a
A existência de caudas pesadas numa distribuição leva a problemas de ajustamento que
necessitam para ser resolvidos das técnicas associadas à teoria dos valores extremos.
4 Value at Risk
Uma das medidas de risco mais correntemente usadas é o Value at Risk (VaR). O VaR
pode ser definido como uma estimativa estatı́stica de uma perda com a propriedade que
com uma dada probabilidade (pequena) é possı́vel que sobrevenha essa perda ou uma
perda superior, num dado perı́odo de tempo (em geral pequeno). Mais concretamente
tem-se a definição seguinte.
MF0910
13
Capı́tulo VI
Risco Operacional
Secção: 5
Definição 3 (Value at Risk (VaR)). Dado um grau de confiança α ∈]0, 1[ o VaRα de
uma perda, representada por uma variável aleatória L, ao nı́vel de confiança α é dado
pelo mais pequeno número l tal que a a probabilidade que a perda L exceda esse número
l é menor ou igual a 1 − α, isto é:
VaRα (L) = inf{l ∈ R : P[L > l] ≤ 1 − α} .
O VaRα é assim o quantil (qα ) da distribuição da variável aleatória L ou seja
qα = F ← (1 − α) .
São correntes os valores α = 0.95 ou α = 0.99. Note-se que α = 0.99 corresponde a
uma acontecimento que ocorre uma em cada mil vezes. O VaR como medida de risco
tem graves inconvenientes. Um dos mais relevantes é o não ser sub-aditiva isto é para
duas variáveis aleatórias K e L, representando dois tipos distintos de risco operacional,
não se verifica necessariamente
VaRα (K + L) ≤ VaRα (K) + VaRα (L) ,
isto é pode ocorrer que:
VaRα (K + L) > VaRα (K) + VaRα (L) .
Deste inconveniente resulta que efectuar a análise de uma carteira de riscos calculando
os VaR para cada um dos riscos e somando-os para obter um majorante do VaR da
carteira é um processo sem justificação salvo em casos muito especiais. Foram propostos
dois caminhos para evitar este grave inconveniente. Um primeiro consiste em utilizar a
composição de riscos através da teoria das cópulas 3 . Um outro consiste em considerar
o expected shortfall (ES) definido como:
ESα = E[L | X > VaRα (L)] .
O ES é uma medida de risco coerente e em particular já é sub-aditiva.
Observação 11. No endereço http://www.math.ethz.ch/riskometer/ poderá encontrar
uma funcionalidade na Internet que permite apreciar os resultados permanentemente
actualizados de um estudo comparativo de métodos distintos de aplicação do VaR a
vários ı́ndices bolsistas.
Na secção seguinte veremos como determinar o VaR de uma forma mais robusta para
as distribuições que naturalmente ocorrem na análise dos riscos operacionais.
5 Teoria dos Valores Extremos
A teoria dos valores extremos é a técnica adequada para a estimação de quantis elevados
de uma distribuição de perdas dado que permite ajustar um modelo para a distribuição
3
No endereço http://www.fenews.com/fen39/one time articles/copula/copula-vaR.htm poderá encontrar uma introdução rápida à estimação do VaR multivariado por meio da teoria das cópulas
MF0910
14
Capı́tulo VI
Risco Operacional
Secção: 5
da cauda de um conjunto de dados usando apenas a informação sobre acontecimentos
extremos. No entanto, é imperativo que haja um conjunto de dados suficientes para a
calibração dos modelos. Como pressupostos de base importantes supõe-se que as perdas
são independentes e identicamente distribuı́das. É frequente observar nos dados reais
que as perdas são não estacionárias o que obriga a extensões não triviais dos métodos
introduzidos (veja-se [Chavez 04]). Por outro lado, uma estimativa do risco global que
se obtêm somando os riscos calculados em cada um dos tipos de conjunto de classes
de risco não é coerente. Uma alternativa neste contexto é a de utilizar a agregação de
distribuições de risco através da teoria das cópulas.
5.1 Introdução
Consideraremos o seguinte problema: determinar um modelo rigoroso para as perdas operacionais X1 , X2 , . . . Xq acima de um dado limiar (threshold) u. Supõe-se que
X1 , . . . , Xn são observações independentes e identicamente distribuı́das (iid), de uma lei,
para nós desconhecida, tendo F como função distribuição.
Uma resposta resumida a este problema pode ser dada usando a teoria dos valores
extremos, podendo concretizar-se nos seguintes dois passos.
• Realiza-se primeiramente um ajustamento de uma distribuição de Pareto generalizada (DPG) aos excessos das perdas sobre o limiar u, representados por
Wj := Xi − u j = 1, . . . , n , i = 1, . . . , n , Xi > u ,
das perdas operacionais X1 , X2 , . . . Xq . Este tipo de distribuições é dado pela
definição seguinte.
Definição 4. A distribuição de Pareto generalizada (DPG) com parâmetro
ξ é dada por definição por:

− 1
ξ

ξx
1− 1+ β
if
ξ 6= 0
Gξ,β (x) =
1 − exp(− x )
if
ξ=0
β
No caso dos modelos de risco operacional tem-se regra geral que ξ > 0. Tal conduz
a que os excessos Wj para j = 1, . . . , n tenham uma distribuição de Pareto com
ı́ndice de cauda 1/ξ isto é:
P[Wj > x] =x→+∞
1
L(x) ,
x1/ξ
em que L é uma função regular.
Note-se que se toma como hipótese de partida que F pertence ao domı́nio maximal de atracção de uma distribuição de valores extremos generalizada (DVEG)
(Fréchet, Weibull or Gumbel) de forma a podermos aplicar o teorema de Fisher
Tippett. Uma DVEG é por definição uma distribuição do tipo seguinte.
MF0910
15
Capı́tulo VI
Risco Operacional
Secção: 5
Definição 5. A distribuição de valores extremos generalizada (DVEG) com
parâmetro ξ é dada por definição por:
(
−1
exp −(1 + ξx) ξ
if
ξ 6= 0
Hξ (x) =
−x
exp (−e )
if
ξ=0
Sendo que consoante o valor do parâmetro ξ assim a denominação da distribuição:
– Quando ξ > 0 temos a distribuição de Fréchet;
– Quando ξ < 0 temos a distribuiçãoWeibull;
– Quando ξ = 0 temos a distribuição Gumbel.
Defina-se Fu (x) como a probabilidade que a perda exceda o limiar u numa quantidade inferior ou igual a x, isto é, Fu (x) é a função de distribuição dos excessos
condicionada pelas perdas serem superiores ao limiar u, ou mais concretamente:
Fu (x) := P[X − u ≤ x | X ≥ u] .
Em virtude de o teorema de Balkema, de Haan 74 & Pickands 75, distribuição
de Pareto generalizada aparece como distribuição limite para a distribuição dos
excessos sobre o limiar u quando u cresce, isto é, Fu (x) converge para uma DPG
Gξ,β com parâmetro ξ, quando o limiar u converge para o ponto extremo à direita
de F que é o ponto dado por:
x0 := sup{x ∈ R : F (x) < 1} .
Podemos pois aproximar Fu (x) por Gξ,β(u) (x) para um valor de u judiciosamente
escolhido. Para referência apresentamos o enunciado do teorema já referido que
preside a este passo do método.
Teorema 4 (Balkema, de Haan 74 & Pickands 75). A distribuição F está no
domı́nio de atracção maximal de uma distribuição DVEG Hξ se e só se para β =
β(u) adequado se verificar:
lim
u↑x0
sup
0≤x<x0 −u
| Fu (x) − Gξ,β(u) (x) |= 0 .
• Seguidamente efectuamos um ajustamento de uma DPG com três parâmetros à
distribuição condicional empı́rica das perdas e uma estimativa dos quantis a 99%
and 95% destas perdas para a obtenção do VaR.
5.2
Método de aplicação e problemas na implementação
Resumindo, o método de implementação funciona com os seguintes passos:
• Aproxima-se a distribuição dos excessos sobre os nı́veis por uma DPG Gξ,σ em
que os parâmetros ξ e σ são estimados por exemplo pelo método de estimação da
verosimilhança máxima;
MF0910
16
Capı́tulo VI
Risco Operacional
Secção: 6
• Ajusta-se uma distribuição não condicionada para obter um modelo para as caudas
e determinar os quantis para esta distribuição.
• Estima-se o parâmetro ξ.
• Determina-se o nı́vel u em que u deve ficar muito perto do ponto final da distribuição a aproximação, melhor (teoricamente) mas, se se verificar que os dados
acima do nı́vel u são insuficientes pode ficar em causa a estabilidade e fiabilidade
nas estimativas dos quantis.
Com o fim de determinar um bom valor para u pode usar-se numa primeira aproximação a função excesso médio empı́rica correspondente à função excesso médio e(u)
ambas definidas seguidamente.
Definição 6. A função excesso médio é dada por definição por:
e(u) := E[X − u | X > u] .
A função excesso médio empı́rica é dada por:
Pn
+
i=1 (Xi − u)
en (u) := P
.
n
i=1 I{Xi >u}
O gráfico de en (u) dá indicação sobre a existência (declive positivo), ou não (declive negativo - caso da normal- ou nulo - caso da exponencial), de caudas pesadas na
distribuição.
6 Frequência
Para a modelização da frequência dos eventos indutores de risco operacional aplicase uma metodologia idêntica à que foi proposta para a modelização da severidade. De
atender agora que as variáveis associadas à frequência são discretas. De entre os modelos
mais comuns salientamos os seguintes.
6.1 Poisson
É de uso comum na modelação da frequência em que um dado evento ocorre durante
um intervalo determinado de tempo ou numa dada área ou volume.
X(Ω) = {0, 1, 2, }
∀k ∈ X(Ω) P[X = k] =
λk e−λ
k!
E[X] = λ
V[X] = λ
MF0910
17
Capı́tulo VI
Risco Operacional
Secção: 7
6.2 Binomial Negativa
Numa sucessão de tiragens de Bernoulli independentes uma variável aleatória que conte
o número de fracassos antes do n-ésimo sucesso tem distribuição binomial negativa.
Tem-se assim que
X(Ω) = {0, 1, 2, }
n+k+1 n
∀k ∈ X(Ω) P[X = k] = Cn−1
p (1 − p)k
E[X] =
n(1 − p)
p
V[X] =
n(1 − p)
p2
7 As perdas agregadas
O modelo consensualmente aceite para perdas operacionais agregadas é uma adaptação
do modelo colectivo das Ciências Actuariais e consiste em supor que Yt a variável
aleatória que descreve essas perdas à data t se escreve
!
Nt
+∞ X
n
X
X
Yt =
Xi =
Xi 1I{Nt =n}
i=1
n=0
i=1
em que a variável aleatória Nt é dada pelo modelo da frequência e em que X1 , . . . Xn , . . .
é uma sucessão de variáveis aleatórias independentes e com distribuição idêntica ao
modelo encontrado para a severidade X. A questão natural agora é a da determinação
da distribuição de Yt .
7.1 Solução Analı́tica
Esta determinação directa é em geral impossı́vel a não ser em casos particulares especiais.
Um método útil usa as transformações funcionais, por exemplo a função caracterı́stica
ou a função geradora de momentos. Com efeito, considerando as funções caracterı́sticas,
ii
h h PNt
ψYt (u) := E eiuYt = E E eiu i=1 Xi | Nt
Supondo que Nt , X1 , . . . Xi . . . são independentes, por uma propriedade importante da
esperança condicional (ver [Resnick 01, p. 350] ou [Hoffmann-Jorgensen 94, p. 452]),
" n
#
h PNt
i
h Pn
i
Y
iu i=1 Xi
iu i=1 Xi
iuXi
E e
| Nt = n = E e
=E
e
= (ψX (u))n ,
i=1
pelo que, pelas propriedades da esperaça condicional,
h PNt
i
E eiu i=1 Xi | Nt = (ψX (u))Nt
MF0910
18
Capı́tulo VI
Risco Operacional
Secção: 8
e, finalmente,
ψYt (u) = E (ψX (u))Nt .
Por exemplo, se (Nt )t≥0 for o processo de Poisson de parâmetro λ ter-se-á que
+∞
+∞
X
X
(λt)k
ψYt (u) = E (ψX (u))Nt =
.
ψX (u))k P[Nt = k] =
(ψX (u))k e−λt
k!
k=0
k=0
Ou seja:
ψYt (u) = e−λt eλtψX (u) = e−λt(1−ψX (u)) .
Caso seja possı́vel inverter esta função caracterı́stica ter-se-á a distribuição de Yt numa
representação analı́tica. Um caso interessante é o de X ter a distribuição gama (veja-se
também a secção 3.6) com parâmetro de forma α e parâmetro de escala inverso β cuja
densidade e função caracterı́stica são dadas, respectivamente, por
fX (x) =
β α α−1 −βx
1
x
e
ψX (u) =
k
Γ(α)
(1 − iu
β)
Mas até neste caso, aparentemente simples, a determinação da distribuição de Yt necessita o uso de cálculo numérico (veja-se o ficheiro do Mathematica RscOp20091201).
7.2 Solução Simulada ou Aproximada
Referiremos dois métodos aproximados com alguma relevância prática.
• Se a variável aleatória N tomar valores grandes com grande probabilidade é justificável o teorema limite central que nos permite afirmar
Y _ Gaussiana (E[Y ], σ(Y ))
No entanto, esta aproximação normal não é considerada fiável em Ciências Actuariais pelo que o seu uso no risco operacional não pode ser recomendado.
• Uma solução advogada na prática consiste em simular a distribuição de Y para, dos
resultados dessa simulação, extrair as medidas de risco. A metodologia é simples
e está descrita e exemplificada completamente em [Cruz 02][p. 105]. Consiste
em simular numa coluna a variável N . Para cada linha simular uma amostra da
distribuição da severidade com dimensão exactamente igual ao valor que a variável
N simulada tem nessa linha. Para cada linha somar os valores correspondentes a
cada um dos termos da amostra da distribuição da severidade. Finalmente somar os
resultados obtidos nas linhas. Efectuámos assim uma repetição da simulação. Para
completar a simulação efectuar-se-á um número suficiente de repetições (entre 10
000 e 100 000) obtendo-se assim uma amostra da distribuição das perdas agregadas
de acordo com o modelo. As técnicas de cálculo das medidas de risco, por exemplo
o VaR, podem agora ser aplicadas a esta amostra.
MF0910
19
Capı́tulo VI
Risco Operacional
Secção: 8
8 Bibliografia Comentada
Nesta secção apresentamos comentários que pretendem guiar o eventual leitor para na
consulta à bibliografia e às referências apresentadas no final.
• [Abell 99] Esta obra colectiva é muito completa e permite uma exploração, usando
o software Mathematica, das principais técnicas estatı́sticas elementares tais como:
a estatı́stica descritiva, alisamento de dados e séries cronológicas, inferência para
amostras simples e para pares de amostras, análise de variância, regressões e
métodos não paramétricos. Pode revelar-se extremamente útil para quem pretender uma familiarização simultânea com os métodos da estatı́stica e o uso do
Mathematica.
• [Basel 01] Trata-se de um documento que descreve a aproximação do Comité
de Basileia para a avaliação e controlo do risco operacional. É indispensável que
os técnicos que se ocupam da implementação das metodologias de avaliação e
controlo do risco operacional conheçam precisamente a filosofia dos organismos de
supervisão sobre esse assunto.
• [Chavez 04] Demonstra-se a extensão da teoria dos extremos aplicada ao risco
operacional no caso em que os dados não são estacionários, isto é grosso modo,
apresentam uma variabilidade no tempo que sugere que as leis probabilı́sticas que
regulam o fenómeno variam no tempo.
• [Chavez 05] Uma versão mais elaborada, completa, e detalhada do artigo [Chavez 04].
A leitura é aconselhada dado que os autores não só demonstram a utilidade das
técnicas que propõem mas também chamam a atenção dos leitores para as as
condições especiais em que as técnicas podem fornecer resultados fiáveis.
• [Gomes04] Um texto que recolhe e sistematiza informação útil e actual sobre a
teoria dos valores extremos e suas aplicações à análise do risco.
• [Pestana 02] Para quem procura uma introdução, um auxiliar de estudo e uma
obra de referência de referência nas ciências estatı́sticas recomendo esta obra.
Escrita muito cuidadosamente, o leitor poderá nela encontrar a par de muitos
exemplos detalhados que permitem uma sensibilização para a arte de aplicar a
Estatı́stica a problemas concretos, muitas
• [Cruz 02] Uma referência básica que recomendamos para o estudo inicial dos
métodos quantitativos aplicáveis ao risco operacional. É um texto detalhado de
nı́vel correspondendo a uma iniciação informada que reflecte bem a filosofia subjacente à aplicação dos métodos quantitativos. Alguma precaução é necessária
no que toca às fórmulas apresentadas. Estas devem ser objecto de verificação
independente antes de serem postas em aplicação. Pode ser lida em conjunto
com [Lewis 04].
• [Embrechts 97] Obra fundamental para um estudo detalhado da teoria dos valores extremos. Necessita para um pleno aproveitamento de alguns conhecimentos
MF0910
20
Capı́tulo VI
Risco Operacional
Secção: 8
iniciais em Estatı́stica mas mesmo sem estes conhecimentos pode ser estudada
permitindo uma primeira abordagem bem sucedida à arte de aplicar a teoria aos
problemas concretos.
• [Embrechts 03] Uma chamada de atenção para as limitações que tem a aplicação
da teoria dos valores extremos em situações em que os dados utilizados nas estimações não têm a estrutura e as qualidades adequadas.
• [Embrechts 04] Os autores passam em revista as principais ideias subjacentes à
aplicação da teoria dos valores extremos ao risco operacional. A referência à teoria
da ruı́na deriva do facto de o modelo colectivo das Ciências Actuariais ser utilizado
na quantificação do risco operacional na determinação de um modelo das perdas
agregadas envolvendo a severidade e a frequência.
• [Ivchenko 90] É uma obra de grande qualidade, relativamente exigente sob o
ponto de vista técnico, mas muito clara e concisa. Permite um estudo das principais
ideias da Estatı́stica Matemática esclarecendo com exemplos escolhidos as noções
apresentadas. É complementado com um óptimo livro de exercı́cios.
• [Lewis 04] Pode considerar-se uma obra de iniciação que permite uma familiarização progressiva com conceitos úteis a um nı́vel introdutório. É acompanhada
de ficheiros Excel que ilustram os noções apresentadas. Recomendamos a leitura
desta obra aos leitores que pretendam uma sensibilização introdutória aos métodos
da Estatı́stica aplicada ao risco operacional. Ganha em ser lida em conjunto
com [Cruz 02].
• [Reiss 01] Para uma exploração aprofundada t̀eoria dos valores extremos e suas
aplicações. Uma versão académica do software Xtremes acompanha o livro permitindo tratar completamente variados exemplos.
• [Ricci 05] Trata-se de uma abordagem à estimação usando o software R. Detalha
alguns procedimentos importantes e explica como efectuar interpretações dos resultados para algumas das técnicas apresentadas no ajustamento de distribuições.
• [Rolski 99] É um texto de referência para muitas matérias que não foram aqui
abordadas mas que são da maior importância para a análise do risco operacional
uma vez que algumas das técnicas utilizadas têm sido exploradas no âmbito das
aplicações actuariais.
Referências
[Abell 99] M. L. Abell, J. P. Braselton, J. A. Rafter, Statistics with Mathematica ,
Academic Press 1999.
[Basel 01] Basel Committee on Banking Supervision, Consultative Document Operational Risk, Bank for International Settlements 2001.
MF0910
21
Capı́tulo VI
Risco Operacional
Secção: 8
[Chavez 04] V. Chavez-Demoulin, P. Embrechts, Advanced Extremal Models for Operational Risk, preprint (http://www.math.ethz.ch/%7Ebaltes/ftp/papers.html).
[Chavez 05] V. Chavez-Demoulin, P. Embrechts, J. Nes̆lehová, Quantitative Models for Operational Risk:
Extremes, Dependence and Aggregation,
submetido ao Journal of Banking and Finance preprint
(http://www.math.ethz.ch/%7Ebaltes/ftp/papers.html).
[Gomes04] M. Ivette Gomes, Extremes and Risk Management, in proceedings of Stochastic Finance 2004, Autumn School and International Conference (disponı́vel on-line).
[Hoffmann-Jorgensen 94] J. Hoffmann-Jorgensen, Probability with a View Toward Statistics. Volume I, Chapman & Hall , 1994.
[Pestana 02] D. D. Pestana, S. F. Velosa Introdução à Probabilidade e à Estatı́stica,
Volume I, Fundação Calouste Gulbenkian, Lisboa 2002.
[Cruz 02] M. G. Cruz, Modeling measuring and hedging operational risk. John Wiley &
Sons, Inc. 2002.
[Embrechts 97] P. Embrechts, C Klüppelberg, T. Mikosch, Modelling Extremal Events
for insurance and Finance. Springer Verlag, 1997.
[Embrechts 03] P. Embrechts, H. Furrer, R. Kaufmann, Quantifying Regulatory Capital
for Operational Risk, Derivatives Use, Trading & Regulation. 9(3), 217–233, 2003.
[Embrechts 04] P. Embrechts, G. Samorodnitsky, Ruin Theory Revisited: Stochastic
Models for Operational Risk, In: Risk Management for Central Bank Foreign Reserves (Eds. C. Bernadell et al.) European Central Bank, Frankfurt a.M., 243-261,
2004.
[Ivchenko 90] G. I. Ivchenko, Yu. I. Medvedev, Mathematical Statistics, Mir Publishers
Moscow, 1990.
[Lewis 04] N. da Costa Lewis, Operational Risk with Excel and VBA. John Wiley &
Sons, Inc. 2004.
[Reiss 01] R. D. Reiss, M Thomas Statistical Analysis of Extreme values, second edition,
Birkhauser Verlag, 2001.
[Resnick 01] S. I. Resnick A Probability Path, second printing, Birkhauser Boston, 2001.
[Ricci 05] V. Ricci, Fitting Distributions with R, release 0.4, 21 February 2005.
[Rolski 99] T. Rolski, H. Schmidli, Volker Schmidt, J. Teugels Stochastic Processes for
Insurance and Finance, John Wiley & Sons, 1999.
MF0910
22

Matemática Financeira - Universidade Nova de Lisboa

Transcrição

Documentos relacionados

Exerc´ıcios sobre Discriminaç˜ao de Preços

Bolo do Caco Bimby: 27 min Ingredientes: 1 c. café sal

A distribuiç ˜ao Weibull inversa generalizada na modelagem de

Fettuccine à Alfredo Ingredientes: 400 g massa fettuccine ou

Sopa de Castanhas Ingredientes: 1 cebola 40 g azeite 50 g linguiça

Jardineira de Carne

autorização do responsável

Empanada de Frango com Sultanas Ingredientes p/ a massa

Lista de exercícios 03

Probabilidade para Finanças