Contribuições Conceituais e Estatísticas para a - arcos

Transcrição

Aceleração cósmica:
aspectos fenomenológicos e estatísticos
Émille Eugênia de Oliveira Ishida
Orientador: Ioav Waga
Co-orientador: Ribamar Rondon de Rezende dos Reis
i
UFRJ
Tese de Doutorado apresentada ao Programa
de Pós-graduação em Física, Instituto de
Física, da Universidade Federal do Rio de
Janeiro, como parte dos requisitos necessários
à obtenção do título de Doutor em Ciências
(Física).
Co-orientador: Ribamar Rondon de Rezende
dos Reis
Rio de Janeiro
Março de 2010
ii
iii
I 79 Ishida, Émille Eugênia de Oliveira
Aceleração cósmica: aspectos fenomenológicos e estatísticos/
Émille Eugênia de Oliveira Ishida - Rio de Janeiro: UFRJ / IF,
2010.
xiii, 121f.: il. ; 29,7cm.
Tese (doutorado) - UFRJ / Instituto de Física / Programa de
Pós-graduação em Física , 2010.
Referências Bibliográficas: f. 115-121.
1. Cosmologia. 2. Energia Escura. 3. Supernovas. 4. Análise
por Componentes Principais I. Waga, Ioav. II. Universidade Federal
do Rio de Janeiro, Instituto de Física, Programa de pós-graduação
em Física. III. Aceleração cósmica: aspectos fenomenológicos e
estatísticos.
Para conseguirmos entender o curso natural das coisas temos que conseguir desaprender
muitos conceitos. Para os podermos desaprender é preciso que antes os tenhamos
aprendido.
Tao Te Ching
v
Resumo
Resumo da Tese de Doutorado submetida ao Programa de Pós-graduação em Física, do
Instituto de Física, da Universidade Federal do Rio de Janeiro - UFRJ, como parte dos
requisitos necessários à obtenção do título de Doutor em Ciências (Física).
O trabalho apresentado nesta tese utiliza duas abordagens complementares para a análise
da dinâmica global do universo. Sabemos, desde fins do século XX, que o universo entrou
em uma fase de expansão acelerada no passado. Para explicar a aceleração cósmica, as duas
maiores linhas de investigação presentes na literatura sugerem, a presença de um componente
exótico com pressão negativa ou que a Teoria da Relatividade Geral deve ser modificada
em escalas cosmológicas. Em ambas possibilidades admite-se uma determinada teoria de
gravitação e um modelo cosmológico particular.
Um dos objetivos desta tese, é analisar a aceleração cósmica da forma mais geral possível.
Para tanto, utilizamos apenas a definição do parâmetro de desaceleração, q,: uma quantidade
formada a partir do fator de escala da métrica de Friedman-Lemaître-Robertson-Walker e de
suas derivadas até segunda ordem. Primeiramente propomos uma nova parametrização para
q, composta por quatro parâmetros com significados físicos bastante claros. Utilizamos dados
de supernovas do tipo Ia, medidas de oscilações acústicas de bárions e da distância à superfície
de último espalhamento da radiação cósmica de fundo para encontrar vínculos sobre esses
parâmetros. Nossos resultados mostram, de uma forma bem geral, que houve uma transição
(desaceleração-aceleração) no passado. Realizamos também uma simulação de experimentos
vi
futuros, considerando a melhora nas incertezas que certamente será proporcionada pelos
mesmos.
Em um segundo momento, analisamos também a possibilidade de obter informações sobre
a dinâmica do universo a partir dos dados, sem a necessidade de supor uma forma funcional
para o parâmetro de desaceleração. Para tanto, utilizamos a Análise por Componentes Principais (ACP). Este método utiliza o inverso da matriz de covariância (matriz de Fisher) para
reescrever os dados observacionais em uma nova base onde o erro ao longo de uma determinada direção no espaço de parâmetros não tem correlação com os erros nas outras direções.
De posse dessa nova base, reconstruímos q. Nesse processo, a reconstrução é feita utilizando
apenas os componentes ao longo dos quais a variância dos dados é maior, o que nos possibilita
reduzir o espaço de parâmetros e simplificar o problema. Nós apresentamos detalhadamente
os cálculos que levam a uma expressão analítica para a matriz de Fisher, partindo tanto
de dados de supernovas Ia assim como de oscilações acústicas de bárions. Aplicamos esse
procedimento ao mais recente conjunto de dados de observações de supernovas Ia, que nos
fornecem uma reconstrução razoável, mas ainda predominantemente dominada por incertezas. Como uma maneira de verificar a eficácia do método frente aos dados provenientes
de futuros experimentos, realizamos também a mesma análise com base em simulações de
medidas de oscilações acústicas de bárions para um experimento como o Square Kilometre
Array. Mostramos que, no futuro, o uso de ACP pode ser bastante promissor para que se
extraia a forma funcional do parâmetro de desaceleração a partir dos dados observacionais
sem a utilização de uma parametrização específica e praticamente livre de erros numéricos.
Palavras-chave: Cosmologia. Energia escura. Supernovas. Análise por Componentes Principais.
Rio de Janeiro
Março de 2010
vii
Abstract
The cosmic acceleration:
phenomenological and statistical aspects
Supervisor: Ioav Waga
Second Supervisor: Ribamar Rondon de Rezende dos Reis
Abstract da Tese de Doutorado submetida ao Programa de Pós-graduação em Física,
Instituto de Física, da Universidade Federal do Rio de Janeiro - UFRJ, como parte dos
requisitos necessários à obtenção do título de Doutor em Ciências (Física).
The work presented in this thesis investigates two complementary approaches used to
study the universe’s global dynamical properties. We know, since the end of the 20th century,
that the universe entered a phase of decelerated expansion in the past. In order to explain this
behavior, the two main paths of investigation found in the literature suggest a new exotic
component with negative pressure or modifications applied to General Relativity Theory
in cosmological scales. In both cases, one must begin with a given gravity theory and
cosmological model and perform the analysis case by case.
One of the main objectives of this work is to analyze cosmic acceleration in the most
general possible way. As a consequence, we make use of the definition of the deceleration parameter, q,: a quantity constructed from the scale factor of the Friedman-LemaîtreRobertson-Walker metric and its derivatives up to second order. We begin proposing a new
parametrization for q, composed by four parameters with very clear physical meaning. We
use data from type Ia supernova observations, measurements of baryon acoustic oscillations
and the distance to the last scattering surface from the cosmic microwave background radiation in order to find constraints on our parameters. Our results show, in a general way, that
there was a transition (deceleration-acceleration) in the past. We also performed a simula-
viii
tion based on future experiments designs, taking into account the improvement on current
uncertainties that will certainly come from a new generation of observational facilities.
As a second step, we also analyzed the possibility of obtaining information about the
dynamics of the universe based only in the data, without the need of imposing a functional
form for the deceleration parameter. Our tool to achieve this objective is the use of Principal
Component Analysis (PCA). PCA is a statistical method that uses the inverse of the covariance matrix (also called Fisher matrix) in order to rewrite the observational data in a new
base, where the errors associated to a determined direction in the parameter space (principal
component) has no correlation with the errors associated to other directions. Having this
new base, we reconstructed q. The reconstruction is performed using only a few components
which represent the majority of the variance present in the data set, as a consequence, this
procedure allows us to reduce the dimensionality of the parameter space, simplifying the
problem. We present the detailed calculations that lead us to an analytical expression for
the Fisher matrix, based on supernova and baryon acoustic oscillation observations. We
apply this procedure to the most recent supernova data set, which provided a reasonable
reconstruction, but still predominantly driven by uncertainties. In order to verify the efficiency of the method, once data from future experiments is available, we also used PCA
based on simulated data from baryon acoustic oscillations for an experiments like the Square
Kilometre Array. We show that, in the future, the use of PCA may be use to extract the
functional form of the deceleration parameter from the data set without the use of a specific
parametrization and practically free from numerical errors.
Key-words: Cosmology. Dark energy. Supernovae. Principal Component Analysis.
Rio de Janeiro
Março de 2010
Notações e Convenções
1. Índices gregos variam de 0 a 3;
2. Índices latinos variam de 1 a 3;
3. Derivada parcial:
∂φ
∂xα
= ∂α φ = φ,α ;
4. Símbolo de Christoffel: Γαβγ = 21 g αµ (∂γ gµβ + ∂β gµγ − ∂µ gβγ );
5. Derivada covariante: Tβ;α = ∇α Tβ = ∂α Tβ − Γλβα Tλ ;
6. Tensor de Riemann:R
µ
αβλ
= ∂β Γµαλ − ∂λ Γµαβ + Γγαλ Γµγβ − Γγαβ Γµγλ ;
7. Tensores simétricos: T(αβ) ≡ 21 (Tαβ + Tβα );
8. Assinatura da métrica: (+, −, −, −);
9. No sistema de unidades utilizado: ~ = c = kb = 1;
10. M¯ corresponde à massa solar ≈ 1.9891 × 1030 kg;
11. 1 Mpc ≈ 3 × 1022 m ≈ 3 × 106 anos-luz.
ix
x
Agradecimentos
Mais uma vez agradeço a Deus por ter colocado tantas pessoas incríveis no meu caminho:
Meu pai, Osvaldo, que apesar da nossa curta convivência continua sendo um exemplo em
muitos aspectos da minha vida;
Minha mãe, Iedes, que sempre acreditou em mim muito mais do que eu mesma, e cujos
esforços foram imprescindíveis para que este trabalho pudesse ser desenvolvido;
Minha irmã e meu cunhado, Myleni e Natan, presentes em todos os momentos desesperadores que eu tive nos últimos anos, e sempre compreensivos quanto às minhas ausências
cada vez mais frequentes;
Minha tia, Maria, que além de muitos conselhos me ajudou a adquirir parte dos equipamentos necessários para o desenvolvimento deste trabalho;
Meu amigo, namorado, companheiro, confidente e colaborador, Rafael, que se mostrou
uma surpresa incrível no melhor dos sentidos, e me trouxe não apenas paz de espírito mas
uma companhia para todos os projetos mirabolantes e hobbies exóticos que eu sempre quis
fazer. Além, é claro, de entender minhas piadas e ajudar na revisão desta tese;
Meu colaborador, Alan, que nos ajudou a desenvolver parte do trabalho aqui apresentado;
Meus companheiros de sala, Bruno, Fernando, Marcos, Ramón e Vinícius, ótimas companhias para bater papo sobre o que quer seja, e que nunca demonstraram incômodo em
relação à minha mania de organizar a nossa sala;
Os professores do Instituto de Física da UFRJ, principalmente os integrantes do ARCOS
(Grupo de Astrofísica, Relatividade e COSmologia), que sempre proporcionaram a mim e
aos demais estudantes um ambiente saudável de discussão e crescimento científico;
xi
xii
Meu colaborador, amigo e agora co-orientador, Ribamar, dono de uma paciência sem
tamanho, testada à exaustão ao longo de quatro anos de colaboração, intensas discusões, e
convivência durante minhas primeiras peripécias pelo mundo;
O supervisor do meu estágio no exterior, Ofer, que me ensinou muito sobre as possibilidades de internacionalização da minha pesquisa;
Meu mais novo colaborador, Filipe e todos os membros do Grupo de Astrofísica da UCL,
que me receberam de braços abertos e ajudaram a me adaptar ao jeito londrino de ser... na
medida do possível;
Meu anfitrião no IAG-USP durante o segundo semestre de 2008, Opher, que me deu a
oportunidade de participar das atividades do seu grupo de pesquisa nos estágios finais do
meu doutorado;
Meus amigos do Clube do Livro, André, Beatriz, Martin, Miguel e Paula, responsáveis
por grande parte do meu crescimento filosófico ao longo dos últimos quatro anos;
Todos os membros da Congregação Evangélica Luterana Cristo Redentor que me deram
a honra de participar do Projeto Zona Sul, e em especial Cibele, Cíntia, Felipe, Heliete, Luis
e Vera, duas famílias incríveis que me adotaram quando precisei de um teto durante a fase
final de redação deste trabalho;
A família Waga, Sandra e Tamara, que aceitaram me hospedar no Rio em momentos
críticos no desenvolvimento desta tese;
O CNPq e a CAPES, que não são pessoas, mas aos quais agradeço pelo apoio financeiro
no desenvolvimento deste projeto;
E por fim, serei sempre grata por ter tido a oportunidade de desenvolver meu doutorado
sob a orientação do professor Ioav Waga, que antes mesmo de me conhecer fez uma análise
psicológica do meu inocente email de graduanda e decidiu que por algum motivo eu merecia
uma chance. Agradeço imensamente por ter me recebido na UFRJ, ter me ajudado a desvendar os mistérios da vida acadêmica e acima de tudo, por proporcionar um ambiente onde
pude desenvolver livremente meu gosto pela pesquisa.
Lista de Figuras
2.1
Velocidade como função do desvio para o vermelho (Hubble, 1929). . . . . .
10
2.2
Distância de diâmetro angular. . . . . . . . . . . . . . . . . . . . . . . . . . .
15
3.1
Tipos de supernovas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
3.2
Relação entre a função de correlação e o espectro de potência. . . . . . . . .
36
3.3
Fases do desacoplamento entre fótons e bárions. . . . . . . . . . . . . . . . .
37
3.4
Medidas de dA (z) e H(z) a partir de BAO. . . . . . . . . . . . . . . . . . . .
38
3.5
Pico acústico na função de correlação. . . . . . . . . . . . . . . . . . . . . . .
40
3.6
Incertezas em medidas de H(z) e dA (z) usadas na simulação. . . . . . . . . .
42
4.1
Influência de zt e τ na forma de q(z). . . . . . . . . . . . . . . . . . . . . . .
49
4.2
Vínculos impostos por dados de SNIa e Sk/Dv. . . . . . . . . . . . . . . . .
54
4.3
Vínculos impostos por dados de SNIa + Sk /Dv . . . . . . . . . . . . . . . . .
54
4.4
Forma de q(z) para melhores ajustes do Gold182
. . . . . . . . . . . . . . .
56
4.5
Forma de q(z) para melhores ajustes do SNLS. . . . . . . . . . . . . . . . . .
56
5.1
Exemplo de dados em função de 2 variáveis correlacionadas. . . . . . . . . .
59
5.2
Exemplo de dados em função dos CPs. . . . . . . . . . . . . . . . . . . . . .
59
5.3
CPs para dados do SDSS. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
71
5.4
CPs para medidas de dA (estágios 1 a 3). . . . . . . . . . . . . . . . . . . . .
72
5.5
CPs para medidas de H(z) (estágios 1 a 3). . . . . . . . . . . . . . . . . . .
73
5.6
Reconstruções de 1 a 3 CPs para dados do SDSS. . . . . . . . . . . . . . . .
79
5.7
Reconstrução final para dados do SDSS. . . . . . . . . . . . . . . . . . . . .
82
xiii
xiv
LISTA DE FIGURAS
5.8
Reconstruções para medidas de dA (estágio 1). . . . . . . . . . . . . . . . . .
84
5.9
Reconstruções para medidas de dA (estágio 2). . . . . . . . . . . . . . . . . .
85
5.10 Reconstruções para medidas de dA (estágio 3). . . . . . . . . . . . . . . . . .
86
5.11 Reconstruções finais para dA . . . . . . . . . . . . . . . . . . . . . . . . . . .
87
5.12 Reconstruções a partir de medidas de H(z) (estágio 1). . . . . . . . . . . . .
89
5.13 Reconstruções para medidads de H(z) (estágio 2). . . . . . . . . . . . . . . .
90
5.14 Reconstruções para medidas de H(z) (estágio 3). . . . . . . . . . . . . . . .
91
5.15 Reconstruções finais para medidas de H(z) . . . . . . . . . . . . . . . . . . .
92
Lista de Tabelas
5.1
Critério para seleção do número de componentes na reconstrução para dL e dA . 75
5.2
Critério para seleção do número de componentes na reconstrução para H(z).
xv
76
xvi
LISTA DE TABELAS
Índice
Resumo
v
Abstract
vii
Notações e Convenções
ix
Agradecimentos
xi
Lista de Figuras
xiii
Lista de Tabelas
xiii
1 Introdução
1
2 Princípios Básicos
5
2.1
Homogeneidade e Isotropia
. . . . . . . . . . . . . . . . . . . . . . . . . . .
6
2.2
O universo em expansão . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
2.3
Distâncias em Cosmologia . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
2.3.1
Distância Comóvel . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
2.3.2
Distância de Diâmetro Angular . . . . . . . . . . . . . . . . . . . . .
14
2.3.3
Distância de Luminosidade e o Sistema de Magnitudes . . . . . . . .
16
O Modelo Padrão da Cosmologia . . . . . . . . . . . . . . . . . . . . . . . .
19
2.4.1
Equações de Einstein
. . . . . . . . . . . . . . . . . . . . . . . . . .
20
2.4.2
ΛCDM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
2.4
xvii
xviii
ÍNDICE
3 Dados Observacionais
25
3.1
Supernovas Ia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
3.2
Oscilações Acústicas de Bárions . . . . . . . . . . . . . . . . . . . . . . . . .
30
4 Um novo olhar sobre o Parâmetro de Desaceleração
43
4.1
Nosso Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
44
4.2
Vínculos Observacionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
50
5 Análise por Componentes Principais
5.1
5.2
5.3
57
A matriz de Fisher... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
60
5.1.1
... a partir da Distância de Luminosidade . . . . . . . . . . . . . . . .
62
5.1.2
... a partir da Distância de Diâmetro Angular . . . . . . . . . . . . .
63
5.1.3
... a partir do Parâmetro de Hubble . . . . . . . . . . . . . . . . . . .
65
Reconstrução do Parâmetro de Desaceleração . . . . . . . . . . . . . . . . .
66
5.2.1
Quantos Componentes Principais? . . . . . . . . . . . . . . . . . . . .
67
Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77
5.3.1
Observações de Supernovas Ia . . . . . . . . . . . . . . . . . . . . . .
77
5.3.2
Quando a informação não é suficiente . . . . . . . . . . . . . . . . . .
80
5.3.3
Medidas de dA (z) e H(z) a partir de BAO . . . . . . . . . . . . . . .
83
6 Discussões e Conclusões
93
A Desvio para o Vermelho
97
B Cálculo da Matriz de Fisher...
99
B.1 ... a partir da Distância de Luminosidade . . . . . . . . . . . . . . . . . . . . 100
B.2 ... a partir da Distância de Diâmetro Angular . . . . . . . . . . . . . . . . . 108
B.3 ... a partir do Parâmetro de Hubble . . . . . . . . . . . . . . . . . . . . . . . 110
Capítulo 1
Introdução
A história do nosso conhecimento sobre a dinâmica do universo pode ser dividida em antes
e depois de 1998. Neste ano, dois grupos independentes (Riess et al., 1998; Perlmutter et al.,
1999) trouxeram a público resultados de observações de supernovas Ia (SNIa) que indicavam uma fase recente de expansão cósmica acelerada. Posteriormente, medidas de Oscilações
Acústicas de Bárions (BAO, do inglês Baryon Acoustic Oscillations) (Eisenstein et al., 2005)
mostraram que a matéria bariônica somada à matéria escura correspondem à ≈ 27% do conteúdo energético do universo. Paralelamente, medidas provenientes da Radiação Cósmica
de Fundo (RCF) favoreciam um universo com curvatura espacial nula (Bennett et al., 2003;
Spergel et al., 2007; Komatsu et al., 2009). Esses resultados, somados aos mais recentes
resultados de SNIa (Kessler et al., 2009) interpretados no contexto da relatividade geral,
parecem apontar a existência de uma componente exótica, de pressão negativa, que atualmente domina a expansão do universo. Este componente responsável pela recente aceleração
é denominado Energia Escura (EE).
A idéia de um componente com efeito gravitacional repulsivo esteve presente no cenário cosmológico desde a criação da Relatividade Geral (RG). O próprio Einstein propôs a
existência deste tipo de efeito, que ele denominou Constante Cosmológica (CC), a fim de
compatibilizar os resultados da RG com a crença em um universo estático que predominava
na época. Com a descoberta feita por Hubble em 1929, de que as galáxias estão na verdade
se afastando umas das outras, Einstein abandonou a idéia da CC. A expansão acelerada
1
2
CAPÍTULO 1. INTRODUÇÃO
presente nos dados de 1998 trouxe novamente a CC ao centro das discussões, como uma
alternativa para explicar a causa da aceleração.
A volta da constante cosmológica ao cenário científico no fim do século passado não foi a
única consequência direta da descoberta da expansão acelerada. Um resultado experimental
em desacordo com a teoria padrão vigente sempre abre um grande e novo leque de discussões.
Primeiramente, questionando a veracidade dos dados apresentados e, posteriormente, caso
os dados sejam comprovadamente verossímeis, propondo modificações à teoria padrão. Neste
caso não foi diferente.
Uma das primeiras hipóteses astrofísicas sugeridas como alternativa à existência da EE
considerava poeira presente na linha de visada, uniformemente distribuída entre a fonte
e o observador. A poeira ocasionaria uma demagnificação sistemática das supernovas mais
distantes, causando um efeito análogo àquele gerado pela expansão acelerada (Aguirre, 1999).
Entretanto, essa hipótese foi descartada logo em seguida, devido à ausência de assinaturas
que deveriam ser observadas na radiação de cósmica de fundo no infravermelho (por exemplo,
Aguirre & Haiman (2000)).
Também foi levantada a possibilidade deste efeito ser devido à nossa localização em
uma região de baixa densidade no universo ("bolha")(Zehavi et al., 1998). Neste contexto,
objetos mais distantes estariam se distanciando ainda mais de nós, de maneira acelerada,
devido ao efeito gravitacional da região de sobredensidade que nos circunda. Entretanto,
estudos preliminares não apóiam esta hipótese, devido à ausência de tal efeito em medidas
da velocidade de aglomerados de galáxias (Giovanelli et al., 1999) e também em estimativas
de velocidade das galáxias hospedeiras em dados de SNIa (Hicken et al., 2009). Análises
deste tipo de comportamento em dados que utilizam SN Ia como velas padrão mostram que
a detecção ou não de uma região de subdensidade local depende fortemente do método de
padronização das curvas de luz utilizado (Conley et al., 2007). Sendo assim, esta hipótese
continua em aberto (para mais detalhes sobre o atual cenário da utilização de SN Ia como
velas padrão, ver capítulo (3)).
Estes são apenas alguns exemplos de tentativas presentes na literatura a fim de eliminar
3
a necessidade de um componente com pressão negativa (para uma revisão, ver Sami (2009)),
entretanto, a existência de algum tipo de energia escura presente como parte dominante da
energia de um universo regido pela RG continua sendo parte do mosaico que compõe o atual
Modelo Padrão da Cosmologia (vide capítulo 2). Dentro deste cenário várias possibilidades
foram traçadas. Estudou-se também a eficácia de diferentes parametrizações onde a relação
entre densidade, ρ, e pressão, p, da EE (p = wρ, onde w é o parâmetro da equação de
estado) depende do desvio para o vermelho (Chevallier & Polarski, 2001; Linder, 2003). Foi
abordada também a hipótese de um fluido que se comportaria como matéria escura no início
do universo e cujo comportamento seria semelhante àquele da energia escura para o universo
atual (Kamenshchik, Moschella, & Pasquier, 2001; Makler, de Oliveira, & Waga, 2003). Em
todos esses casos e muitos outros não citados aqui, a estratégia de investigação proposta
impõe alguma característica à EE e a partir desta, determina-se os valores dos parâmetros
para os quais a concordância com os dados observacionais é máxima. Entretanto, essa
abordagem é bastante restrita, pois oferece resultados apenas para um modelo de fluido, em
um determinado contexto cosmológico.
O trabalho apresentado nesta tese visa diminuir os efeitos do que ainda não sabemos em
relação à EE e à RG, extraindo dos dados informações sobre a dinâmica do universo que
independem dessas hipóteses. Para tanto, baseamos nossa análise no parâmetro de desaceleração, q, que representa o comportamento dinâmico global do universo. Como mostraremos
a seguir, a escolha deste parâmetro como base de nossa análise exige que façamos hipóteses
apenas em relação à homogeneidade e isotropia do universo, ou seja, da métrica. Podemos
expressar distâncias em escalas cosmológicas (distância de luminosidade (dL ), distância de
diâmetro angular (dA ) e distância comóvel (dC )) em função de q, assim como do parâmetro
de Hubble (H) e consequentemente impor vínculos sobre o comportamento de q como função do desvio para o vermelho sem especificar o conteúdo material do universo e a teoria de
gravitação subjacente.
Primeiramente propomos uma forma funcional para q dependente de 4 parâmetros, todos com claro significado físico. Além disso, a expressão proposta neste trabalho é capaz de
4
CAPÍTULO 1. INTRODUÇÃO
reproduzir uma grande quantidade de modelos de EE para diferentes valores de seus parâmetros. Utilizamos dados de observações de SNIa, BAO e RCF para impor vínculos sobre
três dos quatro parâmetros.
A abordagem descrita no parágrafo anterior apresenta vantagens, já citadas, em relação
a estudos similares focados em w. Entretanto, os resultados ainda são submetidos a um viés
introduzido pela forma funcional específica escolhida (q(z)). A fim de obter resultados ainda
mais abrangentes, onde a dependência com o desvio para o vermelho é construída a partir dos
dados, fazemos uso da Análise por Componentes Principais (ACP). Neste trabalho, reescrevemos nossa função de interesse como uma combinação linear dos autovetores da matriz de
Fisher, em uma abordagem que amplia aquela sugerida inicialmente por Shapiro & Turner
(2006). Novamente nos concentramos na análise do parâmetro de desaceleração, o que nos
permitiu obter analiticamente todos os passos necessários ao cálculo da matriz de Fisher.
Como um exemplo de aplicação deste método, submetemos a este procedimento, dados provenientes de observações de SNIa apresentados por Kessler et al. (2009) e dados simulados
para um experimento como o Square Kilometre Array (SKA), de acordo com os resultados
apresentados por por Abdalla, Blake, & Rawlings (2009).
Acreditamos que este trabalho ilustra uma das possibilidades disponíveis para se encontrar informações sobre a dinâmica do universo, independentemente de modelo cosmológico
e praticamente livre de erros numéricos.
Capítulo 2
Princípios Básicos
A cosmologia moderna é baseada na hipótese de que o lugar que ocupamos no universo
não é especial. Podemos resumir desta maneira o Princípio Cosmológico, que representa uma
idéia ao mesmo tempo simples e poderosa. Sua influência na história do desenvolvimento
humano se torna clara se levarmos em conta que, durante a maior parte da história da
humanidade, acreditou-se que o homem ocupava um lugar especial no universo (o centro).
Os gregos antigos acreditavam que a Terra se encontrava no centro do universo, idéia
descrita com detalhes no sistema planetário de Ptolomeu. Neste sistema, o Sol e demais
planetas orbitavam ao redor da Terra, e um complicado sistema de epiciclos foi criado a
fim de explicar o movimento retrógrado aparente dos planetas. Por volta de 1500, Nicolau
Copérnico propôs um sistema que facilmente explicava esses movimentos, mas que para isso
retirava a Terra do centro do universo substituindo-a pelo Sol. Famoso por ter derrubado
a visão antropocêntrica de sua época, Copérnico manteve a crença de que o Sol ocupava o
centro do universo.
Nos próximos duzentos anos, ficou claro que as estrelas não estavam distribuídas em
esferas celestes, mas que estas se agrupavam em forma de um disco que atualmente conhecemos como a Via-Láctea. Em 1700, Herschel identificou essa estrutura em forma de disco,
mas suas observações o levaram a concluir erroneamente que o sistema solar se encontrava
no centro da galáxia. No início do século XX, Shapley foi o primeiro a detectar que, na
5
6
CAPÍTULO 2. PRINCÍPIOS BÁSICOS
verdade, nos encontramos bastante afastados do centro. Mesmo assim, ele aparentemente
acreditava que a Via-Láctea se encontrava no centro do universo. Apenas em 1952, Baade
demonstrou que a Via-Láctea é uma galáxia típica, dando forma à visão moderna, conhecida
como Princípio Cosmológico (ou Princípio de Copérnico), segundo a qual o universo parece
sempre o mesmo não importa de que ponto no espaço-tempo o estamos observando (Liddle,
2004).
Obviamente, o Princípio Cosmológico não é exato. A observação do céu noturno nos
mostra que as estrelas ao nosso redor formam a Via Láctea (≈ 30 kpc), o que por si só é uma
evidência clara de anisotropia. Observações astronômicas em uma escala um pouco maior
revelam que a nossa galáxia pertence a um pequeno grupo de galáxias denominado Grupo
Local (≈ 3 Mpc). Em uma escala ainda maior veremos que o Grupo Local encontra-se na
periferia de um superaglomerado de galáxias centrado na constelação de Virgem (≈ 33 Mpc).
Evidentemente a matéria em pequena escala é distribuída de forma altamente irregular,
contudo quando olhamos em escalas cada vez maiores, a distribuição de matéria visível se
torna cada vez mais uniforme.
Atualmente podemos fazer este tipo de afirmação graças aos levantamentos de campo
amplo (observações de grande parte do céu), que desde fins do século XX, vieram adicionar
ao Princípio Cosmológico um importante suporte observacional. De posse de tais dados,
podemos afirmar que o universo ao nosso redor parece o mesmo em todas as direções, pelo
menos em escalas acima de 100 Mpc (Wu, Lahav, & Rees, 1999). A precisão se torna muito
maior se levarmos em conta medidas da RCF, a partir das quais o universo nos parece
isotrópico para uma parte em 105 (Komatsu et al., 2009). Esta radiação está viajando pelo
universo a aproximadamente 14 bilhões de anos, o que nos fornece mais um indício de que o
universo, em escalas suficientemente grandes, é o mesmo em todas as direções.
2.1. HOMOGENEIDADE E ISOTROPIA
2.1
7
Homogeneidade e Isotropia
As evidências observacionais citadas na seção anterior, dão suporte ao Princípio Cosmológico. Como consequência, acreditamos que o universo como um todo possui duas propriedades importantes: homogeneidade e isotropia. Homogeneidade significa que o universo é o
mesmo em todos os pontos, e isotropia indica que o universo parece o mesmo em todas as direções. Sendo assim, podemos descrevê-lo como uma variedade quadridimensional composto
por uma dimensão temporal e uma seção tridimensional espacial homogênea e isotrópica.
A métrica de Friedman-Lemaître-Robertson-Walker (FLRW) pode ser obtida partindo
apenas dessas hipóteses. Uma derivação puramente geométrica desta métrica pode ser encontrada em Ishida (2006). A forma usualmente encontrada é dada por
·
ds = dt − a (t)
2
2
2
¸
1
2
2
2
2
2
dr + r (dθ + sen θdφ ) ,
1 − kr2
(2.1)
onde a(t) representa o fator de escala da expansão e t representa o tempo cósmico. O valor
do parâmetro k indica a curvatura espacial do universo: k > 0 corresponde a uma curvatura
positiva, k = 0 corresponde a uma curvatura espacial nula (universo plano) e k < 0 representa
um espaço-tempo com curvatura espacial negativa.
2.2
O universo em expansão
No início do século XIX, foram observadas as primeiras linhas espectrais provenientes
de estrelas próximas. Em 1842, Johann Christian Doppler sugeriu que se um observador
recebe radiação proveniente de uma fonte em movimento, o comprimento de onda medido
será deslocado proporcionalmente à velocidade da fonte em relação ao observador (projetada
ao longo da linha de visada), ou seja,
−
→
→
∆λ
v •−
n
=
,
λ
c
→
−
onde −
v é a velocidade da fonte e →
n é o vetor que liga o observador à fonte.
(2.2)
8
Em 1868, William Huggins confirmou experimentalmente que as linhas espectrais de
estrelas próximas se apresentavam ligeiramente deslocadas para as partes azuis ou vermelhas
do espectro. Desta forma, era possível determinar a velocidade das estrelas ao longo da linha
de visada, vr , utilizando
z≡
∆λ
vr
= ,
λ
c
(2.3)
sendo z o desvio para o vermelho (caso a radiação esteja deslocada para o azul, este valor
é negativo - a conexão entre o desvio para o vermelho e o fator de escala da expansão é
apresentada no apêndice (A)).
Com instrumentos cada vez melhores, foi possível medir o desvio espectral dos objetos
mais brilhantes do céu. Os primeiros levantamentos de medidas deste efeito em estrelas
mostravam uma distribuição aparentemente aleatória de desvios para o vermelho e para
o azul. Entretanto, com o aumento no número de dados e maior variedade de objetos
observados, verificou-se uma certa tendência em favor de desvios para o vermelho. Tal
característica era encontrada principalmente em observações de nebulosas, indicando que
em sua maioria, estas estavam se afastando de nós. Este foi o primeiro indício de que o
universo se encontrava em expansão.
A principal questão a se levantar neste ponto é: como compatibilizar o Princípio Cosmológico com um universo dinâmico? Para tanto, precisamos considerar um campo de velocidades
que obedece a relação linear
→
−
→
v = H−
r,
(2.4)
→
→
onde −
v indica a velocidade de um corpo arbitrário na posição −
r e H é uma constante de
proporcionalidade. Um campo regido por esta relação é homogêneo, pois é invariante sob
translação da origem do sistema de coordenadas utilizado. Poderíamos chegar a essa mesma
conclusão através da análise da equação (2.1), onde a dependência temporal é apenas uma
constante multiplicativa à seção espacial. Isto implica que em um universo descrito pela
métrica de FLRW a dinâmica permitida se resume a um grau de liberdade: expansão ou
contração. Logo, um estudo da dinâmica global se resume a uma análise sobre o fator de
2.2. O UNIVERSO EM EXPANSÃO
9
escala da expansão e suas derivadas (Quinet, 2007).
Sendo assim, para que o universo respeite o Princípio Cosmológico, é preciso que a
velocidade das galáxias ao longo da linha de visada, ou seu desvio para o vermelho, seja
proporcional à distância medida a partir do observador. Edwin Hubble tentou verificar
esta relação medindo distâncias através da variação no brilho de cefeidas e desvio para
o vermelho de 18 galáxias. Seus resultados mostravam uma leve correlação linear entre
velocidade e desvio para o vermelho, e foram publicados em 1929 (figura (2.1)). Com base
nessas observações, ele concluiu que o universo se encontrava em uma expansão homogênea
e foi o primeiro a apresentar uma estimativa para a constante de proporcionalidade H, hoje
conhecida como parâmetro de Hubble.
Ao longo deste trabalho, nos referimos ao parâmetro de Hubble através da expressão
H = 100 h km/s/Mpc,
(2.5)
onde h é um parâmetro adimensional cujo valor se encontra no intervalo h = 0.74 ± 0.04
km/s/Mpc (Riess et al., 2009).
Vale lembrar que a equação (2.4) é uma aproximação para baixos valores de z e consequentemente velocidades baixas se comparadas com a velocidade da luz. No tratamento de
dados com altos valores de desvio para o vermelho, devemos inserir os efeitos relativísticos.
Entretanto, sabemos que o resultado newtoniano deve ser recuperado para fontes próximas.
Sendo assim, considere t0 o tempo presente e nossa galáxia localizada na origem do sistema
de coordenadas, r = 0. Queremos medir o desvio para o vermelho de uma galáxia próxima
que emitiu a luz que recebemos hoje no instante t0 − dt. No limite de baixos valores de dt,
a distância entre o observador e a fonte, L, é dada por (Liddle, 2004)
L ≈ dl = cdt,
(2.6)
utilizando os resultados apresentados no apêndice (A), sabemos que o desvio para o vermelho
10
Figura 2.1: Diagrama apresentado por Hubble. A escala no eixo horizontal representa 0, 1
e 2 Mpc e o eixo vertical indica 0, 500 e 1000 km/s. Hubble estimou a taxa de expansão em
torno de 500 km/s/Mpc. Atualmente, sabemos que o valor correto se encontra em torno de
70 km/s/Mpc. Figura retirada de Hubble (1929).
2.2. O UNIVERSO EM EXPANSÃO
11
será
z=
a(t0 )
a(t0 )
1
ȧ(t0 )
−1≈
−1=
−
1
≈
dt,
ȧ(t0 )
a(t0 − dt)
a(t0 ) − ȧ(t0 )dt
a(t0 )
1 − a(t
0)
(2.7)
onde o ponto denota a derivada temporal.
Combinando as equações (2.6) e (2.7), temos
z≈
ȧ(t0 ) L
.
a(t0 ) c
(2.8)
Logo, para baixos valores de desvio para o vermelho nós recuperamos a Lei de Hubble e o
papel do parâmetro de Hubble é desempenhado por ȧ(t0 )/a(t0 ).
Durante este trabalho, consideraremos sempre um universo com métrica tipo FLRW, e
neste caso definiremos o parâmetro de Hubble diretamente como
H(t) =
ȧ(t)
.
a(t)
(2.9)
É natural que, a partir do momento em que descobrimos que o universo está se expandindo
comecemos a nos questionar também a respeito da taxa desta expansão, ou seja, gostaríamos
de determinar como o H(t) varia com o tempo. Isto pode ser feito através do parâmetro de
desaceleração q(z).
Considere uma expansão de Taylor do fator de escala ao redor do instante atual,
1
a(t) = a(t0 ) + ȧ(t0 )(t − t0 ) + ä(t0 )(t − t0 )2 + ....
2
(2.10)
Dividindo ambos os lados por a(t0 ), temos
a(t)
q0
= 1 + H0 (t − t0 ) − H02 (t − t0 )2 + ...,
a(t0 )
2
(2.11)
onde q0 é o valor do parâmetro de desaceleração para z = 0. No que segue, generalizamos
12
esta definição para um instante arbitrário, de modo que
q(t) = −
ä(t)
.
a(t)H 2 (t)
(2.12)
É fácil perceber que podemos obter a expressão para o parâmetro de desaceleração a
partir do parâmetro de Hubble,
d
q(t) =
dt
µ
1
H
¶
− 1.
(2.13)
Esta relação entre q e H será importante para o trabalho aqui apresentado. Entretanto,
é mais comum que a mesma seja expressa em função do desvio para o vermelho (z), e não em
função do tempo cósmico. Fazendo uso novamente do resultado do apêndice (A), obtemos
1+z =
1
a
⇒
dt = −
dz
,
(1 + z)H
(2.14)
onde utilizamos o fator de escala normalizado em relação ao valor atual, a0 = 1. Substituindo
dt dado pela expressão acima na equação (2.13), podemos reescrever o parâmetro de Hubble
de forma que
½Z
z
H(z) = H0 exp
0
¾
1 + q(v)
dv .
1+v
(2.15)
Esta será a expressão básica a que vamos nos referir no restante desta tese.
Na próxima seção, vamos utilizar a forma da métrica dada pela equação (2.1) para construir as definições de distância. Tais definições serão baseadas no parâmetro de Hubble, o
que nos permitirá realizar uma conexão entre o parâmetro de desaceleração os dados observacionais.
2.3
Distâncias em Cosmologia
A definição de distâncias em cosmologia requer uma certa reflexão. Consideremos primeiramente a distância até uma galáxia remota. Devido ao fato da velocidade da luz ser finita
2.3. DISTÂNCIAS EM COSMOLOGIA
13
(c), a luz que recebemos de tal galáxia foi emitida quando o universo era mais jovem. Logo
quando olhamos para objetos distantes, nós os vemos como eles eram em tempos remotos
no universo. Dado que o universo está se expandindo, isso também implica que no momento
da emissão a distância própria era menor. Assim sendo, precisamos definir o que significa
distância a um determinado objeto.
Na realidade, existem várias maneiras diferentes de definir a distância de uma fonte a
partir da radiação que chega até nós. Apresentamos algumas delas a seguir.
2.3.1
Distância Comóvel
Considere um observador na origem do sistema de coordenadas que recebe hoje (t0 ), um
sinal emitido por uma fonte em (r, θ, φ) no instante t. A radiação terá percorrido uma
geodésica radial nula com θ e φ constantes. Com essas condições e utilizando a equação
(2.1), obtemos que:
dχ ≡
dt
dr
= −√
.
a(t)
1 − kr2
(2.16)
Integrando a equação anterior, obtemos:
Z
t0
χ=
t
dt
=
a(t)
Z
r
0






arcsen(r
√
k
√
k)
se k > 0
dr
√
=
r
se k = 0 .
1 − kr2 

√


−k)
 arcsenh(r
√
se k < 0
−k
A distância comóvel, dC , entre a fonte e o observador é definida como χ vezes o valor
atual do fator de escala. É importante ressaltar que da maneira como foi definida, a dC da
fonte não muda com o tempo, mas continua a mesma durante todas as etapas da expansão.
Assim,
14
Z
dC = a0 χ = a0
Z t
dC =
t0
t0
dt
= a0
a(t)
t
dz
.
H(z)
Z
t0
t
da
,
ȧ a
(2.17)
(2.18)
onde utilizamos a equação (2.14) para obter (2.18).
2.3.2
Distância de Diâmetro Angular
Quando olhamos para um objeto no céu, nós não vemos seu tamanho real, mas seu diâmetro angular. Na geometria Euclidiana, o tamanho angular de um objeto, dθ é relacionado
ao seu tamanho real l e à sua distância através da relação
dθ =
dl
.
r
(2.19)
Lembrando que z ≈ v/c e v = Hr, podemos facilmente encontrar a relação entre diâmetro
angular e desvio para o vermelho em um espaço Euclidiano,
dθ =
H dl
.
c z
(2.20)
Na RG, partirmos da métrica de FLRW (equação (2.1)) para encontrar a relação entre
o tamanho próprio e o diâmetro angular de um objeto. Para tanto, considere δ o diâmetro
angular observado na origem (r = 0) de uma fonte que possui diâmetro próprio D localizada
em r (coordenada comóvel) e cuja radiação, observada hoje (t = 0), foi emitida no instante
t. Considerando δ ¿ 1 temos,
δ=
D
,
ra(t)
(2.21)
em analogia à definição de diâmetro angular na geometria Euclidiana (equação (2.19)), a
15
distância de diâmetro angular é definida como:
dA ≡
D
= a(t)r = a0 r(1 + z)−1 ,
δ
(2.22)
onde novamente utilizamos a equação (2.14).
2.3.3
Distância de Luminosidade e o Sistema de Magnitudes
A distância de luminosidade, dL , relaciona o fluxo medido em nosso detector (energia por
unidade de tempo por unidade de área) com a luminosidade (energia total por unidade de
tempo) emitida por uma fonte distante (Misner, Thorne & Wheeler, 1973).
Isto é melhor visualizado se imaginarmos um objeto irradiando no centro de uma esfera,
de raio comóvel r0 , com detectores na superfície da esfera. O raio físico da esfera será a0 r0 , e
a área da superfície total 4πa20 r02 . Em um espaço estático, o fluxo de radiação recebido será
simplesmente F = L/4πa20 r02 . Contudo, vivemos em um universo em expansão, o que afeta
os fótons durante seu deslocamento entre a fonte e o observador. Dois efeitos ocorrem neste
contexto:
1. Cada fóton deixa a fonte com energia hν1 e atinge o observador com energia hν0 =
hν1 /(1 + z1 );
2. O intervalo de tempo entre os dois fótons no momento da emissão era de δt1 e no
momento da detecção este intervalo será δt0 = δt1 /(1 + z1 ).
Combinando os dois efeitos, o fluxo recebido será
F =
L
4πa20 r02 (1
+ z)2
,
(2.23)
a fim de manter a analogia com o resultado Euclidiano, a distância de luminosidade é definida
como
dL = a0 r0 (1 + z).
(2.24)
16
Figura 2.2: Representação esquemática dos elementos envolvidos no cálculo da distância de
diâmetro angular. Figura retirada de Weinberg (1971).
17
Assim, usando a equação (2.18) em um universo plano, obtemos finalmente:
Z
z
dL = (1 + z)dC = (1 + z)
0
dz 0
.
H(z 0 )
(2.25)
Uma forma mais antiga de abordar o efeito descrito na definição da distância de luminosidade nos leva à origem do sistema de medida de brilho utilizado atualmente. Muito antes
dos modernos telescópios, os gregos já classificavam as estrelas de acordo com o seu brilho.
Essa primeira classificação deu origem ao chamado sistema de magnitudes que ainda hoje
é utilizado nas definições de distância de experimentos modernos. Neste sistema a magnitude aparente bolométrica (em todos os comprimentos de onda observados), m, é definida
com base em uma estrela escolhida como ponto de referência. Atualmente, consideramos
como referência a estrela Vega cuja magnitude aparente é definida como nula. Uma estrela
mais brilhante do que Vega tem magnitude aparente negativa e, analogamente, uma menos
brilhante terá magnitude aparente positiva. Matematicamente, a definição é dada por:
m = −2.5 log10
F
,
Fα
(2.26)
onde F e Fα representam os fluxos (energia por unidade de tempo por unidade de área
medidos no detector) da estrela em questão e de α-Centauri, respectivamente.
Utilizaremos também a Magnitude Absoluta (M ), definida como a magnitude que a fonte
apresenta quando se encontra a uma distância de 10 pc. Neste caso,
¡
F10
consequentemente,
¢
4πd2L
µ
¶2
dL
L
=
=F
,
=
4π(10pc)2
4π(10pc)2
10pc
L
4πd2L
(2.27)
18
M = −2.5 log10
F10
F
= −2.5 log10
− 2.5 log10
Fα
Fα
dL
M = m − 5 log10
.
10pc
µ
dL
10pc
¶2
,
(2.28)
(2.29)
Usualmente, este resultado é escrito na forma:
m = 5 log10
dL
cH0−1
+
5
log
+ M − 5,
10
1pc
cH0−1
m = 5 log10 DL + M.
(2.30)
(2.31)
onde a quantidade M é chamada intercept ou magnitude de ponto zero e DL a distância
de luminosidade em unidades de (cH0−1 ). A quantidade (M − m) é chamada módulo de
distância. Utilizando a parametrização apresentada na equação (2.5), podemos escrever o
intercept como:
M = 5 log10
2.9979 × 105 × 106
+ M − 5,
100h
M = −5 log10 h + M + 42.3841.
(2.32)
(2.33)
Logo, ao observarmos uma determinada fonte podemos obter através da análise da radiação emitida, a magnitude aparente e seu desvio para o vermelho. Se considerarmos apenas
fontes cujas magnitudes absolutas nos sejam conhecidas, a magnitude aparente estará relacionada à distância e consequentemente ao tempo transcorrido desde que a luz deixou a
fonte até hoje, enquanto o desvio para o vermelho trará informações sobre a expansão total
experimentada pelo universo neste intervalo de tempo.
As definições apresentadas até aqui representam boa parte da base teórica necessária
para implementar nossos estudos sobre a dinâmica global do universo. Entretanto, precisa-
2.4. O MODELO PADRÃO DA COSMOLOGIA
19
mos também comparar nossos resultados com aqueles encontrados na literatura. Principalmente, precisamos entender quais hipóteses fazem parte do modelo padrão atual. Para tanto,
apresentamos na seção seguinte uma rápida revisão sobre o Modelo Padrão da Cosmologia.
2.4
O Modelo Padrão da Cosmologia
O conhecimento adquirido até o momento em relação ao comportamento global do universo forma um quadro consistente que chamamos Modelo Padrão da Cosmologia. Este
modelo tem como base algumas hipóteses fundamentais (Quinet, 2007; Peebles, 1993):
• O Princípio Cosmológico é uma boa descrição do universo em grandes escalas;
• As leis da física que experimentamos localmente são válidas em qualquer ponto do
espaço-tempo;
• A RG é adequada para descrever as propriedades do universo em grandes escalas.
A partir destas hipóteses, é possível demonstrar que a geometria do espaço-tempo pode
ser descrita pela métrica de FLRW (equação (2.1)). Um universo homogêneo e isotrópico
implica que o seu conteúdo material pode ser aproximado por um fluido perfeito, cujo tensor
energia-momento é dado por
T µν = (ρ + p)uµ uν − pg µν
onde uα =
dxα
dτ
(2.34)
é o quadri-vetor velocidade em coordenadas comóveis, tal que uα = (1, 0, 0, 0)
e uα uα = 1, ρ é a densidade de energia e p a pressão relacionadas ao conteúdo material do
universo (matéria e radiação).
20
De posse de tais definições, o tensor energia-momento pode ser escrito como

T µν

0
0
 ρ 0

 0 −p 0
0

=
 0 0 −p 0


0 0
0 −p




.



A pressão e a densidade podem, em geral, ser relacionadas por uma equação de estado,
p = p(ρ). Sendo que cada componente terá uma equação de estado própria. Para todos os
tipos de constituintes materiais considerados neste trabalho,
pi = wi ρi ,
(2.35)
onde o índice i corresponde aos diferentes componentes do tensor energia-momento e wi
é chamado Parâmetro da Equação de Estado. Para o caso de poeira (bárions ou matéria
escura), wp = 0 e para radiação, wrad = 1/3.
O tensor energia-momento deve obedecer à equação de conservação, ∇ν T µν = 0, ou seja,
ȧ
ρ̇ + 3 (ρ + p) = 0,
a
(2.36)
onde o ponto representa a derivada em relação ao tempo cósmico.
2.4.1
Equações de Einstein
Estamos agora prontos para relacionar o conteúdo energético do universo ao espaçotempo, encontrando leis que regem a interação entre os mesmos. Isso será feito a partir
da aplicação da métrica de FLRW e do tensor energia-momento apropriado às equações de
Einstein, dadas por:
1
Rµν − Rgµν = 8πGTµν + Λgµν ,
2
(2.37)
21
onde Rµν é o tensor de Ricci, R o escalar de curvatura e Λ a constante cosmológica.
As componentes do tensor de Ricci são dadas por:
ä
R00 = 3 = −4πG(ρ + p) + Λ
a
(2.38)
R0i = 0
(2.39)
Rij = −
gij
[2k + (aä + 2ȧ2 )] = 4πGgij (p − ρ) + gij Λ,
a2
(2.40)
utilizando estas expressões, a métrica de FLRW e a equação (2.34) na equação (2.37), temos:
µ ¶2
ȧ
8πG
k
Λ
H =
=
ρ− 2 +
a
3
a
3
(2.41)
ä
4πG
Λ
=−
(ρ + 3p) + .
a
3
3
(2.42)
2
A expressão (2.41) é chamada equação de Friedman e a equação (2.42) é conhecida como
equação da aceleração. Nessas expressões, a densidade e a pressão correspondem a todo o
conteúdo material do universo. Caso este possua mais de uma componente, ρ e p devem ser
substituídos por suas respectivas somatórias sobre os constituintes em questão.
2.4.2
ΛCDM
As equações (2.36), (2.41) e (2.42) formam um conjunto de equações acopladas onde
apenas duas são independentes. A fim de que possamos encontrar uma solução para este
sistema, precisamos de outra expressão que relacione p, ρ e a. Para este fim, usaremos a
equação de estado (equação (2.35)), que deve ser determinada a partir das propriedades de
cada fluido.
É importante, neste momento, definir a densidade crítica, que servirá como base para a
comparação entre as contribuições de cada componente para a densidade de energia total do
22
universo. Esta é obtida a partir da equação (2.41) dividida por H 2 :
1=
k
Λ
8πG
ρ− 2 2 +
.
2
3H
aH
3H 2
(2.43)
A densidade crítica é definida como a densidade total de energia em um universo com
curvatura nula e sem constante cosmológica, logo,
ρcr =
3H 2
.
8πG
(2.44)
Dados provenientes de curvas de rotação em galáxias espirais e lentes gravitacionais indicam que matéria não relativística (p = 0), que se aglomera, contribui com aproximadamente
30% da densidade crítica de energia. Por outro lado, a nucleossíntese primordial impõe que
apenas 5% da densidade crítica pode ser constituída por matéria bariônica. É usual em
cosmologia, considerar que os 25% restantes provém de algum tipo de matéria escura (não
relativística) não-bariônica. Estes resultados somados a análises da anisotropia da radiação cósmica de fundo, as quais indicam que o nosso universo possui, em boa aproximação,
curvatura espacial nula, nos levam a concluir que cerca de 70% do conteúdo do universo é
formado por uma componente de natureza desconhecida, uniformemente distribuída e com
pressão negativa, que de acordo com as observações atuais, se comporta como um tipo de
constante cosmológica (Steinhardt, Wang, & Zlatev, 1999). Esse componente é chamado
energia escura.
Logo, o atual modelo cosmológico padrão, considera o universo homogêneo e isotrópico,
constituído basicamente por matéria escura, CDM (do inglês, Cold Dark Matter ), matéria
bariônica, fótons, neutrinos e energia escura com w = cte = −1 (Λ). Isso nos permite descrever a história da evolução do universo de acordo com algumas quantidades, ou parâmetros
básicos. São eles:
• o parâmetro de Hubble, H ≡ ȧa ;
23
• o parâmetro de desaceleração, q ≡ − aHä 2 ;
• o parâmetro da equação de estado, wi ≡
pi
;
ρi
• o parâmetro de densidade da matéria (bárions + matéria escura), Ωm ≡
• o parâmetro de densidade da radiação (fótons + neutrinos), Ωr ≡
ρr
;
ρcr
• o parâmetro de densidade associado à curvatura do espaço, Ωk ≡
k
;
a2 H 2
• o parâmetro de densidade associado à CC, ΩΛ ≡
ρm
;
ρcr
Λ
.
3H 2
Utilizando estas definições, a equação (2.43) se torna
Ωm + Ωr + Ωk + ΩΛ = 1.
(2.45)
Para que possamos descrever o comportamento de cada um dos componentes do universo,
devemos resolver a equação (2.36) para cada um, separadamente. Logo, em se tratando de
matéria não relativística (bárions e matéria escura), p ≈ 0
→
wm = 0, consequente-
mente,
ρ̇m
ȧ
= −3 .
ρm
a
(2.46)
Integrando a expressão acima, obtemos:
µ
ρm (t) = ρm0
a(t0 )
a(t)
¶3
,
(2.47)
24
No caso da radiação, pr = 13 ρr , ou seja wr = 1/3, logo,
ρr = ρr0
³ a ´4
0
a
.
(2.48)
O modelo ΛCDM representa a forma mais simples de energia escura, descrita por w = −1
na equação (2.35). Utilizando este fato na equação (2.36), concluímos que a densidade de
energia da energia escura (ρΛ ) não depende do tempo (e consequentemente também não
depende de a).
Utilizando a equação (2.7), a equação (2.41) neste caso é dada por:
H2 =
2
H(z)
=
8πG
k
Λ
(ρm + ρΛ + ρr ) − 2 + ,
3·
a
3
H02
¸
Ωm0 (1 + z) + Ωr0 (1 + z) + Ωk0 (1 + z) + ΩΛ .
3
4
2
(2.49)
De posse da expressão para o parâmetro de Hubble, podemos enfim definir distâncias
de acordo com as expressões da seção (2.3). Este modelo representa atualmente o melhor
ajuste aos dados observacionais. No que segue, utilizaremos como modelo fiducial em nossas
simulações o modelo ΛCDM plano com Ωm = 0.23.
Capítulo 3
Dados Observacionais
No capítulo anterior descrevemos a base teórica das idéias que serão descritas detalhadamente nos capítulos (4) e (5). Neste capítulo, discutimos os observáveis que utilizaremos em
nossas aplicações. Descrevemos brevemente as supernovas como fenômenos astrofísicos, o
uso das mesmas em cosmologia e os conjuntos de dados utilizados nesse trabalho. Da mesma
forma, descrevemos o uso de medidas da BAO e detalhamos a simulação cujos resultados
são apresentados mais adiante.
3.1
Supernovas Ia
Explosões estelares estão entre os eventos mais energéticos e violentos do universo. O
aparecimento de objetos nunca antes observados no céu noturno, ou do latim stellae novae,
são relatados em documentos astronômicos chineses e coreanos de idade milenar 1 . A nova
estrela que apareceu em Cassiopéia em 1572 foi observada por Tycho Brahe. Baseado na
ausência de medidas de paralaxe, ele concluiu que a mesma deveria se encontrar além do
sistema solar, e consequentemente não se encaixava na descrição ptolomaica do universo.
Aproximadamente 150 anos depois, Lundmark (1925) foi o primeiro a sugerir a existência
de duas classes de nova, onde a diferença de brilho entre as mesmas seria da ordem de 10
magnitudes. Ele baseou sua teoria, em grande parte, na observação da SN1885A2 que apre1
Para um relato histórico muito bem escrito sobre a observação de supernovas até fins da década de 80
do século passado, assim como para mais detalhes sobre os eventos citados neste texto, ver Marshall (1988).
2
De acordo com a convenção atualmente utilizada, supernovas são nomeadas como SNXXXXY, onde
25
26
CAPÍTULO 3. DADOS OBSERVACIONAIS
sentava essa diferença de magnitude em relação a um outro conjunto de aproximadamente
20 outras novae também observadas na galáxia de Andromeda. Acredita-se que ele também
foi o primeiro a sugerir o nome supernova (Lundmark, 1932).
A classificação moderna dos eventos conhecidos como supernovas é baseada em resultados
de observações espectroscópicas ao redor do máximo de emissão (ver Filippenko (1997)). A
presença de linhas de hidrogênio no espectro define uma supernova do tipo II, e a ausência de
tais linhas indicam que a supernova é do tipo I. Existe ainda uma subdivisão das supernovas
do tipo I, aquelas que têm uma linha proeminente de Si II são chamadas supernovas Ia (SNIa)
e aquelas que não apresentam silício são chamadas supernovas Ib/c. A diferença entre os
tipos Ib e Ic se encontra na presença ou ausência de linhas de hélio, respectivamente. Uma
visão esquemática dessa classificação é mostrada na figura (3.1). Esta figura também lista
exemplos típicos de cada subclasse.
O significado físico dessa classificação está diretamente ligado aos sistemas progenitores
de cada evento. SNIa são geradas a partir de explosões termonucleares de objetos que
esgotaram suas reservas de hidrogênio ao longo de sua evolução. Logo, não encontramos
traços desse elemento na explosão. Outros tipos de supernovas vêm de explosão de estrelas
solitárias (core-collapse) e mais jovens, que ainda possuem traços de hidrogênio entre seus
componentes.
O modelo mais aceito para explicar a explosão de uma SNIa considera um sistema progenitor binário, composto por uma anã branca que recebe matéria de uma estrela doadora.
Essa transferência de matéria ocorre até que a anã branca atinja o limite de massa de Chandrasekhar. Nesse limite, a pressão gravitacional não é suficiente para balancear a pressão de
radiação e ocorre a explosão, que libera uma imensa quantidade de energia em um intervalo
curto de tempo (∼ 1051 ergs/s). O material ejetado nessas explosões muitas vezes leva ao
surgimento de nebulosas. Uma supernova pode aumentar a luminosidade da estrela que
a gerou em até 1010 vezes a luminosidade do sol em alguns dias e após atingir seu brilho
XXXX corresponde ao ano em que foram observadas e Y varia de A a Z para as primeiras 26 supernovas
descobertas naquele ano. A partir da 27a , Y é substituído por letras minúsculas, sendo que para a 27a
Y=aa, para a 28a Y=ab e assim por diante. Um exemplo clássico de como a nomenclatura é empregada é a
supernova SN2006ub, que foi a 551a supernova descoberta em 2006.
3.1. SUPERNOVAS IA
Figura 3.1: Diagrama da classificação de supernovas, retirado de Leibundgut (2005).
27
28
máximo, este decresce em alguns meses.
Este cenário depende exclusivamente de parâmetros internos do sistema progenitor e
teoricamente pode ocorrer em qualquer fase da evolução do universo após a formação das
primeiras estrelas, dando origem à mesma quantidade de energia liberada em cada evento.
Essa independência dos parâmetros cosmológicos nos leva a crer que as supernovas seriam
velas-padrão, a partir das quais seria possível inferir distâncias em escalas cosmológicas.
Apesar da aparente simplicidade com a qual descrevemos a formação de um evento como
as SNIa, precisamos lembrar sempre que esta é apenas uma imagem qualitativa do que
realmente ocorre. Atualmente não possuímos um modelo teórico eficaz capaz de reproduzir
a potência observadas nas explosões, que chegam a ser mais brilhantes do que a própria
galáxia hospedeira.
Além disso, não existe um consenso sobre qual seria a estrela doadora (Branch et al.,
1995; Livio, 2000). De fato, um cenário bastante estudado nos últimos anos considera os
sistema progenitor binário, chamado duplo-degenerado, composto por duas anãs brancas que
colidem formando um envelope único e a partir do qual a explosão termonuclear é deflagrada.
Simulações desse tipo de evento, utilizando anãs brancas com massas da ordem de 0.9 M¯ , são
o exemplo mais recente de sucesso na modelagem de SNIa (Pakmor et al., 2010). Entretanto,
os autores deste trabalho chamam a atenção para o fato de que apenas foram capazes de gerar
eventos com luminosidade muito baixa (p.e. SN1991bg) em comparação com a luminosidade
média da amostra atualmente disponível.
Talvez como consequência dessa “ignorância” em relação ao sistema progenitor, as curvas
de luz (magnitude como função do tempo) apresentadas pelas SNIa não são tão similares
entre si quanto esperaríamos. Existe uma correlação entre o brilho no máximo da emissão e o tempo de decaimento que nos permite “padronizar” as curvas de luz. SNIa mais
brilhantes possuem um tempo de decaimento maior e SNIa menos brilhantes decaem mais
rapidamente. Por esse motivo, as SNIa são ditas “padronizáveis”. Ou seja, existe uma forma
de levar em conta os erros e fatores que contribuem para a dispersão das curvas de luz de
diferentes supernovas, de modo que as mesmas indiquem uma mesma magnitude absoluta
3.1. SUPERNOVAS IA
29
(o que corresponde a uma mesma potência total emitida), e consequentemente possam ser
usadas como velas padrão. De posse do valor do fluxo medido em detectores terrestres e da
radiação total emitida por uma SNIa, podemos inferir a distância a partir da medida de seu
desvio para o vermelho e de um determinado modelo cosmológico.
O método segundo o qual essa padronização deve ser efetuada também não é um consenso na comunidade científica. Existem vários trabalhos que tentam propor uma maneira
coerente de se tratar as curvas de luz de modo a obter um valor verossímil para o brilho no máximo da emissão. Os dois métodos mais usados são: Multicolor Light-Curve
Shape (MLCS2k2)(Jha, Riess, & Kirshner, 2007) e Spectral Adaptative Lightcurve Template
(SALT2)(Guy et al., 2007). Ambos apresentam estruturas diferentes e os resultados não
concordam plenamente entre si (Nesseris & Perivolaropoulos, 2005; Kessler et al., 2009), entretanto, os mesmos nos fornecem procedimentos fenomenológicos através dos quais somos
capazes de medir distâncias em escalas cosmológicas.
De posse de diferentes observações e processos de análise de dados e padronização das curvas de luz, em fins da década de 90, Riess et al. (1998) e Perlmutter et al. (1999) anunciaram
pela primeira vez a detecção da expansão acelerada do universo.
Neste trabalho, utilizaremos três conjuntos diferentes de observações de SNIa:
• Gold182
Nós denominamos Gold182 o conjunto de dados compilado por Riess et al. (2007).
Esse conjunto é composto por 182 supernovas, dentre elas 21 observadas com o telescópio espacial Hubble, em 1.0 < z < 1.7. O importante a se destacar aqui é o
processo de padronização utilizado. Mesmo quando apresentam dados da literatura,
os autores refazem o processo de padronização de acordo com o procedimento descrito
em Jha, Riess, & Kirshner (2007) (MLCS2k2). Consequentemente, após o processo de
padronização, a tabela final de dados consiste em valores de desvio para o vermelho,
módulo de distância e os respectivos erros nessas duas quantidades.
30
• SNLS
Chamamos SNLS, o conjunto de dados compilados por Astier et al. (2006), composto
por 115 SNIa com z < 1.0, observadas como parte do Supernova Legacy Survey. Dentre estas, 71 foram observadas com o Canada-France-Hawaii Telescope (CFHT), e o
restante são SNIa presentes também no Gold182. Neste trabalho, a padronização das
curvas de luz foi feita de acordo com o procedimento proposto por Guy et al. (2005)
(SALT). Logo, os dados após a padronização incluem o desvio para o vermelho, a magnitude aparente na banda B (∼ 450 nm) e mais outras duas quantidades, s e c, que
correspondem à correções devido à forma (stretch) e à cor (diferença de magnitudes
em diferentes bandas) da curva de luz, respectivamente.
• SDSS
Por fim, denominamos SDSS o conjunto de dados apresentados por Kessler et al.
(2009), composto por 288 SNIa com z < 1.6. Dentre estas, 108 SNIa foram observadas como parte do Sloan Digital Sky Supernova Survey (Frieman et al., 2008). As
demais supernovas são uma compilação de dados apresentados em Wood-Vasey et al.
(2007), Astier et al. (2006) e Gold182. Neste caso, os dados são apresentados nas duas
formas: de acordo com MLCS2k2 assim como na forma de SALT2 (uma versão atualizada de SALT proposta por Guy et al. (2007), que gera as mesmas quantidades após
a padronização).
3.2
Oscilações Acústicas de Bárions
Além de velas padrão (papel desempenhado pelas SNIa em cosmologia), outra maneira
utilizada para medir distâncias é a utilização de réguas padrão. O exemplo clássico dessa
aplicação é o fato de que calculamos a nossa distância em relação a um objeto cujo tamanho
conhecemos (uma pessoa, por exemplo) através da comparação entre o seu tamanho real e o
tamanho angular subtendido quando esse objeto se encontra a uma certa distância de nós.
3.2. OSCILAÇÕES ACÚSTICAS DE BÁRIONS
31
Quanto mais distante a pessoa estiver, menor nos parecerá. A mesma idéia pode ser aplicada
em cosmologia, com o agravante de que o espaço pode ser curvo. É como se estivéssemos
observando a pessoa através de uma lente. Neste contexto, não sabemos se a pessoa está
pequena por estar distante ou porque a imagem está sendo distorcida pela lente. Entretanto,
a curvatura do espaço não é o maior problema quando se trata de aplicações cosmológicas
dessas idéias . Nesse caso, o grande problema é que não sabemos qual o tamanho real de
objetos extragalácticos3 .
Para que o conceito de régua padrão possa ser utilizado em cosmologia, precisamos de
um objeto cujo tamanho podemos determinar em um certo valor de desvio para o vermelho
ou que dependa do desvio para o vermelho de uma forma conhecida. Esse é o caso das BAO.
Antes da recombinação e desacoplamento, o universo era composto por um plasma quente,
onde fótons e bárions estavam fortemente acoplados formando um único fluido. Consideremos uma perturbação esférica neste fluido formado por matéria escura, neutrinos e o fluido
bárions-fótons. Devido à baixa velocidade do som e temperatura, a perturbação na matéria
escura não se propaga. Devido à sua alta velocidade e baixa seção de choque os neutrinos rapidamente se desacoplam, e a perturbação nos mesmos tende a diluir-se. No fluido
fótons-bárions, estas oscilações se propagam como uma onda acústica com velocidade
c
cs = r ³
3 1+
3ρb
ργ
´,
(3.1)
onde ρb representa a densidade de bárions e ργ a densidade de fótons, afastando-se da origem
onde existe uma maior concentração de matéria. Na recombinação, quando a temperatura
do universo chega a ≈ 0.3 eV, os bárions formam átomos neutros e os fótons se desacoplam,
formando o que hoje observamos como RCF. Após esse desacoplamento, a pressão de radiação
sobre os bárions desaparece e consequentemente, a velocidade do som se torna desprezível,
ou seja, a perturbação nos bárions é congelada. Através da interação gravitacional entre os
bárions e a matéria escura, ambos tenderão a se aglomerar nesta escala.
3
A descrição apresentada nesta seção foi baseada em Bassett & Hlozek (2009)
32
Podemos medir a escala de aglomeração de estruturas através da função de correlação de
dois pontos, ξ(r), que quantifica o excesso de aglomeração em uma determinada escala em
relação a um fundo homogêneo com a mesma densidade média. Em outras palavras, dada a
posição de uma determinada galáxia, a função de correlação nos dirá qual a probabilidade
de encontrarmos outra galáxia dentro de um raio r0 centrado na galáxia inicial.
Esta função de correlação pode ser descrita aproximadamente por uma lei de potências
(Totsuji & Kihara, 1969),
ξ(r) ∝
³ r ´γ
0
r
,
(3.2)
onde r0 ≈ 5h−1 Mpc−1 .
Uma escala característica de aglomeração de galáxias irá aparecer como um pico ou vale
na função de correlação, caso exista um excesso ou escassez de galáxias em uma determinada
escala, respectivamente. Essa mesma característica também estará presente no espectro de
potência, que é dado pela transformada de Fourier da função de correlação, ou seja,
Z
∞
P (k) =
ξ(r) exp(−ikr)r2 dr.
(3.3)
−∞
Podemos ver a relação entre essas duas funções na figura (3.2). Uma função δ em uma escala
r∗ na função de correlação (painel esquerdo) resultará em uma série de oscilações no espectro
de potência (painel direito). Essas são as BAO.
Consideremos o caso onde uma galáxia se formou no centro da perturbação inicial, usando
esta galáxia como o ponto de partida para a medida de r0 na equação (3.2), encontraríamos
um bump a uma distância s do centro. Essa escala corresponde à distância percorrida pelas
perturbações no fluido fótons-bárions até o desacoplamento, chamada horizonte acústico, e
depende da densidade de bárions e fótons de acordo com (Eisenstein & White, 2004)
Z
∞
s=
zrec
onde R =
3ρb
4ργ
1
cs dz
2c
√
=p
ln
2
H(z)
Ωm H0 3zrec Rrec
"√
#
p
1 + Rrec + Rrec + Req
p
,
1 + Req
(3.4)
∝ Ω2b h/(1 + z) é proporcional à razão bárions-fótons, zeq = Ωm /Ωrad é o desvio
33
para o vermelho na equipartição entre matéria e radiação e rec se refere à recombinação.
A RCF impõe fortes vínculos sobre a densidade de matéria escura e bárions no desacoplamento, o que nos permite calcular o horizonte acústico como s = 146.8 ± 1.8 Mpc
(Komatsu et al., 2009). É importante ressaltar que na realidade, existiram muitas dessas
perturbações, nos concentramos em uma delas a fim de simplificar a descrição. Por outro
lado, como as perturbações são variações pequenas na densidade média do fluido primordial,
o efeito final de várias perturbações será uma combinação linear dos efeitos individuais.
A distância característica que a perturbação no fluido fótons-bárions percorreu até o
desacoplamento, também chamada horizonte acústico, resultará em uma escala de sobredensidade na distribuição de bárions. Consequentemente, existe uma probabilidade maior
de uma galáxia se formar na região de sobredensidade distante ≈ 150 Mpc da perturbação
inicial do que, por exemplo, em 130 ou 180 Mpc (Abramo et al., 2009).
Este efeito é melhor visualizado através da figura (3.3)4 . Nessa figura, o perfil de massa
(densidade×raio2 ) está normalizado de modo que curvas da mesma altura indicam perturbações igualmente proporcionais nos diferentes fluidos. O eixo horizontal representa o
tamanho da perturbação em coordenadas comóveis. Em valores bastante altos de desvio
para o vermelho (z À 1000), a matéria ordinária estava acoplada em um fluido primordial,
onde fótons, bárions, neutrinos e matéria escura interagiam entre si. Adicionemos agora uma
única perturbação esférica na densidade desse fluido (linha 1-coluna 1).
Esta perturbação se propaga como uma onda sonora no fluido primordial. Conforme o
universo se expande e resfria, os neutrinos são os primeiros a desacoplarem, pois possuem
seção de choque extremamente baixa e não são aprisionados gravitacionalmente. A matéria
escura interage apenas gravitacionalmente e tem velocidade não significativa (é chamada
matéria escura fria porque a temperatura no momento do desacoplamento era muito menor
do que a energia de repouso), logo o perfil de matéria escura é "congelado". A perturbação
tem o papel de uma sobredensidade, que atrai mais matéria escura para seu centro. Os fótons
e bárions estão aprisionados em um plasma ionizado, no qual a perturbação se propaga como
4
A descrição a seguir, assim como a figura (3.3), foram extraídas de
http://cmb.as.arizona.edu/∼eisenste/acousticpeak/acoustic_physics.html
34
uma onda sonora com velocidade dada pela equação (3.1), afastando-se da origem (figura
(3.3), linha 1-coluna 2).
A perturbação no fluido de neutrinos é a primeira a ser diluída devido à sua característica
relativística e baixa seção de choque, e ao mesmo tempo mais matéria escura continua a ser
agregada ao centro da perturbação, o que faz com que o perfil de massa adquira uma largura
maior (figura (3.3), linha 2-coluna 1). Assim que a temperatura baixa o suficiente para
que os elétrons e prótons possam formar átomos neutros, ou seja, quando a temperatura é
≈ 0.3 eV, os fótons se desacoplam e a perturbação na radiação se separa da perturbação nos
bárions (figura (3.3), linha 2- coluna 2). Assim como os neutrinos fizeram, os fótons agora
podem se propagar livremente pelo universo, o que dá origem à RCF observada atualmente.
Sem a interação com os fótons, a pressão de radiação que existia sobre os bárions desaparece
e a perturbação se mantém estacionada (figura (3.3), linha 3-coluna 1). Nos resta agora
uma sobredensidade de matéria escura ao redor do centro da perturbação inicial e uma
sobredensidade de bárions a um raio de ≈ 150 Mpc. Com o passar do tempo, a interação
gravitacional entre essas duas regiões de sobredensidade faz com que as diferenças entre as
mesmas diminuam: as perturbações começam a se misturar (figura (3.3), linha 3-coluna 2).
Eventualmente, elas tendem ao mesmo perfil, ou seja, a perturbação nos bárions deixa uma
assinatura no perfil da matéria escura. Ao mesmo tempo, como a quantidade de matéria
escura é muito maior do que a quantidade de bárions, o pico da perturbação ao redor do
ponto inicial é mais evidente do que o pico correspondente à flutuação nos bárions (figura
(3.3), linha 4-coluna 1). Entretanto, enfatizamos que até o momento a figura (3.3) mostrou o
perfil de massa. O perfil de densidade é muito mais íngreme. A sobredensidade em 150 Mpc
é de apenas ≈ 1% daquela ao redor da origem (figura (3.3), linha 4-coluna 2). No decorrer
da história de evolução do universo, estruturas em grandes escalas têm maior probabilidade
de serem formadas em regiões que apresentam sobredensidades em bárions e em matéria
escura.
Vale enfatizar que a escala a que nos referimos até o momento corresponde à distância
comóvel percorrida pela perturbação até o desacoplamento. Na realidade, em um levanta-
35
mento de galáxias cada intervalo de desvio para o vermelho, ∆z, corresponderá a uma escala
característica de aglomeração. A figura (3.4), demonstra esquematicamente este efeito. Sabemos o tamanho comóvel do raio correspondente à escala de aglomeração, logo, podemos
relacionar as medidas de escalas ao longo e transversalmente à linha de visada utilizando as
expressões
c∆z
,
sk (z)
s⊥ (z)
dA (z) =
.
∆z(1 + z)
H(z) =
(3.5)
(3.6)
36
Figura 3.2: Figura esquemática que representa o par ξ(r∗), P (k). Um pico estreito na
função de correlação (painel esquerdo), corresponde a uma série de oscilações em P (k)
(painel direito). O pico acústico na função de correlação dos bárions se manifestará como
uma série de Oscilações Acústicas de Bárions no espectro de potência. Figura retirada de
Bassett & Hlozek (2009).
37
Figura 3.3: Diagrama que descreve o desacoplamento do plasma primordial, composto por
matéria escura (curva preta), bárions (curva azul), fótons (cuva vermelha) e neutrinos (curva
verde). Os painéis descrevem o perfil de densidade de energia de acordo com o desvio para o
vermelho (proporcional ao resfriamento do conteúdo material do universo). Figura retirada
de Eisenstein (2005).
38
Figura 3.4: O tamanho de um objeto ao longo da linha de visada é dado por cdz/H(z),
onde dz é a diferença em desvio para o vermelho entre a parte anterior e posterior do
objeto. O tamanho na direção perpendicular à linha de visada é dado por dA (z)θ, sendo
θ seu tamanho angular. Como podemos teoricamente determinar o raio dessa escala de
aglomeração através das BAO, podemos então determinar dA (z) e H(z) separadamente.
Figura retirada de Bassett & Hlozek (2009).
39
Sendo assim, através do mapeamento de uma parte grande do céu, podemos verificar
a existência dessa pequena sobredensidade de matéria tanto na direção radial (∝ 1/H(z))
quanto na direção perpendicular à linha de visada (∝ dA (z)). Combinando essas medidas
com resultados da escala da perturbação inicial obtida a partir da RCF, podemos obter as
quantidades H(z) e dA (z) independentemente (Abramo et al., 2009).
O uso de BAO para encontrar vínculos sobre os parâmetros cosmológicos foi primeiramente proposto por Eisenstein, Hu & Tegmark (1998). Entretanto, uma análise mais detalhada de como essa sugestão seria aplicada a dados reais foi apresentada em Blake & Glazebrook
(2003), Blake & Glazebrook (2003), entre outros. Entretanto, os primeiros resultados positivos de detecção deste efeito tiveram que esperar experimentos como o SDSS (Eisenstein et al.,
2005) e do 2 Degree Field Galaxy Redshift Survey (2dF)(Cole et al., 2005), que rapidamente
impuseram vínculos fortes sobre a densidade da matéria e curvatura.
Mostramos na figura (3.5), a função de correlação encontrada a partir de dados do SDSS
juntamente com o modelo teórico para Ωm h2 = 0.12, 0.13 e 0.14 (curvas verde, vermelha e
azul, respectivamente). Em todos esses modelos, Ωb = 0.024. A curva rosa representa um
universo sem bárions, Ωb = 0.
Nos próximos capítulos, nós utilizamos medidas de BAO em duas formas diferentes:
• Sk /Dv
No capítulo 4, nós utilizamos medidas de BAO de acordo com a prescrição apresentada
por Percival et al. (2007). Neste trabalho, os autores utilizam a razão entre a distância
à superfície de último espalhamento (Sk (zls = 1098)) e a escala de distância às BAO
(Dv (zBAO )) em zBAO = 0.2 e zBAO = 0.35. Este observável é ideal ao nosso propósito,
pois depende exclusivamente da razão H(z)/H0 .
• SKA
No capítulo (5), mostramos resultados baseados em simulações de medidas de H(z)
40
Figura 3.5: Pico acústico na função de correlação encontrado na amostra de dados do SDSS
Luminous Red Galaxy Survey. A altura do pico é sensível à densidade de matéria. As curvas
verde, vermelha e azul representam a função de correlação para Ωm h2 = 0.12, 0.13 e 0.14,
respectivamente. Em todos os casos, Ωb h2 = 0.024. A linha rosa representa o modelo sem
bárions Ωb = 0. Figura retirada de Eisenstein et al. (2005).
41
e dA (z), para diferentes estágios de um experimento como o SKA5 , de acordo com a
simulação realizada por Abdalla, Blake, & Rawlings (2009).
O SKA é um projeto de um arranjo de rádio telescópios que têm o objetivo de rastrear
a presença de linhas de emissão HI em diferentes partes do céu. Como a maior parte
da matéria no universo se encontra na forma de hidrogênio, esta é uma maneira de se
rastrear os bárions e consequentemente medir BAO. Os diferentes estágios (1 a 3) aos
quais nos referimos nos próximos capítulos correspondem a diferentes frações do campo
de visão total disponíveis em cada estágio (ver Abdalla, Blake, & Rawlings (2009) para
uma definição detalhada do design considerado na simulação). Para o propósito deste
trabalho, é suficiente a divisão dos estágios por faixa de profundidade das observações:
o estágio 1 corresponde a observações em 0.2 < z < 1.0, o estágio 2 corresponde a
0.2 < z < 1.4 e o estágio 3 tem 0.2 < z < 2.2. As incertezas para bins de ∆z = 0.2
podem ser visualizadas na figura (3.6).
De acordo com o atual cronograma do SKA, a parte necessária do SKA para que se
possa obter esse tipo de dados não estará pronta antes de 2020. Entretanto, nós não
nos aventuramos a utilizar resultados de simulações mais simples apresentadas por
Abdalla, Blake, & Rawlings (2009) porque o número de medidas em diferentes valores
de desvio para o vermelho não são suficientes para um estudo de evolução temporal
das mesmas.
5
http://www.skatelescope.org/
42
Figura 3.6: Incertezas nas medidas finais de H(z) (linhas tracejadas) e dA (z) (linhas cheias),
para diferentes estágios de um experimento como o SKA. f = 1.0 indica que esses resultados
se referem a um experimento com a mesma área de cobertura do SKA, limite mínimo para
detecção de uma fonte: nσ = 10 e diferentes valores de campo de visão efetivo. Figura
retirada de Abdalla, Blake, & Rawlings (2009).
Capítulo 4
Um novo olhar sobre o Parâmetro de
Desaceleração
Como mencionamos anteriormente, ao longo dos últimos anos várias estratégias de abordagem do problema da aceleração cósmica foram desenvolvidas. Uma dessas alternativas
consiste em realizar uma análise dos vínculos impostos aos parâmetros cosmológicos pelos
dados para um modelo cosmológico específico. Alternativamente, podemos adotar uma postura fenomenológica, através da utilização de diferentes parametrizações para a equação de
estado (Chevallier & Polarski, 2001; Linder, 2003), o parâmetro de Hubble (Kujat et al.,
2002; Alam et al., 2003; Daly & Djorgovski, 2003; Nesseris & Perivolaropoulos, 2004) ou a
densidade de energia da EE (Wang & Garnavich, 2001; Wang & Freese, 2006). Este procedimento pode resultar em alguns vínculos interessantes, entretanto as parametrizações
normalmente assumem a existência da matéria e energia escura como substâncias diferentes.
Com poucas exceções, nenhuma interação no setor escuro é considerada e os resultados são
válidos apenas para cenários onde a RG é considerada como teoria de gravitação. Neste cenário, um ponto importante deve ser considerado: quantos parâmetros são necessários para
se conseguir resultados confiáveis. Se utilizarmos muitos parâmetros, a região permitida no
espaço de parâmetros pode ser grande o bastante a ponto de inviabilizar a obtenção de resultados significativos (Linder & Huterer, 2005). Por outro lado, se o número de parâmetros
43
44CAPÍTULO 4. UM NOVO OLHAR SOBRE O PARÂMETRO DE DESACELERAÇÃO
for muito pequeno, o resultado será altamente dependente da parametrização escolhida e os
resultados serão altamente enviesados (Bassett, Corasaniti, & Kunz, 2004). A estratégia que
utilizaremos nesta primeira análise consiste em escolhermos um alto número de parâmetros
(4), para que a generalidade possa ser mantida. No entanto, utilizaremos argumentos físicos
para fixarmos dois deles. Em um segundo momento, nós deixamos três desses parâmetros
livres e apresentamos nossos resultados como uma superfície em um espaço tridimensional.
Nossos resultados foram previamente apresentados em Ishida et al. (2008).
Nesta análise, estamos primeiramente interessados em duas questões: qual o valor do
desvio para o vermelho no qual ocorreu a transição entre a fase desacelerada e a fase acelerada
da expansão? Quão rápida foi esta transição?
Nós estudamos maneiras de responder a tais indagações através de uma nova parametrização para o parâmetro de desaceleração, q, que por sua vez depende de 4 parâmetros:
os valores inicial, qi , e final, qf , do parâmetro de desaceleração, o valor do desvio para o
vermelho onde ocorre a transição entre aceleração e desaceleração, zt , e a largura de tal transição, τ . Nesta formulação, nosso objetivo é responder às questões levantadas anteriormente
fazendo uso de um número mínimo de hipóteses sobre o setor escuro e teoria de gravitação.
4.1
Nosso Modelo
Começamos nossa análise considerando um universo homogêneo e isotrópico, cuja métrica
é dada pela equação (2.1). A partir deste ponto, nos restringiremos ao caso de um universo
plano, o que está em acordo com os últimos resultados provenientes da RCF (Komatsu et al.,
2009).
Propomos então uma nova parametrização fenomenológica para o parâmetro de desaceleração dada por
q(z) ≡ qf +
(qi − qf )
¡ t ¢1/τ ,
1 − qqfi 1+z
1+z
(4.1)
onde qi e qf correspondem aos valores inicial (z À zt ) e final (z = −1) do parâmetro de
desaceleração, respectivamente. O parâmetro zt representa o valor do desvio para o vermelho
4.1. NOSSO MODELO
45
onde ocorre a transição (q(zt ) = 0) e τ representa a largura da transição. O parâmetro τ está
relacionado à derivada do parâmetro de desaceleração em relação ao desvio para o vermelho,
em z = zt , através da expressão
µ
τ
−1
=
1
1
−
qi qf
¶·
dq(z)
d ln(1 + z)
¸
.
(4.2)
z=zt
A expressão (4.1) é similar àquela apresentada por (Bassett et al., 2002) (veja também
alguns exemplos em Corasaniti & Copeland (2002); Bassett et al. (2003); Corasaniti et al.
(2003); Hannestad & Moörtsell (2004); Linder & Huterer (2005); Bassett, Corasaniti, & Kunz
(2004)), com a diferença de que nós parametrizamos q(z) ao invés de w(z). Uma das vantagens em utilizarmos uma parametrização para q(z) é o fato de que zt assume um claro significado físico. Vários aspectos de diferentes parametrizações de q(z) podem ser encontradas em
Turner & Riess (2002); Riess et al. (2004); Shapiro & Turner (2006); Elgarøy & Multamäki
(2006); Gong & Wang (2007); Rapetti et al. (2007); Xu & Liu (2008).
Com as definições acima, podemos integrar a equação (2.15), obtendo
µ
H(z)
H0
Ã
¶2
= (1 + z)2(1+qi )
qi
¡ 1+zt ¢1/τ
1+z
− qf
!2τ (qi −qf )
qi (1 + zt )1/τ − qf
.
(4.3)
Definimos também o parâmetro de densidade da matéria "efetivo"(Ωm∞ ), dado por
µ
Ωm∞ ≡ lim
z→∞
H(z)
H0
¶2
(1 + z)−2(1+qi ) .
(4.4)
Nos cenários mais simples analisados na literatura, o universo necessariamente passa por
uma fase dominada pela matéria, a fim de que estruturas em largas escalas possam se formar.
Consequentemente, no início da história evolutiva do universo, mas depois da fase dominada
pela radiação, H 2 ∝ (1+z)3 , o que implica q = 1/2. Com base nestas afirmações, nós fixamos
o valor inicial do parâmetro de desaceleração em qi = 1/2, reduzindo a três o número de
parâmetros livres em nossa análise.
Pode-se argumentar que essa restrição culmina em uma perda de generalidade, mas a
questão na qual devemos nos concentrar é: quanto qi pode se afastar de 1/2 e ainda assim
permitir a formação de estruturas durante a fase dominada pela matéria? No contexto
da RG, em modelos onde o acoplamento entre matéria e energia escura é constante (δ), a
condição qi = 1/2 não é satisfeita. Neste caso, H 2 ∝ (1+z)(3+δ) durante a fase dominada pela
matéria. Entretanto, resultados apresentados por Guo, Ohta, & Tsujikawa (2007), mostram
que testes cosmológicos restringem |δ| < 0.1. Se levarmos em consideração perturbações na
densidade de matéria, vínculos mais fortes podem ser encontrados (Fabris, Shapiro, & Solà,
2007). Podemos também considerar modelos onde a matéria possui pressão, nesses casos,
qi 6= 1/2. Entretanto, se as perturbações na densidade de matéria forem adiabáticas, devido
a uma velocidade do som finita, o espectro de potência da matéria apresentará instabilidades,
descartando esse modelos a menos que p = 0 (qi = 1/2) ou muito perto disso. Em princípio,
podemos contornar esse tipo de problema assumindo perturbações de entropia de tal forma
que δp = 0 (Reis et al., 2003; Amendola, Waga, & Finelli, 2005). Entretanto, há indícios de
que nós não estamos deixando de mapear muitos modelos viáveis ao fixarmos qi = 1/2, a
análise de um quadro onde este parâmetro é considerado livre com certeza merece atenção,
mas está fora dos objetivos deste trabalho.
No caso específico onde qi = 1/2, temos
µ
Ωm∞ =
1
1−
(1 + zt )1/τ
2qf
¶−τ (1−2qf )
.
(4.5)
Com esta definição, podemos eliminar zt da equação (4.3) e reescrevê-la como
µ
H(z)
H0
¶2
µ
¶τ (1−2qf )
1
1
τ (1−2qf )
τ (1−2qf )
− τ1
= (1 + z) Ωm∞
+ (1 − Ωm∞
)(1 + z)
.
3
(4.6)
A expressão acima, conectando H(z) com Ωm∞ , é bastante útil para que possamos fazer
conexões entre a parametrização proposta neste trabalho e demais modelos presentes na
literatura. Por exemplo, podemos utilizar a equação (4.6) para verificar que a expressão (4.1),
está relacionada ao modelo Cardassiano Politrófico Modificado (CPM) (Gondolo & Freese,
2003; Wang et al., 2003). Este modelo depende de três parâmetros: m (denominado q em
4.1. NOSSO MODELO
47
Gondolo & Freese (2003)), n e Ωm0 . Neste contexto, o parâmetro de Hubble é dado por
·
H(z)
H0
¸2
= (1 + z)3
©¡
Ωobs
m0
¢p
+ [1 − (Ωpm0 )p ] (1 + z)−3p(1−n)
ª1/p
.
(4.7)
CP M
Se identificarmos Ωm0 = Ωm∞ , m = 1/(τ (1 − 2qf )) e n = 2/3(1 + qf ), os dois modelos
apresentam a mesma cinemática. Chamamos a atenção para o fato de que, no modelo
CPM, Ωm0 representa o valor atual do parâmetro de densidade da matéria, enquanto acima,
Ωm∞ é definido para altos valores de desvio para o vermelho. Essas duas quantidades podem ser diferentes, por exemplo, em modelos onde existe um acoplamento entre a matéria
e a energia escura (Amendola, 2000; Zimdahl & Pavón, 2007). Para ilustrar nosso argumento, considere modelos cujo acoplamento entre matéria e energia escura seja variável,
entretanto, onde a equação de estado da energia escura (wX ) seja constante, e que apresentem ρX /ρm = ρX0 /ρm0 aξ (Dalal et al., 2001). Tais modelos podem ser descritos pela equação
1/τ (1−2qf )
(4.1), se identificarmos Ωm0 = Ωm∞
, ξ = 1/τ e wX = −(1 − 2qf )/3. Como já dissemos,
nossa abordagem não exige que façamos hipóteses fortes sobre o setor escuro e/ou teoria de
gravitação. No modelo CPM, os componentes do universo são radiação e matéria escura,
não há energia escura. A parametrização (4.1) inclui o modelo CPM (e os modelos com
acoplamento citados anteriormente) como casos especiais.
Podemos obter também o modelo de quartessência de Chaplygin (ver, por exemplo,
Kamenshchik, Moschella, & Pasquier (2001); Bilić, Tupper, & Viollier (2002); Bento et al.
(2002); Makler, de Oliveira, & Waga (2003)) na ausência de bárions (p = −M 4(α+1) /ρα ),
no caso especial onde qi = 1/2, qf = −1, 1/τ = 3(1 + α) e Ωm∞ = (1 − w0 )1/(1+α) , onde
w0 = −M 4 /ρα+1
é o valor atual da equação de estado da energia escura.
0
Modelos de energia escura com equação de estado constante (wX ) podem ser obtidos
se identificarmos Ωm∞ = Ωm0 e impusermos que −3wX = 1/τ = (1 − 2qf ) na equação
(4.1). Em particular, fixando qf = −1 e τ = 1/3, recuperamos o modelo ΛCDM. Neste
modelo, zt = (2(1 − Ωm0 )/ Ωm0 )1/3 − 1. O fato de podermos identificar o modelo ΛCDM
no espaço de parâmetros é bastante conveniente, uma vez de que este apresenta uma boa
concordância com os dados atuais, e consequentemente espera-se que o verdadeiro modelo
cosmológico não seja muito distante deste. É importante enfatizar que, no contexto da RG
com matéria e energia escuras não interagentes, se τ < 1/3 e qf = −1, a energia escura
possuirá um comportamento tipo phantom (w < −1), que pode já ter iniciado no passado
ou se apresentará no futuro. Modelos com τ > 1/3 serão sempre não-phantom.
É curioso notar que, se aplicarmos a definição dada pela equação (4.2) (com qi = 1/2
e qf = −1) ao modelo DGP plano (Dvali, Gabadadze, & Porrati, 2000), obtemos τ = 1/2
independente do valor atribuído a Ωm0 . Logo, modelos do parâmetro de desaceleração onde
zt = (2(1 − Ωm0 )2 / Ωm0 )1/3 − 1 (desvio para o vermelho da transição no modelo DGP) e
τ = 1/2 são uma boa aproximação para modelos tipo DGP.
4.1. NOSSO MODELO
49
1.0
0.5
q(z)
0.0
- 0.5
- 1.0
- 1.5
-1
0
1
z
2
-1
0
1
z
2
3
Figura 4.1: Influência dos parâmetros zt e τ na forma funcional do parâmetro de desaceleração para o caso especial onde qi = 1/2 e qf = −1. Painel Esquerdo: q(z) para zt = 1.0 e
τ = 0.1 (curva verde-tracejada), 0.3 (curva cheia-preta) e 0.5 (curva azul-ponto tracejada).
Painel Direito: q(z) para τ = 0.3 e zt = 0.5 (curva verde-tracejada), 1.0 (curva cheia-preta)
e 1.5 (curva azul-ponto tracejada).
4.2
Vínculos Observacionais
Uma das principais questões não resolvidas da cosmologia atual se refere à causa da
aceleração cósmica: ela é causada por um tipo de constante cosmológica ou não? Os dados
indicam que modelos tipo ΛCDM são altamente favorecidos. Em nossa análise, consideramos
primeiramente modelos que possuem uma fase final tipo de Sitter (qf = −1). Neste caso,
o modelo ΛCDM é facilmente identificado no espaço de parâmetros, o que possibilita um
teste simples para o paradigma representado pelo modelo ΛCDM. O caso mais geral, onde
qf 6= −1, será brevemente discutido posteriormente. Considerando qf = −1, temos
q(z) = −1 +
·
H(z)
H0
¸2
3
¡ 1+zt ¢1/τ ,
2 + 1+z
"¡
¢
1+z 1/τ
+2
= (1 + z)3
(1 + zt )1/τ + 2
·
¸−3τ
1
1/τ
=
(1 + zt ) + 1
.
2
t
1+z
Ω∞
(4.8)
#3τ
,
(4.9)
(4.10)
Obtivemos então vínculos no espaço de parâmetros formado por zt e τ , a partir de dados
de SNIa e de medidas da razão entre a distância à superfície de último espalhamento Sk (zue =
1098) e a distância característica definida por medidas de BAO, Dv (z), em zBAO = 0.2 e
zBAO = 0.35, como estimado por Percival et al. (2007).
Este observável nos é útil por duas razões. Primeiramente, o mesmo não depende explicitamente dos componentes escuros do universo ou da teoria de gravitação, pois é essencialmente controlado pela função
H(z)
.
H0
Além disso, seus resultados são complementares aos
dados de supernovas porque ambos obtêm informações a partir de objetos em intervalos diferentes de desvio para o vermelho. Com supernovas, estamos medindo distâncias até z ∼ 1−2,
enquanto Sk depende da distância à superfície de último espalhamento, em z ∼ 1100.
Utilizamos em nossa análise ambos os conjuntos de dados citados no capítulo 3, Gold182
(Riess et al., 2007) e SNLS (Astier et al., 2006). No que segue, apresentamos resultados
baseados em funções de verossimilhança marginalizadas sobre o parâmetro de Hubble, uti-
4.2. VÍNCULOS OBSERVACIONAIS
51
lizando um a priori gaussiano tal que h = 0.72 ± 0.08 (Freedman et al., 2001). Na figura
(4.2)-painel esquerdo, apresentamos os contornos de confiança (68% e 95%) no plano (arctg
zt × τ ) construídos a partir de dados de SNIa, no caso particular onde qf = −1. Note que,
para os dois conjuntos de dados, zt < 0 não é permitido mesmo em altos níveis de confiança,
indicando que uma transição ocorreu no passado. Chamamos a atenção para o fato de que
esse resultado é esperado para modelos tipo ΛCDM (ou outros) que possuem um tempo de
transição não-nulo. Entretanto, nossos resultados indicam que zt > 0 inclusive para modelos
onde a transição é instantânea (τ = 0). Mais adiante, mostramos que esse resultado é válido
inclusive para casos onde qf 6= −1.
Além disso, também fica claro pela figura (4.2) - painel esquerdo que os dados atuais
não podem impor vínculos fortes sobre o valor máximo permitido para zt . Esse resultado
reflete o fato de que as SNIa podem ser utilizadas como medida de distância até um valor
de desvio para o vermelho de z ∼ 1 − 2. Em um modelo em que a transição é lenta (τ > 1),
mesmo que a transição ocorra em um valor alto de desvio para o vermelho a distância até
um objeto localizado em z . 1, por exemplo, será bastante similar à distância ao mesmo
objeto em um modelo onde zt . 1 mas no qual a transição é mais rápida (menor τ ). Isto
explica a forma dos contornos de confiança extraídos de dados de SNIa. Comparando os
contornos obtidos a partir dos diferentes conjuntos de dados, observamos que aqueles provenientes do Gold182 estão deslocados para valores mais baixos de zt em comparação com
os contornos obtidos a partir de dados do SNLS. É importante enfatizar que, mesmo na
região de maior interesse (zt . 1), a diferença entre os resultados de diferentes conjuntos
de dados, apesar de não ser tão severa, existe e é importante. Resultados semelhantes foram obtidos por Jassal, Bagla, & Padmanabhan (2005); Nesseris & Perivolaropoulos (2005);
Alam, Sahni, & Starobinsky (2007); Nesseris & Perivolaropoulos (2007), tais diferenças podem estar relacionadas a inomogeneidades presentes nos dados do Gold182 e deve ser melhor
investigada.
A fim de obter intervalos de confiança a partir do teste Sk /Dv , utilizamos um teste
estatístico tipo χ2 levando em consideração a matriz de correlação entre as medidas de BAO
τ
6
6
5
5
4
4
3
3
2
2
1
1
0
0
0
0.2
0.4
0.6
0.8
1
arctan z t
1.2
1.4
-1
-0.5
0
zt
0.5
1
1.5
Figura 4.2: Painel esquerdo: Vínculos impostos por observações de SNIa. Os contornos
representam intervalos de confiança de 68% and 95%. As curvas verde-tracejadas correspondem a resultados obtidos a partir dos dados do Gold182 e as curvas azuis-sólidas correspondem aos dados do SNLS. Painel direito: Vínculos impostos por medidas de Sk /Dv
(Percival et al., 2007) (níveis de confiança de 68% and 95%) como explicado no texto. A
linha vermelha-sólida em ambos os painéis correspondem ao modelo ΛCDM. Note que, para
estes modelos, valores mais altos de zt correspondem a valores menores de Ωm∞ . Nos dois
painéis utilizamos qf = −1
53
e a razão Sk /Dv apresentadas por Percival et al. (2007), ou seja,
χ2Sk /Dv = Xt V−1 X,
onde
e
(4.11)


Sk
 D (0.2) − 19.04 
v

X=


Sk
− 10.52
Dv (0.35)

(4.12)

 3.79198 −2.59919 
V−1 = 
,
−2.59919 11.7137
(4.13)
sendo V−1 a matriz de correlação entre as duas medidas de BAO (Percival et al., 2007).
Como estamos considerando a curvatura espacial nula, podemos escrever
Z
1098
Sk (zt , τ, h) =
0
e

dz
,
He (zt , τ, h, z)
³R
zBAO
dx
H(zt ,τ,x)
0
 zBAO
Dv (zBAO , zt , τ ) = 
H(zt , τ, zBAO )
(4.14)
´2 1/3


.
(4.15)
O termo He na equação (4.14) leva em consideração a necessidade de contabilizarmos a
contribuição da radiação para valores de desvio para o vermelho muito altos, que não são mapeados pela nossa parametrização (equação (4.1)). Pode-se argumentar que ao introduzirmos
a contribuição da radiação estamos perdendo generalidade. Entretanto, qualquer modificação ao modelo padrão da cosmologia deve satisfazer a nucleossíntese primordial para z À 1.
Nós sabemos que a radiação existe e sabemos também qual deve ser o comportamento do
parâmetro de Hubble em tempos remotos, onde a dinâmica do universo é dominada por este
componente, de modo a preservar os resultados bem sucedidos da nucleossíntese primordial.
Neste fase, H 2 ∝ (1 + z)4 e q = 1. Logo, a fim de levarmos em conta a contribuição da radiação, adicionamos o termo Ωr0 (1 + z)4 ao lado direito da equação (4.3), quando a utilizamos
para calcular Sk ,
·
He (zt , τ, h, z)
H0
¸2
·
H(zt , τ, z)
=
H0
¸2
+
4.15 × 10−5
(1 + z)4 .
h2
(4.16)
Caso não façamos essa correção, poderíamos chegar a um valor de Sk com erro aproximado
de 18%.
Marginalizamos a função de verossimilhança sobre h utilizando o mesmo a priori aplicado
aos dados de SNIa. Na verdade, Sk é praticamente independente de h, uma vez que o mesmo
apenas aparece na contribuição da radiação. Na figura (4.2 - painel direito), apresentamos
níveis de confiança de 68% e 95% no plano zt × τ , obtidos a partir do teste Sk /Dv . É
importante mencionar que a forma destes contornos é bastante similar àqueles calculados
para diferentes valores de Ωm∞ , de modo que este teste pode ser considerado uma maneira
de restringir tal quantidade. O mesmo tipo de comportamento pode ser encontrado em
modelos planos onde a equação de estado é considerada constante (Percival et al., 2007).
A partir da figura (4.2), fica clara a complementariedade entre os resultados deste teste e
aqueles encontrados a partir de dados de SNIa.
A fim de obter resultados combinados (SNIa+Sk /Dv ), multiplicamos suas respectivas
funções de verossimilhança marginalizadas. Na figura (4.3) apresentamos níveis de confiança
(68% e 95%) obtidos a partir de resultados do teste Sk /Dv combinados com dados do Gold182
(verde-tracejado) e SNLS (azul-ponto tracejado). A linha horizontal vermelha nesta figura
representa o modelo ΛCDM (τ = 1/3). Vemos que este modelo está em bom acordo com
os dados do SNLS+Sk /Dv . Após a marginalização sobre o parâmetro extra (Colistete,
2006), obtemos para Sk /Dv +Gold182 (com nível de confiança de 95.4%), zt = 0.84±0.13
0.17 e
0.12
0.12
τ = 0.51±0.23
0.17 , enquanto para Sk /Dv +SNLS encontramos, zt = 0.88±0.10 e τ = 0.35±0.10 .
Considerando um modelo onde qf = −1, τ = 0.35 e zt = 0.88, a equação (4.5) nos mostra que
Ωm∞ = 0.23. É fácil mostrar que a idade do universo neste modelo específico, considerando
h = 0.72 é de 14 Ganos e que a aceleração começou a 7.2 Ganos atrás. Note que o modelo
ΛCDM (τ = 1/3) está em bom acordo com os resultados de SNLS+Sk /Dv , mas está excluído
55
com mais de 68% de confiança para dados do Gold182 +Sk /Dv . Essa discrepância revela uma
tensão entre os dados de SNIa e a necessidade eminente de melhores dados e um procedimento
de padronização mais eficaz para que essa questão possa ser esclarecida. Mostramos na
mesma figura (curva preta-sólida) o que devemos esperar de futuros dados de SNIa+Sk /Dv .
Em nossa simulação de Monte Carlo, utilizamos como modelo fiducial ΛCDM Ωm0 = 0.23
(τ = 1/3, zt ' 0.88). Para os dados de SNIa consideramos um levantamento do tipo proposto
para o programa Joint Dark energy Mission (JDEM)1 , com a hipótese de que a magnitude
intrínseca das SNIa e o valor do parâmetro de Hubble hoje são plenamente conhecidos.
Para o teste Sk /Dv nós adotamos a postura conservadora (mas em algum nível também
arbitrária) de que, no futuro, os erros em Sk /Dv serão reduzidos em 2/3 sobre os valores
atuais. Consideramos também que os coeficientes de correlação serão os mesmos. A figura
mostra níveis de confiança de 95%.
Nós analizamos também o caso mais geral, onde qf 6= −1. A expressão (4.1) nos permite
escrever o valor do parâmetro de desaceleração hoje (q0 ) como função de zt , τ e qf . Apesar dos dados atuais não imporem vínculos sobre o valor mínimo de qf , eles restringem q0
(encontramos −1.4 . q0 . −0.3). Apresentamos na figura (4.3, painel direito), níveis de
confiança de 95% no espaço de parâmetros zt × τ × qf para o caso geral onde qf ∈ (−∞, 0),
obtidos a partir de dados do SNLS+Sk /Dv .
Com base nesses resultados podemos afirmar, sem utilizar fortes hipóteses sobre o modelo cosmológico e/ou teoria métrica de gravitação, que houve uma transição entre uma
fase de aceleração e uma fase de desaceleração no passado (zt > 0). Entretanto, os dados
atuais ainda não são capazes de impor fortes vínculos sobre este parâmetro. As simulações
realizadas nos mostram que no futuro, esse tipo de abordagem proporcionará vínculos muito
mais restritivos. Apesar de todas as vantagens citadas anteriormente, o comportamento do
parâmetro de desaceleração como função do desvio para o vermelho (figuras (4.4) e (4.5)) é
restrita às formas permitidas pela parametrização utilizada (figura (4.1)).
A fim de tentar eliminar tal restrição, no próximo capítulo utilizamos um outro proce1
www.snap.lbl.gov
dimento, onde a forma funcional da quantidade estudada é obtida unicamente a partir dos
dados.
57
1.0
-0.2
0.8
-0.6
τ
q0
0.6
-1
-1.4
1.2
0.4
0.8
τ
0.2
0.6
0.7
0.8
zt
0.9
1
1.1
0.4
1
0
0.4
0.6
1.2
0.8
z
t
Figura 4.3: Painel esquerdo: Níveis de confiança de 68% e 95% impostos pela combinação
dos dados apresentados na figura (4.2). Os contornos verde-tracejados (azuis-ponto tracejados) representam Gold182 (SNLS) + Sk /Dv . O contorno preto-sólido (nível de confiança de
95%) foi obtido a partir de dados simulados como explicado no texto. Nesta figura, impomos
qf = −1. Painel direito: Nível de confiança de 95% no espaço zt × τ × q0 para o caso geral
onde q0 ∈ (−∞, 0), obtido a partir dos dados de SNLS+Sk /Dv .
0.4
LCDM
com Wm =0.23
0.2
qHzL
0.0
-0.2
q i =0.50
-0.4
q f =-1.0
-0.6
melhor
-0.8
ajuste
1 Σ para dados do Gold182
z t =0.84
+0.13
-0.17
Τ=0.51
+0.23
-0.17
-1.0
0.0
0.5
1.0
1.5
z
Figura 4.4: Reconstrução do parâmetro de desaceleração utilizando os melhores ajustes
encontrados para zt e τ a partir de dados do Gold182.
0.4
LCDM
com Wm =0.23
0.2
qHzL
0.0
-0.2
q i =0.50
-0.4
q f =-1.0
-0.6
melhor
-0.8
ajuste
1 Σ para dados do SNLS
z t =0.88
+0.12
-0.10
Τ=0.35
+0.12
-0.10
-1.0
0.0
0.5
1.0
1.5
z
Figura 4.5: Reconstrução do parâmetro de desaceleração, construída a partir dos melhores
ajustes encontrados a partir dos dados do SNLS.
Capítulo 5
Análise por Componentes Principais
Os resultados apresentados no capítulo anterior nos mostraram que a análise do parâmetro de desaceleração tem a vantagem de nos proporcionar resultados independentes de
modelo cosmológico ou teoria de gravitação. Entretanto, a imposição de uma forma específica para q(z) ainda introduz um viés que limita a forma final encontrada àquela permitida
pela forma funcional escolhida. Em geral, a relevância de qualquer parametrização é diretamente proporcional à sua capacidade de reproduzir modelos viáveis em todos os valores
de desvio para o vermelho. Nesse aspecto, a parametrização que propusemos no capítulo
anterior representa uma das mais versáteis parametrizações disponíveis na literatura, vide o
número de modelos que podem ser encontrados para valores especiais de seus parâmetros.
Entretanto, procuramos por um método de análise de dados que permita aos mesmos apontar qualquer valor para o parâmetro de desaceleração, mesmo que estes valores não estejam
previamente mapeados em nenhum modelo cosmológico. Para tanto utilizaremos a Análise
por Componentes Principais (ACP). Os resultados aqui apresentados também podem ser
encontrados em Ishida et al. (2010).
ACP é bastante utilizada para lidar com conjuntos de dados em problemas de muitas
variáveis. O método nos permite encontrar direções de maior concentração dos dados no
espaço de fase formado pelos parâmetros da teoria, a partir dos quais podemos reduzir a dimensionalidade do espaço de parâmetros com perda mínima de informação. Historicamente,
59
60
CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS
ACP foi primeiramente aplicada em análise sociais. O argumento matemático por trás dos
testes de inteligência aplicados no início do século XX era baseado em ACP (Gould, 1981).
Em cosmologia, este método é bastante utilizado em problemas que exigem redução do espaço de parâmetros, como RCF e lentes gravitacionais, entre outros (Galaz & de Lapparent
(1998), Efstathiou & Bond (1999), Ronen, Aragon-Salamanca, & Lahav (1999), Efstathiou
(2002) Hu & Holder (2003), Dick, Knox, & Chu (2006), Tang, Abdalla, & Weller (2008),
Pogosian et al. (2009), Kitching & Amara (2009)), e para realizar análise de propriedades
da energia escura de modo independente de modelo. Mais recentemente, a aplicação de ACP
na determinação de vínculos sobre os parâmetros cosmológicos vem sendo alvo de muitas
discussões, desde que Albrecht et al. (2009) sugeriu o mesmo como alternativa à figura de
mérito proposta pelo Dark Energy Task Force (DETF)(Albrecht et al., 2006). Entretanto,
existem hipóteses importantes que devem ser observadas para que essa utilização possa ser
feita de maneira coerente, como aponta Kitching & Amara (2009). Analisaremos como tais
hipóteses devem ser tratadas em uma análise de q(z) mais adiante.
A ACP não ignora correlações e covariâncias, mas em um primeiro momento a análise se
concentra na variância (ou grau de dispersão) apresentados pelos dados.
Se dispusermos de um conjunto de dados composto por N pontos xi , cuja média é x̄ =
PN
i=1 xi /N , definimos a variância associada à quantidade x, (var[x]), como
var[x] =
N
X
(xi − x̄)2
i=1
N −1
.
(5.1)
Considere p̄ um vetor contendo p variáveis aleatórias. Nosso primeiro passo será encontrar
uma função linear dos elementos de p̄ tal que a variância associada à essa combinação linear
seja maximizada. Em seguida, procuramos uma outra função de variância máxima, que
não seja correlacionada à primeira função, e assim por diante. Desta forma, a k-ésima
variável será o k-ésimo componente principal (CP). Ao todo, podemos repetir este processo
até obtermos p CPs, entretanto, na maioria dos casos apenas m CPs, sendo m ¿ p, são
suficientes para englobar a maior parte da variância presente nos dados.
5.1. A MATRIZ DE FISHER...
61
O leitor deve estar atento para a definição de variância que estamos utilizando. Como
apresentado acima, a variância considerada representa a dispersão associada aos dados na
direção definida pelos CPs.
Apresentamos na figura (5.1) um exemplo em 2 dimensões. Esta figura representa 100
pontos em função de duas variáveis altamente correlacionadas {x1 , x2 }. Existe uma dispersão
razoável dos dados ao longo dessas duas variáveis (x ∈ {−0.3, 0.4} e y ∈ {−0.3, 0.4}).
Entretanto, quando reescrevemos os dados como função do primeiro e segundo componentes,
percebemos que a dispersão na direção definida pelo primeiro CP (CP 1) é maior do que
a dispersão na direção definida pelo segundo CP (CP 2) (CP 1 ∈ {−0.3, 0.4} e CP 2 ∈
{−0.1, 0.1}). Em resumo, se um conjunto formado por p > 2 variáveis possui uma forte
correlação entre as mesmas, os primeiros CPs representarão a maior parte da variância
presente nas variáveis originais. Por outro lado, os últimos CPs identificam direções ao
longo das quais existe pouca variância, ou seja, onde a relação entre as variáveis originais é
praticamente linear.
Neste exemplo, caso desejemos reduzir o espaço de parâmetros, poderíamos expressar
os dados apenas em função de CP1. Obviamente alguma informação seria perdida, mas
o comportamento geral dos dados seria preservado. Em um problema multidimensional
essa característica será de extrema valia para que possamos reduzir a dimensionalidade do
problema e consequentemente as dificuldades numéricas envolvidas.
5.1
A matriz de Fisher...
Na análise utilizada neste trabalho, a forma dos CPs é determinada através da Matriz
de Fisher. A matriz de Fisher, sob algumas hipóteses básicas (para uma dedução detalhada
ver Jollife (2001) - capítulos 1 a 6), é uma boa aproximação para o inverso da matriz de
correlação. Isso nos permite identificar os CPs e as variâncias associadas aos mesmos com
os autovetores e autovalores da matriz de Fisher, respectivamente.
Encontrar os CPs a partir da matriz de Fisher nos proporciona uma forma matemati-
62
x2
0.4
0.2
-0.4
0.2
-0.2
0.4
x1
-0.2
-0.4
Figura 5.1: Exemplo em duas dimensões, representação de um conjunto de dados formado
por 100 pontos, em termos das variáveis x1 e x2 .
CP2
0.4
0.2
CP1
-0.4
0.2
-0.2
0.4
-0.2
-0.4
Figura 5.2: O mesmo conjunto de dados da figura (5.1), desta vez em função dos Componentes Principais.
63
camente elegante de determiná-los. Entretanto, como em todo problema de diagonalização
de matrizes, precisamos esclarecer dúvidas referentes a dois casos raros quando lidamos com
dados reais, mas que teoricamente podem acontecer: casos que apresentem autovalores iguais
e casos onde existem autovalores nulos. Quando a matriz de Fisher apresenta autovalores
iguais, isso significa que os autovetores correspondentes formam um subconjunto onde os elementos são ortogonais entre si, mas fora isso arbitrários. Essa situação é melhor visualizada
geometricamente. Por exemplo, suponha o caso bidimensional, onde os dados formam um
círculo no plano de variáveis. Neste caso, não é possível definir um eixo principal de maneira
unívoca, e todos os possíveis pares de eixos ortogonais entre si representam igualmente bem
a dispersão presente nos dados.
Em situações onde a matriz de Fisher apresenta r autovalores nulos, isso indica que na
verdade a dimensionalidade da mesma é (r − q). Autovalores nulos indicam uma relação
linear exata entre duas variáveis, de modo que uma pode ser escrita em função da outra e
consequentemente o espaço de parâmetros pode ser reduzido sem que haja nenhuma perda
de informação. Na maioria dos casos, esse tipo de relação é percebida antes da aplicação de
ACP, e a dimensionalidade inicial é naturalmente corrigida.
Para ilustrar o que foi dito em um exemplo prático, considere que nosso conjunto de
dados é formado por N observações independentes, cada uma delas caracterizada por uma
função densidade de probabilidade fi (xi , σdadosi ; θ̄). Na notação que utilizaremos daqui em
diante, xi corresponde à i-ésima medida, cujo erro associado é dado por σdadosi e θ̄ é o vetor
formado pelos parâmetros da teoria. Neste caso, a função de verossimilhança é dada por
L(θ̄) =
N
Y
£
¤
fi (xi , σdadosi ; θ̄) ,
(5.2)
i=1
e a matriz de Fisher é definida como
¿
Fkl ≡
∂ 2 ln L(θ̄)
−
∂θk ∂θl
À
.
(5.3)
Lembramos que o símbolo <> na equação anterior representa o valor esperado. Para uma
64
variável qualquer x, cuja função densidade de probabilidade é dada por p(x), o valor esperado
é encontrado a partir da expressão
Z
∞
hxi =
xp(x)dx.
(5.4)
−∞
No que segue, consideraremos uma distribuição de probabilidade gaussiana para cada
evento,
¸
(xi − x̄(θ̄))2
√ exp −
.
f (xi , σi ; θ̄) =
2
2σdados
σdadosi 2π
i
·
1
(5.5)
Sendo assim, podemos combinar as equações (5.2), (5.3) e (5.5), tendo como produto final
os elementos da matriz de Fisher. Na próxima seção, apresentamos as principais etapas dos
cálculos necessários à obtenção de uma expressão analítica para os componentes da matriz de
Fisher, baseados em três tipos diferentes de dados (medidas de distância). Uma apresentação
bem mais detalhada de cada etapa é mostrada no apêndice B.
5.1.1
... a partir da Distância de Luminosidade
No que segue, consideramos um universo homogêneo e isotrópico, representado pela métrica de FRW (equação (2.1)). Por questão de simplicidade, estudaremos apenas o caso onde
a curvatura é nula (K = 0), o que está em bom acordo com os últimos resultados da RCF
(Komatsu et al., 2009).
Como demonstramos no capítulo 3, a observação de supernovas nos fornece valores de
módulo de distância (Jha, Riess, & Kirshner, 2007) ou magnitude aparente em uma determinada banda (Guy et al., 2007) dependendo do processo de padronização utilizado, e valores
de desvio para o vermelho. Como uma consequência natural das equações (2.15) e (2.24), o
módulo de distância é dada por
½
Z
z
µth (z) = m − Mabs = 5 log (1 + z)
0
· Z u
¸ ¾
exp −
[q(v) + 1]d ln (1 + v) du + µ0 .
0
(5.6)
65
A fim de escrever o parâmetro de desaceleração da forma mais geral possível, nós seguimos
o procedimento utilizado por Shapiro & Turner (2006), expandindo q(z) em funções degrau,
de modo que
q(z) =
M
X
βi ci (z),
(5.7)
i=1
onde os ci ’s são dados por


 1
ci (z) =

 0
se
(i − 1)∆z < z < i∆z
,
caso contrário
βi são constantes e nesse caso representarão os parâmetros da nossa teoria, ∆z representa
a largura do bin em desvio para o vermelho e M representa o números de bins utilizados
na expansão. A escolha dessa expansão para expressar o parâmetro de desaceleração tem a
vantagem de que a resolução final na forma dos CPs será limitada apenas por nosso poder
de computação, uma vez que para um número infinito de bins podemos reconstruir com
detalhes qualquer função a partir da expressão (5.7).
A forma final dos elementos de matriz após marginalização sobre H0 será
(
¸ N ·
¸
N ·
1
∂DL (zi ; β̄) X 1
1
∂DL (zj ; β̄)
1 X
+
C i=1 DL (zi ; β̄)
∂βk
σj2 DL (zj ; β̄)
∂βl
j=1
)
N
X
1
1
∂DL (zi ; β̄) ∂DL (zi ; β̄)
,
−
2
2
σ
∂β
∂β
D
(z
;
β̄)
k
l
L
i
i
i=1
25
=
ln(10)2
Fkl
(5.8)
onde C =
5.1.2
PN
i=1
σi−2 (equação (B.15)) e β̄ é o vetor composto pelos parâmetros βi .
... a partir da Distância de Diâmetro Angular
Gostaríamos de ressaltar que, o mesmo procedimento utilizado anteriormente para de
dados de SNIa pode ser aplicado a outros observáveis. Por exemplo, de acordo com o
66
trabalho apresentado em Abdalla, Blake, & Rawlings (2009), observações de BAO podem
nos proporcionar medidas do parâmetro de Hubble (H(z)) e distância de diâmetro angular
(dA (z)) em diferentes valores de desvio para o vermelho.
Para o caso onde possuímos medidas da distância de diâmetro angular, a função de
verossimilhança é dada por
LDA (H0 ; β̄) =

N 

Y
 ³
´2 



 ,


1
D (z ; β̄)
H0 A i
 dAi −
exp
−
³
´2
√ ³ dA ´2

dA

i=1
2π σdadosi
2 σdados
i
1
(5.9)
onde DA (z; β̄) a distância de diâmetro angular em unidades de H0−1 e dAi a i-ésima medida
de dA . A forma como a função de verossimilhança depende de H0 não nos permite realizar
a marginalização sobre H0 como feito no caso de dados de SN. Logo, utilizaremos o método
DA
proposto por Albrecht et al. (2009), onde a matriz de Fisher marginalizada, Fmarg
, é dada
por
¡
¢−1 H0 β
DA
Fmarg
= F ββ − F βH0 F H0 H0
F
.
(5.10)
Nesta expressão, F ββ , F βH0 e F H0 H0 são submatrizes da matriz de Fisher.
Dado que a distância de diâmetro angular se relaciona de uma maneira simples com a
distância de luminosidade (equações (2.22) e (2.24)),
1
1
dA (z) =
dL (z) =
2
(1 + z)
(1 + z)
Z
z
0
du
,
H(u)
(5.11)
podemos obter os componentes necessários ao cálculo da matriz de Fisher marginalizada
em função das expressões analíticas para distância de diâmetro angular e suas derivadas
apresentadas na seção anterior.
67
A matriz de Fisher para medidas de distância diâmetro angular será finalmente dada por
Fklββ
βH0
Fk1
=
H0 β
F1k
H0 H0
F11
5.1.3
N
1 X
1
∂DL (zi ; β̄) ∂DL (zi ; β̄)
=
,
2
d
A
2
2
H0 i=1 ((1 + zi ) σdados )
∂βk
∂βl
i
N
DL (H0 ; β̄)
1 X
∂DL (zi ; β̄)
=
,
3
d
A
2
2
H0 i=1 ((1 + zi ) σdados )
∂βk
i
"
#2
N
1 X
DL (zi ; β̄)
=
.
dA
H04 i=1 (1 + zi )2 σdados
i
(5.12)
(5.13)
(5.14)
... a partir do Parâmetro de Hubble
Em se tratando de medidas para o parâmetro de Hubble, a função de verossimilhança
será
H
L (H0 ; β̄) =
N
Y
i=1
"
¢2 )#
hi − H(zi ; β̄)
√ exp −
.
¡ H ¢2
H
σdados
2π
2 σdados
i
i
( ¡
1
(5.15)
Após a marginalização analítica, os componentes da matriz de Fisher para medidas do parâmetro de Hubble são dados por
FklH
¿ 2
À
∂ ln LH (β̄)
=
−
∂βk ∂βl
¶
¶
µ
µ
1 ∂M ∂M 1
1
1 ∂ 2M
∂ 2K
1
=
+
−
+
.
1+
2M ∂βk ∂βl M
2
2 ∂βk βl
M
∂βk ∂βl
(5.16)
onde
K ≡
N
X
hi g(zi ; β̄)
i=1
M ≡
2
σdados
i
N
X
g(zi ; β̄)2
i=1
2
σdados
i
,
,
(5.17)
(5.18)
g(z; β̄) representa o parâmetro de Hubble em unidades de H0 e hi os dados observacionais.
68
5.2
Reconstrução do Parâmetro de Desaceleração
De acordo com o que apresentamos anteriormente, os CPs são dados pelos autovetores
da matriz de Fisher (ēi ) e seus autovalores estão relacionados à variância na direção definida pelo autovetor correspondente. Os autovetores (ou CPs) serão ordenados seguindo uma
ordem decrescente do autovalor associado. Sendo assim, o primeiro CP será o autovetor
correspondente ao maior autovalor (variância) e assim por diante. O parâmetro de desaceleração pode agora ser escrito como uma combinação linear das variáveis descorrelacionadas,
identificadas com os autovetores da matriz de Fisher. Matematicamente temos,
0
q(z; ᾱ) = qf id +
M
X
αi ei (z),
(5.19)
i=1
onde αi ’s são constantes, M 0 representa o número de componentes utilizados na reconstrução
e ᾱ é o vetor composto pelos parâmetros αi . qf id representa o modelo que utilizamos como
base para nossa expansão (vide seção 5.2.1). Escolhido um determinado qf id , a ACP irá
simplesmente mapear as características presentes nos dados que desviem desse modelo.
Utilizando as equações (5.6) e (5.19), consideramos os valores de αi como aqueles que
minimizam a expressão
2
χ =
N
X
(µi − µth (zi ; ᾱ))2
i=1
2
σrec
i
.
(5.20)
É importante chamar a atenção para o fato de que os parâmetros αi presentes na equação anterior não são os mesmos definidos por Huterer & Starkman (2003). Esses autores
consideram o conjunto completo de autovetores, o que possibilita encontrar os coeficientes
da expansão linear através de relações de ortogonalidade. No nosso caso, esses parâmetros
são obtidos através de um processo de minimização, e consequentemente possuem um erro
5.2. RECONSTRUÇÃO DO PARÂMETRO DE DESACELERAÇÃO
associado. Além disso, se λi é o i-ésimo autovalor da matriz de Fisher, σi =
69
p
λ−1
é uma
i
medida da dispersão dos dados ao redor do i-ésimo autovetor. Uma simples propagação de
tais erros na função reconstruída resulta em
0
2
σrec
(z)
=
M
X
¡
¢2
σαj ej (z) + (αj σj )2 .
(5.21)
j=1
Nos concentramos agora nos limites dos somatórios presentes nas equações (5.19) e (5.21).
É aqui que a redução de dimensionalidade do espaço de parâmetros que mencionamos anteriormente se materializa. Uma reconstrução feita com todos os M 0 = M CPs manteria
toda a informação presente nos dados. Entretanto, como os erros aumentam do primeiro
para o último CP, a propagação de tais erros na reconstrução final resultaria em intervalos de confiança absurdamente grandes, e nenhuma informação útil à cosmologia poderia
ser obtida. Podemos contornar este problema ao escolhermos reconstruir q utilizando apenas os primeiros M 0 < M CPs. Obviamente haverá alguma perda de informação devido
aos CPs não utilizados. Entretanto, estes correspondem àqueles menos representativos do
comportamento dos dados e os que possuem os maiores erros associados.
5.2.1
Quantos Componentes Principais?
Quantos componentes utilizar na reconstrução é uma questão bastante complicada. Existem inúmeros métodos utilizados a fim de encontrar uma resposta quantitativa a essa pergunta. Entretanto, todos possuem algum grau de subjetividade (ver Jollife (2001), capítulo
6). Se mantivermos muitos CPs na reconstrução final, os intervalos de confiança serão enormes e os resultados perderiam o sentido estatístico. Por outro lado, se considerarmos um
valor muito pequeno para M 0 podemos não perceber características importantes presentes
70
nos dados. Na verdade, cabe ao pesquisador definir um limite máximo para M 0 , baseado em
sua tolerância aos erros e na quantidade de informação que está disposto a sacrificar.
Neste trabalho, utilizaremos o critério mais simples possível, chamado Percentual Cumulativo da Variância Total. Se considerarmos a soma de todos os autovalores como a variância
total, a porcentagem englobada em uma reconstrução com M 0 CPs será
PM 0
i=1
tM 0 = 100 PM
λi
j=1 λj
.
(5.22)
Por exemplo, ao escolhermos um limite superior t∗ em algum valor entre 80% e 90%,
mantendo M’ CPs, onde M’ é o menor valor inteiro para o qual tM 0 ≥ t∗, estamos elaborando
uma regra que na prática preserva nos primeiros M’ CPs a maior parte da informação contida
nos dados. Na maioria dos casos, o melhor valor para t∗ será maior quanto maior for número
de observações e/ou o número de bins. É de consenso geral que um bom valor para t∗ muitas
vezes estará entre 80% e 90%, entretanto, esse valor pode ser menor ou maior, dependendo
das peculiaridades do conjunto de dados. Por exemplo, um valor maior do que 90% será
apropriado quando um ou dois CPs apresentarem variância muito maiores do que os demais.
Nesse caso, as estruturas menos óbvias contidas além desses CPs podem ser de interesse e
um valor acima de 90% pode ser necessário para que essas características se manifestem. Por
outro lado, quando o sistema apresenta um número de variáveis p muito grande, um corte
em t∗ = 80% pode resultar em um número impraticável de CPs a ser transferidos para uma
análise futura. Neste caso um valor menor para t∗ deve ser escolhido. Existiram ao longo da
história várias tentativas de atribuir uma distribuição a tM 0 , e consequentemente produzir um
procedimento formal para a escolha de M’ baseado em tM 0 . Mandel (1972) apresenta valores
esperados para tM 0 quando todas as variáveis são independentes, normalmente distribuídas
71
e com a mesma variância. Os resultados de Mandel são baseados em simulações e, apesar
de resultados exatos terem sido produzidos por alguns autores, eles funcionam apenas para
casos limitados e muito especiais. Sugiyama & Tong (1976) descrevem uma distribuição
aproximada para tM 0 que não assume independência ou variâncias iguais, e que pode ser
usada para decidir se existe alguma estrutura subjacente para a distribuição dos valores de
λ1 , λ2 , λ3 , ..., λM . Entretanto, o teste ainda assume gaussianidade e é apenas aproximado,
logo não é claro quão útil o mesmo é na determinação de um valor para M’.
Além disso, também é importante enfatizar que a forma dos CPs está diretamente relacionada à quantidade medida no conjunto de dados. A forma final dos CPs é consequência da
pergunta que fazemos frente aos dados disponíveis. Neste contexto, medidas de diferentes
quantidades resultam em CPs com comportamentos diferentes, e exigem que o limite mínimo
exigido de tM 0 seja específico para cada caso.
Este comportamento fica evidente nas figuras (5.3), (5.4) e (5.5), que representam os três
primeiros CPs para medidas de distância de luminosidade, distância de diâmetro angular
e parâmetro de Hubble, respectivamente. Os painéis das figuras (5.4) e (5.5) representam
diferentes estágios de um experimento como o SKA, conforme descrito no capítulo (3). Observando os painéis inferiores dessas figuras, percebemos que CPs obtidos a partir de medidas
do parâmetro de Hubble são significativamente diferentes de zero ao longo de todo o intervalo de desvio para o vermelho, o que não acontece para medidas de distância diâmetro
angular (ou distância de luminosidade). Isto é uma consequência direta da estrutura matemática dessas duas quantidades: como escolhemos concentrar nossa análise no parâmetro
de desaceleração, o cálculo da matriz de Fisher no caso de distâncias diâmetro angular (ou
luminosidade) requer uma integral dupla (equação (B.31)), enquanto a expressão para o pa-
72
râmetro de Hubble necessita de apenas uma integral ao longo dos valores de desvio para o
vermelho (2.15). Logo, dados em baixos valores de desvio para o vermelho serão sempre mais
importantes em um conjunto de medidas de distâncias diâmetro angular ou luminosidade
do que em medidas do parâmetro de Hubble. Essa característica será bastante importante
também na maneira como a variância total é distribuída entre os CPs. Podemos afirmar que
para o tipo de análise desenvolvida neste trabalho, medidas de distâncias diâmetro angular
ou luminosidade são mais aptas a isolar a informação contida nos dados do que medidas do
parâmetro de Hubble. Em outras palavras, um conjunto de dados se mostra mais adequado,
no contexto de ACP, a isolar a informação contida nos mesmos quando um valor menor de
M 0 engloba uma maior percentagem da variância total tM 0 (vide valores de tM 0 apresentados
nas figuras (5.11) e (5.15)).
73
1.0
dados do SDSS
ei
0.5
0.0
1o CP
2o CP
3o CP
-0.5
-1.0
0.2
0.4
0.6
14o CP
15o CP
0.8
z
1.0
1.2
1.4
,
Figura 5.3: Primeiro (vermelho-sólido), segundo (azul-tracejado), terceiro (verdepontilhado), décimo quarto (cian-ponto-tracejado) e décimo quinto (amarelo-pontotracejado-largo) CPs como função do desvio para o vermelho obtidos a partir de dados
de SNIa do SDSS. Nesta figura mostramos a função de interpolação de primeira ordem. Os
dados foram divididos em 15 bins de largura ∆z = 0.1. Os CPs são mostrados de acordo
com a convenção ei (z = 0) > 0.
74
1.0
BAO - d A
estágio 1
ei
0.5
0.0
1o CP
2o CP
3o CP
-0.5
-1.0
0.3
0.4
0.5
0.6
0.7
0.8
0.9
z
1.0
BAO - d A
estágio 2
ei
0.5
0.0
1o CP
2o CP
3o CP
-0.5
-1.0
0.4
0.6
0.8
1.0
1.2
z
1.0
BAO - d A
estágio 3
ei
0.5
0.0
1o CP
2o CP
3o CP
-0.5
-1.0
0.5
1.0
1.5
2.0
z
Figura 5.4: Primeiro (vermelho-sólido), segundo (azul-tracejado) e terceiro (verdepontilhado) CPs como função do desvio para o vermelho obtidos a partir de dados simulados
de distância de diâmetro angular. Em todos os casos, ∆z = 0.1. Painel superior: simulação de um experimento de estágio 1 do SKA, conforme descrito no texto, com 0.2 < z <1.0.
Painel central: simulação de um experimento de estágio 2, com 0.2 < z < 1.4. Painel
inferior: simulação de um experimento de estágio 3, com 0.2 < z < 2.2.
75
1.0
BAO - Hubble
estágio 1
ei
0.5
0.0
-0.5
1o PC
2o PC
3o PC
-1.0
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
z
1.0
BAO - Hubble
estágio 2
ei
0.5
0.0
-0.5
-1.0
1o PC
2o PC
3o PC
0.4
0.6
0.8
1.0
1.2
1.4
z
1.0
BAO - Hubble
estágio 3
ei
0.5
0.0
1o PC
2o PC
3o PC
-0.5
-1.0
0.5
1.0
1.5
2.0
z
Figura 5.5: Análogo à figura (5.4), mas neste caso para simulações de medidas do parâmetro
de Hubble.
76
A fim de lidar com essa diferente distribuição da variância total, definimos dois conjuntos
de limites inferiores para tM 0 (tabelas 5.1 e 5.2), os quais utilizamos para definir o número de
componentes presentes na reconstrução final. No caso de dados reais, o limite para tM 0 foi
definido de maneira a evitar comportamento oscilatório de q(z) (vide figura (5.6)). Apesar de
não impormos nenhuma forma funcional para o parâmetro de desaceleração, consideramos o
mesmo uma função suave do desvio para o vermelho. Quando analisamos resultados baseados
em dados simulados, o limite inferior para tM 0 foi definido de acordo com a concordância
entre a reconstrução e o modelo fiducial. Os estágio mencionados nas tabelas 5.1 e 5.2
correspondem a diferentes estágios de um experimento como foi definido no capítulo (3). O
gradativo aumento no limite definido para tM 0 reflete a melhora no razão entre sinal e ruído
esperada para os diferentes estágios simulados. Conforme a qualidade e quantidade de dados
aumenta, espera-se que possamos incluir uma porcentagem maior da variância total e ainda
assim manter as incertezas na reconstrução final dentro de um limite razoável.
É importante enfatizar que este comportamento varia de acordo com a estrutura de
nosso conjunto de dados. Como apontam Kitching & Amara (2009), diferentes bases de
dados resultarão em CPs diferentes, entretanto os mesmos tendem a um comportamento
assintótico quando a incerteza nos dados diminui e o número de bins e dados aumentam
(compare os painéis inferiores das figuras (5.4) e (5.5)). Neste limite, os CPs serão os
mesmos, independentemente do conjunto de dados utilizados.
77
Tabela 5.1: Valores mínimos de tM 0 exigidos para determinar o número de CPs a serem
utilizados na reconstrução do parâmetro de desaceleração, para dados de distância de luminosidade e distância de diâmetro angular.
Dados
tM 0
SDSS
≥ 90, 0%
Simulação BAO - estágio 1
≥ 95, 0%
≥ 99, 0%
≥ 99, 9%
78
Tabela 5.2: Porcentagem mínima da variância total (tM 0 ) exigido para determinar o número
de componentes utilizados na reconstrução de q com base em medidas do parâmetro de
Hubble.
Dados
tM 0
Simulação - estágio 1
≥ 92.5%
≥ 95.0%
≥ 97.5%
5.3. APLICAÇÕES
5.3
5.3.1
79
Aplicações
Observações de Supernovas Ia
Como um exemplo prático do procedimento descrito na seção anterior, aplicamos ACP
a dados de SNIa do SDSS (Kessler et al., 2009). Conforme afirmamos no capítulo (3), a fim
de evitar ambiguidades em relação aos parâmetros extras presentes no SALT2, utilizamos
apenas valores de distancia módulo provenientes do sistema de padronização de curvas de luz
MLCS2k2. Uma investigação nos moldes daquela apresentada aqui que inclua um tratamento
coerente do parâmetros extras do SALT2 é certamente um assunto que merece atenção,
entretanto está além dos objetivos deste trabalho.
Seguindo as expressões apresentadas no apêndice (B), fomos capazes de calcular a matriz
de Fisher e seus respectivos autovalores e autovetores. Possuímos alguma liberdade de escolha
em se tratando dos valores atribuídos aos parâmetros βi nesta primeira etapa. Como ACP
procura por direções no espaço de parâmetros onde a informação está concentrada, apesar da
matriz de Fisher ser diferente para diferentes conjuntos de valores β̄, a forma global dos CPs
e as relações entre os autovalores são mantidas. É preciso apenas enfatizar que as expressões
apresentadas aqui são válidas quando βi 6= 0, ∀i.
A figura (5.3) mostra os 3 primeiros CPs obtidos a partir de dados do SDSS. De posse
desses CPs e utilizando os limites para tM 0 definidos na tabela 5.1, chegamos a conclusão de
que a reconstrução final corresponde àquela com 2 CPs, e que engloba 94.8% da variância
total. Mostramos na figura (5.6) as reconstruções a partir de 1 CP (painel superior) , 2
CPs (painel central) e 3 CPs (painel inferior). Para fins de comparação, a figura também
mostra o comportamento de q(z) em um universo com matéria e energia escuras, onde
80
wEE = cte = −0.76 (linha tracejada-azul). Esse modelo corresponde ao melhor ajuste
encontrado por Kessler et al. (2009) para este conjunto de dados no contexto do MLCS2k2.
5.3. APLICAÇÕES
81
0.4
t M '=1 =81.5 %
0.2
0.0
q
-0.2
-0.4
-0.6
dados do SDSS
-0.8
1 PC
-1.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
z
0.4
t M '=2 =94.8 %
0.2
0.0
q
-0.2
-0.4
-0.6
dados do SDSS
-0.8
2 PC
-1.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
z
0.4
t M '=3 =98.1 %
0.2
0.0
q
-0.2
-0.4
-0.6
dados do SDSS
-0.8
3 PC
-1.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
z
Figura 5.6: Reconstrução de q(z) a partir de dados de SNIa do SDSS. A linha sólida (preta)
representa o melhor ajuste para a função reconstruída e as linhas pontilhadas (vermelhas)
representam níveis de confiança de 68.3%. A linha tracejada (azul) corresponde ao parâmetro
de desaceleração em um universo plano, que contem matéria e energia escuras, no qual
Ωm = 0.30 e w = cte = −0.76 (melhor ajuste encontrado por Kessler et al. (2009) para
dados tratados de acordo com MLCS2k2 e a linha tracejada horizontal indica q(z) = 0, ∀z.
Painel superior: Reconstrução de q(z) com 1 CP, correspondente a tM 0 =1 = 81.5% da
variância total. Melhor ajuste para o parâmetro da expansão linear é α11CP = −0.38 ± 0.05.
Painel central: Reconstrução feita com 2 CPs, que engloba tM 0 =2 = 94.8% da variância
total e tem como coeficientes da expansão linear α12P C = −0.38 ±0.05 e α22P C = −0.18 ± 0.13.
Painel inferior: Reconstrução com 3 CPs, cuja percentagem da variância total englobada
é tM 0 =3 = 98.1%, α13P C = −0.38 ± 0.05, α23P C = −0.18 ± 0.13 e α33P C = −0.27 ± 0.29.
82
5.3.2
Quando a informação não é suficiente
Neste ponto é importante chamar a atenção para o comportamento em altos valores de
desvio para o vermelho encontrado nas figuras (5.3). Todos os três primeiros componentes
tendem a zero na extremidade do intervalo de z, enquanto os últimos CPs (curvas pontotracejadas) exibem um sinal nesta região. Entretanto, estes são os que possuem maior erro
associado e consequentemente, a forma dos mesmos se resume a um ruído oscilatório cujo
comportamento é dominado pelas grandes incertezas locais. O importante a perceber aqui é
que independentemente dos valores atribuídos aos parâmetros αi , uma combinação linear dos
primeiros CPs sempre tenderá a zero para altos valores de z. Isso é uma reflexão da integral
dupla presente nas expressões para distância de luminosidade, como discutimos anteriormente. Entretanto, nos falta argumentar quais serão as consequências desse comportamento
dos CPs na função reconstruída.
Em alguns estudos presentes na literatura (ver figura (20) de Tang, Abdalla, & Weller
(2008) e referências para estudos de ACP focados em w), qf id na equação (5.19) recebe o
valor de que o mesmo teria em um universo descrito pelo modelo padrão. Desta forma,
os CPs mapeariam apenas desvios deste modelo presente nos dados. Em outras palavras,
dado um determinado valor de z, se a informação presente nos dados é relevante a forma da
função reconstruída é direcionada por tal informação. Entretanto, quando esta informação
não existe ou é de pouca relevância, a reconstrução é direcionada para o valor qf id escolhida
na equação (5.19).
Nós evitamos fazer qualquer hipótese sobre o comportamento do universo em uma determinada faixa de desvio para o vermelho. Sendo assim, ao longo deste trabalho consideraremos
qf id = 0, e consequentemente, podemos garantir que qualquer característica da reconstrução
5.3. APLICAÇÕES
83
com módulo diferente de zero é proveniente dos dados, e não de algum modelo previamente
escolhido.
Por outro lado, esta escolha implica na necessidade de encontrarmos um método de
avaliar até que valor de z a reconstrução pode ser considerada confiável e a partir de qual
valor de z o comportamento é puramente direcionado pela nossa escolha de qf id . Sendo
assim, nossa função reconstruída será considerada verossímil apenas até o valor de z onde o
comportamento assintótico começa a dominar:
• o valor de corte zcut será definido como o valor de desvio para o vermelho onde a
derivada da função reconstruída é nula,
∂qrec
∂z
|zcut = 0, após znull , onde q(znull ) = 0,
dentro de um intervalo de confiança de 68.3%.
Para valores de z > zcut , a reconstrução tende a zero. Entretanto, consideramos que
esse comportamento é uma consequência das escolhas relatadas anteriormente, e não de
uma característica presente nos dados. Com base nesse critério, a figura (5.7) mostra a
reconstrução final do parâmetro de desaceleração baseada em dados do SDSS, construída a
partir da combinação linear dos 2 primeiros CPs apenas até o limite zcut = 0.63.
84
0.4
0.2
t M '=2 =94.8 %
z cut =0.63
q
0.0
-0.2
-0.4
-0.6
dados do SDSS
2 PC
-0.8
-1.0
0.1
0.2
0.3
0.4
0.5
0.6
z
Figura 5.7: Reconstrução final do parâmetro de desaceleração para dados do SDSS. Valores
dos parâmetros α1 e α2 são os mesmos mostrados na figura (5.6). Valor limite de desvio para
o vermelho zcut = 0.63.
5.3. APLICAÇÕES
5.3.3
85
Medidas de dA (z) e H(z) a partir de BAO
Aplicamos o mesmo procedimento a dados simulados de medidas de distância de diâmetro angular e medidas do parâmetro de Hubble, com base nas incertezas previstas por
Abdalla, Blake, & Rawlings (2009) para diferentes estágios de um experimento como o SKA
(vide capítulo (3)).
Para cada estágio, realizamos 1000 simulações, tendo como modelo fiducial ΛCDM com
Ωm = 0.23, Ωk = 0 bins em desvio para o vermelho de tamanho ∆z = 0.2, onde consideramos
as medidas no valor médio de cada bin. Os três primeiros CPs construídos a partir de medidas
do parâmetro de Hubble são mostrados na figura (5.5). A figura (5.8) mostra reconstruções
com 1, 2 e 3 CPs, de cima para baixo respectivamente. De acordo com o critério definido na
tabela 5.1, a reconstrução mais adequada é aquela com 1 CP que corresponde a 97.4% da
variância total. As reconstruções feitas a partir de simulações de um experimento de estágio
2, feitas com 1 a 4 CPs a partir de medidas de distância de diâmetro angular são encontradas
na figura (5.9). Os critérios descritos indicam que a reconstrução final deve ser representada
por aquela feita com 2 CPs, que corresponde a ≈ 99.7% da variância total. No caso de um
experimento de estágio 3, as reconstruções com 1 a 6 CPs são mostradas na figura (5.10). A
reconstrução final corresponde àquela construída a partir de 3 CPs, englobando ≈ 99.9% da
variância total.
As reconstruções finais para experimentos de estágios 1 a 3 feitas a partir de medidas de
distância de diâmetro angular são colocadas lado a lado na figura (5.11).
86
0.4
0.2
t M '=1 =97.4 %
z cut =0.87
0.0
q
-0.2
-0.4
BAO - está gio 1
-0.6
dA
-0.8
1 CP
-1.0
0.3
0.4
0.5
0.6
0.7
0.8
z
0.4
0.2
t M '=2 =99.7 %
z cut =0.89
0.0
q
-0.2
-0.4
BAO - está gio 1
-0.6
dA
-0.8
2 CP
-1.0
0.3
0.4
0.5
0.6
0.7
0.8
z
0.4
0.2
t M '=2 =99.9 %
z cut =0.90
0.0
q
-0.2
-0.4
BAO - stage 1
-0.6
dA
-0.8
3 CP
-1.0
0.3
0.4
0.5
0.6
0.7
0.8
0.9
z
Figura 5.8: Reconstrução de q(z) a partir de medidas de distância de diâmetro angular para
um experimento de estágio 1. A linha preta corresponde ao melhor ajuste para cada caso
e as linhas vermelhas delimitam intervalos de confiança de 68.3%. A linha azul-tracejada
corresponde ao modelo fiducial (ΛCDM com Ωm = 0.23) e a linha horizontal tracejada
corresponde a q(z) = 0, ∀z. Painel superior: reconstrução com 1CP, para o qual α11CP =
−0.63 ± 0.03. Painel central: reconstrução com 2 CPs, com α12CP = −0.62 ± 0.03, α22CP =
0.10 ± 0.18. Painel inferior: reconstrução com 3 CPs, sendo α13CP = −0.62 ± 0.03, α23CP =
0.10 ± 0.18 e α33CP = −0.10 ± 0.57.
5.3. APLICAÇÕES
0.4
0.2
87
0.4
t M '=1 =97.7 %
0.2
z cut =1.30
-0.2
-0.2
z cut =1.27
q
0.0
q
0.0
t M '=2 =99.7 %
-0.4
-0.4
-0.6
BAO - está gio 2 -0.6
dA
-0.8
BAO - está gio 2
dA
-0.8
1 CP
-1.0
2 CP
-1.0
0.4
0.6
0.8
1.0
1.2
0.4
0.6
0.8
z
0.4
0.2
1.0
1.2
z
0.4
t M '=3 =99.9 %
0.2
z cut =0.82
-0.2
-0.2
z cut =0.84
q
0.0
q
0.0
t M '=4 =99.9 %
-0.4
-0.4
-0.6
dA
-0.8
BAO - está gio 2
dA
-0.8
3 CP
-1.0
0.3
0.4
0.5
0.6
z
0.7
4 CP
-1.0
0.8 0.3
0.4
0.5
0.6
0.7
0.8
z
Figura 5.9: Reconstrução de q(z) para medidas de dA para um experimento de estágio
2. O código de cores é o mesmo utilizado na figura (5.8. Painel superior esquerdo:
reconstrução com 1 CP, sendo α11CP = −0.63±0.01. Painel superior direito: reconstrução
com 2 CP, para os quais α12CP = −0.63 ± 0.01 e α22CP = −0.04 ± 0.10. Painel inferior
esquerdo: reconstrução com 3 CP, sendo α11CP = −0.63 ± 0.01, α23CP = −0.04 ± 0.10 e
α33CP = 0.16±0.25. Painel inferior direito: reconstrução com 4 CPs: α14CP = −0.63±0.01,
α24CP = −0.04 ± 0.10, α34CP = 0.16 ± 0.26 e α44CP = −0.02 ± 0.46.
88
0.4
0.2
0.4
t M '=1 =98.7 %
0.2
z cut =2.1
-0.2
-0.2
z cut =1.05
q
0.0
q
0.0
t M '=2 =99.8 %
-0.4
-0.4
-0.6
dA
-0.8
BAO - está gio 3
dA
-0.8
1 CP
-1.0
0.5
1.0
2 CP
-1.0
2.0 0.3
1.5
0.4
0.5
0.6
z
0.4
0.2
0.7
0.8
0.9
1.0
z
0.4
tM'=3=99.9%
0.2
z cut=1.17
-0.2
-0.2
z cut =1.46
q
0.0
q
0.0
t M '=4 =99.9 %
-0.4
-0.4
BAO - está gio 3
-0.6
dA
-0.8
BAO - está gio 3
-0.6
dA
-0.8
4 CP
3 CP
-1.0
-1.0
0.4
0.6
0.8
1.0
0.4
0.6
0.8
z
0.4
0.2
1.0
1.2
1.4
z
0.4
t M '=5 =99.9 %
0.2
z cut =1.41
-0.2
-0.2
z cut =1.3
q
0.0
q
0.0
t M '=6 =99.9 %
-0.4
-0.4
BAO - está gio 3
-0.6
dA
-0.8
BAO - está gio 3
-0.6
dA
-0.8
5 CP
-1.0
0.4
0.6
0.8
1.0
z
1.2
6 CP
-1.0
1.4
0.4
0.6
0.8
1.0
1.2
z
Figura 5.10: Reconstrução de q(z) utilizando medidas de dA para um experimento de estágio
3. O código de cores é o mesmo utilizado nas figuras (5.8) e (5.9). Painel superior
esquerdo: reconstrução com 1CP, tendo α11CP = −0.59 ± 0.01. Painel superior direito:
reconstrução com 2 CPs, sendo α12CP = −0.59 ± 0.01 e α22CP = −0.28 ± 0.05. Painel central
esquerdo: reconstrução com 3 CPs, com α13CP = −0.59 ± 0.01, α23CP = −0.31 ± 0.05
e α33CP = 0.19 ± 0.15. Painel central direito: reconstrução com 4 CPs com valores
α14CP = −0.59 ± 0.01, α24CP = −0.32 ± 0.05, α34CP = 0.28 ± 0.17 e α44CP = −0.28 ± 0.26.
Painel inferior esquerdo: reconstrução com 5 CPs, sendo α15CP = −0.58 ± 0.01, α25CP =
−0.32 ± 0.05, α35CP = 0.28 ± 0.17, α45CP = −0.33 ± 0.27 e α55CP = 0.01 ± 0.23. Painel
inferior direito: reconstrução com 6 CPs, sendo α16CP = −0.58±0.01, α26CP = −0.39±0.05,
α36CP = 0.29 ± 0.18, α46CP = −0.03 ± 0.28, α56CP = 0.10 ± 0.23 e α66CP = −0.06 ± 0.29.
5.3. APLICAÇÕES
0.4
0.2
89
t 1 =97.4 %
z cut=0.87
0.4
t 3 =99.3 %
0.4 t 3 =99.9 %
0.2
z cut=0.88
0.2 z cut=1.08
-0.2
-0.2
-0.2
-0.4
q
0.0
q
0.0
q
0.0
-0.4
-0.4
BAO - stage 1-0.6
-0.6
angular diameter distance
-0.8
BAO - stage 2-0.6
-0.8
1PC
-1.0
0.3
0.4
0.5
0.6
z
0.7
-1.0
0.8
0.3
BAO - stage 3
0.4
0.5
0.6
z
0.7
-0.8
2PC
-1.0
0.8
0.3
3PC
0.4
0.5
0.6
0.7
0.8
0.9
1.0
z
Figura 5.11: Reconstruções finais feitas a partir dados simulados de medidas de distância de
diâmetro angular. Painel esquerdo: dados de um experimento de estágio 3. Reconstrução
feita com 1 CP, que corresponde a ≈ 97.4% da variância total e tem zcut = 0.87. Coeficiente da expansão linear tem valor α1 = −0.63 ± 0.03. Painel central: simulação de um
experimento de estágio 2. Reconstrução final feita a partir de 2 CPs, que engloba ≈ 99.3%
da variância total e tem zcut = 0.88. Expansão linear com coeficientes α1 = −0.63 ± 0.01 e
α2 = −0.04 ± 0.10. Painel inferior: simulação de um experimento de estágio 3. Reconstrução final com 3 CPs, correspondente a ≈ 99.9% da variância total e com zcut = 1.08. Coeficientes da expansão linear dados por α1 = −0.59 ± 0.01, α2 = −0.31 ± 0.05 e α3 = 0.19 ± 0.15.
90
A figura (5.5) mostra os três primeiros CPs obtidos a partir de medidas do parâmetro de
Hubble para experimentos de estágio 1 a 3, de cima para baixo, respectivamente. Na figura
(5.12), mostramos a reconstrução para um experimento de estágio 1, baseada em medidas
do parâmetro de Hubble. Para este caso, a reconstrução final de acordo com os critérios
definidos anteriormente é feita a partir de 2 CPs, que engloba ≈ 95.2% da variância total.
As reconstruções para um experimento de estágio 2 são mostradas na figura (5.13), feitas
a partir de 1 a 4 CPs. Neste caso, a reconstrução final é aquela feita com 3 CPs, que
engloba ≈ 95.6% da variância total. O caso correspondente a um experimento de estágio 3
é mostrado na figura (5.14) para reconstruções com 1 a 6 CPs. Neste caso, a reconstrução
final será aquela com 2 CPs, correspondendo a ≈ 97.5% da variância total. As reconstruções
finais para os 3 estágios são mostradas lado a lado na figura (5.15).
5.3. APLICAÇÕES
91
0.4
0.2
t M '=1 =78.2 %
z cut =0.43
0.0
q
-0.2
-0.4
-0.6
BAO - está gio 2
-0.8
H -1.0
0.30
0.32
0.34
0.36
0.38
1 CP
0.40
0.42
z
0.4
0.2
t M '=2 =95.2 %
z cut =0.78
0.0
q
-0.2
-0.4
BAO - está gio 1
-0.6
H
-0.8
2 CP
-1.0
0.3
0.4
0.5
0.6
0.7
z
0.4
0.2
t M '=3 =98.8 %
z cut =0.63
0.0
q
-0.2
-0.4
BAO - está gio 1
-0.6
H
-0.8
3 CP
-1.0
0.30
0.35
0.40
0.45
0.50
0.55
0.60
z
Figura 5.12: Reconstrução do parâmetro de desaceleração para um experimento de estagio 1,
a partir de medidas do parâmetro de Hubble. O código de cores é o mesmo utilizado na figura
(5.8). Painel superior: reconstrução com 1 CP, parâmetro da expansão linear dado por
α11CP = −0.75±0.04. Painel central: reconstrução com 2 CPs, sendo α12CP = −0.60±0.06 e
α22CP = −0.39±0.13. Painel inferior: reconstrução com 3 CPs, sendo α13CP = −0.55±0.07,
α23CP = −0.30 ± 0.15 e α33CP = −0.28 ± 0.24.
92
0.4
0.2
0.4
t M '=1 =68.1 %
0.2
z cut =0.7
-0.2
-0.2
z cut =0.98
q
0.0
q
0.0
t M '=2 =88.1 %
-0.4
-0.4
BAO - está gio 2
-0.6
H
-0.8
BAO - está gio 2
-0.6
H
-0.8
1 CP
-1.0
0.30
0.35
0.40
0.45
0.50
0.55
0.60
2 CP
-1.0
0.700.3
0.65
0.4
0.5
0.6
z
0.4
0.2
0.7
0.8
0.9
z
t M '=3 =95.6 %
0.4
z cut =0.97
0.2
-0.2
-0.2
z cut =0.43
q
0.0
q
0.0
t M '=4 =98.6 %
-0.4
-0.4
BAO - está gio 2
-0.6
H
-0.8
BAO - está gio 2
-0.6
H
-0.8
3 CP
-1.0
0.3
4 CP
-1.0
0.4
0.5
0.6
0.7
z
0.8
0.9
0.4
0.6
0.8
1.0
z
Figura 5.13: Reconstrução de q(z) para um experimento de estágio 2, utilizando medidas
do parâmetro de Hubble. O código de cores é o mesmo utilizado na figura (5.8). Painel
superior esquerdo: reconstrução com 1 CP, sendo α11CP = −0.73 ± 0.02. Painel superior
direito: reconstrução com 2 CPs, onde α12CP = −0.26 ± 0.05 e α22CP = −0.77 ± 0.07.
Painel inferior esquerdo: reconstrução com 3 CPs, onde α13CP = −0.26 ± 0.05, α23CP =
−0.73 ± 0.10 e α33CP = −0.08 ± 0.15. Painel inferior direito: reconstrução com 4 CPs,
sendo α14CP = −0.20 ± 0.05, α24CP = −0.75 ± 0.11, α34CP = 0.06 ± 0.16 e α44CP = −0.30 ± 0.14.
5.3. APLICAÇÕES
0.4
0.2
93
0.4
t M '=1 =93.3 %
0.2
z cut =1.85
-0.2
-0.2
z cut =1.26
q
0.0
q
0.0
t M '=2 =97.4 %
-0.4
-0.4
-0.6
H
-0.8
BAO - está gio 3
H
-0.8
1 CP
-1.0
0.4
0.6
0.8
1.0
1.2
1.4
2 CP
-1.0
1.8
1.6
0.4
0.6
0.8
z
0.4
0.2
1.0
1.2
z
0.4
t M '=3 =98.7 %
0.2
z cut =1.39
-0.2
-0.2
z cut =1.5
q
0.0
q
0.0
t M '=4 =99.3 %
-0.4
-0.4
-0.6
H
-0.8
BAO - está gio 3
H
-0.8
3 CP
-1.0
4 CP
-1.0
0.4
0.6
0.8
1.0
1.2
0.4
0.6
0.8
1.0
z
0.4
0.2
1.2
1.4
z
0.4
t M '=1 =99.6 %
0.2
z cut =1.61
-0.2
-0.2
z cut =0.96
q
0.0
q
0.0
t M '=6 =99.8 %
-0.4
-0.4
-0.6
H
-0.8
BAO - está gio 3
H
-0.8
5 CP
-1.0
0.4
0.6
0.8
1.0
z
1.2
1.4
6 CP
-1.0
1.6
0.3
0.4
0.5
0.6
0.7
0.8
0.9
z
Figura 5.14: Reconstrução de q(z) para um experimento de estágio 3, utilizando medidas
do parâmetro de Hubble. O código de cores é o mesmo utilizado na figura (5.8). Painel
superior esquerdo: reconstrução com 1 CP, onde α11CP = −0.41 ± 0.01. Painel superior
direito: reconstrução com 2 CPs, sendo α12CP = −0.41±0.01 e α22CP = −0.62±0.04. Painel
central esquerdo: reconstrução com 3 CPs e α13CP = −0.41 ± 0.01, α23CP = −0.62 ± 0.04
e α33CP = 0.24 ± 0.07. Painel central direito: reconstrução com 4 CPs, onde α14CP =
−0.42±0.01, α24CP = −0.62±0.04, α34CP = 0.25±0.07 e α44CP = −0.20±0.08. Painel inferior
esquerdo: reconstrução com 5CPs, onde α15CP = −0.41 ± 0.01, α25CP = −0.64 ± 0.04,
α35CP = 0.23 ± 0.07, α45CP = −0.22 ± 0.08 e α55CP = 0.18 ± 0.12. Painel inferior direito:
reconstrução com 6 CPs, sendo α16CP = −0.40±0.01, α26CP = −0.67±0.04, α36CP = 0.17±0.07,
α46CP = −0.64 ± 0.15, α56CP = 0.42 ± 0.14 e α66CP = −0.41 ± 0.12.
94
0.4
0.2
t 2 =95.2 %
z cut =0.78
0.4
t 3 =95.6 %
0.4
0.2
z cut =0.97
0.2
-0.2
-0.2
-0.2
-0.4
-0.4
Hubble parameter
-0.8
2PC
-1.0
0.6
0.7
0.3
-0.8
-1.0
0.3
-0.4
BAO - stage -0.6
1
-0.6
0.4
0.5
z
z cut =1.27
q
0.0
q
0.0
q
0.0
t 2 =97.5 %
BAO - stage -0.6
2
BAO - stage 3
Hubble parameter
0.4
0.5
0.6
0.7
z
0.8
-0.8
3PC
-1.0
0.9
Hubble parameter
2PC
0.4
0.6
0.8
1.0
1.2
z
Figura 5.15: Reconstruções finais para o parâmetro de desaceleração, para medidas de H(z).
O código de cores é o mesmo utilizado na figura (5.8). Painel esquerdo: reconstrução
final para um experimento de estágio 1, feita com 2 CP, o que corresponde a ≈ 95.2% da
variância total e tem desvio para o vermelho máximo zcut = 0.78. Melhores ajustes para os
coeficientes da expansão linear dados por α1 = −0.60 ± 0.06 e α2 = −0.39 ± 0.13. Painel
central: reconstrução final para um experimento de estágio 2, feita com 3 CP, que engloba
≈ 95.6% da variância total e tem zcut = 0.97, α1 = −0.26 ± 0.05, α2 = −0.73 ± 0.10 e
α3 = −0.08 ± 0.15. Painel direito: reconstrução final para um experimento de estágio 3, a
partir de 2 CP englobando ≈ 97.5% da variância total e tendo zcut = 1.27, α1 = −0.41 ± 0.01
e α2 = −0.62 ± 0.04.
Capítulo 6
Discussões e Conclusões
Neste trabalho, nosso principal objetivo foi encontrar informações sobre a história da
evolução dinâmica do universo fazendo uso do menor número possível de hipóteses. Para
tanto, focamos nossa análise no parâmetro de desaceleração, o que nos permitiu utilizar
medidas de distâncias sem fazer hipóteses restritivas a cerca do modelo cosmológico ou
teoria métrica de gravitação.
Primeiramente, propusemos uma parametrização formada por 4 parâmetros (qi , qf , zt , τ )
com significados físicos bastante claros. O ponto importante a ser destacado é a versatilidade
presente nesta parametrização, que pode ser interpretada como sua habilidade em reproduzir modelos presentes na literatura para valores específicos de seus parâmetros. Além, é
claro, das vantagens embutidas na escolha da análise do parâmetro de desaceleração citadas
anteriormente.
Considerando que houve uma fase de desaceleração dominada pela matéria e que atualmente a expansão é guiada por algo que se parece muito a CC, fixamos qi = 0.5. Aplicamos
então nossa parametrização a dados de SNIa, BAO e medidas da distância à superfície de
último espalhamento. Nossos resultados indicam que, utilizando apenas dados de SNIa, o valor do desvio para o vermelho na transição entre desaceleração/aceleração pode ser bastante
grande (zt > 10). Mostramos também que a combinação Sk /Dv + SNIa formam um par de
observáveis ideal a ser usado no espaço de fase zt × τ , uma vez que os mesmos produzem
contornos de confiança quase ortogonais entre si nesse espaço.
95
96
CAPÍTULO 6. DISCUSSÕES E CONCLUSÕES
Ao aplicarmos esta formulação a diferentes conjuntos de dados, confirmamos a tensão
existente entre os dados do Gold182 e SNLS de uma maneira bem geral. Apresentamos
também uma simulação considerando avanços futuros nas medidas de BAO e SNIa que
mostram o potencial restritivo dos dados frente à nossa parametrização.
Em uma tentativa de determinar o valor atual do parâmetro de desaceleração, apresentamos também níveis de confiança no espaço de parâmetros zt × τ × qf para dados atuais
de Sk /Dv + SNIa. Desta análise, podemos apenas dizer que o parâmetro de desaceleração
atualmente possui um valor negativo, mas os intervalos de confiança ainda são muito largos
para que algo mais possa ser dito. Uma análise mais detalhada do comportamento desta
parametrização para qf 6= −1 ainda se faz necessária. Neste momento, nossa parametrização
não é capaz de reproduzir modelos que atualmente apresentem desaceleração mas que no
futuro voltarão a acelerar (Frieman et al., 1995; Carvalho et al., 2006). Seria interessante
investigar até que ponto nossa parametrização é capaz de reproduzir esse tipo de modelo
para z > 0. O caso mais geral, onde qf 6= −1 também pode ser alvo de investigações futuras. Uma versão mais detalhada e atualizada desse tipo de análise está em desenvolvimento
atualmente por Giostri et al. (2010).
Em um segundo momento, procuramos uma maneira de analisar q(z) sem a necessidade
de determinar previamente uma dependência com o valor do desvio para o vermelho. Para
tanto, utilizamos ACP. Este procedimento é bastante utilizado em cosmologia a fim de obter
contornos de confiança em um determinado espaço de parâmetros. Na análise apresentada
nesta tese, chamamos a atenção para um outro aspecto da ACP: a capacidade de proporcionar
um espaço de parâmetros de dimensão pequena onde os erros são descorrelacionados e no
qual podemos reescrever quantidades cosmológicas.
Escolhemos novamente analisar o parâmetro de desaceleração, e neste caso, descobrimos
que os cálculos necessários à obtenção da matriz de Fisher podem ser resolvidos analiticamente. Além disso, como não estamos fazendo nenhum tipo de hipótese sobre o conteúdo
material do universo, evitamos problemas relacionados a parâmetros cosmológicos não relacionados a q, como discutido em Kitching & Amara (2009).
97
Foi necessário também escolher uma base na qual deveríamos expandir q(z). A única
restrição imposta a um potencial conjunto de funções é que o mesmo forme um conjunto
completo ortogonal (Kitching & Amara, 2009). Novamente, nossa decisão foi feita de forma
a preservar a generalidade. Decidimos expandir q(z) em uma soma de funções degrau, de
forma que a resolução de nossos resultados é determinada unicamente pela nossa capacidade de computação, uma vez que qualquer função pode ser exatamente determinada para
um número infinito de bins. É importante enfatizar que essa escolha também tem suas
consequências. Diferentes funções de base iniciais levam a diferentes formas para os CPs,
entretanto, para um número suficientemente grande de bins os CPs tendem ao mesmo comportamento.
O fato dos CPs e variâncias associadas serem diferentes para diferentes conjuntos de base
iniciais é bastante importante no uso da matriz de Fisher para a determinação de curvas de
confiança, mas não é tão grave para o caso apresentado aqui. No nosso caso, os CPs são uma
base para a expansão linear e a forma final de q(z) será determinada pelos parâmetros αi .
O mesmo tipo de comportamento é observado no caso onde a base inicial é a mesma, mas
utilizamos observáveis diferentes. Podemos visualizar tal efeito nos resultados apresentados
no capítulo (5). Sabemos que neste caso existem diferenças entre o comportamento dos componentes ao longo do intervalo de desvio para o vermelho para diferentes observáveis (figura
(5.4) e (5.5)), o que também se reflete na distribuição da percentagem da variância total
entre os CPs (tabelas (5.1) e (5.2)). Apesar disso, diferentes CPs resultarão em diferentes
valores αi , mas a forma de q(z) será sempre guiada pelo comportamento dos dados (compare
os painéis direitos das figuras (5.11) e (5.15)).
Realizamos a reconstrução de q(z) a partir de dados do SDSS. Como era esperado, este
procedimento demanda incertezas muito baixas e os dados atuais não são capazes de proporcionar resultados conclusivos. Entretanto, simulações de BAO para um experimento como o
SKA mostram que, no futuro, resultados bastante interessantes podem ser obtidos a partir
deste procedimento.
O ponto crucial aqui é a redução da dimensionalidade do espaço de parâmetros. Por
98
CAPÍTULO 6. DISCUSSÕES E CONCLUSÕES
exemplo, para um experimento de estágio 3, tínhamos inicialmente 10 valores de βi correspondentes a bins de ∆z = 0.2 em um intervalo de desvio para o vermelho de 0.2 < z < 2.2.
Vemos na figura (5.11), painel direito, a reconstrução feita com 3 CPs em excelente acordo
com o modelo fiducial, para 0.2 < z < 1.1.
Nossa escolha da quantidade de CPs a serem usados nas reconstruções e o valor de zcut
escolhido em cada caso reduziram o intervalo de desvio para o vermelho na reconstrução
a aproximadamente metade do intervalo inicial coberto pelos dados. Por outro lado, a
reconstrução obtida nesse intervalo de desvio para o vermelho é muito melhor do que aquela
que seria obtida a partir da soma de funções degrau em bins de ∆z = 0.2, como tínhamos
inicialmente.
Vale lembrar que todos os resultados apresentados nesta tese, em se tratando de ACP,
foram obtidos analítica e numericamente. Até o momento, nós não encontramos na literatura
referências a esse tipo de derivação analítica aplicada à cosmologia. Acreditamos que essa é
uma maneira eficaz de obter informações sobre a evolução dinâmica do universo de maneira
independente de modelo e praticamente livre de erros numéricos.
Apêndice A
Desvio para o Vermelho
Existem várias maneiras de medir distâncias em escalas cosmológicas. Em todos os
métodos nossa única fonte de informação é a radiação emitida pela fonte da qual deseja-se
saber a distância.
Cada fonte (uma estrela, por exemplo) emite radiação em frequências características,
determinadas pelos elementos químicos responsáveis pela radiação emitida. Quando existe
movimento relativo entre a fonte e o observador, dois picos de onda que saíram da fonte
em um intervalo ∆t chegarão ao observador em um intervalo de tempo menor ou maior,
dependendo se a fonte se aproxima ou se afasta de quem a observa. Matematicamente, esta
diferença no período entre os picos pode ser representada em termos do comprimento de onda
emitido, λe , e aquele medido pelo observador, λ0 . De acordo com a Relatividade Restrita,
esta razão é dada por:
λ0
1 + vr
1 + v senθ cos φ
√
=√
=
,
2
λe
1−v
1 − v2
(A.1)
onde vr é a velocidade na direção radial e a segunda igualdade é válida para um observador na
origem de um sistema de coordenadas esférico. Esse efeito é conhecido como Efeito Doppler
e o desvio espectral, z, da radiação emitida, definido como:
z=
λ0 − λe
λe
ou
99
1+z =
λ0
.
λe
(A.2)
100
APÊNDICE A. DESVIO PARA O VERMELHO
Em um universo em expansão, quando o movimento entre a fonte e o observador se deve
à expansão cósmica, o efeito é designado efeito Doppler Cosmológico e a relação entre o
desvio para o vermelho e o fator de escala pode ser encontrada a partir da equação (2.1).
Considere um observador na origem do sistema de coordenadas e uma onda eletromagnética viajando na direção radial. Lembrando que a luz segue geodésicas nulas, temos:
0 = dt2 − a2 (t) √
dr2
.
1 − kr2
(A.3)
Um sinal luminoso deixa a fonte em (re ,θe ,φe ) no instante te e chega ao observador na
origem em t0 . Sendo assim,
Z
t0
te
dt
=
a(t)
Z
0
√
re
dr
.
1 − kr2
(A.4)
Note que o lado direito da expressão anterior é independente do tempo. Da mesma forma,
se um outro sinal sai da fonte em te + δte , será observado na origem em t0 + δt0 . Consequentemente,
Z
Z
t0
te +δte
dt
+
a(t)
t0 +δt0
te +δte
Z t0 +δt0
t0
Z t0 +δt0
t0
dt
=
a(t)
dt
=
a(t)
dt
=
a(t)
Z
t0
dt
,
a(t)
te
Z te +δte
te
Z te +δte
te
dt
+
a(t)
(A.5)
Z
t0
te +δte
dt
,
a(t)
(A.6)
dt
.
a(t)
(A.7)
νe
a0
= .
ν0
ae
(A.8)
Como t0 − te = δt ¿ 1, podemos escrever:
δte
δt0
=
a(t0 )
a(te )
⇒
De acordo com a definição apresentada na equação (A.2), podemos concluir:
1+z =
νe
a0
λ0
=
= .
λe
ν0
ae
(A.9)
Apêndice B
Cálculo da Matriz de Fisher...
Os resultados apresentados no corpo desta tese foram obtidos com base nos cálculos
analíticos apresentados a seguir.
Para calcular a matrix de Fisher, primeiramente consideramos uma função densidade de
probabilidade (PDF) Gaussiana para cada evento,
f (x; σdados ; x̄(θ̄)) =
1
√
σdados
¸
·
(x − x̄(θ̄))2
,
exp −
2
2σdados
2π
(B.1)
onde θ̄ é o vetor cujos componentes são os parâmetros do modelo em questão e σdados representa o erro associado a cada observação. Seja N o número de observações independentes
presentes em nosso conjunto de dados, neste caso, a função de verossimilhança será dada
por:
L(θ̄) =
N
Y
£
¤
f (xi , σdadosi ; θ̄) ,
(B.2)
i=1
e a matriz de Fisher é definida como
¿ 2
À
∂ ln L(θ̄)
Fkl = −
,
∂θk ∂θl
(B.3)
onde <> representa o valor esperado.
Considerando uma variável x, cuja função densidade de probabilidade é dada por P rob(x),
101
102
APÊNDICE B. CÁLCULO DA MATRIZ DE FISHER...
o valor esperado será
Z
hxi =
xP rob(x)dx,
(B.4)
Ω
onde Ω representa todo o domínio da variável x. É importante lembrar que, por definição,
Z
P rob(x)dx = 1.
(B.5)
Ω
B.1
... a partir da Distância de Luminosidade
Mostraremos abaixo alguns passos já apresentados no capítulo 5 a fim de facilitar o
acompanhamento dos cálculos posteriores.
Como foi discutido no capítulo 3, as duas quantidades resultantes da observação de supernovas quando utilizamos MLCS2k2, são o módulo de distância, µ, e o desvio para o
vermelho (z). Ambos podem ser relacionados à cosmologia através da distância de luminosidade (equação (2.24)),
módulo de distância:
µ(z) = m − Mabs = 5 log10 [DL (z)] + µ0 ,
onde:
distância de luminosidade:
parâmetro de desaceleração:
µ0 = 42.38 + 5 log(h),
DL
dL (z) =
= (1 + z)
H0
q(z) = (1 + z)
Z
z
0
H 0 (z)
− 1,
H(z)
·Z
parâmetro de Hubble:
(B.6)
z
H(z) = H0 exp
du
,
H(u)
(B.7)
(B.8)
¸
(q(v) + 1)d ln (1 + v) , (B.9)
0
onde Mabs representa a magnitude absoluta de uma SNIa, a linha na equação (B.8) representa
B.1. ... A PARTIR DA DISTÂNCIA DE LUMINOSIDADE
103
a derivada em relação ao desvio para o vermelho, H0 = 100 h km/s/Mpc é o valor atual do
parâmetro de Hubble e DL (z) é a distância de luminosidade em unidades de H0 .
Agrupando as equações (B.6) à (B.9), temos a expressão para a módulo de distância em
função do parâmetro de desaceleração,
·
Z
µ(z) = 5 log (1 + z)
z
· Z u
¸ ¸
exp −
[q(v) + 1]d ln (1 + v) du .
0
(B.10)
0
De acordo com o método proposto por Shapiro & Turner (2006), dividimos o intervalo
de desvio para o vermelho em M bins de tamanho ∆z, e consideramos o parâmetro de
desaceleração como uma expansão linear de funções degrau. Matematicamente,
q(z, β̄) =
M
X
βi ci (z),
(B.11)
i=1
onde βi são constantes e
ci (z) =


 1
se

 0
caso contrário
(i − 1)∆z < z < i∆z
.
Agora, podemos utilizar a equação (B.11) na equação (B.10) e obter uma expressão para
a distância de luminosidade, e consequentemente para módulo de distância, a partir do valor
atribuído ao parâmetro de desaceleração em cada bin.
Na análise que segue, {βi } será o conjunto de parâmetros do nosso modelo. Nosso objetivo
é encontrar o valor de cada β em seu respectivo bin de modo que a concordância com os
dados seja a melhor possível. Logo, precisamos encontrar uma expressão para função de
verossimilhança, e consequentemente da matriz de Fisher, tendo x̄i (θ) → µ(zi ; β̄) e xi → mi ,
LSN (θ̄) =
N
Y
i=1
"
"
(mi − µ(zi ; β̄))2
√
exp
−
¡ SN ¢2
SN
σdados
2π
2
σdadosi
i
1
##
,
(B.12)
SN
onde β̄ é o vetor cujos componentes são os parâmetros βi e σdados
são as incertezas de cada
i
observação, obtidas a partir dos dados. Nosso primeiro passo será marginalizar a equação
104
(B.12) para todos os valores possíveis de µ0 (Goliath et al., 2001). Para tanto, considere
¡
¢
yi = 5 log DL (zi ; β̄) , com isso podemos expandir a função de verossimilhança de forma que
#
2
(m
−
y
−
µ
)
i
i
0
√
LSN (M, β̄) =
exp −
¡ SN ¢2
SN
σdadosj 2π i=1
2 σdadosi
j=1
"
"
#
#
N
N
Y
X
1
(mi − yi )2 − 2µ0 (mi − yi ) + µ20
√
=
exp −
¡ SN ¢2
SN
σdados
2π
2 σdados
j=1
i=1
j
i
"
#
"
#
N
N
2
Y
X
1
1
(mi − yi )
√
=
exp
−
¡ SN ¢2 ×
SN
2
σ
2π
σdadosi
dados
j=1
i=1
j
"
#
N
N
X
1
(mi − yi ) µ20 X
× exp µ0
¡ SN ¢2 −
¡ SN ¢2 .
2 i=1 σdados
i=1 σdados
N
Y
"
1
#
"
N
Y
i
i
Para facilitar a notação, considere
N
X
(mi − yi )2
A ≡
¡ SN ¢2 ,
σdadosi
i=1
(B.13)
N
X
(mi − yi )
B ≡
¡ SN ¢2 ,
i=1 σdadosi
(B.14)
C ≡
N
Y
i=1
¡
1
SN
σdados
i
¢2 ,
(B.15)
Dessa forma, a função de verossimilhança se torna
SN
L
µ
¶
µ
¶
C
A
Cµ20
(β̄, µ0 ) = √ exp −
exp Bµ0 −
.
2
2
2π
(B.16)
Por definição, C ∈ <+ , o que nos permite realizar facilmente a marginalização sobre o
parâmetro µ0 ,
Z
+∞
−∞
r
µ 2¶
¸
Cµ20
π
B
exp Bµ0 −
exp
dµ0 =
.
2
2C
2C
·
(B.17)
Logo, a função de verossimilhança marginalizada será dada por
Z
SN
L
∞
√
C
exp
(β̄) =
L(β̄, µ0 )dµ0 =
2
−∞
µ
B2
2C
¶
µ
A
exp −
2
¶
.
(B.18)
105
Utilizamos então a equação (B.18) na expressão (B.3) para obter expressões analíticas
para os componentes da matriz de Fisher. Para tanto, é necessário derivar o logaritmo da
equação (B.18) em relação aos parâmetros βi ,
£
SN
ln L
¤
(β̄) = ln
Ã√ !
C
B2 A
+
−
2
2C
2
(B.19)
£
¤
∂ ln LSN (β̄)
B ∂B 1 ∂A
=
−
∂βl
C ∂βl 2 ∂βl
£
¤
∂ 2 ln LSN (β̄)
1 ∂B ∂B B ∂ 2 B
1 ∂ 2A
=
+
−
.
∂βk ∂βl
C ∂βk ∂βl C ∂βk ∂βl 2 ∂βk ∂βl
(B.20)
(B.21)
A partir das definições (B.13 e B.14), temos,
N
X (mi − yi ) ∂yi
∂A
= −
2¡
¢2
SN
∂βl
∂βl
σdados
i=1
i
(
)
N
X
∂ 2A
∂yi ∂yi
2
(mi − yi ) ∂ 2 yi
=
− 2¡
¡ SN ¢2
¢2
SN
∂βk ∂βl
∂βk ∂βl
σdados ∂βk ∂βl
σdados
i=1
i
∂B
= −
∂βl
N
X
i=1
(B.23)
i
1
∂yi
¡ SN ¢2
σdadosi ∂βl
(B.24)
N
X
1
∂ B
∂ 2 yi
= −
,
¡ SN ¢2
∂βk ∂βl
∂β
∂β
k
l
σ
i=1
dados
2
(B.22)
(B.25)
i
consequentemente,
∂ 2 LSN (β̄)
1
=
∂βk ∂βl
C
N
X
Ã
!


N
X
∂yi
1
1
∂yj 

³
+
¡ SN ¢2
´2
∂β
∂β
k
k
SN
σ
i=1
j=1
dadosi
σdadosj
#
"
N
N
1 X (mi − yi ) X
1
∂ 2 yj
−
+
¡ SN ¢2
³
´2
C i=1 σdados
∂β
∂β
k
l
SN
j=1 σdados
i
j
−
N
X
i=1
¡
1
SN
σdados
i
N
∂yi ∂yi X (mi − yi ) ∂ 2 yi
+
.
¢2
¡ SN ¢2
∂βk ∂βl
∂β
∂β
k
l
σ
i=1
dados
(B.26)
i
A aplicação do valor esperado na expressão acima nos permite escrever os elementos da
106
matriz de Fisher como
*
FklSN =
=
£
¤+
∂ 2 ln L(β̄)
−
∂βk ∂βl
1
C
N
X
Ã
¡
i=1
−
1
SN
σdados
i
N
X
i=1
¡
¢2
1
SN
σdados
i
∂yi
∂βk
¢2
!

N
X

³
j=1

1
SN
σdados
j
´2
∂yj 
+
∂βk
∂yi ∂yi
.
∂βk ∂βl
(B.27)
Sendo assim, concluímos que para obtermos uma expressão analítica para a matriz de
Fisher, é preciso saber calcular analiticamente a derivada da módulo de distância em relação
aos parâmetros βi .
Lembrando que
∂ loga x
1
=
,
∂x
x ln a
(B.28)
∂yi
5
∂DL (zi ; β̄)
=
.
∂βl
∂βl
DL (zi ; β̄) ln(10)
(B.29)
temos
Utilizamos então a equação (B.29) na equação (B.27), obtemos
FklSN
#
¸ N "
1
∂DL (zi ; β̄) X
1
1
∂DL (zj ; β̄)
+
2
∂βk
σdados
∂βl
DL (zi ; β̄)
DL (zj ; β̄)
j
i=1
j=1
)
N
X
1
∂DL (zk ; β̄) ∂DL (zk ; β̄)
1
−
.
(B.30)
2
2
σ
∂β
∂β
D
(z
;
β̄)
k
l
k
dados
L
k
k=1
25
=
ln(10)2
(
N ·
X
Nosso próximo passo é calcular a derivada da distância de luminosidade em relação aos
parâmetros βi . Para facilitar a notação, dividimos a equação (B.7) em duas integrais:
DL (z; β̄)
=
onde
I1 (u, β̄)
(1 + z)I2 (I1 (u, β̄)),
Z
I2 (z, I1 (u; β̄))
u
=
Z
(B.31)
0
=
0
[1 + q(v, β̄)]d ln (1 + v),
(B.32)
exp [−I1 (u)]du, .
(B.33)
z
107
Começamos por introduzir a equação (B.11) na expressão para I1 (u, β̄),
Z
u
I1 (u, β̄) =
[1 + q(v, β̄)]d ln (1 + v),
!
Z uÃ
M
X
=
1+
βi ci (v) d ln (1 + v),
(B.34)
0
0
Z
i=1
u
=
d ln (1 + v) +
0
M
X
Z
= ln (1 + u) +
M
X
βi
i=1
u
βi
ci (v)d ln (1 + v),
(B.36)
0
i=1



0


Z


(B.35)
if
u < (i − 1)∆z
ui
d ln (1 + v) if
ui−1

Z

u




d ln (1 + v) if
u > i∆z
(B.37)
.
(i − 1)∆z < u < i∆z
ui−1
Podemos simplificar a expressão anterior, considerando algumas definições:
• J → número de bins inteiros entre 0 e o valor de desvio para o vermelho da i-ésima
supernova;
• u0 = 0 (z0 = 0);
• βJ é o parâmetro correspondente ao bin imediatamente anterior àquele onde se encontra
a supernova em questão 1 ;
• ui (zi ) corresponde ao limite superior do i-ésimo bin.
Com isto, podemos escrever:
I1 (u, β̄) = ln(1 + u) +
J
X
µ
βi ln
i=1
1 + ui
1 + ui−1
µ
¶
+ βJ+1 ln
¶
1+u
.
1 + uJ
(B.38)
Logo, a expressão para I2 a partir da equação (B.38) é dada por

Z
z
I2 (z, β̄) =
0
1


(1 + u)
u
J=int( ∆z
)µ
Y
i=1

¶−βi µ
¶−βJ+1
1 + ui
 1+u
du.

1 + ui−1
1 + uJ
(B.39)
1
Por exemplo: se ∆z = 0.1 e zi = 0.34 → J = 3 e zi se encontra no quarto bin, cujo parâmetro
correspondente é β4 .
108
Como o limite do produtório depende da variável de integração, dividimos a integral em
uma soma de J + 1 integrais, de modo que dentro de cada intervalo de integração o índice
do somatório permaneça constante2 , ou seja,
I2 (z, β̄) =
(Z
J
X
k=1
"k−1 µ
#
)
Y 1 + ui ¶−βi µ 1 + u ¶−βk
1
du +
1 + ui−1
1 + uk−1
zk−1 (1 + u) i=1
#
" J µ
Z z
Y 1 + ui ¶−βi µ 1 + u ¶−βJ+1
1
+
du.
1 + ui−1
1 + uJ
zJ (1 + u) i=1
zk
(B.40)
Dado que o produtório da expressão acima não depende da variável de integração, podemos
escrever
("k−1 µ
#
)
¶−βk Z zk
Y 1 + zi ¶−βi µ
1
−βk −1
I2 (z, β̄) =
(1 + u)
du +
1 + zi−1
1 + zk−1
zk−1
i=1
k=1
#
" J µ
Y 1 + zi ¶−βi µ 1 ¶−βJ+1 Z z
(1 + u)−βJ+1 −1 du.,
+
1
+
z
1
+
z
i−1
J
zJ
i=1
J
X
(B.41)
e consequentemente, a distância de luminosidade será dada por
( J ""k−1 µ
#
#
¶−βk Z zk
X Y 1 + zi ¶−βi µ
1
DL (z, β̄) = (1 + z)
(1 + u)−βk −1 du +
1
+
z
1
+
z
i−1
k−1
zk−1
i=1
k=1
)
¶
¶
µ
µ
Z
J
−βi
−βL+1
z
Y
1 + zi
1
(1 + u)−βJ+1 −1 du .
(B.42)
+
1
+
z
1
+
z
i−1
J
z
J
i=1
Supondo que estamos trabalhando em um caso particular, onde todos os coeficientes β
são diferentes de zero (βi 6= 0, ∀i), podemos efetuar a integral obtendo
#
"
""k−1 µ
µ
¶−βk # #
Y 1 + zi ¶−βi µ 1 ¶
1 + zk
1−
+
DL (z, β̄) = (1 + z)
1
+
z
β
1
+
z
i−1
k
k−1
i=1
k=1
" J µ
#
"
µ
¶−βJ+1 #)
Y 1 + zi ¶−βi µ 1 ¶
1+z
+
1−
.
(B.43)
1 + zi−1
βJ+1
1 + zJ
i=1
(
2
J
X
Lembramos que, por definição,
P0
i=1
i = 0 e, da mesma forma,
Q0
i=1
i = 1.
109
Dividimos então a equação (B.43) de forma que
DL (z; β̄)
=
sendo
f1
=
f2
=
(1 + z) [f1 + f2 ] ,
(B.44)
("k−1 µ
#
"
µ
¶−βk #)
Y 1 + zi ¶−βi µ 1 ¶
1 + zk
1−
, (B.45)
1 + zi−1
βk
1 + zk−1
i=1
k=1
#
"
" J µ
µ
¶−βJ+1 #
Y 1 + zi ¶−βi µ 1 ¶
1+z
1−
.
(B.46)
1
+
z
β
1
+
z
i−1
J+1
J
i=1
J
X
Sendo assim, podemos efetuar a derivada dos dois termos separadamente.3 É importante
chamar a atenção para os limites do somatório em f1 e f2 . Repare que, quando derivamos
em relação a um determinado parâmetro βl , o produtório produzirá um resultado não nulo
apenas quando k > l, pois caso contrário o termo dependente de βl . Para representar
matematicamente essa característica, definimos
Θ(x) =


 1, se x ≥ 0

 0, se x < 0
.
Podemos então escrever
J
X
∂f1
=
∂βl
k=1
("k−1 µ
#
Y 1 + zi ¶−βi
×
1 + zi−1
i=1
( µ ¶ "µ
Ã
µ
¶−βk µ
¶
¶−βk !#
1
1 + zk
1 + zk
1
1 + zk
× δkl
ln
−
1−
+
βk
1 + zk−1
1 + zk−1
βk
1 + zk−1
" µ
¶µ ¶"
µ
¶−βk ##))
1
1 + zk
1 + zl
1−
,
−Θ(k − 1 − l) ln
1 + zl−1
βk
1 + zk−1
(B.47)
onde δ representa a função delta de Kronecker4 . Da mesma forma, a derivada de f2 será
x
x
Lembre-se que ∂a
∂x = a ln a e, analogamente,
4
δkl = 0 se k 6= l e δkl = 1 caso contrário.
3
∂a−x
∂x
= −a−x ln a.
110
dada por
¶−βi
J µ
Y
∂f2
1 + zi
=
×
∂βl
1 + zi−1
i=1
(
"µ
"
¶−βJ+1 µ
¶
µ
¶−βJ+1 ##
δ(J)l
1
1+z
1+z
1+z
×
ln
−
1−
+
βJ+1
1 + zJ
1 + zJ
βJ+1
1 + zJ
"
µ
¶"
µ
¶−βJ+1 ##)
1 + zl
1+z
Θ(J − l)
ln
1−
.
(B.48)
−
βJ+1
1 + zl−1
1 + zJ
Dessa forma, podemos utilizar as equações (B.47 e B.48) para compor a expressão analítica para a derivada da distância de luminosidade,
·
¸
∂DL (z, β̄)
∂f1 (z; β̄) ∂f2 (z; β̄)
= (1 + z)
+
,
∂βl
∂βl
∂βl
(B.49)
e utilizar esta última na equção (B.30). Assim obtemos uma expressão analítica para o
cálculo dos elementos da matriz de Fisher.
B.2
... a partir da Distância de Diâmetro Angular
Novamente, consideramos funções densidade de probabilidade gaussianas para cada observação. Somando a isso que cada ponto observacional deve ser independente dos demais,
temos que a função de verossimilhança terá a forma dada pela equação (5.2). Mais especificamente,

LDA (H0 ; β̄) =
N 

Y
 ³
 dAi −
exp
−
´
³
´2
2
√
dA
dA
i=1  2π σdados
2
σ
dadosi
i
³
1
´2 



 ,


1
D (z ; β̄)
H0 A i
(B.50)
onde DA (z; β̄) é a distância de diâmetro angular em unidades de H0−1 e N o número de dados
disponíveis.
Neste caso, a dependência com H0 não nos permite realizar a marginalização sobre H0
como fizemos com µ0 na seção anterior. Sendo assim, utilizaremos o mesmo procedimento
B.2. ... A PARTIR DA DISTÂNCIA DE DIÂMETRO ANGULAR
111
adotado por Albrecht et al. (2009), onde á matriz de Fisher é construída a partir de todos os
S
parâmetros (q r), onde q corresponde ao conjunto de parâmetros de interesse e r representa
os parâmetros sob os quais desejamos realizar a marginalização. Neste contexto, a matriz de
DA
Fisher marginalizada (Fmarg
) será dada por
¡
¢−1 H0 β
DA
Fmarg
= F ββ − F βH0 F H0 H0
F
,
(B.51)
onde F ββ , F βH0 e F H0 H0 são submatrized da matriz de Fisher. No caso específico que estamos
analisando, tais termos são dados por
Fklββ
βH0
Fk1
=
rq
F1k
H0 H0
F11
¿ 2
À
N
∂ ln LDA (H0 ; β̄)
1 X
=
−
= 2
³
∂βk ∂βl
H0 i=1
1
dA
σdados
i
´2
∂DA (zi ; β̄) ∂DA (zi ; β̄)
(B.52)
,
∂βk
∂βl
¿ 2
À
N
∂ ln LDA (zi ; β̄)
1 X DA (H0 ; β̄) ∂DA (zi ; β̄)
=
−
,
= 3
³
´2
∂βk ∂H0
H0 i=1
∂βk
dA
σdadosi
#2
"
¿ 2
À
N
∂ ln LDA (H0 ; β̄)
1 X DA (zi ; β̄)
.
=
−
= 4
dA
∂H02
H0 i=1
σdados
i
(B.53)
(B.54)
Logo, utilizando a relação entre a distância de luminosidade e distância diâmetro angular
DA
(dL (z) = (1 + z)2 dA (z)), podemos escrever as expressões necessárias para calcular Fmarg
em
função da distância luminosidade, obtendo
FklDA
DA
FkH
0
=
rq
F1k
FHD0AH0
N
1 X
1
∂DL (zi ; β̄) ∂DL (zi ; β̄)
=
,
2
d
A
2
2
H0 i=1 ((1 + zi ) σdados )
∂βk
∂βl
i
N
DL (H0 ; β̄)
1 X
∂DL (zi ; β̄)
,
=
3
d
A
2
2
H0 i=1 ((1 + zi ) σdados )
∂βk
i
"
#2
N
1 X
DL (zi ; β̄)
=
.
dA
H04 i=1 (1 + zi )2 σdados
i
(B.55)
(B.56)
(B.57)
Podemos então utilizar as derivadas apresentadas na seção anterior (equações (B.44) e
(B.49)), juntamente com as equações (B.51) e (B.55) a (B.57) e assim obter uma expressão
analítica para a matriz de Fisher a partir da distância de diâmetro angular.
112
B.3
... a partir do Parâmetro de Hubble
Caso tenhamos em mãos dados de medida do parâmetro de Hubble como função do desvio
para o vermelho, a função de verossimilhança para N observações independentes é dada por
LH (H0 ; β̄) =
N
Y
i=1
"
( ¡
¢2 )#
hi − H(zi ; β̄)
√ exp −
.
¡ H ¢2
H
σdados
2π
2
σ
i
dadosi
1
(B.58)
Considere g(z; β̄) a expressão para o parâmetro de Hubble em unidades de H0 , e também
N
X
hi g(zi ; β̄)
K ≡
¡ H ¢2 ,
i=1 σdadosi
L ≡
N
X
h2i
(B.59)
¢2 ,
(B.60)
N
X
g(zi ; β̄)2
M ≡
¡ H ¢2 .
i=1 σdadosi
(B.61)
¡
i=1
H
σdados
i
Desta forma, a função de verossimilhança é dada por
¶
µ
¶
µ
1
L
H02 M
L (H0 ; β̄) = √ CH exp −
exp KH0 −
.
2
2
2π
H
(B.62)
Integrando sobre H0 , temos
Z
+∞
−∞
r
µ 2¶
¸
H02 M
π
K
exp KH0 −
exp
dH0 =
,
2
2M
2M
·
(B.63)
e consequentemente, podemos escrever a função de verossimilhança como
CH
L (β̄) = √ exp
2 M
H
µ
K2
2M
¶
µ
exp
−L
2
¶
.
(B.64)
B.3. ... A PARTIR DO PARÂMETRO DE HUBBLE
113
É possível calcular diretamente o logaritmo e as derivadas dessa função:
ln L
H
∂ ln LH
∂βl
∂ 2 ln LH
∂βk βl
µ ¶
C
K2
L 1
,
= ln
− − ln (M ) +
2
2
2
2M
1 ∂M
K ∂K
K 2 ∂M
= −
+
−
2M ∂βl
M ∂βl
2M 2 ∂βl
µ
¶
K2
1 ∂M
K ∂K
1+
+
,
= −
2M ∂βl
M
M ∂βl
(B.65)
(B.66)
(B.67)
µ
¶
µ
¶
1 ∂M ∂M
K2
1 ∂2M
K2
K ∂K ∂M
=
1+
−
1+
− 2
+
2
2M ∂βk ∂βl
M
2M ∂βk βl
M
M ∂βk ∂βl
K 2 ∂M ∂M
1 ∂K ∂K
K ∂M ∂K
K ∂2K
+
+
−
+
.
(B.68)
2M 3 ∂βk ∂βl
M ∂βk ∂βl
M 2 ∂βk ∂βl
M ∂βk ∂βl
As derivadas necessárias ao cálculo da equação anterior são dadas por
∂K
∂βl
N
X
hi
2
σ
i=1 dadosH
i
=
∂g(zi ; β̄)
∂βl
N
X
hi
∂2K
∂ 2 g(zi ; β̄)
=
,
¡ H ¢2
∂βk ∂βl
∂β
∂β
k
l
σ
i=1
dadosi
∂M
∂βl
∂ 2M
∂βk ∂βl
N
X
2g(zi ; β̄) ∂g(zi ; β̄)
¡ H ¢2
∂βl
i=1 σdadosi
·
¸
N
X
2
∂g(zi ; β̄) ∂g(zi ; β̄)
∂ 2 g(zi ; β̄)
=
+ g(zi ; β̄)
.
¡ H ¢2
∂βk
∂βk
∂βk ∂βl
i=1 σdados
=
(B.69)
(B.70)
(B.71)
(B.72)
i
Logo, precisamos calcular as derivadas de g(z; β̄) em relação aos parâmetros βi . A partir
das equações (B.37) e (B.38), podemos verificar que
" J µ
#
Y 1 + zi ¶βi µ 1 + z ¶βJ+1
¢
g(z; β̄) = exp I1 (z; β̄) = (1 + z)
,
1
+
z
1
+
z
i−1
J
i=1
¡
onde J novamente corresponde à parte inteira de z/dz.
(B.73)
114
Sendo assim, as derivadas serão
" J µ
#
Y 1 + zi ¶βi µ 1 + z ¶βJ+1
∂g(z; β̄)
= (1 + z)
×
∂βl
1 + zi−1
1 + zJ
i=1
½
µ
¶
µ
¶¾
1 + zl
1+z
+ δJ+1,l ln
,
× Θ(J + 1 − l) ln
1 + zl−1
1 + zJ
" J µ
#
Y 1 + zi ¶βi µ 1 + z ¶βJ+1
∂ 2 g(z; β̄)
= (1 + z)
×
∂βk ∂βl
1 + zi−1
1 + zJ
i=1
½
µ
¶
µ
¶¾
1 + zk
1+z
× Θ(J + 1 − k) ln
+ δJ+1,k ln
×
1 + zk−1
1 + zJ
½
µ
¶
µ
¶¾
1 + zl
1+z
× Θ(J + 1 − l) ln
+ δJ+1,l ln
.
1 + zl−1
1 + zJ
(B.74)
(B.75)
Temos então todas as ferramentas necessárias para obter uma expressão analítica para a
matriz de Fisher a partir de medidas do parâmetro de Hubble. Após aplicar o valor esperado
à equação (B.68), temos que
FklH
¿ 2
À
∂ ln LH (β̄)
=
−
∂βk ∂βl
¶
¶
µ
µ
1 ∂M ∂M 1
1
1 ∂ 2M
∂ 2K
1
=
+
−
+
.
1+
2M ∂βk ∂βl M
2
2 ∂βk βl
M
∂βk ∂βl
(B.76)
Bibliografia
Abdalla F. B., Blake C., Rawlings S., 2010, MNRAS, 401, 743
Abramo L., et al., A Energia Escura e os desafios da Cosmologia Observacional para a
próxima década: "white paper"para a comissão especial de astronomia (CEA), 2009, Rio
de Janeiro
Aguirre A., 1999, ApJ, 525, 583
Aguirre A., Haiman Z., 2000, ApJ, 532, 28
Alam U., Sahni V., Deep Saini T., Starobinsky A. A., 2003, MNRAS, 344, 1057
Alam U., Sahni V., Starobinsky A. A., 2007, JCAP, 2, 11
Albrecht A., et al., 2006, arXiv:astro-ph/0609591
Albrecht A., et al., 2009, arXiv:0901.0721
Amendola L., 2000, PhRvD, 62, 043511
Amendola L., Waga I., Finelli F., 2005, JCAP, 11, 9
Astier P., et al., 2006, A&A, 447, 31
Bassett B. A., Kunz M., Silk J., Ungarelli C., 2002, MNRAS, 336, 1217
Bassett B. A., Kunz M., Parkinson D., Ungarelli C., 2003, PhRvD, 68, 043504
Bassett B. A., Corasaniti P. S., Kunz M., 2004, ApJ, 617, L1
115
116
BIBLIOGRAFIA
Bassett B. A., Hlozek R., 2009, arXiv, arXiv:0910.5224
Bennett C. L., et al., 2003, ApJS, 148, 1
Bento M. C., Bertolami O., Sen A. A., 2002, PhRvD, 66, 043507
Bilić N., Tupper G. B., Viollier R. D., 2002, PhLB, 535, 17
Blake C., Glazebrook K., 2003, ApJ, 594, 665
Bond J. R., Efstathiou G., Tegmark M., 1997, MNRAS, 291, L33
Branch D., Livio M., Yungelson L. R., Boffi F. R., Baron E., 1995, PASP, 107, 1019
Carroll S. M., 2001, LRR, 4, 1
Carvalho F. C., Alcaniz J. S., Lima J. A. S., Silva R., 2006, PhRvL, 97, 081301
Chevallier M., Polarski D., 2001, IJMPD, 10, 213
Cole S., et al., 2005, MNRAS, 362, 505
Colistete Jr., R., BayEsian Tools for Observational Cosmology using SNe Ia (BETOCS),
disponível em http://www.RobertoColistete.net/BETOCS, (2006)
Conley A., Carlberg R. G., Guy J., Howell D. A., Jha S., Riess A. G., Sullivan M., 2007,
ApJ, 664, L13
Corasaniti P. S., Copeland E. J., 2002, PhRvD, 65, 043004
Corasaniti P. S., Bassett B. A., Ungarelli C., Copeland E. J., 2003, PhRvL, 90, 091303
Dalal N., Abazajian K., Jenkins E., Manohar A. V., 2001, PhRvL, 87, 141302
Daly R. A., Djorgovski S. G., 2003, ApJ, 597, 9
Dick J., Knox L., Chu M., 2006, JCAP, 7, 1
D R. D’Inverno, Introducing Einstein’s Relativity, Oxford (Oxford Univ. Press, 1992)
BIBLIOGRAFIA
117
Dvali G., Gabadadze G., Porrati M., 2000, PhLB, 485, 208
Efstathiou G., Bond J. R., 1999, MNRAS, 304, 75
Efstathiou G., 2002, MNRAS, 332, 193
Eisenstein D., Hu W., Tegmark M., 1998, ApJ, 504, L57
Eisenstein D., 2003, arXiv:astro-ph/0301623
Eisenstein D., White M., 2004, PRD, 70, 103523
Eisenstein D. J., et al., 2005, ApJ, 633, 560
Eisenstein, D. J., http : //cmb.as.arizona.edu/eisenstein/acousticpeak/acousticp hysics.html
, (Janeiro de 2005)
Elgarøy Ø., Multamäki T., 2006, JCAP, 9, 2
Fabris J. C., Shapiro I. L., Solà J., 2007, JCAP, 2, 16
Filippenko A. V., 1997, ARA&A, 35, 309
Freedman W. L., et al., 2001, ApJ, 553, 47
Frieman J. A., Hill C. T., Stebbins A., Waga I., 1995, PhRvL, 75, 2077
Frieman J. A., et al., 2008, AJ, 135, 338
Galaz G., de Lapparent V., 1998, A&A, 332, 459
Giovanelli R., Dale D. A., Haynes M. P., Hardy E., Campusano L. E., 1999, ApJ, 525, 25
Giostri R., Reis R. R. R., Waga I., Ishida E. E. O., em preparação
Goliath M., Amanullah R., Astier P., Goobar A., Pain R., 2001, A&A, 380, 6
Gondolo P., Freese K., 2003, PhRvD, 68, 063509
Gong Y., Wang A., 2007, PhRvD, 75, 043520
118
BIBLIOGRAFIA
Gould S. J., The Mismeasure of Man, W. W. Norton (1981), New York
Grøn Ø., Elgarøy Ø., 2007, AmJPh, 75, 151
Guy J., Astier P., Nobili S., Regnault N., Pain R., 2005, A&A, 443, 781
Guy J., et al., 2007, A&A, 466, 11
Guo Z.-K., Ohta N., Tsujikawa S., 2007, PhRvD, 76, 023508
Hannestad S., Mörtsell E., 2004, JCAP, 9, 1
Hicken M., Wood-Vasey W. M., Blondin S., Challis P., Jha S., Kelly P. L., Rest A., Kirshner
R. P., 2009, ApJ, 700, 1097
Hu W., Holder G. P., 2003, PhRvD, 68, 023001
Hubble E., 1929, PNAS, 15, 168
Huterer D., Starkman G., 2003, PhRvL, 90, 031301
Ishida, Émille E. O., O teste diagnóstico statefinder e a natureza da energia escura, Dissertação de mestrado (2006), IF-UFRJ, Rio de Janeiro
Ishida É. E. O., Reis R. R. R., Toribio A. V., Waga I., 2008, APh, 28, 547
Ishida, É. E. O., Reis R. R. R., Waga I., Lago B. L., submetido à publicação
Jassal H. K., Bagla J. S., Padmanabhan T., 2005, PhRvD, 72, 103503
Jha S., Riess A. G., Kirshner R. P., 2007, ApJ, 659, 122
Jollife I. T., Principal Component Analysis 2nd. edition, Springer-Verlag (2002), New York
Kamenshchik A., Moschella U., Pasquier V., 2001, PhLB, 511, 265
Kessler R., et al., 2009, ApJS, 185, 32
Kitching T. D., Amara A., 2009, MNRAS, 398, 2134
BIBLIOGRAFIA
119
Komatsu E., et al., 2009, ApJS, 180, 330
Kujat J., Linn A. M., Scherrer R. J., Weinberg D. H., 2002, ApJ, 572, 1
Leibundgut, B., in:Fronteirs in Cosmology, ed: Blanchard A. & Signore M., 195, Springer,
2005, Dordrecht
Liddle, A., An Introduction to Modern Cosmology, 2a edição, John Wiley & Sons, 2004, West
Sussex, England
Linder E. V., 2003, PhRvL, 90, 091301
Linder E. V., Huterer D., 2005, PhRvD, 72, 043509
Livio, M. in:Type Ia Supernova: theory and cosmology, J.C. Niemeyer & J. W. Truran,
Cambridge Univeristy Press (2000), 33
Lundmark, K. E., 1925, MNRAS, 85, 865
Lundmark, K. E., 1932, Lund Observatory Circ., 8
Mandel, J., 1972, Statistica Neerlandica, 26, 119–129
Makler M., de Oliveira S. Q., Waga I., 2003, PhLB, 555, 1
Marshall, L., The Supernova story, Princeton University Press (1988), New Jersey
Misner, C. W., Thorne, K. S., Wheeler, J. A., Gravitation, W. H. Freeman & Company
(1973), São Francisco
Nesseris S., Perivolaropoulos L., 2004, PhRvD, 70, 043531
Nesseris S., Perivolaropoulos L., 2005, PhRvD, 72, 123519
Nesseris S., Perivolaropoulos L., 2007, JCAP, 1, 18
Nesseris S., Perivolaropoulos L., 2007, JCAP, 2, 25
120
BIBLIOGRAFIA
Pakmor R., Kromer M., Röpke F. K., Sim S. A., Ruiter A. J., Hillebrandt W., 2010, Nature,
463, 61
Peebles, P. J. E., Principles of Physical Cosmology, Princeton University Press (1993), Nova
Jersey
Percival W. J., Cole S., Eisenstein D. J., Nichol R. C., Peacock J. A., Pope A. C., Szalay
A. S., 2007, MNRAS, 381, 1053
Perlmutter S., et al., 1999, ApJ, 517, 565
Pogosian L., Zhao G.-B., Silverstri A., Zylberberg J., 2009, APS..NWS., 1002
Quinet, S., 2007, Vínculos Observacionais sobre modelos de Quartessência do tipo Gás de
Chaplygin, Tese de doutorado, IF-UFRJ, Rio de Janeiro
Rapetti D., Allen S. W., Amin M. A., Blandford R. D., 2007, MNRAS, 375, 1510
Reis R. R., Waga I., Calvão M. O., Jorás S. E., 2003, PhRvD, 68, 061302
Riess A. G., Press W. H., Kirshner R. P., 1995, ApJ, 438, L17
Riess A. G., et al., 1998, AJ, 116, 1009
Riess A. G., et al., 2004, ApJ, 607, 665
Riess A. G., et al., 2007, ApJ, 659, 98
Riess A. G., et al., 2009, ApJS, 183, 109
Robertson, H. P., (1929) Pro- c. Nat. Acad. Science USA, vol. 15, pag. 822-829
Ronen S., Aragon-Salamanca A., Lahav O., 1999, MNRAS, 303, 284
Sami M., 2009, arxiv:0901.0756
Shapiro C., Turner M. S., 2006, ApJ, 649, 563
BIBLIOGRAFIA
121
Sotiriou T. P., Faraoni V., 2008, arXiv:0805.1726
Spergel D. N., et al., 2007, ApJS, 170, 377
Steinhardt P. J., Wang L., Zlatev I., 1999, PhRvD, 59, 123504
Sugiyama, T. and Tong, H., 1976, Commun. Statist., A5, 711–721.
Tang J., Abdalla F. B., Weller J., 2008, arXiv:0807.3140
Totsuji, H., Kihara, T. , 1969, PASJ, 21, 221
Turner M. S., Riess A. G., 2002, ApJ, 569, 18
Xu L., Liu H., 2008, MPLA, 23, 1939
Wang, Y. and Garnavich, P., 2001, Astrophys. J., 552, 445 (2001)
Wang Y., Freese K., Gondolo P., Lewis M., 2003, ApJ, 594, 25
Wang Y., Freese K., 2006, PhLB, 632, 449
Wang Y., Mukherjee P., 2006, ApJ, 650, 1
Weinberg S., Gravitation and Cosmology: principles and applications of the General Theory
of Relativity, 1971, John Wiley & Sons, New York
Wood-Vasey W. M., et al., 2007, ApJ, 666, 694
Wu K. K. S., Lahav O., Rees M. J., 1999, Natur, 397, 225
Zehavi I., Riess A. G., Kirshner R. P., Dekel A., 1998, ApJ, 503, 483
Zimdahl W., Pavón D., 2007, CQGra, 24, 5461

Contribuições Conceituais e Estatísticas para a - arcos

Transcrição

Documentos relacionados

CONTA POUPANÇA - BAO EMIGRANTE

AGA 0101 8 .2 Ondas acústicas no universo primordial

Novo Parâmetro para Promoções Frente de Loja

CÁLCULO DE RAÇÃO PELO MÉTODO ALGÉBRICO

Manual Linux Básico - Avanço Informática

A LUTA PELA 4ª INTERNACIONAL

a influência da marca na percepção sensorial de chocolates ao leite

Alg I - Glencoe

Superfícies Quádricas (Resumo)

e4-SOLICITACAO ADJUNTO-FISICA APLICADA