Contribuições Conceituais e Estatísticas para a - arcos
Transcrição
Contribuições Conceituais e Estatísticas para a - arcos
Aceleração cósmica: aspectos fenomenológicos e estatísticos Émille Eugênia de Oliveira Ishida Orientador: Ioav Waga Co-orientador: Ribamar Rondon de Rezende dos Reis i UFRJ Aceleração cósmica: aspectos fenomenológicos e estatísticos Émille Eugênia de Oliveira Ishida Tese de Doutorado apresentada ao Programa de Pós-graduação em Física, Instituto de Física, da Universidade Federal do Rio de Janeiro, como parte dos requisitos necessários à obtenção do título de Doutor em Ciências (Física). Orientador: Ioav Waga Co-orientador: Ribamar Rondon de Rezende dos Reis Rio de Janeiro Março de 2010 ii iii I 79 Ishida, Émille Eugênia de Oliveira Aceleração cósmica: aspectos fenomenológicos e estatísticos/ Émille Eugênia de Oliveira Ishida - Rio de Janeiro: UFRJ / IF, 2010. xiii, 121f.: il. ; 29,7cm. Orientador: Ioav Waga Co-orientador: Ribamar Rondon de Rezende dos Reis Tese (doutorado) - UFRJ / Instituto de Física / Programa de Pós-graduação em Física , 2010. Referências Bibliográficas: f. 115-121. 1. Cosmologia. 2. Energia Escura. 3. Supernovas. 4. Análise por Componentes Principais I. Waga, Ioav. II. Universidade Federal do Rio de Janeiro, Instituto de Física, Programa de pós-graduação em Física. III. Aceleração cósmica: aspectos fenomenológicos e estatísticos. Para conseguirmos entender o curso natural das coisas temos que conseguir desaprender muitos conceitos. Para os podermos desaprender é preciso que antes os tenhamos aprendido. Tao Te Ching v Resumo Aceleração cósmica: aspectos fenomenológicos e estatísticos Émille Eugênia de Oliveira Ishida Orientador: Ioav Waga Co-orientador: Ribamar Rondon de Rezende dos Reis Resumo da Tese de Doutorado submetida ao Programa de Pós-graduação em Física, do Instituto de Física, da Universidade Federal do Rio de Janeiro - UFRJ, como parte dos requisitos necessários à obtenção do título de Doutor em Ciências (Física). O trabalho apresentado nesta tese utiliza duas abordagens complementares para a análise da dinâmica global do universo. Sabemos, desde fins do século XX, que o universo entrou em uma fase de expansão acelerada no passado. Para explicar a aceleração cósmica, as duas maiores linhas de investigação presentes na literatura sugerem, a presença de um componente exótico com pressão negativa ou que a Teoria da Relatividade Geral deve ser modificada em escalas cosmológicas. Em ambas possibilidades admite-se uma determinada teoria de gravitação e um modelo cosmológico particular. Um dos objetivos desta tese, é analisar a aceleração cósmica da forma mais geral possível. Para tanto, utilizamos apenas a definição do parâmetro de desaceleração, q,: uma quantidade formada a partir do fator de escala da métrica de Friedman-Lemaître-Robertson-Walker e de suas derivadas até segunda ordem. Primeiramente propomos uma nova parametrização para q, composta por quatro parâmetros com significados físicos bastante claros. Utilizamos dados de supernovas do tipo Ia, medidas de oscilações acústicas de bárions e da distância à superfície de último espalhamento da radiação cósmica de fundo para encontrar vínculos sobre esses parâmetros. Nossos resultados mostram, de uma forma bem geral, que houve uma transição (desaceleração-aceleração) no passado. Realizamos também uma simulação de experimentos vi futuros, considerando a melhora nas incertezas que certamente será proporcionada pelos mesmos. Em um segundo momento, analisamos também a possibilidade de obter informações sobre a dinâmica do universo a partir dos dados, sem a necessidade de supor uma forma funcional para o parâmetro de desaceleração. Para tanto, utilizamos a Análise por Componentes Principais (ACP). Este método utiliza o inverso da matriz de covariância (matriz de Fisher) para reescrever os dados observacionais em uma nova base onde o erro ao longo de uma determinada direção no espaço de parâmetros não tem correlação com os erros nas outras direções. De posse dessa nova base, reconstruímos q. Nesse processo, a reconstrução é feita utilizando apenas os componentes ao longo dos quais a variância dos dados é maior, o que nos possibilita reduzir o espaço de parâmetros e simplificar o problema. Nós apresentamos detalhadamente os cálculos que levam a uma expressão analítica para a matriz de Fisher, partindo tanto de dados de supernovas Ia assim como de oscilações acústicas de bárions. Aplicamos esse procedimento ao mais recente conjunto de dados de observações de supernovas Ia, que nos fornecem uma reconstrução razoável, mas ainda predominantemente dominada por incertezas. Como uma maneira de verificar a eficácia do método frente aos dados provenientes de futuros experimentos, realizamos também a mesma análise com base em simulações de medidas de oscilações acústicas de bárions para um experimento como o Square Kilometre Array. Mostramos que, no futuro, o uso de ACP pode ser bastante promissor para que se extraia a forma funcional do parâmetro de desaceleração a partir dos dados observacionais sem a utilização de uma parametrização específica e praticamente livre de erros numéricos. Palavras-chave: Cosmologia. Energia escura. Supernovas. Análise por Componentes Principais. Rio de Janeiro Março de 2010 vii Abstract The cosmic acceleration: phenomenological and statistical aspects Émille Eugênia de Oliveira Ishida Supervisor: Ioav Waga Second Supervisor: Ribamar Rondon de Rezende dos Reis Abstract da Tese de Doutorado submetida ao Programa de Pós-graduação em Física, Instituto de Física, da Universidade Federal do Rio de Janeiro - UFRJ, como parte dos requisitos necessários à obtenção do título de Doutor em Ciências (Física). The work presented in this thesis investigates two complementary approaches used to study the universe’s global dynamical properties. We know, since the end of the 20th century, that the universe entered a phase of decelerated expansion in the past. In order to explain this behavior, the two main paths of investigation found in the literature suggest a new exotic component with negative pressure or modifications applied to General Relativity Theory in cosmological scales. In both cases, one must begin with a given gravity theory and cosmological model and perform the analysis case by case. One of the main objectives of this work is to analyze cosmic acceleration in the most general possible way. As a consequence, we make use of the definition of the deceleration parameter, q,: a quantity constructed from the scale factor of the Friedman-LemaîtreRobertson-Walker metric and its derivatives up to second order. We begin proposing a new parametrization for q, composed by four parameters with very clear physical meaning. We use data from type Ia supernova observations, measurements of baryon acoustic oscillations and the distance to the last scattering surface from the cosmic microwave background radiation in order to find constraints on our parameters. Our results show, in a general way, that there was a transition (deceleration-acceleration) in the past. We also performed a simula- viii tion based on future experiments designs, taking into account the improvement on current uncertainties that will certainly come from a new generation of observational facilities. As a second step, we also analyzed the possibility of obtaining information about the dynamics of the universe based only in the data, without the need of imposing a functional form for the deceleration parameter. Our tool to achieve this objective is the use of Principal Component Analysis (PCA). PCA is a statistical method that uses the inverse of the covariance matrix (also called Fisher matrix) in order to rewrite the observational data in a new base, where the errors associated to a determined direction in the parameter space (principal component) has no correlation with the errors associated to other directions. Having this new base, we reconstructed q. The reconstruction is performed using only a few components which represent the majority of the variance present in the data set, as a consequence, this procedure allows us to reduce the dimensionality of the parameter space, simplifying the problem. We present the detailed calculations that lead us to an analytical expression for the Fisher matrix, based on supernova and baryon acoustic oscillation observations. We apply this procedure to the most recent supernova data set, which provided a reasonable reconstruction, but still predominantly driven by uncertainties. In order to verify the efficiency of the method, once data from future experiments is available, we also used PCA based on simulated data from baryon acoustic oscillations for an experiments like the Square Kilometre Array. We show that, in the future, the use of PCA may be use to extract the functional form of the deceleration parameter from the data set without the use of a specific parametrization and practically free from numerical errors. Key-words: Cosmology. Dark energy. Supernovae. Principal Component Analysis. Rio de Janeiro Março de 2010 Notações e Convenções 1. Índices gregos variam de 0 a 3; 2. Índices latinos variam de 1 a 3; 3. Derivada parcial: ∂φ ∂xα = ∂α φ = φ,α ; 4. Símbolo de Christoffel: Γαβγ = 21 g αµ (∂γ gµβ + ∂β gµγ − ∂µ gβγ ); 5. Derivada covariante: Tβ;α = ∇α Tβ = ∂α Tβ − Γλβα Tλ ; 6. Tensor de Riemann:R µ αβλ = ∂β Γµαλ − ∂λ Γµαβ + Γγαλ Γµγβ − Γγαβ Γµγλ ; 7. Tensores simétricos: T(αβ) ≡ 21 (Tαβ + Tβα ); 8. Assinatura da métrica: (+, −, −, −); 9. No sistema de unidades utilizado: ~ = c = kb = 1; 10. M¯ corresponde à massa solar ≈ 1.9891 × 1030 kg; 11. 1 Mpc ≈ 3 × 1022 m ≈ 3 × 106 anos-luz. ix x Agradecimentos Mais uma vez agradeço a Deus por ter colocado tantas pessoas incríveis no meu caminho: Meu pai, Osvaldo, que apesar da nossa curta convivência continua sendo um exemplo em muitos aspectos da minha vida; Minha mãe, Iedes, que sempre acreditou em mim muito mais do que eu mesma, e cujos esforços foram imprescindíveis para que este trabalho pudesse ser desenvolvido; Minha irmã e meu cunhado, Myleni e Natan, presentes em todos os momentos desesperadores que eu tive nos últimos anos, e sempre compreensivos quanto às minhas ausências cada vez mais frequentes; Minha tia, Maria, que além de muitos conselhos me ajudou a adquirir parte dos equipamentos necessários para o desenvolvimento deste trabalho; Meu amigo, namorado, companheiro, confidente e colaborador, Rafael, que se mostrou uma surpresa incrível no melhor dos sentidos, e me trouxe não apenas paz de espírito mas uma companhia para todos os projetos mirabolantes e hobbies exóticos que eu sempre quis fazer. Além, é claro, de entender minhas piadas e ajudar na revisão desta tese; Meu colaborador, Alan, que nos ajudou a desenvolver parte do trabalho aqui apresentado; Meus companheiros de sala, Bruno, Fernando, Marcos, Ramón e Vinícius, ótimas companhias para bater papo sobre o que quer seja, e que nunca demonstraram incômodo em relação à minha mania de organizar a nossa sala; Os professores do Instituto de Física da UFRJ, principalmente os integrantes do ARCOS (Grupo de Astrofísica, Relatividade e COSmologia), que sempre proporcionaram a mim e aos demais estudantes um ambiente saudável de discussão e crescimento científico; xi xii Meu colaborador, amigo e agora co-orientador, Ribamar, dono de uma paciência sem tamanho, testada à exaustão ao longo de quatro anos de colaboração, intensas discusões, e convivência durante minhas primeiras peripécias pelo mundo; O supervisor do meu estágio no exterior, Ofer, que me ensinou muito sobre as possibilidades de internacionalização da minha pesquisa; Meu mais novo colaborador, Filipe e todos os membros do Grupo de Astrofísica da UCL, que me receberam de braços abertos e ajudaram a me adaptar ao jeito londrino de ser... na medida do possível; Meu anfitrião no IAG-USP durante o segundo semestre de 2008, Opher, que me deu a oportunidade de participar das atividades do seu grupo de pesquisa nos estágios finais do meu doutorado; Meus amigos do Clube do Livro, André, Beatriz, Martin, Miguel e Paula, responsáveis por grande parte do meu crescimento filosófico ao longo dos últimos quatro anos; Todos os membros da Congregação Evangélica Luterana Cristo Redentor que me deram a honra de participar do Projeto Zona Sul, e em especial Cibele, Cíntia, Felipe, Heliete, Luis e Vera, duas famílias incríveis que me adotaram quando precisei de um teto durante a fase final de redação deste trabalho; A família Waga, Sandra e Tamara, que aceitaram me hospedar no Rio em momentos críticos no desenvolvimento desta tese; O CNPq e a CAPES, que não são pessoas, mas aos quais agradeço pelo apoio financeiro no desenvolvimento deste projeto; E por fim, serei sempre grata por ter tido a oportunidade de desenvolver meu doutorado sob a orientação do professor Ioav Waga, que antes mesmo de me conhecer fez uma análise psicológica do meu inocente email de graduanda e decidiu que por algum motivo eu merecia uma chance. Agradeço imensamente por ter me recebido na UFRJ, ter me ajudado a desvendar os mistérios da vida acadêmica e acima de tudo, por proporcionar um ambiente onde pude desenvolver livremente meu gosto pela pesquisa. Lista de Figuras 2.1 Velocidade como função do desvio para o vermelho (Hubble, 1929). . . . . . 10 2.2 Distância de diâmetro angular. . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3.1 Tipos de supernovas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 3.2 Relação entre a função de correlação e o espectro de potência. . . . . . . . . 36 3.3 Fases do desacoplamento entre fótons e bárions. . . . . . . . . . . . . . . . . 37 3.4 Medidas de dA (z) e H(z) a partir de BAO. . . . . . . . . . . . . . . . . . . . 38 3.5 Pico acústico na função de correlação. . . . . . . . . . . . . . . . . . . . . . . 40 3.6 Incertezas em medidas de H(z) e dA (z) usadas na simulação. . . . . . . . . . 42 4.1 Influência de zt e τ na forma de q(z). . . . . . . . . . . . . . . . . . . . . . . 49 4.2 Vínculos impostos por dados de SNIa e Sk/Dv. . . . . . . . . . . . . . . . . 54 4.3 Vínculos impostos por dados de SNIa + Sk /Dv . . . . . . . . . . . . . . . . . 54 4.4 Forma de q(z) para melhores ajustes do Gold182 . . . . . . . . . . . . . . . 56 4.5 Forma de q(z) para melhores ajustes do SNLS. . . . . . . . . . . . . . . . . . 56 5.1 Exemplo de dados em função de 2 variáveis correlacionadas. . . . . . . . . . 59 5.2 Exemplo de dados em função dos CPs. . . . . . . . . . . . . . . . . . . . . . 59 5.3 CPs para dados do SDSS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 5.4 CPs para medidas de dA (estágios 1 a 3). . . . . . . . . . . . . . . . . . . . . 72 5.5 CPs para medidas de H(z) (estágios 1 a 3). . . . . . . . . . . . . . . . . . . 73 5.6 Reconstruções de 1 a 3 CPs para dados do SDSS. . . . . . . . . . . . . . . . 79 5.7 Reconstrução final para dados do SDSS. . . . . . . . . . . . . . . . . . . . . 82 xiii xiv LISTA DE FIGURAS 5.8 Reconstruções para medidas de dA (estágio 1). . . . . . . . . . . . . . . . . . 84 5.9 Reconstruções para medidas de dA (estágio 2). . . . . . . . . . . . . . . . . . 85 5.10 Reconstruções para medidas de dA (estágio 3). . . . . . . . . . . . . . . . . . 86 5.11 Reconstruções finais para dA . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 5.12 Reconstruções a partir de medidas de H(z) (estágio 1). . . . . . . . . . . . . 89 5.13 Reconstruções para medidads de H(z) (estágio 2). . . . . . . . . . . . . . . . 90 5.14 Reconstruções para medidas de H(z) (estágio 3). . . . . . . . . . . . . . . . 91 5.15 Reconstruções finais para medidas de H(z) . . . . . . . . . . . . . . . . . . . 92 Lista de Tabelas 5.1 Critério para seleção do número de componentes na reconstrução para dL e dA . 75 5.2 Critério para seleção do número de componentes na reconstrução para H(z). xv 76 xvi LISTA DE TABELAS Índice Resumo v Abstract vii Notações e Convenções ix Agradecimentos xi Lista de Figuras xiii Lista de Tabelas xiii 1 Introdução 1 2 Princípios Básicos 5 2.1 Homogeneidade e Isotropia . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.2 O universo em expansão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.3 Distâncias em Cosmologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.3.1 Distância Comóvel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.3.2 Distância de Diâmetro Angular . . . . . . . . . . . . . . . . . . . . . 14 2.3.3 Distância de Luminosidade e o Sistema de Magnitudes . . . . . . . . 16 O Modelo Padrão da Cosmologia . . . . . . . . . . . . . . . . . . . . . . . . 19 2.4.1 Equações de Einstein . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.4.2 ΛCDM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.4 xvii xviii ÍNDICE 3 Dados Observacionais 25 3.1 Supernovas Ia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 3.2 Oscilações Acústicas de Bárions . . . . . . . . . . . . . . . . . . . . . . . . . 30 4 Um novo olhar sobre o Parâmetro de Desaceleração 43 4.1 Nosso Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4.2 Vínculos Observacionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 5 Análise por Componentes Principais 5.1 5.2 5.3 57 A matriz de Fisher... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 5.1.1 ... a partir da Distância de Luminosidade . . . . . . . . . . . . . . . . 62 5.1.2 ... a partir da Distância de Diâmetro Angular . . . . . . . . . . . . . 63 5.1.3 ... a partir do Parâmetro de Hubble . . . . . . . . . . . . . . . . . . . 65 Reconstrução do Parâmetro de Desaceleração . . . . . . . . . . . . . . . . . 66 5.2.1 Quantos Componentes Principais? . . . . . . . . . . . . . . . . . . . . 67 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 5.3.1 Observações de Supernovas Ia . . . . . . . . . . . . . . . . . . . . . . 77 5.3.2 Quando a informação não é suficiente . . . . . . . . . . . . . . . . . . 80 5.3.3 Medidas de dA (z) e H(z) a partir de BAO . . . . . . . . . . . . . . . 83 6 Discussões e Conclusões 93 A Desvio para o Vermelho 97 B Cálculo da Matriz de Fisher... 99 B.1 ... a partir da Distância de Luminosidade . . . . . . . . . . . . . . . . . . . . 100 B.2 ... a partir da Distância de Diâmetro Angular . . . . . . . . . . . . . . . . . 108 B.3 ... a partir do Parâmetro de Hubble . . . . . . . . . . . . . . . . . . . . . . . 110 Capítulo 1 Introdução A história do nosso conhecimento sobre a dinâmica do universo pode ser dividida em antes e depois de 1998. Neste ano, dois grupos independentes (Riess et al., 1998; Perlmutter et al., 1999) trouxeram a público resultados de observações de supernovas Ia (SNIa) que indicavam uma fase recente de expansão cósmica acelerada. Posteriormente, medidas de Oscilações Acústicas de Bárions (BAO, do inglês Baryon Acoustic Oscillations) (Eisenstein et al., 2005) mostraram que a matéria bariônica somada à matéria escura correspondem à ≈ 27% do conteúdo energético do universo. Paralelamente, medidas provenientes da Radiação Cósmica de Fundo (RCF) favoreciam um universo com curvatura espacial nula (Bennett et al., 2003; Spergel et al., 2007; Komatsu et al., 2009). Esses resultados, somados aos mais recentes resultados de SNIa (Kessler et al., 2009) interpretados no contexto da relatividade geral, parecem apontar a existência de uma componente exótica, de pressão negativa, que atualmente domina a expansão do universo. Este componente responsável pela recente aceleração é denominado Energia Escura (EE). A idéia de um componente com efeito gravitacional repulsivo esteve presente no cenário cosmológico desde a criação da Relatividade Geral (RG). O próprio Einstein propôs a existência deste tipo de efeito, que ele denominou Constante Cosmológica (CC), a fim de compatibilizar os resultados da RG com a crença em um universo estático que predominava na época. Com a descoberta feita por Hubble em 1929, de que as galáxias estão na verdade se afastando umas das outras, Einstein abandonou a idéia da CC. A expansão acelerada 1 2 CAPÍTULO 1. INTRODUÇÃO presente nos dados de 1998 trouxe novamente a CC ao centro das discussões, como uma alternativa para explicar a causa da aceleração. A volta da constante cosmológica ao cenário científico no fim do século passado não foi a única consequência direta da descoberta da expansão acelerada. Um resultado experimental em desacordo com a teoria padrão vigente sempre abre um grande e novo leque de discussões. Primeiramente, questionando a veracidade dos dados apresentados e, posteriormente, caso os dados sejam comprovadamente verossímeis, propondo modificações à teoria padrão. Neste caso não foi diferente. Uma das primeiras hipóteses astrofísicas sugeridas como alternativa à existência da EE considerava poeira presente na linha de visada, uniformemente distribuída entre a fonte e o observador. A poeira ocasionaria uma demagnificação sistemática das supernovas mais distantes, causando um efeito análogo àquele gerado pela expansão acelerada (Aguirre, 1999). Entretanto, essa hipótese foi descartada logo em seguida, devido à ausência de assinaturas que deveriam ser observadas na radiação de cósmica de fundo no infravermelho (por exemplo, Aguirre & Haiman (2000)). Também foi levantada a possibilidade deste efeito ser devido à nossa localização em uma região de baixa densidade no universo ("bolha")(Zehavi et al., 1998). Neste contexto, objetos mais distantes estariam se distanciando ainda mais de nós, de maneira acelerada, devido ao efeito gravitacional da região de sobredensidade que nos circunda. Entretanto, estudos preliminares não apóiam esta hipótese, devido à ausência de tal efeito em medidas da velocidade de aglomerados de galáxias (Giovanelli et al., 1999) e também em estimativas de velocidade das galáxias hospedeiras em dados de SNIa (Hicken et al., 2009). Análises deste tipo de comportamento em dados que utilizam SN Ia como velas padrão mostram que a detecção ou não de uma região de subdensidade local depende fortemente do método de padronização das curvas de luz utilizado (Conley et al., 2007). Sendo assim, esta hipótese continua em aberto (para mais detalhes sobre o atual cenário da utilização de SN Ia como velas padrão, ver capítulo (3)). Estes são apenas alguns exemplos de tentativas presentes na literatura a fim de eliminar 3 a necessidade de um componente com pressão negativa (para uma revisão, ver Sami (2009)), entretanto, a existência de algum tipo de energia escura presente como parte dominante da energia de um universo regido pela RG continua sendo parte do mosaico que compõe o atual Modelo Padrão da Cosmologia (vide capítulo 2). Dentro deste cenário várias possibilidades foram traçadas. Estudou-se também a eficácia de diferentes parametrizações onde a relação entre densidade, ρ, e pressão, p, da EE (p = wρ, onde w é o parâmetro da equação de estado) depende do desvio para o vermelho (Chevallier & Polarski, 2001; Linder, 2003). Foi abordada também a hipótese de um fluido que se comportaria como matéria escura no início do universo e cujo comportamento seria semelhante àquele da energia escura para o universo atual (Kamenshchik, Moschella, & Pasquier, 2001; Makler, de Oliveira, & Waga, 2003). Em todos esses casos e muitos outros não citados aqui, a estratégia de investigação proposta impõe alguma característica à EE e a partir desta, determina-se os valores dos parâmetros para os quais a concordância com os dados observacionais é máxima. Entretanto, essa abordagem é bastante restrita, pois oferece resultados apenas para um modelo de fluido, em um determinado contexto cosmológico. O trabalho apresentado nesta tese visa diminuir os efeitos do que ainda não sabemos em relação à EE e à RG, extraindo dos dados informações sobre a dinâmica do universo que independem dessas hipóteses. Para tanto, baseamos nossa análise no parâmetro de desaceleração, q, que representa o comportamento dinâmico global do universo. Como mostraremos a seguir, a escolha deste parâmetro como base de nossa análise exige que façamos hipóteses apenas em relação à homogeneidade e isotropia do universo, ou seja, da métrica. Podemos expressar distâncias em escalas cosmológicas (distância de luminosidade (dL ), distância de diâmetro angular (dA ) e distância comóvel (dC )) em função de q, assim como do parâmetro de Hubble (H) e consequentemente impor vínculos sobre o comportamento de q como função do desvio para o vermelho sem especificar o conteúdo material do universo e a teoria de gravitação subjacente. Primeiramente propomos uma forma funcional para q dependente de 4 parâmetros, todos com claro significado físico. Além disso, a expressão proposta neste trabalho é capaz de 4 CAPÍTULO 1. INTRODUÇÃO reproduzir uma grande quantidade de modelos de EE para diferentes valores de seus parâmetros. Utilizamos dados de observações de SNIa, BAO e RCF para impor vínculos sobre três dos quatro parâmetros. A abordagem descrita no parágrafo anterior apresenta vantagens, já citadas, em relação a estudos similares focados em w. Entretanto, os resultados ainda são submetidos a um viés introduzido pela forma funcional específica escolhida (q(z)). A fim de obter resultados ainda mais abrangentes, onde a dependência com o desvio para o vermelho é construída a partir dos dados, fazemos uso da Análise por Componentes Principais (ACP). Neste trabalho, reescrevemos nossa função de interesse como uma combinação linear dos autovetores da matriz de Fisher, em uma abordagem que amplia aquela sugerida inicialmente por Shapiro & Turner (2006). Novamente nos concentramos na análise do parâmetro de desaceleração, o que nos permitiu obter analiticamente todos os passos necessários ao cálculo da matriz de Fisher. Como um exemplo de aplicação deste método, submetemos a este procedimento, dados provenientes de observações de SNIa apresentados por Kessler et al. (2009) e dados simulados para um experimento como o Square Kilometre Array (SKA), de acordo com os resultados apresentados por por Abdalla, Blake, & Rawlings (2009). Acreditamos que este trabalho ilustra uma das possibilidades disponíveis para se encontrar informações sobre a dinâmica do universo, independentemente de modelo cosmológico e praticamente livre de erros numéricos. Capítulo 2 Princípios Básicos A cosmologia moderna é baseada na hipótese de que o lugar que ocupamos no universo não é especial. Podemos resumir desta maneira o Princípio Cosmológico, que representa uma idéia ao mesmo tempo simples e poderosa. Sua influência na história do desenvolvimento humano se torna clara se levarmos em conta que, durante a maior parte da história da humanidade, acreditou-se que o homem ocupava um lugar especial no universo (o centro). Os gregos antigos acreditavam que a Terra se encontrava no centro do universo, idéia descrita com detalhes no sistema planetário de Ptolomeu. Neste sistema, o Sol e demais planetas orbitavam ao redor da Terra, e um complicado sistema de epiciclos foi criado a fim de explicar o movimento retrógrado aparente dos planetas. Por volta de 1500, Nicolau Copérnico propôs um sistema que facilmente explicava esses movimentos, mas que para isso retirava a Terra do centro do universo substituindo-a pelo Sol. Famoso por ter derrubado a visão antropocêntrica de sua época, Copérnico manteve a crença de que o Sol ocupava o centro do universo. Nos próximos duzentos anos, ficou claro que as estrelas não estavam distribuídas em esferas celestes, mas que estas se agrupavam em forma de um disco que atualmente conhecemos como a Via-Láctea. Em 1700, Herschel identificou essa estrutura em forma de disco, mas suas observações o levaram a concluir erroneamente que o sistema solar se encontrava no centro da galáxia. No início do século XX, Shapley foi o primeiro a detectar que, na 5 6 CAPÍTULO 2. PRINCÍPIOS BÁSICOS verdade, nos encontramos bastante afastados do centro. Mesmo assim, ele aparentemente acreditava que a Via-Láctea se encontrava no centro do universo. Apenas em 1952, Baade demonstrou que a Via-Láctea é uma galáxia típica, dando forma à visão moderna, conhecida como Princípio Cosmológico (ou Princípio de Copérnico), segundo a qual o universo parece sempre o mesmo não importa de que ponto no espaço-tempo o estamos observando (Liddle, 2004). Obviamente, o Princípio Cosmológico não é exato. A observação do céu noturno nos mostra que as estrelas ao nosso redor formam a Via Láctea (≈ 30 kpc), o que por si só é uma evidência clara de anisotropia. Observações astronômicas em uma escala um pouco maior revelam que a nossa galáxia pertence a um pequeno grupo de galáxias denominado Grupo Local (≈ 3 Mpc). Em uma escala ainda maior veremos que o Grupo Local encontra-se na periferia de um superaglomerado de galáxias centrado na constelação de Virgem (≈ 33 Mpc). Evidentemente a matéria em pequena escala é distribuída de forma altamente irregular, contudo quando olhamos em escalas cada vez maiores, a distribuição de matéria visível se torna cada vez mais uniforme. Atualmente podemos fazer este tipo de afirmação graças aos levantamentos de campo amplo (observações de grande parte do céu), que desde fins do século XX, vieram adicionar ao Princípio Cosmológico um importante suporte observacional. De posse de tais dados, podemos afirmar que o universo ao nosso redor parece o mesmo em todas as direções, pelo menos em escalas acima de 100 Mpc (Wu, Lahav, & Rees, 1999). A precisão se torna muito maior se levarmos em conta medidas da RCF, a partir das quais o universo nos parece isotrópico para uma parte em 105 (Komatsu et al., 2009). Esta radiação está viajando pelo universo a aproximadamente 14 bilhões de anos, o que nos fornece mais um indício de que o universo, em escalas suficientemente grandes, é o mesmo em todas as direções. 2.1. HOMOGENEIDADE E ISOTROPIA 2.1 7 Homogeneidade e Isotropia As evidências observacionais citadas na seção anterior, dão suporte ao Princípio Cosmológico. Como consequência, acreditamos que o universo como um todo possui duas propriedades importantes: homogeneidade e isotropia. Homogeneidade significa que o universo é o mesmo em todos os pontos, e isotropia indica que o universo parece o mesmo em todas as direções. Sendo assim, podemos descrevê-lo como uma variedade quadridimensional composto por uma dimensão temporal e uma seção tridimensional espacial homogênea e isotrópica. A métrica de Friedman-Lemaître-Robertson-Walker (FLRW) pode ser obtida partindo apenas dessas hipóteses. Uma derivação puramente geométrica desta métrica pode ser encontrada em Ishida (2006). A forma usualmente encontrada é dada por · ds = dt − a (t) 2 2 2 ¸ 1 2 2 2 2 2 dr + r (dθ + sen θdφ ) , 1 − kr2 (2.1) onde a(t) representa o fator de escala da expansão e t representa o tempo cósmico. O valor do parâmetro k indica a curvatura espacial do universo: k > 0 corresponde a uma curvatura positiva, k = 0 corresponde a uma curvatura espacial nula (universo plano) e k < 0 representa um espaço-tempo com curvatura espacial negativa. 2.2 O universo em expansão No início do século XIX, foram observadas as primeiras linhas espectrais provenientes de estrelas próximas. Em 1842, Johann Christian Doppler sugeriu que se um observador recebe radiação proveniente de uma fonte em movimento, o comprimento de onda medido será deslocado proporcionalmente à velocidade da fonte em relação ao observador (projetada ao longo da linha de visada), ou seja, − → → ∆λ v •− n = , λ c → − onde − v é a velocidade da fonte e → n é o vetor que liga o observador à fonte. (2.2) 8 CAPÍTULO 2. PRINCÍPIOS BÁSICOS Em 1868, William Huggins confirmou experimentalmente que as linhas espectrais de estrelas próximas se apresentavam ligeiramente deslocadas para as partes azuis ou vermelhas do espectro. Desta forma, era possível determinar a velocidade das estrelas ao longo da linha de visada, vr , utilizando z≡ ∆λ vr = , λ c (2.3) sendo z o desvio para o vermelho (caso a radiação esteja deslocada para o azul, este valor é negativo - a conexão entre o desvio para o vermelho e o fator de escala da expansão é apresentada no apêndice (A)). Com instrumentos cada vez melhores, foi possível medir o desvio espectral dos objetos mais brilhantes do céu. Os primeiros levantamentos de medidas deste efeito em estrelas mostravam uma distribuição aparentemente aleatória de desvios para o vermelho e para o azul. Entretanto, com o aumento no número de dados e maior variedade de objetos observados, verificou-se uma certa tendência em favor de desvios para o vermelho. Tal característica era encontrada principalmente em observações de nebulosas, indicando que em sua maioria, estas estavam se afastando de nós. Este foi o primeiro indício de que o universo se encontrava em expansão. A principal questão a se levantar neste ponto é: como compatibilizar o Princípio Cosmológico com um universo dinâmico? Para tanto, precisamos considerar um campo de velocidades que obedece a relação linear → − → v = H− r, (2.4) → → onde − v indica a velocidade de um corpo arbitrário na posição − r e H é uma constante de proporcionalidade. Um campo regido por esta relação é homogêneo, pois é invariante sob translação da origem do sistema de coordenadas utilizado. Poderíamos chegar a essa mesma conclusão através da análise da equação (2.1), onde a dependência temporal é apenas uma constante multiplicativa à seção espacial. Isto implica que em um universo descrito pela métrica de FLRW a dinâmica permitida se resume a um grau de liberdade: expansão ou contração. Logo, um estudo da dinâmica global se resume a uma análise sobre o fator de 2.2. O UNIVERSO EM EXPANSÃO 9 escala da expansão e suas derivadas (Quinet, 2007). Sendo assim, para que o universo respeite o Princípio Cosmológico, é preciso que a velocidade das galáxias ao longo da linha de visada, ou seu desvio para o vermelho, seja proporcional à distância medida a partir do observador. Edwin Hubble tentou verificar esta relação medindo distâncias através da variação no brilho de cefeidas e desvio para o vermelho de 18 galáxias. Seus resultados mostravam uma leve correlação linear entre velocidade e desvio para o vermelho, e foram publicados em 1929 (figura (2.1)). Com base nessas observações, ele concluiu que o universo se encontrava em uma expansão homogênea e foi o primeiro a apresentar uma estimativa para a constante de proporcionalidade H, hoje conhecida como parâmetro de Hubble. Ao longo deste trabalho, nos referimos ao parâmetro de Hubble através da expressão H = 100 h km/s/Mpc, (2.5) onde h é um parâmetro adimensional cujo valor se encontra no intervalo h = 0.74 ± 0.04 km/s/Mpc (Riess et al., 2009). Vale lembrar que a equação (2.4) é uma aproximação para baixos valores de z e consequentemente velocidades baixas se comparadas com a velocidade da luz. No tratamento de dados com altos valores de desvio para o vermelho, devemos inserir os efeitos relativísticos. Entretanto, sabemos que o resultado newtoniano deve ser recuperado para fontes próximas. Sendo assim, considere t0 o tempo presente e nossa galáxia localizada na origem do sistema de coordenadas, r = 0. Queremos medir o desvio para o vermelho de uma galáxia próxima que emitiu a luz que recebemos hoje no instante t0 − dt. No limite de baixos valores de dt, a distância entre o observador e a fonte, L, é dada por (Liddle, 2004) L ≈ dl = cdt, (2.6) utilizando os resultados apresentados no apêndice (A), sabemos que o desvio para o vermelho 10 CAPÍTULO 2. PRINCÍPIOS BÁSICOS Figura 2.1: Diagrama apresentado por Hubble. A escala no eixo horizontal representa 0, 1 e 2 Mpc e o eixo vertical indica 0, 500 e 1000 km/s. Hubble estimou a taxa de expansão em torno de 500 km/s/Mpc. Atualmente, sabemos que o valor correto se encontra em torno de 70 km/s/Mpc. Figura retirada de Hubble (1929). 2.2. O UNIVERSO EM EXPANSÃO 11 será z= a(t0 ) a(t0 ) 1 ȧ(t0 ) −1≈ −1= − 1 ≈ dt, ȧ(t0 ) a(t0 − dt) a(t0 ) − ȧ(t0 )dt a(t0 ) 1 − a(t 0) (2.7) onde o ponto denota a derivada temporal. Combinando as equações (2.6) e (2.7), temos z≈ ȧ(t0 ) L . a(t0 ) c (2.8) Logo, para baixos valores de desvio para o vermelho nós recuperamos a Lei de Hubble e o papel do parâmetro de Hubble é desempenhado por ȧ(t0 )/a(t0 ). Durante este trabalho, consideraremos sempre um universo com métrica tipo FLRW, e neste caso definiremos o parâmetro de Hubble diretamente como H(t) = ȧ(t) . a(t) (2.9) É natural que, a partir do momento em que descobrimos que o universo está se expandindo comecemos a nos questionar também a respeito da taxa desta expansão, ou seja, gostaríamos de determinar como o H(t) varia com o tempo. Isto pode ser feito através do parâmetro de desaceleração q(z). Considere uma expansão de Taylor do fator de escala ao redor do instante atual, 1 a(t) = a(t0 ) + ȧ(t0 )(t − t0 ) + ä(t0 )(t − t0 )2 + .... 2 (2.10) Dividindo ambos os lados por a(t0 ), temos a(t) q0 = 1 + H0 (t − t0 ) − H02 (t − t0 )2 + ..., a(t0 ) 2 (2.11) onde q0 é o valor do parâmetro de desaceleração para z = 0. No que segue, generalizamos 12 CAPÍTULO 2. PRINCÍPIOS BÁSICOS esta definição para um instante arbitrário, de modo que q(t) = − ä(t) . a(t)H 2 (t) (2.12) É fácil perceber que podemos obter a expressão para o parâmetro de desaceleração a partir do parâmetro de Hubble, d q(t) = dt µ 1 H ¶ − 1. (2.13) Esta relação entre q e H será importante para o trabalho aqui apresentado. Entretanto, é mais comum que a mesma seja expressa em função do desvio para o vermelho (z), e não em função do tempo cósmico. Fazendo uso novamente do resultado do apêndice (A), obtemos 1+z = 1 a ⇒ dt = − dz , (1 + z)H (2.14) onde utilizamos o fator de escala normalizado em relação ao valor atual, a0 = 1. Substituindo dt dado pela expressão acima na equação (2.13), podemos reescrever o parâmetro de Hubble de forma que ½Z z H(z) = H0 exp 0 ¾ 1 + q(v) dv . 1+v (2.15) Esta será a expressão básica a que vamos nos referir no restante desta tese. Na próxima seção, vamos utilizar a forma da métrica dada pela equação (2.1) para construir as definições de distância. Tais definições serão baseadas no parâmetro de Hubble, o que nos permitirá realizar uma conexão entre o parâmetro de desaceleração os dados observacionais. 2.3 Distâncias em Cosmologia A definição de distâncias em cosmologia requer uma certa reflexão. Consideremos primeiramente a distância até uma galáxia remota. Devido ao fato da velocidade da luz ser finita 2.3. DISTÂNCIAS EM COSMOLOGIA 13 (c), a luz que recebemos de tal galáxia foi emitida quando o universo era mais jovem. Logo quando olhamos para objetos distantes, nós os vemos como eles eram em tempos remotos no universo. Dado que o universo está se expandindo, isso também implica que no momento da emissão a distância própria era menor. Assim sendo, precisamos definir o que significa distância a um determinado objeto. Na realidade, existem várias maneiras diferentes de definir a distância de uma fonte a partir da radiação que chega até nós. Apresentamos algumas delas a seguir. 2.3.1 Distância Comóvel Considere um observador na origem do sistema de coordenadas que recebe hoje (t0 ), um sinal emitido por uma fonte em (r, θ, φ) no instante t. A radiação terá percorrido uma geodésica radial nula com θ e φ constantes. Com essas condições e utilizando a equação (2.1), obtemos que: dχ ≡ dt dr = −√ . a(t) 1 − kr2 (2.16) Integrando a equação anterior, obtemos: Z t0 χ= t dt = a(t) Z r 0 arcsen(r √ k √ k) se k > 0 dr √ = r se k = 0 . 1 − kr2 √ −k) arcsenh(r √ se k < 0 −k A distância comóvel, dC , entre a fonte e o observador é definida como χ vezes o valor atual do fator de escala. É importante ressaltar que da maneira como foi definida, a dC da fonte não muda com o tempo, mas continua a mesma durante todas as etapas da expansão. Assim, 14 CAPÍTULO 2. PRINCÍPIOS BÁSICOS Z dC = a0 χ = a0 Z t dC = t0 t0 dt = a0 a(t) t dz . H(z) Z t0 t da , ȧ a (2.17) (2.18) onde utilizamos a equação (2.14) para obter (2.18). 2.3.2 Distância de Diâmetro Angular Quando olhamos para um objeto no céu, nós não vemos seu tamanho real, mas seu diâmetro angular. Na geometria Euclidiana, o tamanho angular de um objeto, dθ é relacionado ao seu tamanho real l e à sua distância através da relação dθ = dl . r (2.19) Lembrando que z ≈ v/c e v = Hr, podemos facilmente encontrar a relação entre diâmetro angular e desvio para o vermelho em um espaço Euclidiano, dθ = H dl . c z (2.20) Na RG, partirmos da métrica de FLRW (equação (2.1)) para encontrar a relação entre o tamanho próprio e o diâmetro angular de um objeto. Para tanto, considere δ o diâmetro angular observado na origem (r = 0) de uma fonte que possui diâmetro próprio D localizada em r (coordenada comóvel) e cuja radiação, observada hoje (t = 0), foi emitida no instante t. Considerando δ ¿ 1 temos, δ= D , ra(t) (2.21) em analogia à definição de diâmetro angular na geometria Euclidiana (equação (2.19)), a 2.3. DISTÂNCIAS EM COSMOLOGIA 15 distância de diâmetro angular é definida como: dA ≡ D = a(t)r = a0 r(1 + z)−1 , δ (2.22) onde novamente utilizamos a equação (2.14). 2.3.3 Distância de Luminosidade e o Sistema de Magnitudes A distância de luminosidade, dL , relaciona o fluxo medido em nosso detector (energia por unidade de tempo por unidade de área) com a luminosidade (energia total por unidade de tempo) emitida por uma fonte distante (Misner, Thorne & Wheeler, 1973). Isto é melhor visualizado se imaginarmos um objeto irradiando no centro de uma esfera, de raio comóvel r0 , com detectores na superfície da esfera. O raio físico da esfera será a0 r0 , e a área da superfície total 4πa20 r02 . Em um espaço estático, o fluxo de radiação recebido será simplesmente F = L/4πa20 r02 . Contudo, vivemos em um universo em expansão, o que afeta os fótons durante seu deslocamento entre a fonte e o observador. Dois efeitos ocorrem neste contexto: 1. Cada fóton deixa a fonte com energia hν1 e atinge o observador com energia hν0 = hν1 /(1 + z1 ); 2. O intervalo de tempo entre os dois fótons no momento da emissão era de δt1 e no momento da detecção este intervalo será δt0 = δt1 /(1 + z1 ). Combinando os dois efeitos, o fluxo recebido será F = L 4πa20 r02 (1 + z)2 , (2.23) a fim de manter a analogia com o resultado Euclidiano, a distância de luminosidade é definida como dL = a0 r0 (1 + z). (2.24) 16 CAPÍTULO 2. PRINCÍPIOS BÁSICOS Figura 2.2: Representação esquemática dos elementos envolvidos no cálculo da distância de diâmetro angular. Figura retirada de Weinberg (1971). 2.3. DISTÂNCIAS EM COSMOLOGIA 17 Assim, usando a equação (2.18) em um universo plano, obtemos finalmente: Z z dL = (1 + z)dC = (1 + z) 0 dz 0 . H(z 0 ) (2.25) Uma forma mais antiga de abordar o efeito descrito na definição da distância de luminosidade nos leva à origem do sistema de medida de brilho utilizado atualmente. Muito antes dos modernos telescópios, os gregos já classificavam as estrelas de acordo com o seu brilho. Essa primeira classificação deu origem ao chamado sistema de magnitudes que ainda hoje é utilizado nas definições de distância de experimentos modernos. Neste sistema a magnitude aparente bolométrica (em todos os comprimentos de onda observados), m, é definida com base em uma estrela escolhida como ponto de referência. Atualmente, consideramos como referência a estrela Vega cuja magnitude aparente é definida como nula. Uma estrela mais brilhante do que Vega tem magnitude aparente negativa e, analogamente, uma menos brilhante terá magnitude aparente positiva. Matematicamente, a definição é dada por: m = −2.5 log10 F , Fα (2.26) onde F e Fα representam os fluxos (energia por unidade de tempo por unidade de área medidos no detector) da estrela em questão e de α-Centauri, respectivamente. Utilizaremos também a Magnitude Absoluta (M ), definida como a magnitude que a fonte apresenta quando se encontra a uma distância de 10 pc. Neste caso, ¡ F10 consequentemente, ¢ 4πd2L µ ¶2 dL L = =F , = 4π(10pc)2 4π(10pc)2 10pc L 4πd2L (2.27) 18 CAPÍTULO 2. PRINCÍPIOS BÁSICOS M = −2.5 log10 F10 F = −2.5 log10 − 2.5 log10 Fα Fα dL M = m − 5 log10 . 10pc µ dL 10pc ¶2 , (2.28) (2.29) Usualmente, este resultado é escrito na forma: m = 5 log10 dL cH0−1 + 5 log + M − 5, 10 1pc cH0−1 m = 5 log10 DL + M. (2.30) (2.31) onde a quantidade M é chamada intercept ou magnitude de ponto zero e DL a distância de luminosidade em unidades de (cH0−1 ). A quantidade (M − m) é chamada módulo de distância. Utilizando a parametrização apresentada na equação (2.5), podemos escrever o intercept como: M = 5 log10 2.9979 × 105 × 106 + M − 5, 100h M = −5 log10 h + M + 42.3841. (2.32) (2.33) Logo, ao observarmos uma determinada fonte podemos obter através da análise da radiação emitida, a magnitude aparente e seu desvio para o vermelho. Se considerarmos apenas fontes cujas magnitudes absolutas nos sejam conhecidas, a magnitude aparente estará relacionada à distância e consequentemente ao tempo transcorrido desde que a luz deixou a fonte até hoje, enquanto o desvio para o vermelho trará informações sobre a expansão total experimentada pelo universo neste intervalo de tempo. As definições apresentadas até aqui representam boa parte da base teórica necessária para implementar nossos estudos sobre a dinâmica global do universo. Entretanto, precisa- 2.4. O MODELO PADRÃO DA COSMOLOGIA 19 mos também comparar nossos resultados com aqueles encontrados na literatura. Principalmente, precisamos entender quais hipóteses fazem parte do modelo padrão atual. Para tanto, apresentamos na seção seguinte uma rápida revisão sobre o Modelo Padrão da Cosmologia. 2.4 O Modelo Padrão da Cosmologia O conhecimento adquirido até o momento em relação ao comportamento global do universo forma um quadro consistente que chamamos Modelo Padrão da Cosmologia. Este modelo tem como base algumas hipóteses fundamentais (Quinet, 2007; Peebles, 1993): • O Princípio Cosmológico é uma boa descrição do universo em grandes escalas; • As leis da física que experimentamos localmente são válidas em qualquer ponto do espaço-tempo; • A RG é adequada para descrever as propriedades do universo em grandes escalas. A partir destas hipóteses, é possível demonstrar que a geometria do espaço-tempo pode ser descrita pela métrica de FLRW (equação (2.1)). Um universo homogêneo e isotrópico implica que o seu conteúdo material pode ser aproximado por um fluido perfeito, cujo tensor energia-momento é dado por T µν = (ρ + p)uµ uν − pg µν onde uα = dxα dτ (2.34) é o quadri-vetor velocidade em coordenadas comóveis, tal que uα = (1, 0, 0, 0) e uα uα = 1, ρ é a densidade de energia e p a pressão relacionadas ao conteúdo material do universo (matéria e radiação). 20 CAPÍTULO 2. PRINCÍPIOS BÁSICOS De posse de tais definições, o tensor energia-momento pode ser escrito como T µν 0 0 ρ 0 0 −p 0 0 = 0 0 −p 0 0 0 0 −p . A pressão e a densidade podem, em geral, ser relacionadas por uma equação de estado, p = p(ρ). Sendo que cada componente terá uma equação de estado própria. Para todos os tipos de constituintes materiais considerados neste trabalho, pi = wi ρi , (2.35) onde o índice i corresponde aos diferentes componentes do tensor energia-momento e wi é chamado Parâmetro da Equação de Estado. Para o caso de poeira (bárions ou matéria escura), wp = 0 e para radiação, wrad = 1/3. O tensor energia-momento deve obedecer à equação de conservação, ∇ν T µν = 0, ou seja, ȧ ρ̇ + 3 (ρ + p) = 0, a (2.36) onde o ponto representa a derivada em relação ao tempo cósmico. 2.4.1 Equações de Einstein Estamos agora prontos para relacionar o conteúdo energético do universo ao espaçotempo, encontrando leis que regem a interação entre os mesmos. Isso será feito a partir da aplicação da métrica de FLRW e do tensor energia-momento apropriado às equações de Einstein, dadas por: 1 Rµν − Rgµν = 8πGTµν + Λgµν , 2 (2.37) 2.4. O MODELO PADRÃO DA COSMOLOGIA 21 onde Rµν é o tensor de Ricci, R o escalar de curvatura e Λ a constante cosmológica. As componentes do tensor de Ricci são dadas por: ä R00 = 3 = −4πG(ρ + p) + Λ a (2.38) R0i = 0 (2.39) Rij = − gij [2k + (aä + 2ȧ2 )] = 4πGgij (p − ρ) + gij Λ, a2 (2.40) utilizando estas expressões, a métrica de FLRW e a equação (2.34) na equação (2.37), temos: µ ¶2 ȧ 8πG k Λ H = = ρ− 2 + a 3 a 3 (2.41) ä 4πG Λ =− (ρ + 3p) + . a 3 3 (2.42) 2 A expressão (2.41) é chamada equação de Friedman e a equação (2.42) é conhecida como equação da aceleração. Nessas expressões, a densidade e a pressão correspondem a todo o conteúdo material do universo. Caso este possua mais de uma componente, ρ e p devem ser substituídos por suas respectivas somatórias sobre os constituintes em questão. 2.4.2 ΛCDM As equações (2.36), (2.41) e (2.42) formam um conjunto de equações acopladas onde apenas duas são independentes. A fim de que possamos encontrar uma solução para este sistema, precisamos de outra expressão que relacione p, ρ e a. Para este fim, usaremos a equação de estado (equação (2.35)), que deve ser determinada a partir das propriedades de cada fluido. É importante, neste momento, definir a densidade crítica, que servirá como base para a comparação entre as contribuições de cada componente para a densidade de energia total do 22 CAPÍTULO 2. PRINCÍPIOS BÁSICOS universo. Esta é obtida a partir da equação (2.41) dividida por H 2 : 1= k Λ 8πG ρ− 2 2 + . 2 3H aH 3H 2 (2.43) A densidade crítica é definida como a densidade total de energia em um universo com curvatura nula e sem constante cosmológica, logo, ρcr = 3H 2 . 8πG (2.44) Dados provenientes de curvas de rotação em galáxias espirais e lentes gravitacionais indicam que matéria não relativística (p = 0), que se aglomera, contribui com aproximadamente 30% da densidade crítica de energia. Por outro lado, a nucleossíntese primordial impõe que apenas 5% da densidade crítica pode ser constituída por matéria bariônica. É usual em cosmologia, considerar que os 25% restantes provém de algum tipo de matéria escura (não relativística) não-bariônica. Estes resultados somados a análises da anisotropia da radiação cósmica de fundo, as quais indicam que o nosso universo possui, em boa aproximação, curvatura espacial nula, nos levam a concluir que cerca de 70% do conteúdo do universo é formado por uma componente de natureza desconhecida, uniformemente distribuída e com pressão negativa, que de acordo com as observações atuais, se comporta como um tipo de constante cosmológica (Steinhardt, Wang, & Zlatev, 1999). Esse componente é chamado energia escura. Logo, o atual modelo cosmológico padrão, considera o universo homogêneo e isotrópico, constituído basicamente por matéria escura, CDM (do inglês, Cold Dark Matter ), matéria bariônica, fótons, neutrinos e energia escura com w = cte = −1 (Λ). Isso nos permite descrever a história da evolução do universo de acordo com algumas quantidades, ou parâmetros básicos. São eles: • o parâmetro de Hubble, H ≡ ȧa ; 2.4. O MODELO PADRÃO DA COSMOLOGIA 23 • o parâmetro de desaceleração, q ≡ − aHä 2 ; • o parâmetro da equação de estado, wi ≡ pi ; ρi • o parâmetro de densidade da matéria (bárions + matéria escura), Ωm ≡ • o parâmetro de densidade da radiação (fótons + neutrinos), Ωr ≡ ρr ; ρcr • o parâmetro de densidade associado à curvatura do espaço, Ωk ≡ k ; a2 H 2 • o parâmetro de densidade associado à CC, ΩΛ ≡ ρm ; ρcr Λ . 3H 2 Utilizando estas definições, a equação (2.43) se torna Ωm + Ωr + Ωk + ΩΛ = 1. (2.45) Para que possamos descrever o comportamento de cada um dos componentes do universo, devemos resolver a equação (2.36) para cada um, separadamente. Logo, em se tratando de matéria não relativística (bárions e matéria escura), p ≈ 0 → wm = 0, consequente- mente, ρ̇m ȧ = −3 . ρm a (2.46) Integrando a expressão acima, obtemos: µ ρm (t) = ρm0 a(t0 ) a(t) ¶3 , (2.47) 24 CAPÍTULO 2. PRINCÍPIOS BÁSICOS No caso da radiação, pr = 13 ρr , ou seja wr = 1/3, logo, ρr = ρr0 ³ a ´4 0 a . (2.48) O modelo ΛCDM representa a forma mais simples de energia escura, descrita por w = −1 na equação (2.35). Utilizando este fato na equação (2.36), concluímos que a densidade de energia da energia escura (ρΛ ) não depende do tempo (e consequentemente também não depende de a). Utilizando a equação (2.7), a equação (2.41) neste caso é dada por: H2 = 2 H(z) = 8πG k Λ (ρm + ρΛ + ρr ) − 2 + , 3· a 3 H02 ¸ Ωm0 (1 + z) + Ωr0 (1 + z) + Ωk0 (1 + z) + ΩΛ . 3 4 2 (2.49) De posse da expressão para o parâmetro de Hubble, podemos enfim definir distâncias de acordo com as expressões da seção (2.3). Este modelo representa atualmente o melhor ajuste aos dados observacionais. No que segue, utilizaremos como modelo fiducial em nossas simulações o modelo ΛCDM plano com Ωm = 0.23. Capítulo 3 Dados Observacionais No capítulo anterior descrevemos a base teórica das idéias que serão descritas detalhadamente nos capítulos (4) e (5). Neste capítulo, discutimos os observáveis que utilizaremos em nossas aplicações. Descrevemos brevemente as supernovas como fenômenos astrofísicos, o uso das mesmas em cosmologia e os conjuntos de dados utilizados nesse trabalho. Da mesma forma, descrevemos o uso de medidas da BAO e detalhamos a simulação cujos resultados são apresentados mais adiante. 3.1 Supernovas Ia Explosões estelares estão entre os eventos mais energéticos e violentos do universo. O aparecimento de objetos nunca antes observados no céu noturno, ou do latim stellae novae, são relatados em documentos astronômicos chineses e coreanos de idade milenar 1 . A nova estrela que apareceu em Cassiopéia em 1572 foi observada por Tycho Brahe. Baseado na ausência de medidas de paralaxe, ele concluiu que a mesma deveria se encontrar além do sistema solar, e consequentemente não se encaixava na descrição ptolomaica do universo. Aproximadamente 150 anos depois, Lundmark (1925) foi o primeiro a sugerir a existência de duas classes de nova, onde a diferença de brilho entre as mesmas seria da ordem de 10 magnitudes. Ele baseou sua teoria, em grande parte, na observação da SN1885A2 que apre1 Para um relato histórico muito bem escrito sobre a observação de supernovas até fins da década de 80 do século passado, assim como para mais detalhes sobre os eventos citados neste texto, ver Marshall (1988). 2 De acordo com a convenção atualmente utilizada, supernovas são nomeadas como SNXXXXY, onde 25 26 CAPÍTULO 3. DADOS OBSERVACIONAIS sentava essa diferença de magnitude em relação a um outro conjunto de aproximadamente 20 outras novae também observadas na galáxia de Andromeda. Acredita-se que ele também foi o primeiro a sugerir o nome supernova (Lundmark, 1932). A classificação moderna dos eventos conhecidos como supernovas é baseada em resultados de observações espectroscópicas ao redor do máximo de emissão (ver Filippenko (1997)). A presença de linhas de hidrogênio no espectro define uma supernova do tipo II, e a ausência de tais linhas indicam que a supernova é do tipo I. Existe ainda uma subdivisão das supernovas do tipo I, aquelas que têm uma linha proeminente de Si II são chamadas supernovas Ia (SNIa) e aquelas que não apresentam silício são chamadas supernovas Ib/c. A diferença entre os tipos Ib e Ic se encontra na presença ou ausência de linhas de hélio, respectivamente. Uma visão esquemática dessa classificação é mostrada na figura (3.1). Esta figura também lista exemplos típicos de cada subclasse. O significado físico dessa classificação está diretamente ligado aos sistemas progenitores de cada evento. SNIa são geradas a partir de explosões termonucleares de objetos que esgotaram suas reservas de hidrogênio ao longo de sua evolução. Logo, não encontramos traços desse elemento na explosão. Outros tipos de supernovas vêm de explosão de estrelas solitárias (core-collapse) e mais jovens, que ainda possuem traços de hidrogênio entre seus componentes. O modelo mais aceito para explicar a explosão de uma SNIa considera um sistema progenitor binário, composto por uma anã branca que recebe matéria de uma estrela doadora. Essa transferência de matéria ocorre até que a anã branca atinja o limite de massa de Chandrasekhar. Nesse limite, a pressão gravitacional não é suficiente para balancear a pressão de radiação e ocorre a explosão, que libera uma imensa quantidade de energia em um intervalo curto de tempo (∼ 1051 ergs/s). O material ejetado nessas explosões muitas vezes leva ao surgimento de nebulosas. Uma supernova pode aumentar a luminosidade da estrela que a gerou em até 1010 vezes a luminosidade do sol em alguns dias e após atingir seu brilho XXXX corresponde ao ano em que foram observadas e Y varia de A a Z para as primeiras 26 supernovas descobertas naquele ano. A partir da 27a , Y é substituído por letras minúsculas, sendo que para a 27a Y=aa, para a 28a Y=ab e assim por diante. Um exemplo clássico de como a nomenclatura é empregada é a supernova SN2006ub, que foi a 551a supernova descoberta em 2006. 3.1. SUPERNOVAS IA Figura 3.1: Diagrama da classificação de supernovas, retirado de Leibundgut (2005). 27 28 CAPÍTULO 3. DADOS OBSERVACIONAIS máximo, este decresce em alguns meses. Este cenário depende exclusivamente de parâmetros internos do sistema progenitor e teoricamente pode ocorrer em qualquer fase da evolução do universo após a formação das primeiras estrelas, dando origem à mesma quantidade de energia liberada em cada evento. Essa independência dos parâmetros cosmológicos nos leva a crer que as supernovas seriam velas-padrão, a partir das quais seria possível inferir distâncias em escalas cosmológicas. Apesar da aparente simplicidade com a qual descrevemos a formação de um evento como as SNIa, precisamos lembrar sempre que esta é apenas uma imagem qualitativa do que realmente ocorre. Atualmente não possuímos um modelo teórico eficaz capaz de reproduzir a potência observadas nas explosões, que chegam a ser mais brilhantes do que a própria galáxia hospedeira. Além disso, não existe um consenso sobre qual seria a estrela doadora (Branch et al., 1995; Livio, 2000). De fato, um cenário bastante estudado nos últimos anos considera os sistema progenitor binário, chamado duplo-degenerado, composto por duas anãs brancas que colidem formando um envelope único e a partir do qual a explosão termonuclear é deflagrada. Simulações desse tipo de evento, utilizando anãs brancas com massas da ordem de 0.9 M¯ , são o exemplo mais recente de sucesso na modelagem de SNIa (Pakmor et al., 2010). Entretanto, os autores deste trabalho chamam a atenção para o fato de que apenas foram capazes de gerar eventos com luminosidade muito baixa (p.e. SN1991bg) em comparação com a luminosidade média da amostra atualmente disponível. Talvez como consequência dessa “ignorância” em relação ao sistema progenitor, as curvas de luz (magnitude como função do tempo) apresentadas pelas SNIa não são tão similares entre si quanto esperaríamos. Existe uma correlação entre o brilho no máximo da emissão e o tempo de decaimento que nos permite “padronizar” as curvas de luz. SNIa mais brilhantes possuem um tempo de decaimento maior e SNIa menos brilhantes decaem mais rapidamente. Por esse motivo, as SNIa são ditas “padronizáveis”. Ou seja, existe uma forma de levar em conta os erros e fatores que contribuem para a dispersão das curvas de luz de diferentes supernovas, de modo que as mesmas indiquem uma mesma magnitude absoluta 3.1. SUPERNOVAS IA 29 (o que corresponde a uma mesma potência total emitida), e consequentemente possam ser usadas como velas padrão. De posse do valor do fluxo medido em detectores terrestres e da radiação total emitida por uma SNIa, podemos inferir a distância a partir da medida de seu desvio para o vermelho e de um determinado modelo cosmológico. O método segundo o qual essa padronização deve ser efetuada também não é um consenso na comunidade científica. Existem vários trabalhos que tentam propor uma maneira coerente de se tratar as curvas de luz de modo a obter um valor verossímil para o brilho no máximo da emissão. Os dois métodos mais usados são: Multicolor Light-Curve Shape (MLCS2k2)(Jha, Riess, & Kirshner, 2007) e Spectral Adaptative Lightcurve Template (SALT2)(Guy et al., 2007). Ambos apresentam estruturas diferentes e os resultados não concordam plenamente entre si (Nesseris & Perivolaropoulos, 2005; Kessler et al., 2009), entretanto, os mesmos nos fornecem procedimentos fenomenológicos através dos quais somos capazes de medir distâncias em escalas cosmológicas. De posse de diferentes observações e processos de análise de dados e padronização das curvas de luz, em fins da década de 90, Riess et al. (1998) e Perlmutter et al. (1999) anunciaram pela primeira vez a detecção da expansão acelerada do universo. Neste trabalho, utilizaremos três conjuntos diferentes de observações de SNIa: • Gold182 Nós denominamos Gold182 o conjunto de dados compilado por Riess et al. (2007). Esse conjunto é composto por 182 supernovas, dentre elas 21 observadas com o telescópio espacial Hubble, em 1.0 < z < 1.7. O importante a se destacar aqui é o processo de padronização utilizado. Mesmo quando apresentam dados da literatura, os autores refazem o processo de padronização de acordo com o procedimento descrito em Jha, Riess, & Kirshner (2007) (MLCS2k2). Consequentemente, após o processo de padronização, a tabela final de dados consiste em valores de desvio para o vermelho, módulo de distância e os respectivos erros nessas duas quantidades. 30 CAPÍTULO 3. DADOS OBSERVACIONAIS • SNLS Chamamos SNLS, o conjunto de dados compilados por Astier et al. (2006), composto por 115 SNIa com z < 1.0, observadas como parte do Supernova Legacy Survey. Dentre estas, 71 foram observadas com o Canada-France-Hawaii Telescope (CFHT), e o restante são SNIa presentes também no Gold182. Neste trabalho, a padronização das curvas de luz foi feita de acordo com o procedimento proposto por Guy et al. (2005) (SALT). Logo, os dados após a padronização incluem o desvio para o vermelho, a magnitude aparente na banda B (∼ 450 nm) e mais outras duas quantidades, s e c, que correspondem à correções devido à forma (stretch) e à cor (diferença de magnitudes em diferentes bandas) da curva de luz, respectivamente. • SDSS Por fim, denominamos SDSS o conjunto de dados apresentados por Kessler et al. (2009), composto por 288 SNIa com z < 1.6. Dentre estas, 108 SNIa foram observadas como parte do Sloan Digital Sky Supernova Survey (Frieman et al., 2008). As demais supernovas são uma compilação de dados apresentados em Wood-Vasey et al. (2007), Astier et al. (2006) e Gold182. Neste caso, os dados são apresentados nas duas formas: de acordo com MLCS2k2 assim como na forma de SALT2 (uma versão atualizada de SALT proposta por Guy et al. (2007), que gera as mesmas quantidades após a padronização). 3.2 Oscilações Acústicas de Bárions Além de velas padrão (papel desempenhado pelas SNIa em cosmologia), outra maneira utilizada para medir distâncias é a utilização de réguas padrão. O exemplo clássico dessa aplicação é o fato de que calculamos a nossa distância em relação a um objeto cujo tamanho conhecemos (uma pessoa, por exemplo) através da comparação entre o seu tamanho real e o tamanho angular subtendido quando esse objeto se encontra a uma certa distância de nós. 3.2. OSCILAÇÕES ACÚSTICAS DE BÁRIONS 31 Quanto mais distante a pessoa estiver, menor nos parecerá. A mesma idéia pode ser aplicada em cosmologia, com o agravante de que o espaço pode ser curvo. É como se estivéssemos observando a pessoa através de uma lente. Neste contexto, não sabemos se a pessoa está pequena por estar distante ou porque a imagem está sendo distorcida pela lente. Entretanto, a curvatura do espaço não é o maior problema quando se trata de aplicações cosmológicas dessas idéias . Nesse caso, o grande problema é que não sabemos qual o tamanho real de objetos extragalácticos3 . Para que o conceito de régua padrão possa ser utilizado em cosmologia, precisamos de um objeto cujo tamanho podemos determinar em um certo valor de desvio para o vermelho ou que dependa do desvio para o vermelho de uma forma conhecida. Esse é o caso das BAO. Antes da recombinação e desacoplamento, o universo era composto por um plasma quente, onde fótons e bárions estavam fortemente acoplados formando um único fluido. Consideremos uma perturbação esférica neste fluido formado por matéria escura, neutrinos e o fluido bárions-fótons. Devido à baixa velocidade do som e temperatura, a perturbação na matéria escura não se propaga. Devido à sua alta velocidade e baixa seção de choque os neutrinos rapidamente se desacoplam, e a perturbação nos mesmos tende a diluir-se. No fluido fótons-bárions, estas oscilações se propagam como uma onda acústica com velocidade c cs = r ³ 3 1+ 3ρb ργ ´, (3.1) onde ρb representa a densidade de bárions e ργ a densidade de fótons, afastando-se da origem onde existe uma maior concentração de matéria. Na recombinação, quando a temperatura do universo chega a ≈ 0.3 eV, os bárions formam átomos neutros e os fótons se desacoplam, formando o que hoje observamos como RCF. Após esse desacoplamento, a pressão de radiação sobre os bárions desaparece e consequentemente, a velocidade do som se torna desprezível, ou seja, a perturbação nos bárions é congelada. Através da interação gravitacional entre os bárions e a matéria escura, ambos tenderão a se aglomerar nesta escala. 3 A descrição apresentada nesta seção foi baseada em Bassett & Hlozek (2009) 32 CAPÍTULO 3. DADOS OBSERVACIONAIS Podemos medir a escala de aglomeração de estruturas através da função de correlação de dois pontos, ξ(r), que quantifica o excesso de aglomeração em uma determinada escala em relação a um fundo homogêneo com a mesma densidade média. Em outras palavras, dada a posição de uma determinada galáxia, a função de correlação nos dirá qual a probabilidade de encontrarmos outra galáxia dentro de um raio r0 centrado na galáxia inicial. Esta função de correlação pode ser descrita aproximadamente por uma lei de potências (Totsuji & Kihara, 1969), ξ(r) ∝ ³ r ´γ 0 r , (3.2) onde r0 ≈ 5h−1 Mpc−1 . Uma escala característica de aglomeração de galáxias irá aparecer como um pico ou vale na função de correlação, caso exista um excesso ou escassez de galáxias em uma determinada escala, respectivamente. Essa mesma característica também estará presente no espectro de potência, que é dado pela transformada de Fourier da função de correlação, ou seja, Z ∞ P (k) = ξ(r) exp(−ikr)r2 dr. (3.3) −∞ Podemos ver a relação entre essas duas funções na figura (3.2). Uma função δ em uma escala r∗ na função de correlação (painel esquerdo) resultará em uma série de oscilações no espectro de potência (painel direito). Essas são as BAO. Consideremos o caso onde uma galáxia se formou no centro da perturbação inicial, usando esta galáxia como o ponto de partida para a medida de r0 na equação (3.2), encontraríamos um bump a uma distância s do centro. Essa escala corresponde à distância percorrida pelas perturbações no fluido fótons-bárions até o desacoplamento, chamada horizonte acústico, e depende da densidade de bárions e fótons de acordo com (Eisenstein & White, 2004) Z ∞ s= zrec onde R = 3ρb 4ργ 1 cs dz 2c √ =p ln 2 H(z) Ωm H0 3zrec Rrec "√ # p 1 + Rrec + Rrec + Req p , 1 + Req (3.4) ∝ Ω2b h/(1 + z) é proporcional à razão bárions-fótons, zeq = Ωm /Ωrad é o desvio 3.2. OSCILAÇÕES ACÚSTICAS DE BÁRIONS 33 para o vermelho na equipartição entre matéria e radiação e rec se refere à recombinação. A RCF impõe fortes vínculos sobre a densidade de matéria escura e bárions no desacoplamento, o que nos permite calcular o horizonte acústico como s = 146.8 ± 1.8 Mpc (Komatsu et al., 2009). É importante ressaltar que na realidade, existiram muitas dessas perturbações, nos concentramos em uma delas a fim de simplificar a descrição. Por outro lado, como as perturbações são variações pequenas na densidade média do fluido primordial, o efeito final de várias perturbações será uma combinação linear dos efeitos individuais. A distância característica que a perturbação no fluido fótons-bárions percorreu até o desacoplamento, também chamada horizonte acústico, resultará em uma escala de sobredensidade na distribuição de bárions. Consequentemente, existe uma probabilidade maior de uma galáxia se formar na região de sobredensidade distante ≈ 150 Mpc da perturbação inicial do que, por exemplo, em 130 ou 180 Mpc (Abramo et al., 2009). Este efeito é melhor visualizado através da figura (3.3)4 . Nessa figura, o perfil de massa (densidade×raio2 ) está normalizado de modo que curvas da mesma altura indicam perturbações igualmente proporcionais nos diferentes fluidos. O eixo horizontal representa o tamanho da perturbação em coordenadas comóveis. Em valores bastante altos de desvio para o vermelho (z À 1000), a matéria ordinária estava acoplada em um fluido primordial, onde fótons, bárions, neutrinos e matéria escura interagiam entre si. Adicionemos agora uma única perturbação esférica na densidade desse fluido (linha 1-coluna 1). Esta perturbação se propaga como uma onda sonora no fluido primordial. Conforme o universo se expande e resfria, os neutrinos são os primeiros a desacoplarem, pois possuem seção de choque extremamente baixa e não são aprisionados gravitacionalmente. A matéria escura interage apenas gravitacionalmente e tem velocidade não significativa (é chamada matéria escura fria porque a temperatura no momento do desacoplamento era muito menor do que a energia de repouso), logo o perfil de matéria escura é "congelado". A perturbação tem o papel de uma sobredensidade, que atrai mais matéria escura para seu centro. Os fótons e bárions estão aprisionados em um plasma ionizado, no qual a perturbação se propaga como 4 A descrição a seguir, assim como a figura (3.3), foram extraídas de http://cmb.as.arizona.edu/∼eisenste/acousticpeak/acoustic_physics.html 34 CAPÍTULO 3. DADOS OBSERVACIONAIS uma onda sonora com velocidade dada pela equação (3.1), afastando-se da origem (figura (3.3), linha 1-coluna 2). A perturbação no fluido de neutrinos é a primeira a ser diluída devido à sua característica relativística e baixa seção de choque, e ao mesmo tempo mais matéria escura continua a ser agregada ao centro da perturbação, o que faz com que o perfil de massa adquira uma largura maior (figura (3.3), linha 2-coluna 1). Assim que a temperatura baixa o suficiente para que os elétrons e prótons possam formar átomos neutros, ou seja, quando a temperatura é ≈ 0.3 eV, os fótons se desacoplam e a perturbação na radiação se separa da perturbação nos bárions (figura (3.3), linha 2- coluna 2). Assim como os neutrinos fizeram, os fótons agora podem se propagar livremente pelo universo, o que dá origem à RCF observada atualmente. Sem a interação com os fótons, a pressão de radiação que existia sobre os bárions desaparece e a perturbação se mantém estacionada (figura (3.3), linha 3-coluna 1). Nos resta agora uma sobredensidade de matéria escura ao redor do centro da perturbação inicial e uma sobredensidade de bárions a um raio de ≈ 150 Mpc. Com o passar do tempo, a interação gravitacional entre essas duas regiões de sobredensidade faz com que as diferenças entre as mesmas diminuam: as perturbações começam a se misturar (figura (3.3), linha 3-coluna 2). Eventualmente, elas tendem ao mesmo perfil, ou seja, a perturbação nos bárions deixa uma assinatura no perfil da matéria escura. Ao mesmo tempo, como a quantidade de matéria escura é muito maior do que a quantidade de bárions, o pico da perturbação ao redor do ponto inicial é mais evidente do que o pico correspondente à flutuação nos bárions (figura (3.3), linha 4-coluna 1). Entretanto, enfatizamos que até o momento a figura (3.3) mostrou o perfil de massa. O perfil de densidade é muito mais íngreme. A sobredensidade em 150 Mpc é de apenas ≈ 1% daquela ao redor da origem (figura (3.3), linha 4-coluna 2). No decorrer da história de evolução do universo, estruturas em grandes escalas têm maior probabilidade de serem formadas em regiões que apresentam sobredensidades em bárions e em matéria escura. Vale enfatizar que a escala a que nos referimos até o momento corresponde à distância comóvel percorrida pela perturbação até o desacoplamento. Na realidade, em um levanta- 3.2. OSCILAÇÕES ACÚSTICAS DE BÁRIONS 35 mento de galáxias cada intervalo de desvio para o vermelho, ∆z, corresponderá a uma escala característica de aglomeração. A figura (3.4), demonstra esquematicamente este efeito. Sabemos o tamanho comóvel do raio correspondente à escala de aglomeração, logo, podemos relacionar as medidas de escalas ao longo e transversalmente à linha de visada utilizando as expressões c∆z , sk (z) s⊥ (z) dA (z) = . ∆z(1 + z) H(z) = (3.5) (3.6) 36 CAPÍTULO 3. DADOS OBSERVACIONAIS Figura 3.2: Figura esquemática que representa o par ξ(r∗), P (k). Um pico estreito na função de correlação (painel esquerdo), corresponde a uma série de oscilações em P (k) (painel direito). O pico acústico na função de correlação dos bárions se manifestará como uma série de Oscilações Acústicas de Bárions no espectro de potência. Figura retirada de Bassett & Hlozek (2009). 3.2. OSCILAÇÕES ACÚSTICAS DE BÁRIONS 37 Figura 3.3: Diagrama que descreve o desacoplamento do plasma primordial, composto por matéria escura (curva preta), bárions (curva azul), fótons (cuva vermelha) e neutrinos (curva verde). Os painéis descrevem o perfil de densidade de energia de acordo com o desvio para o vermelho (proporcional ao resfriamento do conteúdo material do universo). Figura retirada de Eisenstein (2005). 38 CAPÍTULO 3. DADOS OBSERVACIONAIS Figura 3.4: O tamanho de um objeto ao longo da linha de visada é dado por cdz/H(z), onde dz é a diferença em desvio para o vermelho entre a parte anterior e posterior do objeto. O tamanho na direção perpendicular à linha de visada é dado por dA (z)θ, sendo θ seu tamanho angular. Como podemos teoricamente determinar o raio dessa escala de aglomeração através das BAO, podemos então determinar dA (z) e H(z) separadamente. Figura retirada de Bassett & Hlozek (2009). 3.2. OSCILAÇÕES ACÚSTICAS DE BÁRIONS 39 Sendo assim, através do mapeamento de uma parte grande do céu, podemos verificar a existência dessa pequena sobredensidade de matéria tanto na direção radial (∝ 1/H(z)) quanto na direção perpendicular à linha de visada (∝ dA (z)). Combinando essas medidas com resultados da escala da perturbação inicial obtida a partir da RCF, podemos obter as quantidades H(z) e dA (z) independentemente (Abramo et al., 2009). O uso de BAO para encontrar vínculos sobre os parâmetros cosmológicos foi primeiramente proposto por Eisenstein, Hu & Tegmark (1998). Entretanto, uma análise mais detalhada de como essa sugestão seria aplicada a dados reais foi apresentada em Blake & Glazebrook (2003), Blake & Glazebrook (2003), entre outros. Entretanto, os primeiros resultados positivos de detecção deste efeito tiveram que esperar experimentos como o SDSS (Eisenstein et al., 2005) e do 2 Degree Field Galaxy Redshift Survey (2dF)(Cole et al., 2005), que rapidamente impuseram vínculos fortes sobre a densidade da matéria e curvatura. Mostramos na figura (3.5), a função de correlação encontrada a partir de dados do SDSS juntamente com o modelo teórico para Ωm h2 = 0.12, 0.13 e 0.14 (curvas verde, vermelha e azul, respectivamente). Em todos esses modelos, Ωb = 0.024. A curva rosa representa um universo sem bárions, Ωb = 0. Nos próximos capítulos, nós utilizamos medidas de BAO em duas formas diferentes: • Sk /Dv No capítulo 4, nós utilizamos medidas de BAO de acordo com a prescrição apresentada por Percival et al. (2007). Neste trabalho, os autores utilizam a razão entre a distância à superfície de último espalhamento (Sk (zls = 1098)) e a escala de distância às BAO (Dv (zBAO )) em zBAO = 0.2 e zBAO = 0.35. Este observável é ideal ao nosso propósito, pois depende exclusivamente da razão H(z)/H0 . • SKA No capítulo (5), mostramos resultados baseados em simulações de medidas de H(z) 40 CAPÍTULO 3. DADOS OBSERVACIONAIS Figura 3.5: Pico acústico na função de correlação encontrado na amostra de dados do SDSS Luminous Red Galaxy Survey. A altura do pico é sensível à densidade de matéria. As curvas verde, vermelha e azul representam a função de correlação para Ωm h2 = 0.12, 0.13 e 0.14, respectivamente. Em todos os casos, Ωb h2 = 0.024. A linha rosa representa o modelo sem bárions Ωb = 0. Figura retirada de Eisenstein et al. (2005). 3.2. OSCILAÇÕES ACÚSTICAS DE BÁRIONS 41 e dA (z), para diferentes estágios de um experimento como o SKA5 , de acordo com a simulação realizada por Abdalla, Blake, & Rawlings (2009). O SKA é um projeto de um arranjo de rádio telescópios que têm o objetivo de rastrear a presença de linhas de emissão HI em diferentes partes do céu. Como a maior parte da matéria no universo se encontra na forma de hidrogênio, esta é uma maneira de se rastrear os bárions e consequentemente medir BAO. Os diferentes estágios (1 a 3) aos quais nos referimos nos próximos capítulos correspondem a diferentes frações do campo de visão total disponíveis em cada estágio (ver Abdalla, Blake, & Rawlings (2009) para uma definição detalhada do design considerado na simulação). Para o propósito deste trabalho, é suficiente a divisão dos estágios por faixa de profundidade das observações: o estágio 1 corresponde a observações em 0.2 < z < 1.0, o estágio 2 corresponde a 0.2 < z < 1.4 e o estágio 3 tem 0.2 < z < 2.2. As incertezas para bins de ∆z = 0.2 podem ser visualizadas na figura (3.6). De acordo com o atual cronograma do SKA, a parte necessária do SKA para que se possa obter esse tipo de dados não estará pronta antes de 2020. Entretanto, nós não nos aventuramos a utilizar resultados de simulações mais simples apresentadas por Abdalla, Blake, & Rawlings (2009) porque o número de medidas em diferentes valores de desvio para o vermelho não são suficientes para um estudo de evolução temporal das mesmas. 5 http://www.skatelescope.org/ 42 CAPÍTULO 3. DADOS OBSERVACIONAIS Figura 3.6: Incertezas nas medidas finais de H(z) (linhas tracejadas) e dA (z) (linhas cheias), para diferentes estágios de um experimento como o SKA. f = 1.0 indica que esses resultados se referem a um experimento com a mesma área de cobertura do SKA, limite mínimo para detecção de uma fonte: nσ = 10 e diferentes valores de campo de visão efetivo. Figura retirada de Abdalla, Blake, & Rawlings (2009). Capítulo 4 Um novo olhar sobre o Parâmetro de Desaceleração Como mencionamos anteriormente, ao longo dos últimos anos várias estratégias de abordagem do problema da aceleração cósmica foram desenvolvidas. Uma dessas alternativas consiste em realizar uma análise dos vínculos impostos aos parâmetros cosmológicos pelos dados para um modelo cosmológico específico. Alternativamente, podemos adotar uma postura fenomenológica, através da utilização de diferentes parametrizações para a equação de estado (Chevallier & Polarski, 2001; Linder, 2003), o parâmetro de Hubble (Kujat et al., 2002; Alam et al., 2003; Daly & Djorgovski, 2003; Nesseris & Perivolaropoulos, 2004) ou a densidade de energia da EE (Wang & Garnavich, 2001; Wang & Freese, 2006). Este procedimento pode resultar em alguns vínculos interessantes, entretanto as parametrizações normalmente assumem a existência da matéria e energia escura como substâncias diferentes. Com poucas exceções, nenhuma interação no setor escuro é considerada e os resultados são válidos apenas para cenários onde a RG é considerada como teoria de gravitação. Neste cenário, um ponto importante deve ser considerado: quantos parâmetros são necessários para se conseguir resultados confiáveis. Se utilizarmos muitos parâmetros, a região permitida no espaço de parâmetros pode ser grande o bastante a ponto de inviabilizar a obtenção de resultados significativos (Linder & Huterer, 2005). Por outro lado, se o número de parâmetros 43 44CAPÍTULO 4. UM NOVO OLHAR SOBRE O PARÂMETRO DE DESACELERAÇÃO for muito pequeno, o resultado será altamente dependente da parametrização escolhida e os resultados serão altamente enviesados (Bassett, Corasaniti, & Kunz, 2004). A estratégia que utilizaremos nesta primeira análise consiste em escolhermos um alto número de parâmetros (4), para que a generalidade possa ser mantida. No entanto, utilizaremos argumentos físicos para fixarmos dois deles. Em um segundo momento, nós deixamos três desses parâmetros livres e apresentamos nossos resultados como uma superfície em um espaço tridimensional. Nossos resultados foram previamente apresentados em Ishida et al. (2008). Nesta análise, estamos primeiramente interessados em duas questões: qual o valor do desvio para o vermelho no qual ocorreu a transição entre a fase desacelerada e a fase acelerada da expansão? Quão rápida foi esta transição? Nós estudamos maneiras de responder a tais indagações através de uma nova parametrização para o parâmetro de desaceleração, q, que por sua vez depende de 4 parâmetros: os valores inicial, qi , e final, qf , do parâmetro de desaceleração, o valor do desvio para o vermelho onde ocorre a transição entre aceleração e desaceleração, zt , e a largura de tal transição, τ . Nesta formulação, nosso objetivo é responder às questões levantadas anteriormente fazendo uso de um número mínimo de hipóteses sobre o setor escuro e teoria de gravitação. 4.1 Nosso Modelo Começamos nossa análise considerando um universo homogêneo e isotrópico, cuja métrica é dada pela equação (2.1). A partir deste ponto, nos restringiremos ao caso de um universo plano, o que está em acordo com os últimos resultados provenientes da RCF (Komatsu et al., 2009). Propomos então uma nova parametrização fenomenológica para o parâmetro de desaceleração dada por q(z) ≡ qf + (qi − qf ) ¡ t ¢1/τ , 1 − qqfi 1+z 1+z (4.1) onde qi e qf correspondem aos valores inicial (z À zt ) e final (z = −1) do parâmetro de desaceleração, respectivamente. O parâmetro zt representa o valor do desvio para o vermelho 4.1. NOSSO MODELO 45 onde ocorre a transição (q(zt ) = 0) e τ representa a largura da transição. O parâmetro τ está relacionado à derivada do parâmetro de desaceleração em relação ao desvio para o vermelho, em z = zt , através da expressão µ τ −1 = 1 1 − qi qf ¶· dq(z) d ln(1 + z) ¸ . (4.2) z=zt A expressão (4.1) é similar àquela apresentada por (Bassett et al., 2002) (veja também alguns exemplos em Corasaniti & Copeland (2002); Bassett et al. (2003); Corasaniti et al. (2003); Hannestad & Moörtsell (2004); Linder & Huterer (2005); Bassett, Corasaniti, & Kunz (2004)), com a diferença de que nós parametrizamos q(z) ao invés de w(z). Uma das vantagens em utilizarmos uma parametrização para q(z) é o fato de que zt assume um claro significado físico. Vários aspectos de diferentes parametrizações de q(z) podem ser encontradas em Turner & Riess (2002); Riess et al. (2004); Shapiro & Turner (2006); Elgarøy & Multamäki (2006); Gong & Wang (2007); Rapetti et al. (2007); Xu & Liu (2008). Com as definições acima, podemos integrar a equação (2.15), obtendo µ H(z) H0 à ¶2 = (1 + z)2(1+qi ) qi ¡ 1+zt ¢1/τ 1+z − qf !2τ (qi −qf ) qi (1 + zt )1/τ − qf . (4.3) Definimos também o parâmetro de densidade da matéria "efetivo"(Ωm∞ ), dado por µ Ωm∞ ≡ lim z→∞ H(z) H0 ¶2 (1 + z)−2(1+qi ) . (4.4) Nos cenários mais simples analisados na literatura, o universo necessariamente passa por uma fase dominada pela matéria, a fim de que estruturas em largas escalas possam se formar. Consequentemente, no início da história evolutiva do universo, mas depois da fase dominada pela radiação, H 2 ∝ (1+z)3 , o que implica q = 1/2. Com base nestas afirmações, nós fixamos o valor inicial do parâmetro de desaceleração em qi = 1/2, reduzindo a três o número de parâmetros livres em nossa análise. Pode-se argumentar que essa restrição culmina em uma perda de generalidade, mas a 46CAPÍTULO 4. UM NOVO OLHAR SOBRE O PARÂMETRO DE DESACELERAÇÃO questão na qual devemos nos concentrar é: quanto qi pode se afastar de 1/2 e ainda assim permitir a formação de estruturas durante a fase dominada pela matéria? No contexto da RG, em modelos onde o acoplamento entre matéria e energia escura é constante (δ), a condição qi = 1/2 não é satisfeita. Neste caso, H 2 ∝ (1+z)(3+δ) durante a fase dominada pela matéria. Entretanto, resultados apresentados por Guo, Ohta, & Tsujikawa (2007), mostram que testes cosmológicos restringem |δ| < 0.1. Se levarmos em consideração perturbações na densidade de matéria, vínculos mais fortes podem ser encontrados (Fabris, Shapiro, & Solà, 2007). Podemos também considerar modelos onde a matéria possui pressão, nesses casos, qi 6= 1/2. Entretanto, se as perturbações na densidade de matéria forem adiabáticas, devido a uma velocidade do som finita, o espectro de potência da matéria apresentará instabilidades, descartando esse modelos a menos que p = 0 (qi = 1/2) ou muito perto disso. Em princípio, podemos contornar esse tipo de problema assumindo perturbações de entropia de tal forma que δp = 0 (Reis et al., 2003; Amendola, Waga, & Finelli, 2005). Entretanto, há indícios de que nós não estamos deixando de mapear muitos modelos viáveis ao fixarmos qi = 1/2, a análise de um quadro onde este parâmetro é considerado livre com certeza merece atenção, mas está fora dos objetivos deste trabalho. No caso específico onde qi = 1/2, temos µ Ωm∞ = 1 1− (1 + zt )1/τ 2qf ¶−τ (1−2qf ) . (4.5) Com esta definição, podemos eliminar zt da equação (4.3) e reescrevê-la como µ H(z) H0 ¶2 µ ¶τ (1−2qf ) 1 1 τ (1−2qf ) τ (1−2qf ) − τ1 = (1 + z) Ωm∞ + (1 − Ωm∞ )(1 + z) . 3 (4.6) A expressão acima, conectando H(z) com Ωm∞ , é bastante útil para que possamos fazer conexões entre a parametrização proposta neste trabalho e demais modelos presentes na literatura. Por exemplo, podemos utilizar a equação (4.6) para verificar que a expressão (4.1), está relacionada ao modelo Cardassiano Politrófico Modificado (CPM) (Gondolo & Freese, 2003; Wang et al., 2003). Este modelo depende de três parâmetros: m (denominado q em 4.1. NOSSO MODELO 47 Gondolo & Freese (2003)), n e Ωm0 . Neste contexto, o parâmetro de Hubble é dado por · H(z) H0 ¸2 = (1 + z)3 ©¡ Ωobs m0 ¢p + [1 − (Ωpm0 )p ] (1 + z)−3p(1−n) ª1/p . (4.7) CP M Se identificarmos Ωm0 = Ωm∞ , m = 1/(τ (1 − 2qf )) e n = 2/3(1 + qf ), os dois modelos apresentam a mesma cinemática. Chamamos a atenção para o fato de que, no modelo CPM, Ωm0 representa o valor atual do parâmetro de densidade da matéria, enquanto acima, Ωm∞ é definido para altos valores de desvio para o vermelho. Essas duas quantidades podem ser diferentes, por exemplo, em modelos onde existe um acoplamento entre a matéria e a energia escura (Amendola, 2000; Zimdahl & Pavón, 2007). Para ilustrar nosso argumento, considere modelos cujo acoplamento entre matéria e energia escura seja variável, entretanto, onde a equação de estado da energia escura (wX ) seja constante, e que apresentem ρX /ρm = ρX0 /ρm0 aξ (Dalal et al., 2001). Tais modelos podem ser descritos pela equação 1/τ (1−2qf ) (4.1), se identificarmos Ωm0 = Ωm∞ , ξ = 1/τ e wX = −(1 − 2qf )/3. Como já dissemos, nossa abordagem não exige que façamos hipóteses fortes sobre o setor escuro e/ou teoria de gravitação. No modelo CPM, os componentes do universo são radiação e matéria escura, não há energia escura. A parametrização (4.1) inclui o modelo CPM (e os modelos com acoplamento citados anteriormente) como casos especiais. Podemos obter também o modelo de quartessência de Chaplygin (ver, por exemplo, Kamenshchik, Moschella, & Pasquier (2001); Bilić, Tupper, & Viollier (2002); Bento et al. (2002); Makler, de Oliveira, & Waga (2003)) na ausência de bárions (p = −M 4(α+1) /ρα ), no caso especial onde qi = 1/2, qf = −1, 1/τ = 3(1 + α) e Ωm∞ = (1 − w0 )1/(1+α) , onde w0 = −M 4 /ρα+1 é o valor atual da equação de estado da energia escura. 0 Modelos de energia escura com equação de estado constante (wX ) podem ser obtidos se identificarmos Ωm∞ = Ωm0 e impusermos que −3wX = 1/τ = (1 − 2qf ) na equação (4.1). Em particular, fixando qf = −1 e τ = 1/3, recuperamos o modelo ΛCDM. Neste modelo, zt = (2(1 − Ωm0 )/ Ωm0 )1/3 − 1. O fato de podermos identificar o modelo ΛCDM no espaço de parâmetros é bastante conveniente, uma vez de que este apresenta uma boa 48CAPÍTULO 4. UM NOVO OLHAR SOBRE O PARÂMETRO DE DESACELERAÇÃO concordância com os dados atuais, e consequentemente espera-se que o verdadeiro modelo cosmológico não seja muito distante deste. É importante enfatizar que, no contexto da RG com matéria e energia escuras não interagentes, se τ < 1/3 e qf = −1, a energia escura possuirá um comportamento tipo phantom (w < −1), que pode já ter iniciado no passado ou se apresentará no futuro. Modelos com τ > 1/3 serão sempre não-phantom. É curioso notar que, se aplicarmos a definição dada pela equação (4.2) (com qi = 1/2 e qf = −1) ao modelo DGP plano (Dvali, Gabadadze, & Porrati, 2000), obtemos τ = 1/2 independente do valor atribuído a Ωm0 . Logo, modelos do parâmetro de desaceleração onde zt = (2(1 − Ωm0 )2 / Ωm0 )1/3 − 1 (desvio para o vermelho da transição no modelo DGP) e τ = 1/2 são uma boa aproximação para modelos tipo DGP. 4.1. NOSSO MODELO 49 1.0 0.5 q(z) 0.0 - 0.5 - 1.0 - 1.5 -1 0 1 z 2 -1 0 1 z 2 3 Figura 4.1: Influência dos parâmetros zt e τ na forma funcional do parâmetro de desaceleração para o caso especial onde qi = 1/2 e qf = −1. Painel Esquerdo: q(z) para zt = 1.0 e τ = 0.1 (curva verde-tracejada), 0.3 (curva cheia-preta) e 0.5 (curva azul-ponto tracejada). Painel Direito: q(z) para τ = 0.3 e zt = 0.5 (curva verde-tracejada), 1.0 (curva cheia-preta) e 1.5 (curva azul-ponto tracejada). 50CAPÍTULO 4. UM NOVO OLHAR SOBRE O PARÂMETRO DE DESACELERAÇÃO 4.2 Vínculos Observacionais Uma das principais questões não resolvidas da cosmologia atual se refere à causa da aceleração cósmica: ela é causada por um tipo de constante cosmológica ou não? Os dados indicam que modelos tipo ΛCDM são altamente favorecidos. Em nossa análise, consideramos primeiramente modelos que possuem uma fase final tipo de Sitter (qf = −1). Neste caso, o modelo ΛCDM é facilmente identificado no espaço de parâmetros, o que possibilita um teste simples para o paradigma representado pelo modelo ΛCDM. O caso mais geral, onde qf 6= −1, será brevemente discutido posteriormente. Considerando qf = −1, temos q(z) = −1 + · H(z) H0 ¸2 3 ¡ 1+zt ¢1/τ , 2 + 1+z "¡ ¢ 1+z 1/τ +2 = (1 + z)3 (1 + zt )1/τ + 2 · ¸−3τ 1 1/τ = (1 + zt ) + 1 . 2 t 1+z Ω∞ (4.8) #3τ , (4.9) (4.10) Obtivemos então vínculos no espaço de parâmetros formado por zt e τ , a partir de dados de SNIa e de medidas da razão entre a distância à superfície de último espalhamento Sk (zue = 1098) e a distância característica definida por medidas de BAO, Dv (z), em zBAO = 0.2 e zBAO = 0.35, como estimado por Percival et al. (2007). Este observável nos é útil por duas razões. Primeiramente, o mesmo não depende explicitamente dos componentes escuros do universo ou da teoria de gravitação, pois é essencialmente controlado pela função H(z) . H0 Além disso, seus resultados são complementares aos dados de supernovas porque ambos obtêm informações a partir de objetos em intervalos diferentes de desvio para o vermelho. Com supernovas, estamos medindo distâncias até z ∼ 1−2, enquanto Sk depende da distância à superfície de último espalhamento, em z ∼ 1100. Utilizamos em nossa análise ambos os conjuntos de dados citados no capítulo 3, Gold182 (Riess et al., 2007) e SNLS (Astier et al., 2006). No que segue, apresentamos resultados baseados em funções de verossimilhança marginalizadas sobre o parâmetro de Hubble, uti- 4.2. VÍNCULOS OBSERVACIONAIS 51 lizando um a priori gaussiano tal que h = 0.72 ± 0.08 (Freedman et al., 2001). Na figura (4.2)-painel esquerdo, apresentamos os contornos de confiança (68% e 95%) no plano (arctg zt × τ ) construídos a partir de dados de SNIa, no caso particular onde qf = −1. Note que, para os dois conjuntos de dados, zt < 0 não é permitido mesmo em altos níveis de confiança, indicando que uma transição ocorreu no passado. Chamamos a atenção para o fato de que esse resultado é esperado para modelos tipo ΛCDM (ou outros) que possuem um tempo de transição não-nulo. Entretanto, nossos resultados indicam que zt > 0 inclusive para modelos onde a transição é instantânea (τ = 0). Mais adiante, mostramos que esse resultado é válido inclusive para casos onde qf 6= −1. Além disso, também fica claro pela figura (4.2) - painel esquerdo que os dados atuais não podem impor vínculos fortes sobre o valor máximo permitido para zt . Esse resultado reflete o fato de que as SNIa podem ser utilizadas como medida de distância até um valor de desvio para o vermelho de z ∼ 1 − 2. Em um modelo em que a transição é lenta (τ > 1), mesmo que a transição ocorra em um valor alto de desvio para o vermelho a distância até um objeto localizado em z . 1, por exemplo, será bastante similar à distância ao mesmo objeto em um modelo onde zt . 1 mas no qual a transição é mais rápida (menor τ ). Isto explica a forma dos contornos de confiança extraídos de dados de SNIa. Comparando os contornos obtidos a partir dos diferentes conjuntos de dados, observamos que aqueles provenientes do Gold182 estão deslocados para valores mais baixos de zt em comparação com os contornos obtidos a partir de dados do SNLS. É importante enfatizar que, mesmo na região de maior interesse (zt . 1), a diferença entre os resultados de diferentes conjuntos de dados, apesar de não ser tão severa, existe e é importante. Resultados semelhantes foram obtidos por Jassal, Bagla, & Padmanabhan (2005); Nesseris & Perivolaropoulos (2005); Alam, Sahni, & Starobinsky (2007); Nesseris & Perivolaropoulos (2007), tais diferenças podem estar relacionadas a inomogeneidades presentes nos dados do Gold182 e deve ser melhor investigada. A fim de obter intervalos de confiança a partir do teste Sk /Dv , utilizamos um teste estatístico tipo χ2 levando em consideração a matriz de correlação entre as medidas de BAO 52CAPÍTULO 4. UM NOVO OLHAR SOBRE O PARÂMETRO DE DESACELERAÇÃO τ 6 6 5 5 4 4 3 3 2 2 1 1 0 0 0 0.2 0.4 0.6 0.8 1 arctan z t 1.2 1.4 -1 -0.5 0 zt 0.5 1 1.5 Figura 4.2: Painel esquerdo: Vínculos impostos por observações de SNIa. Os contornos representam intervalos de confiança de 68% and 95%. As curvas verde-tracejadas correspondem a resultados obtidos a partir dos dados do Gold182 e as curvas azuis-sólidas correspondem aos dados do SNLS. Painel direito: Vínculos impostos por medidas de Sk /Dv (Percival et al., 2007) (níveis de confiança de 68% and 95%) como explicado no texto. A linha vermelha-sólida em ambos os painéis correspondem ao modelo ΛCDM. Note que, para estes modelos, valores mais altos de zt correspondem a valores menores de Ωm∞ . Nos dois painéis utilizamos qf = −1 4.2. VÍNCULOS OBSERVACIONAIS 53 e a razão Sk /Dv apresentadas por Percival et al. (2007), ou seja, χ2Sk /Dv = Xt V−1 X, onde e (4.11) Sk D (0.2) − 19.04 v X= Sk − 10.52 Dv (0.35) (4.12) 3.79198 −2.59919 V−1 = , −2.59919 11.7137 (4.13) sendo V−1 a matriz de correlação entre as duas medidas de BAO (Percival et al., 2007). Como estamos considerando a curvatura espacial nula, podemos escrever Z 1098 Sk (zt , τ, h) = 0 e dz , He (zt , τ, h, z) ³R zBAO dx H(zt ,τ,x) 0 zBAO Dv (zBAO , zt , τ ) = H(zt , τ, zBAO ) (4.14) ´2 1/3 . (4.15) O termo He na equação (4.14) leva em consideração a necessidade de contabilizarmos a contribuição da radiação para valores de desvio para o vermelho muito altos, que não são mapeados pela nossa parametrização (equação (4.1)). Pode-se argumentar que ao introduzirmos a contribuição da radiação estamos perdendo generalidade. Entretanto, qualquer modificação ao modelo padrão da cosmologia deve satisfazer a nucleossíntese primordial para z À 1. Nós sabemos que a radiação existe e sabemos também qual deve ser o comportamento do parâmetro de Hubble em tempos remotos, onde a dinâmica do universo é dominada por este componente, de modo a preservar os resultados bem sucedidos da nucleossíntese primordial. Neste fase, H 2 ∝ (1 + z)4 e q = 1. Logo, a fim de levarmos em conta a contribuição da radiação, adicionamos o termo Ωr0 (1 + z)4 ao lado direito da equação (4.3), quando a utilizamos 54CAPÍTULO 4. UM NOVO OLHAR SOBRE O PARÂMETRO DE DESACELERAÇÃO para calcular Sk , · He (zt , τ, h, z) H0 ¸2 · H(zt , τ, z) = H0 ¸2 + 4.15 × 10−5 (1 + z)4 . h2 (4.16) Caso não façamos essa correção, poderíamos chegar a um valor de Sk com erro aproximado de 18%. Marginalizamos a função de verossimilhança sobre h utilizando o mesmo a priori aplicado aos dados de SNIa. Na verdade, Sk é praticamente independente de h, uma vez que o mesmo apenas aparece na contribuição da radiação. Na figura (4.2 - painel direito), apresentamos níveis de confiança de 68% e 95% no plano zt × τ , obtidos a partir do teste Sk /Dv . É importante mencionar que a forma destes contornos é bastante similar àqueles calculados para diferentes valores de Ωm∞ , de modo que este teste pode ser considerado uma maneira de restringir tal quantidade. O mesmo tipo de comportamento pode ser encontrado em modelos planos onde a equação de estado é considerada constante (Percival et al., 2007). A partir da figura (4.2), fica clara a complementariedade entre os resultados deste teste e aqueles encontrados a partir de dados de SNIa. A fim de obter resultados combinados (SNIa+Sk /Dv ), multiplicamos suas respectivas funções de verossimilhança marginalizadas. Na figura (4.3) apresentamos níveis de confiança (68% e 95%) obtidos a partir de resultados do teste Sk /Dv combinados com dados do Gold182 (verde-tracejado) e SNLS (azul-ponto tracejado). A linha horizontal vermelha nesta figura representa o modelo ΛCDM (τ = 1/3). Vemos que este modelo está em bom acordo com os dados do SNLS+Sk /Dv . Após a marginalização sobre o parâmetro extra (Colistete, 2006), obtemos para Sk /Dv +Gold182 (com nível de confiança de 95.4%), zt = 0.84±0.13 0.17 e 0.12 0.12 τ = 0.51±0.23 0.17 , enquanto para Sk /Dv +SNLS encontramos, zt = 0.88±0.10 e τ = 0.35±0.10 . Considerando um modelo onde qf = −1, τ = 0.35 e zt = 0.88, a equação (4.5) nos mostra que Ωm∞ = 0.23. É fácil mostrar que a idade do universo neste modelo específico, considerando h = 0.72 é de 14 Ganos e que a aceleração começou a 7.2 Ganos atrás. Note que o modelo ΛCDM (τ = 1/3) está em bom acordo com os resultados de SNLS+Sk /Dv , mas está excluído 4.2. VÍNCULOS OBSERVACIONAIS 55 com mais de 68% de confiança para dados do Gold182 +Sk /Dv . Essa discrepância revela uma tensão entre os dados de SNIa e a necessidade eminente de melhores dados e um procedimento de padronização mais eficaz para que essa questão possa ser esclarecida. Mostramos na mesma figura (curva preta-sólida) o que devemos esperar de futuros dados de SNIa+Sk /Dv . Em nossa simulação de Monte Carlo, utilizamos como modelo fiducial ΛCDM Ωm0 = 0.23 (τ = 1/3, zt ' 0.88). Para os dados de SNIa consideramos um levantamento do tipo proposto para o programa Joint Dark energy Mission (JDEM)1 , com a hipótese de que a magnitude intrínseca das SNIa e o valor do parâmetro de Hubble hoje são plenamente conhecidos. Para o teste Sk /Dv nós adotamos a postura conservadora (mas em algum nível também arbitrária) de que, no futuro, os erros em Sk /Dv serão reduzidos em 2/3 sobre os valores atuais. Consideramos também que os coeficientes de correlação serão os mesmos. A figura mostra níveis de confiança de 95%. Nós analizamos também o caso mais geral, onde qf 6= −1. A expressão (4.1) nos permite escrever o valor do parâmetro de desaceleração hoje (q0 ) como função de zt , τ e qf . Apesar dos dados atuais não imporem vínculos sobre o valor mínimo de qf , eles restringem q0 (encontramos −1.4 . q0 . −0.3). Apresentamos na figura (4.3, painel direito), níveis de confiança de 95% no espaço de parâmetros zt × τ × qf para o caso geral onde qf ∈ (−∞, 0), obtidos a partir de dados do SNLS+Sk /Dv . Com base nesses resultados podemos afirmar, sem utilizar fortes hipóteses sobre o modelo cosmológico e/ou teoria métrica de gravitação, que houve uma transição entre uma fase de aceleração e uma fase de desaceleração no passado (zt > 0). Entretanto, os dados atuais ainda não são capazes de impor fortes vínculos sobre este parâmetro. As simulações realizadas nos mostram que no futuro, esse tipo de abordagem proporcionará vínculos muito mais restritivos. Apesar de todas as vantagens citadas anteriormente, o comportamento do parâmetro de desaceleração como função do desvio para o vermelho (figuras (4.4) e (4.5)) é restrita às formas permitidas pela parametrização utilizada (figura (4.1)). A fim de tentar eliminar tal restrição, no próximo capítulo utilizamos um outro proce1 www.snap.lbl.gov 56CAPÍTULO 4. UM NOVO OLHAR SOBRE O PARÂMETRO DE DESACELERAÇÃO dimento, onde a forma funcional da quantidade estudada é obtida unicamente a partir dos dados. 4.2. VÍNCULOS OBSERVACIONAIS 57 1.0 -0.2 0.8 -0.6 τ q0 0.6 -1 -1.4 1.2 0.4 0.8 τ 0.2 0.6 0.7 0.8 zt 0.9 1 1.1 0.4 1 0 0.4 0.6 1.2 0.8 z t Figura 4.3: Painel esquerdo: Níveis de confiança de 68% e 95% impostos pela combinação dos dados apresentados na figura (4.2). Os contornos verde-tracejados (azuis-ponto tracejados) representam Gold182 (SNLS) + Sk /Dv . O contorno preto-sólido (nível de confiança de 95%) foi obtido a partir de dados simulados como explicado no texto. Nesta figura, impomos qf = −1. Painel direito: Nível de confiança de 95% no espaço zt × τ × q0 para o caso geral onde q0 ∈ (−∞, 0), obtido a partir dos dados de SNLS+Sk /Dv . 58CAPÍTULO 4. UM NOVO OLHAR SOBRE O PARÂMETRO DE DESACELERAÇÃO 0.4 LCDM com Wm =0.23 0.2 qHzL 0.0 -0.2 q i =0.50 -0.4 q f =-1.0 -0.6 melhor -0.8 ajuste 1 Σ para dados do Gold182 z t =0.84 +0.13 -0.17 Τ=0.51 +0.23 -0.17 -1.0 0.0 0.5 1.0 1.5 z Figura 4.4: Reconstrução do parâmetro de desaceleração utilizando os melhores ajustes encontrados para zt e τ a partir de dados do Gold182. 0.4 LCDM com Wm =0.23 0.2 qHzL 0.0 -0.2 q i =0.50 -0.4 q f =-1.0 -0.6 melhor -0.8 ajuste 1 Σ para dados do SNLS z t =0.88 +0.12 -0.10 Τ=0.35 +0.12 -0.10 -1.0 0.0 0.5 1.0 1.5 z Figura 4.5: Reconstrução do parâmetro de desaceleração, construída a partir dos melhores ajustes encontrados a partir dos dados do SNLS. Capítulo 5 Análise por Componentes Principais Os resultados apresentados no capítulo anterior nos mostraram que a análise do parâmetro de desaceleração tem a vantagem de nos proporcionar resultados independentes de modelo cosmológico ou teoria de gravitação. Entretanto, a imposição de uma forma específica para q(z) ainda introduz um viés que limita a forma final encontrada àquela permitida pela forma funcional escolhida. Em geral, a relevância de qualquer parametrização é diretamente proporcional à sua capacidade de reproduzir modelos viáveis em todos os valores de desvio para o vermelho. Nesse aspecto, a parametrização que propusemos no capítulo anterior representa uma das mais versáteis parametrizações disponíveis na literatura, vide o número de modelos que podem ser encontrados para valores especiais de seus parâmetros. Entretanto, procuramos por um método de análise de dados que permita aos mesmos apontar qualquer valor para o parâmetro de desaceleração, mesmo que estes valores não estejam previamente mapeados em nenhum modelo cosmológico. Para tanto utilizaremos a Análise por Componentes Principais (ACP). Os resultados aqui apresentados também podem ser encontrados em Ishida et al. (2010). ACP é bastante utilizada para lidar com conjuntos de dados em problemas de muitas variáveis. O método nos permite encontrar direções de maior concentração dos dados no espaço de fase formado pelos parâmetros da teoria, a partir dos quais podemos reduzir a dimensionalidade do espaço de parâmetros com perda mínima de informação. Historicamente, 59 60 CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS ACP foi primeiramente aplicada em análise sociais. O argumento matemático por trás dos testes de inteligência aplicados no início do século XX era baseado em ACP (Gould, 1981). Em cosmologia, este método é bastante utilizado em problemas que exigem redução do espaço de parâmetros, como RCF e lentes gravitacionais, entre outros (Galaz & de Lapparent (1998), Efstathiou & Bond (1999), Ronen, Aragon-Salamanca, & Lahav (1999), Efstathiou (2002) Hu & Holder (2003), Dick, Knox, & Chu (2006), Tang, Abdalla, & Weller (2008), Pogosian et al. (2009), Kitching & Amara (2009)), e para realizar análise de propriedades da energia escura de modo independente de modelo. Mais recentemente, a aplicação de ACP na determinação de vínculos sobre os parâmetros cosmológicos vem sendo alvo de muitas discussões, desde que Albrecht et al. (2009) sugeriu o mesmo como alternativa à figura de mérito proposta pelo Dark Energy Task Force (DETF)(Albrecht et al., 2006). Entretanto, existem hipóteses importantes que devem ser observadas para que essa utilização possa ser feita de maneira coerente, como aponta Kitching & Amara (2009). Analisaremos como tais hipóteses devem ser tratadas em uma análise de q(z) mais adiante. A ACP não ignora correlações e covariâncias, mas em um primeiro momento a análise se concentra na variância (ou grau de dispersão) apresentados pelos dados. Se dispusermos de um conjunto de dados composto por N pontos xi , cuja média é x̄ = PN i=1 xi /N , definimos a variância associada à quantidade x, (var[x]), como var[x] = N X (xi − x̄)2 i=1 N −1 . (5.1) Considere p̄ um vetor contendo p variáveis aleatórias. Nosso primeiro passo será encontrar uma função linear dos elementos de p̄ tal que a variância associada à essa combinação linear seja maximizada. Em seguida, procuramos uma outra função de variância máxima, que não seja correlacionada à primeira função, e assim por diante. Desta forma, a k-ésima variável será o k-ésimo componente principal (CP). Ao todo, podemos repetir este processo até obtermos p CPs, entretanto, na maioria dos casos apenas m CPs, sendo m ¿ p, são suficientes para englobar a maior parte da variância presente nos dados. 5.1. A MATRIZ DE FISHER... 61 O leitor deve estar atento para a definição de variância que estamos utilizando. Como apresentado acima, a variância considerada representa a dispersão associada aos dados na direção definida pelos CPs. Apresentamos na figura (5.1) um exemplo em 2 dimensões. Esta figura representa 100 pontos em função de duas variáveis altamente correlacionadas {x1 , x2 }. Existe uma dispersão razoável dos dados ao longo dessas duas variáveis (x ∈ {−0.3, 0.4} e y ∈ {−0.3, 0.4}). Entretanto, quando reescrevemos os dados como função do primeiro e segundo componentes, percebemos que a dispersão na direção definida pelo primeiro CP (CP 1) é maior do que a dispersão na direção definida pelo segundo CP (CP 2) (CP 1 ∈ {−0.3, 0.4} e CP 2 ∈ {−0.1, 0.1}). Em resumo, se um conjunto formado por p > 2 variáveis possui uma forte correlação entre as mesmas, os primeiros CPs representarão a maior parte da variância presente nas variáveis originais. Por outro lado, os últimos CPs identificam direções ao longo das quais existe pouca variância, ou seja, onde a relação entre as variáveis originais é praticamente linear. Neste exemplo, caso desejemos reduzir o espaço de parâmetros, poderíamos expressar os dados apenas em função de CP1. Obviamente alguma informação seria perdida, mas o comportamento geral dos dados seria preservado. Em um problema multidimensional essa característica será de extrema valia para que possamos reduzir a dimensionalidade do problema e consequentemente as dificuldades numéricas envolvidas. 5.1 A matriz de Fisher... Na análise utilizada neste trabalho, a forma dos CPs é determinada através da Matriz de Fisher. A matriz de Fisher, sob algumas hipóteses básicas (para uma dedução detalhada ver Jollife (2001) - capítulos 1 a 6), é uma boa aproximação para o inverso da matriz de correlação. Isso nos permite identificar os CPs e as variâncias associadas aos mesmos com os autovetores e autovalores da matriz de Fisher, respectivamente. Encontrar os CPs a partir da matriz de Fisher nos proporciona uma forma matemati- 62 CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS x2 0.4 0.2 -0.4 0.2 -0.2 0.4 x1 -0.2 -0.4 Figura 5.1: Exemplo em duas dimensões, representação de um conjunto de dados formado por 100 pontos, em termos das variáveis x1 e x2 . CP2 0.4 0.2 CP1 -0.4 0.2 -0.2 0.4 -0.2 -0.4 Figura 5.2: O mesmo conjunto de dados da figura (5.1), desta vez em função dos Componentes Principais. 5.1. A MATRIZ DE FISHER... 63 camente elegante de determiná-los. Entretanto, como em todo problema de diagonalização de matrizes, precisamos esclarecer dúvidas referentes a dois casos raros quando lidamos com dados reais, mas que teoricamente podem acontecer: casos que apresentem autovalores iguais e casos onde existem autovalores nulos. Quando a matriz de Fisher apresenta autovalores iguais, isso significa que os autovetores correspondentes formam um subconjunto onde os elementos são ortogonais entre si, mas fora isso arbitrários. Essa situação é melhor visualizada geometricamente. Por exemplo, suponha o caso bidimensional, onde os dados formam um círculo no plano de variáveis. Neste caso, não é possível definir um eixo principal de maneira unívoca, e todos os possíveis pares de eixos ortogonais entre si representam igualmente bem a dispersão presente nos dados. Em situações onde a matriz de Fisher apresenta r autovalores nulos, isso indica que na verdade a dimensionalidade da mesma é (r − q). Autovalores nulos indicam uma relação linear exata entre duas variáveis, de modo que uma pode ser escrita em função da outra e consequentemente o espaço de parâmetros pode ser reduzido sem que haja nenhuma perda de informação. Na maioria dos casos, esse tipo de relação é percebida antes da aplicação de ACP, e a dimensionalidade inicial é naturalmente corrigida. Para ilustrar o que foi dito em um exemplo prático, considere que nosso conjunto de dados é formado por N observações independentes, cada uma delas caracterizada por uma função densidade de probabilidade fi (xi , σdadosi ; θ̄). Na notação que utilizaremos daqui em diante, xi corresponde à i-ésima medida, cujo erro associado é dado por σdadosi e θ̄ é o vetor formado pelos parâmetros da teoria. Neste caso, a função de verossimilhança é dada por L(θ̄) = N Y £ ¤ fi (xi , σdadosi ; θ̄) , (5.2) i=1 e a matriz de Fisher é definida como ¿ Fkl ≡ ∂ 2 ln L(θ̄) − ∂θk ∂θl À . (5.3) Lembramos que o símbolo <> na equação anterior representa o valor esperado. Para uma 64 CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS variável qualquer x, cuja função densidade de probabilidade é dada por p(x), o valor esperado é encontrado a partir da expressão Z ∞ hxi = xp(x)dx. (5.4) −∞ No que segue, consideraremos uma distribuição de probabilidade gaussiana para cada evento, ¸ (xi − x̄(θ̄))2 √ exp − . f (xi , σi ; θ̄) = 2 2σdados σdadosi 2π i · 1 (5.5) Sendo assim, podemos combinar as equações (5.2), (5.3) e (5.5), tendo como produto final os elementos da matriz de Fisher. Na próxima seção, apresentamos as principais etapas dos cálculos necessários à obtenção de uma expressão analítica para os componentes da matriz de Fisher, baseados em três tipos diferentes de dados (medidas de distância). Uma apresentação bem mais detalhada de cada etapa é mostrada no apêndice B. 5.1.1 ... a partir da Distância de Luminosidade No que segue, consideramos um universo homogêneo e isotrópico, representado pela métrica de FRW (equação (2.1)). Por questão de simplicidade, estudaremos apenas o caso onde a curvatura é nula (K = 0), o que está em bom acordo com os últimos resultados da RCF (Komatsu et al., 2009). Como demonstramos no capítulo 3, a observação de supernovas nos fornece valores de módulo de distância (Jha, Riess, & Kirshner, 2007) ou magnitude aparente em uma determinada banda (Guy et al., 2007) dependendo do processo de padronização utilizado, e valores de desvio para o vermelho. Como uma consequência natural das equações (2.15) e (2.24), o módulo de distância é dada por ½ Z z µth (z) = m − Mabs = 5 log (1 + z) 0 · Z u ¸ ¾ exp − [q(v) + 1]d ln (1 + v) du + µ0 . 0 (5.6) 5.1. A MATRIZ DE FISHER... 65 A fim de escrever o parâmetro de desaceleração da forma mais geral possível, nós seguimos o procedimento utilizado por Shapiro & Turner (2006), expandindo q(z) em funções degrau, de modo que q(z) = M X βi ci (z), (5.7) i=1 onde os ci ’s são dados por 1 ci (z) = 0 se (i − 1)∆z < z < i∆z , caso contrário βi são constantes e nesse caso representarão os parâmetros da nossa teoria, ∆z representa a largura do bin em desvio para o vermelho e M representa o números de bins utilizados na expansão. A escolha dessa expansão para expressar o parâmetro de desaceleração tem a vantagem de que a resolução final na forma dos CPs será limitada apenas por nosso poder de computação, uma vez que para um número infinito de bins podemos reconstruir com detalhes qualquer função a partir da expressão (5.7). A forma final dos elementos de matriz após marginalização sobre H0 será ( ¸ N · ¸ N · 1 ∂DL (zi ; β̄) X 1 1 ∂DL (zj ; β̄) 1 X + C i=1 DL (zi ; β̄) ∂βk σj2 DL (zj ; β̄) ∂βl j=1 ) N X 1 1 ∂DL (zi ; β̄) ∂DL (zi ; β̄) , − 2 2 σ ∂β ∂β D (z ; β̄) k l L i i i=1 25 = ln(10)2 Fkl (5.8) onde C = 5.1.2 PN i=1 σi−2 (equação (B.15)) e β̄ é o vetor composto pelos parâmetros βi . ... a partir da Distância de Diâmetro Angular Gostaríamos de ressaltar que, o mesmo procedimento utilizado anteriormente para de dados de SNIa pode ser aplicado a outros observáveis. Por exemplo, de acordo com o 66 CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS trabalho apresentado em Abdalla, Blake, & Rawlings (2009), observações de BAO podem nos proporcionar medidas do parâmetro de Hubble (H(z)) e distância de diâmetro angular (dA (z)) em diferentes valores de desvio para o vermelho. Para o caso onde possuímos medidas da distância de diâmetro angular, a função de verossimilhança é dada por LDA (H0 ; β̄) = N Y ³ ´2 , 1 D (z ; β̄) H0 A i dAi − exp − ³ ´2 √ ³ dA ´2 dA i=1 2π σdadosi 2 σdados i 1 (5.9) onde DA (z; β̄) a distância de diâmetro angular em unidades de H0−1 e dAi a i-ésima medida de dA . A forma como a função de verossimilhança depende de H0 não nos permite realizar a marginalização sobre H0 como feito no caso de dados de SN. Logo, utilizaremos o método DA proposto por Albrecht et al. (2009), onde a matriz de Fisher marginalizada, Fmarg , é dada por ¡ ¢−1 H0 β DA Fmarg = F ββ − F βH0 F H0 H0 F . (5.10) Nesta expressão, F ββ , F βH0 e F H0 H0 são submatrizes da matriz de Fisher. Dado que a distância de diâmetro angular se relaciona de uma maneira simples com a distância de luminosidade (equações (2.22) e (2.24)), 1 1 dA (z) = dL (z) = 2 (1 + z) (1 + z) Z z 0 du , H(u) (5.11) podemos obter os componentes necessários ao cálculo da matriz de Fisher marginalizada em função das expressões analíticas para distância de diâmetro angular e suas derivadas apresentadas na seção anterior. 5.1. A MATRIZ DE FISHER... 67 A matriz de Fisher para medidas de distância diâmetro angular será finalmente dada por Fklββ βH0 Fk1 = H0 β F1k H0 H0 F11 5.1.3 N 1 X 1 ∂DL (zi ; β̄) ∂DL (zi ; β̄) = , 2 d A 2 2 H0 i=1 ((1 + zi ) σdados ) ∂βk ∂βl i N DL (H0 ; β̄) 1 X ∂DL (zi ; β̄) = , 3 d A 2 2 H0 i=1 ((1 + zi ) σdados ) ∂βk i " #2 N 1 X DL (zi ; β̄) = . dA H04 i=1 (1 + zi )2 σdados i (5.12) (5.13) (5.14) ... a partir do Parâmetro de Hubble Em se tratando de medidas para o parâmetro de Hubble, a função de verossimilhança será H L (H0 ; β̄) = N Y i=1 " ¢2 )# hi − H(zi ; β̄) √ exp − . ¡ H ¢2 H σdados 2π 2 σdados i i ( ¡ 1 (5.15) Após a marginalização analítica, os componentes da matriz de Fisher para medidas do parâmetro de Hubble são dados por FklH ¿ 2 À ∂ ln LH (β̄) = − ∂βk ∂βl ¶ ¶ µ µ 1 ∂M ∂M 1 1 1 ∂ 2M ∂ 2K 1 = + − + . 1+ 2M ∂βk ∂βl M 2 2 ∂βk βl M ∂βk ∂βl (5.16) onde K ≡ N X hi g(zi ; β̄) i=1 M ≡ 2 σdados i N X g(zi ; β̄)2 i=1 2 σdados i , , (5.17) (5.18) g(z; β̄) representa o parâmetro de Hubble em unidades de H0 e hi os dados observacionais. 68 CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS 5.2 Reconstrução do Parâmetro de Desaceleração De acordo com o que apresentamos anteriormente, os CPs são dados pelos autovetores da matriz de Fisher (ēi ) e seus autovalores estão relacionados à variância na direção definida pelo autovetor correspondente. Os autovetores (ou CPs) serão ordenados seguindo uma ordem decrescente do autovalor associado. Sendo assim, o primeiro CP será o autovetor correspondente ao maior autovalor (variância) e assim por diante. O parâmetro de desaceleração pode agora ser escrito como uma combinação linear das variáveis descorrelacionadas, identificadas com os autovetores da matriz de Fisher. Matematicamente temos, 0 q(z; ᾱ) = qf id + M X αi ei (z), (5.19) i=1 onde αi ’s são constantes, M 0 representa o número de componentes utilizados na reconstrução e ᾱ é o vetor composto pelos parâmetros αi . qf id representa o modelo que utilizamos como base para nossa expansão (vide seção 5.2.1). Escolhido um determinado qf id , a ACP irá simplesmente mapear as características presentes nos dados que desviem desse modelo. Utilizando as equações (5.6) e (5.19), consideramos os valores de αi como aqueles que minimizam a expressão 2 χ = N X (µi − µth (zi ; ᾱ))2 i=1 2 σrec i . (5.20) É importante chamar a atenção para o fato de que os parâmetros αi presentes na equação anterior não são os mesmos definidos por Huterer & Starkman (2003). Esses autores consideram o conjunto completo de autovetores, o que possibilita encontrar os coeficientes da expansão linear através de relações de ortogonalidade. No nosso caso, esses parâmetros são obtidos através de um processo de minimização, e consequentemente possuem um erro 5.2. RECONSTRUÇÃO DO PARÂMETRO DE DESACELERAÇÃO associado. Além disso, se λi é o i-ésimo autovalor da matriz de Fisher, σi = 69 p λ−1 é uma i medida da dispersão dos dados ao redor do i-ésimo autovetor. Uma simples propagação de tais erros na função reconstruída resulta em 0 2 σrec (z) = M X ¡ ¢2 σαj ej (z) + (αj σj )2 . (5.21) j=1 Nos concentramos agora nos limites dos somatórios presentes nas equações (5.19) e (5.21). É aqui que a redução de dimensionalidade do espaço de parâmetros que mencionamos anteriormente se materializa. Uma reconstrução feita com todos os M 0 = M CPs manteria toda a informação presente nos dados. Entretanto, como os erros aumentam do primeiro para o último CP, a propagação de tais erros na reconstrução final resultaria em intervalos de confiança absurdamente grandes, e nenhuma informação útil à cosmologia poderia ser obtida. Podemos contornar este problema ao escolhermos reconstruir q utilizando apenas os primeiros M 0 < M CPs. Obviamente haverá alguma perda de informação devido aos CPs não utilizados. Entretanto, estes correspondem àqueles menos representativos do comportamento dos dados e os que possuem os maiores erros associados. 5.2.1 Quantos Componentes Principais? Quantos componentes utilizar na reconstrução é uma questão bastante complicada. Existem inúmeros métodos utilizados a fim de encontrar uma resposta quantitativa a essa pergunta. Entretanto, todos possuem algum grau de subjetividade (ver Jollife (2001), capítulo 6). Se mantivermos muitos CPs na reconstrução final, os intervalos de confiança serão enormes e os resultados perderiam o sentido estatístico. Por outro lado, se considerarmos um valor muito pequeno para M 0 podemos não perceber características importantes presentes 70 CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS nos dados. Na verdade, cabe ao pesquisador definir um limite máximo para M 0 , baseado em sua tolerância aos erros e na quantidade de informação que está disposto a sacrificar. Neste trabalho, utilizaremos o critério mais simples possível, chamado Percentual Cumulativo da Variância Total. Se considerarmos a soma de todos os autovalores como a variância total, a porcentagem englobada em uma reconstrução com M 0 CPs será PM 0 i=1 tM 0 = 100 PM λi j=1 λj . (5.22) Por exemplo, ao escolhermos um limite superior t∗ em algum valor entre 80% e 90%, mantendo M’ CPs, onde M’ é o menor valor inteiro para o qual tM 0 ≥ t∗, estamos elaborando uma regra que na prática preserva nos primeiros M’ CPs a maior parte da informação contida nos dados. Na maioria dos casos, o melhor valor para t∗ será maior quanto maior for número de observações e/ou o número de bins. É de consenso geral que um bom valor para t∗ muitas vezes estará entre 80% e 90%, entretanto, esse valor pode ser menor ou maior, dependendo das peculiaridades do conjunto de dados. Por exemplo, um valor maior do que 90% será apropriado quando um ou dois CPs apresentarem variância muito maiores do que os demais. Nesse caso, as estruturas menos óbvias contidas além desses CPs podem ser de interesse e um valor acima de 90% pode ser necessário para que essas características se manifestem. Por outro lado, quando o sistema apresenta um número de variáveis p muito grande, um corte em t∗ = 80% pode resultar em um número impraticável de CPs a ser transferidos para uma análise futura. Neste caso um valor menor para t∗ deve ser escolhido. Existiram ao longo da história várias tentativas de atribuir uma distribuição a tM 0 , e consequentemente produzir um procedimento formal para a escolha de M’ baseado em tM 0 . Mandel (1972) apresenta valores esperados para tM 0 quando todas as variáveis são independentes, normalmente distribuídas 5.2. RECONSTRUÇÃO DO PARÂMETRO DE DESACELERAÇÃO 71 e com a mesma variância. Os resultados de Mandel são baseados em simulações e, apesar de resultados exatos terem sido produzidos por alguns autores, eles funcionam apenas para casos limitados e muito especiais. Sugiyama & Tong (1976) descrevem uma distribuição aproximada para tM 0 que não assume independência ou variâncias iguais, e que pode ser usada para decidir se existe alguma estrutura subjacente para a distribuição dos valores de λ1 , λ2 , λ3 , ..., λM . Entretanto, o teste ainda assume gaussianidade e é apenas aproximado, logo não é claro quão útil o mesmo é na determinação de um valor para M’. Além disso, também é importante enfatizar que a forma dos CPs está diretamente relacionada à quantidade medida no conjunto de dados. A forma final dos CPs é consequência da pergunta que fazemos frente aos dados disponíveis. Neste contexto, medidas de diferentes quantidades resultam em CPs com comportamentos diferentes, e exigem que o limite mínimo exigido de tM 0 seja específico para cada caso. Este comportamento fica evidente nas figuras (5.3), (5.4) e (5.5), que representam os três primeiros CPs para medidas de distância de luminosidade, distância de diâmetro angular e parâmetro de Hubble, respectivamente. Os painéis das figuras (5.4) e (5.5) representam diferentes estágios de um experimento como o SKA, conforme descrito no capítulo (3). Observando os painéis inferiores dessas figuras, percebemos que CPs obtidos a partir de medidas do parâmetro de Hubble são significativamente diferentes de zero ao longo de todo o intervalo de desvio para o vermelho, o que não acontece para medidas de distância diâmetro angular (ou distância de luminosidade). Isto é uma consequência direta da estrutura matemática dessas duas quantidades: como escolhemos concentrar nossa análise no parâmetro de desaceleração, o cálculo da matriz de Fisher no caso de distâncias diâmetro angular (ou luminosidade) requer uma integral dupla (equação (B.31)), enquanto a expressão para o pa- 72 CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS râmetro de Hubble necessita de apenas uma integral ao longo dos valores de desvio para o vermelho (2.15). Logo, dados em baixos valores de desvio para o vermelho serão sempre mais importantes em um conjunto de medidas de distâncias diâmetro angular ou luminosidade do que em medidas do parâmetro de Hubble. Essa característica será bastante importante também na maneira como a variância total é distribuída entre os CPs. Podemos afirmar que para o tipo de análise desenvolvida neste trabalho, medidas de distâncias diâmetro angular ou luminosidade são mais aptas a isolar a informação contida nos dados do que medidas do parâmetro de Hubble. Em outras palavras, um conjunto de dados se mostra mais adequado, no contexto de ACP, a isolar a informação contida nos mesmos quando um valor menor de M 0 engloba uma maior percentagem da variância total tM 0 (vide valores de tM 0 apresentados nas figuras (5.11) e (5.15)). 5.2. RECONSTRUÇÃO DO PARÂMETRO DE DESACELERAÇÃO 73 1.0 dados do SDSS ei 0.5 0.0 1o CP 2o CP 3o CP -0.5 -1.0 0.2 0.4 0.6 14o CP 15o CP 0.8 z 1.0 1.2 1.4 , Figura 5.3: Primeiro (vermelho-sólido), segundo (azul-tracejado), terceiro (verdepontilhado), décimo quarto (cian-ponto-tracejado) e décimo quinto (amarelo-pontotracejado-largo) CPs como função do desvio para o vermelho obtidos a partir de dados de SNIa do SDSS. Nesta figura mostramos a função de interpolação de primeira ordem. Os dados foram divididos em 15 bins de largura ∆z = 0.1. Os CPs são mostrados de acordo com a convenção ei (z = 0) > 0. 74 CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS 1.0 BAO - d A estágio 1 ei 0.5 0.0 1o CP 2o CP 3o CP -0.5 -1.0 0.3 0.4 0.5 0.6 0.7 0.8 0.9 z 1.0 BAO - d A estágio 2 ei 0.5 0.0 1o CP 2o CP 3o CP -0.5 -1.0 0.4 0.6 0.8 1.0 1.2 z 1.0 BAO - d A estágio 3 ei 0.5 0.0 1o CP 2o CP 3o CP -0.5 -1.0 0.5 1.0 1.5 2.0 z Figura 5.4: Primeiro (vermelho-sólido), segundo (azul-tracejado) e terceiro (verdepontilhado) CPs como função do desvio para o vermelho obtidos a partir de dados simulados de distância de diâmetro angular. Em todos os casos, ∆z = 0.1. Painel superior: simulação de um experimento de estágio 1 do SKA, conforme descrito no texto, com 0.2 < z <1.0. Painel central: simulação de um experimento de estágio 2, com 0.2 < z < 1.4. Painel inferior: simulação de um experimento de estágio 3, com 0.2 < z < 2.2. 5.2. RECONSTRUÇÃO DO PARÂMETRO DE DESACELERAÇÃO 75 1.0 BAO - Hubble estágio 1 ei 0.5 0.0 -0.5 1o PC 2o PC 3o PC -1.0 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 z 1.0 BAO - Hubble estágio 2 ei 0.5 0.0 -0.5 -1.0 1o PC 2o PC 3o PC 0.4 0.6 0.8 1.0 1.2 1.4 z 1.0 BAO - Hubble estágio 3 ei 0.5 0.0 1o PC 2o PC 3o PC -0.5 -1.0 0.5 1.0 1.5 2.0 z Figura 5.5: Análogo à figura (5.4), mas neste caso para simulações de medidas do parâmetro de Hubble. 76 CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS A fim de lidar com essa diferente distribuição da variância total, definimos dois conjuntos de limites inferiores para tM 0 (tabelas 5.1 e 5.2), os quais utilizamos para definir o número de componentes presentes na reconstrução final. No caso de dados reais, o limite para tM 0 foi definido de maneira a evitar comportamento oscilatório de q(z) (vide figura (5.6)). Apesar de não impormos nenhuma forma funcional para o parâmetro de desaceleração, consideramos o mesmo uma função suave do desvio para o vermelho. Quando analisamos resultados baseados em dados simulados, o limite inferior para tM 0 foi definido de acordo com a concordância entre a reconstrução e o modelo fiducial. Os estágio mencionados nas tabelas 5.1 e 5.2 correspondem a diferentes estágios de um experimento como foi definido no capítulo (3). O gradativo aumento no limite definido para tM 0 reflete a melhora no razão entre sinal e ruído esperada para os diferentes estágios simulados. Conforme a qualidade e quantidade de dados aumenta, espera-se que possamos incluir uma porcentagem maior da variância total e ainda assim manter as incertezas na reconstrução final dentro de um limite razoável. É importante enfatizar que este comportamento varia de acordo com a estrutura de nosso conjunto de dados. Como apontam Kitching & Amara (2009), diferentes bases de dados resultarão em CPs diferentes, entretanto os mesmos tendem a um comportamento assintótico quando a incerteza nos dados diminui e o número de bins e dados aumentam (compare os painéis inferiores das figuras (5.4) e (5.5)). Neste limite, os CPs serão os mesmos, independentemente do conjunto de dados utilizados. 5.2. RECONSTRUÇÃO DO PARÂMETRO DE DESACELERAÇÃO 77 Tabela 5.1: Valores mínimos de tM 0 exigidos para determinar o número de CPs a serem utilizados na reconstrução do parâmetro de desaceleração, para dados de distância de luminosidade e distância de diâmetro angular. Dados tM 0 SDSS ≥ 90, 0% Simulação BAO - estágio 1 ≥ 95, 0% Simulação BAO - estágio 2 ≥ 99, 0% Simulação BAO - estágio 3 ≥ 99, 9% 78 CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS Tabela 5.2: Porcentagem mínima da variância total (tM 0 ) exigido para determinar o número de componentes utilizados na reconstrução de q com base em medidas do parâmetro de Hubble. Dados tM 0 Simulação - estágio 1 ≥ 92.5% Simulação - estágio 2 ≥ 95.0% Simulação - estágio 3 ≥ 97.5% 5.3. APLICAÇÕES 5.3 5.3.1 79 Aplicações Observações de Supernovas Ia Como um exemplo prático do procedimento descrito na seção anterior, aplicamos ACP a dados de SNIa do SDSS (Kessler et al., 2009). Conforme afirmamos no capítulo (3), a fim de evitar ambiguidades em relação aos parâmetros extras presentes no SALT2, utilizamos apenas valores de distancia módulo provenientes do sistema de padronização de curvas de luz MLCS2k2. Uma investigação nos moldes daquela apresentada aqui que inclua um tratamento coerente do parâmetros extras do SALT2 é certamente um assunto que merece atenção, entretanto está além dos objetivos deste trabalho. Seguindo as expressões apresentadas no apêndice (B), fomos capazes de calcular a matriz de Fisher e seus respectivos autovalores e autovetores. Possuímos alguma liberdade de escolha em se tratando dos valores atribuídos aos parâmetros βi nesta primeira etapa. Como ACP procura por direções no espaço de parâmetros onde a informação está concentrada, apesar da matriz de Fisher ser diferente para diferentes conjuntos de valores β̄, a forma global dos CPs e as relações entre os autovalores são mantidas. É preciso apenas enfatizar que as expressões apresentadas aqui são válidas quando βi 6= 0, ∀i. A figura (5.3) mostra os 3 primeiros CPs obtidos a partir de dados do SDSS. De posse desses CPs e utilizando os limites para tM 0 definidos na tabela 5.1, chegamos a conclusão de que a reconstrução final corresponde àquela com 2 CPs, e que engloba 94.8% da variância total. Mostramos na figura (5.6) as reconstruções a partir de 1 CP (painel superior) , 2 CPs (painel central) e 3 CPs (painel inferior). Para fins de comparação, a figura também mostra o comportamento de q(z) em um universo com matéria e energia escuras, onde 80 CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS wEE = cte = −0.76 (linha tracejada-azul). Esse modelo corresponde ao melhor ajuste encontrado por Kessler et al. (2009) para este conjunto de dados no contexto do MLCS2k2. 5.3. APLICAÇÕES 81 0.4 t M '=1 =81.5 % 0.2 0.0 q -0.2 -0.4 -0.6 dados do SDSS -0.8 1 PC -1.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 z 0.4 t M '=2 =94.8 % 0.2 0.0 q -0.2 -0.4 -0.6 dados do SDSS -0.8 2 PC -1.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 z 0.4 t M '=3 =98.1 % 0.2 0.0 q -0.2 -0.4 -0.6 dados do SDSS -0.8 3 PC -1.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 z Figura 5.6: Reconstrução de q(z) a partir de dados de SNIa do SDSS. A linha sólida (preta) representa o melhor ajuste para a função reconstruída e as linhas pontilhadas (vermelhas) representam níveis de confiança de 68.3%. A linha tracejada (azul) corresponde ao parâmetro de desaceleração em um universo plano, que contem matéria e energia escuras, no qual Ωm = 0.30 e w = cte = −0.76 (melhor ajuste encontrado por Kessler et al. (2009) para dados tratados de acordo com MLCS2k2 e a linha tracejada horizontal indica q(z) = 0, ∀z. Painel superior: Reconstrução de q(z) com 1 CP, correspondente a tM 0 =1 = 81.5% da variância total. Melhor ajuste para o parâmetro da expansão linear é α11CP = −0.38 ± 0.05. Painel central: Reconstrução feita com 2 CPs, que engloba tM 0 =2 = 94.8% da variância total e tem como coeficientes da expansão linear α12P C = −0.38 ±0.05 e α22P C = −0.18 ± 0.13. Painel inferior: Reconstrução com 3 CPs, cuja percentagem da variância total englobada é tM 0 =3 = 98.1%, α13P C = −0.38 ± 0.05, α23P C = −0.18 ± 0.13 e α33P C = −0.27 ± 0.29. 82 CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS 5.3.2 Quando a informação não é suficiente Neste ponto é importante chamar a atenção para o comportamento em altos valores de desvio para o vermelho encontrado nas figuras (5.3). Todos os três primeiros componentes tendem a zero na extremidade do intervalo de z, enquanto os últimos CPs (curvas pontotracejadas) exibem um sinal nesta região. Entretanto, estes são os que possuem maior erro associado e consequentemente, a forma dos mesmos se resume a um ruído oscilatório cujo comportamento é dominado pelas grandes incertezas locais. O importante a perceber aqui é que independentemente dos valores atribuídos aos parâmetros αi , uma combinação linear dos primeiros CPs sempre tenderá a zero para altos valores de z. Isso é uma reflexão da integral dupla presente nas expressões para distância de luminosidade, como discutimos anteriormente. Entretanto, nos falta argumentar quais serão as consequências desse comportamento dos CPs na função reconstruída. Em alguns estudos presentes na literatura (ver figura (20) de Tang, Abdalla, & Weller (2008) e referências para estudos de ACP focados em w), qf id na equação (5.19) recebe o valor de que o mesmo teria em um universo descrito pelo modelo padrão. Desta forma, os CPs mapeariam apenas desvios deste modelo presente nos dados. Em outras palavras, dado um determinado valor de z, se a informação presente nos dados é relevante a forma da função reconstruída é direcionada por tal informação. Entretanto, quando esta informação não existe ou é de pouca relevância, a reconstrução é direcionada para o valor qf id escolhida na equação (5.19). Nós evitamos fazer qualquer hipótese sobre o comportamento do universo em uma determinada faixa de desvio para o vermelho. Sendo assim, ao longo deste trabalho consideraremos qf id = 0, e consequentemente, podemos garantir que qualquer característica da reconstrução 5.3. APLICAÇÕES 83 com módulo diferente de zero é proveniente dos dados, e não de algum modelo previamente escolhido. Por outro lado, esta escolha implica na necessidade de encontrarmos um método de avaliar até que valor de z a reconstrução pode ser considerada confiável e a partir de qual valor de z o comportamento é puramente direcionado pela nossa escolha de qf id . Sendo assim, nossa função reconstruída será considerada verossímil apenas até o valor de z onde o comportamento assintótico começa a dominar: • o valor de corte zcut será definido como o valor de desvio para o vermelho onde a derivada da função reconstruída é nula, ∂qrec ∂z |zcut = 0, após znull , onde q(znull ) = 0, dentro de um intervalo de confiança de 68.3%. Para valores de z > zcut , a reconstrução tende a zero. Entretanto, consideramos que esse comportamento é uma consequência das escolhas relatadas anteriormente, e não de uma característica presente nos dados. Com base nesse critério, a figura (5.7) mostra a reconstrução final do parâmetro de desaceleração baseada em dados do SDSS, construída a partir da combinação linear dos 2 primeiros CPs apenas até o limite zcut = 0.63. 84 CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS 0.4 0.2 t M '=2 =94.8 % z cut =0.63 q 0.0 -0.2 -0.4 -0.6 dados do SDSS 2 PC -0.8 -1.0 0.1 0.2 0.3 0.4 0.5 0.6 z Figura 5.7: Reconstrução final do parâmetro de desaceleração para dados do SDSS. Valores dos parâmetros α1 e α2 são os mesmos mostrados na figura (5.6). Valor limite de desvio para o vermelho zcut = 0.63. 5.3. APLICAÇÕES 5.3.3 85 Medidas de dA (z) e H(z) a partir de BAO Aplicamos o mesmo procedimento a dados simulados de medidas de distância de diâmetro angular e medidas do parâmetro de Hubble, com base nas incertezas previstas por Abdalla, Blake, & Rawlings (2009) para diferentes estágios de um experimento como o SKA (vide capítulo (3)). Para cada estágio, realizamos 1000 simulações, tendo como modelo fiducial ΛCDM com Ωm = 0.23, Ωk = 0 bins em desvio para o vermelho de tamanho ∆z = 0.2, onde consideramos as medidas no valor médio de cada bin. Os três primeiros CPs construídos a partir de medidas do parâmetro de Hubble são mostrados na figura (5.5). A figura (5.8) mostra reconstruções com 1, 2 e 3 CPs, de cima para baixo respectivamente. De acordo com o critério definido na tabela 5.1, a reconstrução mais adequada é aquela com 1 CP que corresponde a 97.4% da variância total. As reconstruções feitas a partir de simulações de um experimento de estágio 2, feitas com 1 a 4 CPs a partir de medidas de distância de diâmetro angular são encontradas na figura (5.9). Os critérios descritos indicam que a reconstrução final deve ser representada por aquela feita com 2 CPs, que corresponde a ≈ 99.7% da variância total. No caso de um experimento de estágio 3, as reconstruções com 1 a 6 CPs são mostradas na figura (5.10). A reconstrução final corresponde àquela construída a partir de 3 CPs, englobando ≈ 99.9% da variância total. As reconstruções finais para experimentos de estágios 1 a 3 feitas a partir de medidas de distância de diâmetro angular são colocadas lado a lado na figura (5.11). 86 CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS 0.4 0.2 t M '=1 =97.4 % z cut =0.87 0.0 q -0.2 -0.4 BAO - está gio 1 -0.6 dA -0.8 1 CP -1.0 0.3 0.4 0.5 0.6 0.7 0.8 z 0.4 0.2 t M '=2 =99.7 % z cut =0.89 0.0 q -0.2 -0.4 BAO - está gio 1 -0.6 dA -0.8 2 CP -1.0 0.3 0.4 0.5 0.6 0.7 0.8 z 0.4 0.2 t M '=2 =99.9 % z cut =0.90 0.0 q -0.2 -0.4 BAO - stage 1 -0.6 dA -0.8 3 CP -1.0 0.3 0.4 0.5 0.6 0.7 0.8 0.9 z Figura 5.8: Reconstrução de q(z) a partir de medidas de distância de diâmetro angular para um experimento de estágio 1. A linha preta corresponde ao melhor ajuste para cada caso e as linhas vermelhas delimitam intervalos de confiança de 68.3%. A linha azul-tracejada corresponde ao modelo fiducial (ΛCDM com Ωm = 0.23) e a linha horizontal tracejada corresponde a q(z) = 0, ∀z. Painel superior: reconstrução com 1CP, para o qual α11CP = −0.63 ± 0.03. Painel central: reconstrução com 2 CPs, com α12CP = −0.62 ± 0.03, α22CP = 0.10 ± 0.18. Painel inferior: reconstrução com 3 CPs, sendo α13CP = −0.62 ± 0.03, α23CP = 0.10 ± 0.18 e α33CP = −0.10 ± 0.57. 5.3. APLICAÇÕES 0.4 0.2 87 0.4 t M '=1 =97.7 % 0.2 z cut =1.30 -0.2 -0.2 z cut =1.27 q 0.0 q 0.0 t M '=2 =99.7 % -0.4 -0.4 -0.6 BAO - está gio 2 -0.6 dA -0.8 BAO - está gio 2 dA -0.8 1 CP -1.0 2 CP -1.0 0.4 0.6 0.8 1.0 1.2 0.4 0.6 0.8 z 0.4 0.2 1.0 1.2 z 0.4 t M '=3 =99.9 % 0.2 z cut =0.82 -0.2 -0.2 z cut =0.84 q 0.0 q 0.0 t M '=4 =99.9 % -0.4 -0.4 -0.6 BAO - está gio 2 -0.6 dA -0.8 BAO - está gio 2 dA -0.8 3 CP -1.0 0.3 0.4 0.5 0.6 z 0.7 4 CP -1.0 0.8 0.3 0.4 0.5 0.6 0.7 0.8 z Figura 5.9: Reconstrução de q(z) para medidas de dA para um experimento de estágio 2. O código de cores é o mesmo utilizado na figura (5.8. Painel superior esquerdo: reconstrução com 1 CP, sendo α11CP = −0.63±0.01. Painel superior direito: reconstrução com 2 CP, para os quais α12CP = −0.63 ± 0.01 e α22CP = −0.04 ± 0.10. Painel inferior esquerdo: reconstrução com 3 CP, sendo α11CP = −0.63 ± 0.01, α23CP = −0.04 ± 0.10 e α33CP = 0.16±0.25. Painel inferior direito: reconstrução com 4 CPs: α14CP = −0.63±0.01, α24CP = −0.04 ± 0.10, α34CP = 0.16 ± 0.26 e α44CP = −0.02 ± 0.46. 88 CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS 0.4 0.2 0.4 t M '=1 =98.7 % 0.2 z cut =2.1 -0.2 -0.2 z cut =1.05 q 0.0 q 0.0 t M '=2 =99.8 % -0.4 -0.4 -0.6 BAO - está gio 3 -0.6 dA -0.8 BAO - está gio 3 dA -0.8 1 CP -1.0 0.5 1.0 2 CP -1.0 2.0 0.3 1.5 0.4 0.5 0.6 z 0.4 0.2 0.7 0.8 0.9 1.0 z 0.4 tM'=3=99.9% 0.2 z cut=1.17 -0.2 -0.2 z cut =1.46 q 0.0 q 0.0 t M '=4 =99.9 % -0.4 -0.4 BAO - está gio 3 -0.6 dA -0.8 BAO - está gio 3 -0.6 dA -0.8 4 CP 3 CP -1.0 -1.0 0.4 0.6 0.8 1.0 0.4 0.6 0.8 z 0.4 0.2 1.0 1.2 1.4 z 0.4 t M '=5 =99.9 % 0.2 z cut =1.41 -0.2 -0.2 z cut =1.3 q 0.0 q 0.0 t M '=6 =99.9 % -0.4 -0.4 BAO - está gio 3 -0.6 dA -0.8 BAO - está gio 3 -0.6 dA -0.8 5 CP -1.0 0.4 0.6 0.8 1.0 z 1.2 6 CP -1.0 1.4 0.4 0.6 0.8 1.0 1.2 z Figura 5.10: Reconstrução de q(z) utilizando medidas de dA para um experimento de estágio 3. O código de cores é o mesmo utilizado nas figuras (5.8) e (5.9). Painel superior esquerdo: reconstrução com 1CP, tendo α11CP = −0.59 ± 0.01. Painel superior direito: reconstrução com 2 CPs, sendo α12CP = −0.59 ± 0.01 e α22CP = −0.28 ± 0.05. Painel central esquerdo: reconstrução com 3 CPs, com α13CP = −0.59 ± 0.01, α23CP = −0.31 ± 0.05 e α33CP = 0.19 ± 0.15. Painel central direito: reconstrução com 4 CPs com valores α14CP = −0.59 ± 0.01, α24CP = −0.32 ± 0.05, α34CP = 0.28 ± 0.17 e α44CP = −0.28 ± 0.26. Painel inferior esquerdo: reconstrução com 5 CPs, sendo α15CP = −0.58 ± 0.01, α25CP = −0.32 ± 0.05, α35CP = 0.28 ± 0.17, α45CP = −0.33 ± 0.27 e α55CP = 0.01 ± 0.23. Painel inferior direito: reconstrução com 6 CPs, sendo α16CP = −0.58±0.01, α26CP = −0.39±0.05, α36CP = 0.29 ± 0.18, α46CP = −0.03 ± 0.28, α56CP = 0.10 ± 0.23 e α66CP = −0.06 ± 0.29. 5.3. APLICAÇÕES 0.4 0.2 89 t 1 =97.4 % z cut=0.87 0.4 t 3 =99.3 % 0.4 t 3 =99.9 % 0.2 z cut=0.88 0.2 z cut=1.08 -0.2 -0.2 -0.2 -0.4 q 0.0 q 0.0 q 0.0 -0.4 -0.4 BAO - stage 1-0.6 -0.6 angular diameter distance -0.8 BAO - stage 2-0.6 -0.8 1PC -1.0 0.3 0.4 0.5 0.6 z 0.7 -1.0 0.8 0.3 BAO - stage 3 angular diameter distance 0.4 0.5 0.6 z 0.7 -0.8 2PC -1.0 0.8 0.3 angular diameter distance 3PC 0.4 0.5 0.6 0.7 0.8 0.9 1.0 z Figura 5.11: Reconstruções finais feitas a partir dados simulados de medidas de distância de diâmetro angular. Painel esquerdo: dados de um experimento de estágio 3. Reconstrução feita com 1 CP, que corresponde a ≈ 97.4% da variância total e tem zcut = 0.87. Coeficiente da expansão linear tem valor α1 = −0.63 ± 0.03. Painel central: simulação de um experimento de estágio 2. Reconstrução final feita a partir de 2 CPs, que engloba ≈ 99.3% da variância total e tem zcut = 0.88. Expansão linear com coeficientes α1 = −0.63 ± 0.01 e α2 = −0.04 ± 0.10. Painel inferior: simulação de um experimento de estágio 3. Reconstrução final com 3 CPs, correspondente a ≈ 99.9% da variância total e com zcut = 1.08. Coeficientes da expansão linear dados por α1 = −0.59 ± 0.01, α2 = −0.31 ± 0.05 e α3 = 0.19 ± 0.15. 90 CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS A figura (5.5) mostra os três primeiros CPs obtidos a partir de medidas do parâmetro de Hubble para experimentos de estágio 1 a 3, de cima para baixo, respectivamente. Na figura (5.12), mostramos a reconstrução para um experimento de estágio 1, baseada em medidas do parâmetro de Hubble. Para este caso, a reconstrução final de acordo com os critérios definidos anteriormente é feita a partir de 2 CPs, que engloba ≈ 95.2% da variância total. As reconstruções para um experimento de estágio 2 são mostradas na figura (5.13), feitas a partir de 1 a 4 CPs. Neste caso, a reconstrução final é aquela feita com 3 CPs, que engloba ≈ 95.6% da variância total. O caso correspondente a um experimento de estágio 3 é mostrado na figura (5.14) para reconstruções com 1 a 6 CPs. Neste caso, a reconstrução final será aquela com 2 CPs, correspondendo a ≈ 97.5% da variância total. As reconstruções finais para os 3 estágios são mostradas lado a lado na figura (5.15). 5.3. APLICAÇÕES 91 0.4 0.2 t M '=1 =78.2 % z cut =0.43 0.0 q -0.2 -0.4 -0.6 BAO - está gio 2 -0.8 H -1.0 0.30 0.32 0.34 0.36 0.38 1 CP 0.40 0.42 z 0.4 0.2 t M '=2 =95.2 % z cut =0.78 0.0 q -0.2 -0.4 BAO - está gio 1 -0.6 H -0.8 2 CP -1.0 0.3 0.4 0.5 0.6 0.7 z 0.4 0.2 t M '=3 =98.8 % z cut =0.63 0.0 q -0.2 -0.4 BAO - está gio 1 -0.6 H -0.8 3 CP -1.0 0.30 0.35 0.40 0.45 0.50 0.55 0.60 z Figura 5.12: Reconstrução do parâmetro de desaceleração para um experimento de estagio 1, a partir de medidas do parâmetro de Hubble. O código de cores é o mesmo utilizado na figura (5.8). Painel superior: reconstrução com 1 CP, parâmetro da expansão linear dado por α11CP = −0.75±0.04. Painel central: reconstrução com 2 CPs, sendo α12CP = −0.60±0.06 e α22CP = −0.39±0.13. Painel inferior: reconstrução com 3 CPs, sendo α13CP = −0.55±0.07, α23CP = −0.30 ± 0.15 e α33CP = −0.28 ± 0.24. 92 CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS 0.4 0.2 0.4 t M '=1 =68.1 % 0.2 z cut =0.7 -0.2 -0.2 z cut =0.98 q 0.0 q 0.0 t M '=2 =88.1 % -0.4 -0.4 BAO - está gio 2 -0.6 H -0.8 BAO - está gio 2 -0.6 H -0.8 1 CP -1.0 0.30 0.35 0.40 0.45 0.50 0.55 0.60 2 CP -1.0 0.700.3 0.65 0.4 0.5 0.6 z 0.4 0.2 0.7 0.8 0.9 z t M '=3 =95.6 % 0.4 z cut =0.97 0.2 -0.2 -0.2 z cut =0.43 q 0.0 q 0.0 t M '=4 =98.6 % -0.4 -0.4 BAO - está gio 2 -0.6 H -0.8 BAO - está gio 2 -0.6 H -0.8 3 CP -1.0 0.3 4 CP -1.0 0.4 0.5 0.6 0.7 z 0.8 0.9 0.4 0.6 0.8 1.0 z Figura 5.13: Reconstrução de q(z) para um experimento de estágio 2, utilizando medidas do parâmetro de Hubble. O código de cores é o mesmo utilizado na figura (5.8). Painel superior esquerdo: reconstrução com 1 CP, sendo α11CP = −0.73 ± 0.02. Painel superior direito: reconstrução com 2 CPs, onde α12CP = −0.26 ± 0.05 e α22CP = −0.77 ± 0.07. Painel inferior esquerdo: reconstrução com 3 CPs, onde α13CP = −0.26 ± 0.05, α23CP = −0.73 ± 0.10 e α33CP = −0.08 ± 0.15. Painel inferior direito: reconstrução com 4 CPs, sendo α14CP = −0.20 ± 0.05, α24CP = −0.75 ± 0.11, α34CP = 0.06 ± 0.16 e α44CP = −0.30 ± 0.14. 5.3. APLICAÇÕES 0.4 0.2 93 0.4 t M '=1 =93.3 % 0.2 z cut =1.85 -0.2 -0.2 z cut =1.26 q 0.0 q 0.0 t M '=2 =97.4 % -0.4 -0.4 -0.6 BAO - está gio 3 -0.6 H -0.8 BAO - está gio 3 H -0.8 1 CP -1.0 0.4 0.6 0.8 1.0 1.2 1.4 2 CP -1.0 1.8 1.6 0.4 0.6 0.8 z 0.4 0.2 1.0 1.2 z 0.4 t M '=3 =98.7 % 0.2 z cut =1.39 -0.2 -0.2 z cut =1.5 q 0.0 q 0.0 t M '=4 =99.3 % -0.4 -0.4 -0.6 BAO - está gio 3 -0.6 H -0.8 BAO - está gio 3 H -0.8 3 CP -1.0 4 CP -1.0 0.4 0.6 0.8 1.0 1.2 0.4 0.6 0.8 1.0 z 0.4 0.2 1.2 1.4 z 0.4 t M '=1 =99.6 % 0.2 z cut =1.61 -0.2 -0.2 z cut =0.96 q 0.0 q 0.0 t M '=6 =99.8 % -0.4 -0.4 -0.6 BAO - está gio 3 -0.6 H -0.8 BAO - está gio 3 H -0.8 5 CP -1.0 0.4 0.6 0.8 1.0 z 1.2 1.4 6 CP -1.0 1.6 0.3 0.4 0.5 0.6 0.7 0.8 0.9 z Figura 5.14: Reconstrução de q(z) para um experimento de estágio 3, utilizando medidas do parâmetro de Hubble. O código de cores é o mesmo utilizado na figura (5.8). Painel superior esquerdo: reconstrução com 1 CP, onde α11CP = −0.41 ± 0.01. Painel superior direito: reconstrução com 2 CPs, sendo α12CP = −0.41±0.01 e α22CP = −0.62±0.04. Painel central esquerdo: reconstrução com 3 CPs e α13CP = −0.41 ± 0.01, α23CP = −0.62 ± 0.04 e α33CP = 0.24 ± 0.07. Painel central direito: reconstrução com 4 CPs, onde α14CP = −0.42±0.01, α24CP = −0.62±0.04, α34CP = 0.25±0.07 e α44CP = −0.20±0.08. Painel inferior esquerdo: reconstrução com 5CPs, onde α15CP = −0.41 ± 0.01, α25CP = −0.64 ± 0.04, α35CP = 0.23 ± 0.07, α45CP = −0.22 ± 0.08 e α55CP = 0.18 ± 0.12. Painel inferior direito: reconstrução com 6 CPs, sendo α16CP = −0.40±0.01, α26CP = −0.67±0.04, α36CP = 0.17±0.07, α46CP = −0.64 ± 0.15, α56CP = 0.42 ± 0.14 e α66CP = −0.41 ± 0.12. 94 CAPÍTULO 5. ANÁLISE POR COMPONENTES PRINCIPAIS 0.4 0.2 t 2 =95.2 % z cut =0.78 0.4 t 3 =95.6 % 0.4 0.2 z cut =0.97 0.2 -0.2 -0.2 -0.2 -0.4 -0.4 Hubble parameter -0.8 2PC -1.0 0.6 0.7 0.3 -0.8 -1.0 0.3 -0.4 BAO - stage -0.6 1 -0.6 0.4 0.5 z z cut =1.27 q 0.0 q 0.0 q 0.0 t 2 =97.5 % BAO - stage -0.6 2 BAO - stage 3 Hubble parameter 0.4 0.5 0.6 0.7 z 0.8 -0.8 3PC -1.0 0.9 Hubble parameter 2PC 0.4 0.6 0.8 1.0 1.2 z Figura 5.15: Reconstruções finais para o parâmetro de desaceleração, para medidas de H(z). O código de cores é o mesmo utilizado na figura (5.8). Painel esquerdo: reconstrução final para um experimento de estágio 1, feita com 2 CP, o que corresponde a ≈ 95.2% da variância total e tem desvio para o vermelho máximo zcut = 0.78. Melhores ajustes para os coeficientes da expansão linear dados por α1 = −0.60 ± 0.06 e α2 = −0.39 ± 0.13. Painel central: reconstrução final para um experimento de estágio 2, feita com 3 CP, que engloba ≈ 95.6% da variância total e tem zcut = 0.97, α1 = −0.26 ± 0.05, α2 = −0.73 ± 0.10 e α3 = −0.08 ± 0.15. Painel direito: reconstrução final para um experimento de estágio 3, a partir de 2 CP englobando ≈ 97.5% da variância total e tendo zcut = 1.27, α1 = −0.41 ± 0.01 e α2 = −0.62 ± 0.04. Capítulo 6 Discussões e Conclusões Neste trabalho, nosso principal objetivo foi encontrar informações sobre a história da evolução dinâmica do universo fazendo uso do menor número possível de hipóteses. Para tanto, focamos nossa análise no parâmetro de desaceleração, o que nos permitiu utilizar medidas de distâncias sem fazer hipóteses restritivas a cerca do modelo cosmológico ou teoria métrica de gravitação. Primeiramente, propusemos uma parametrização formada por 4 parâmetros (qi , qf , zt , τ ) com significados físicos bastante claros. O ponto importante a ser destacado é a versatilidade presente nesta parametrização, que pode ser interpretada como sua habilidade em reproduzir modelos presentes na literatura para valores específicos de seus parâmetros. Além, é claro, das vantagens embutidas na escolha da análise do parâmetro de desaceleração citadas anteriormente. Considerando que houve uma fase de desaceleração dominada pela matéria e que atualmente a expansão é guiada por algo que se parece muito a CC, fixamos qi = 0.5. Aplicamos então nossa parametrização a dados de SNIa, BAO e medidas da distância à superfície de último espalhamento. Nossos resultados indicam que, utilizando apenas dados de SNIa, o valor do desvio para o vermelho na transição entre desaceleração/aceleração pode ser bastante grande (zt > 10). Mostramos também que a combinação Sk /Dv + SNIa formam um par de observáveis ideal a ser usado no espaço de fase zt × τ , uma vez que os mesmos produzem contornos de confiança quase ortogonais entre si nesse espaço. 95 96 CAPÍTULO 6. DISCUSSÕES E CONCLUSÕES Ao aplicarmos esta formulação a diferentes conjuntos de dados, confirmamos a tensão existente entre os dados do Gold182 e SNLS de uma maneira bem geral. Apresentamos também uma simulação considerando avanços futuros nas medidas de BAO e SNIa que mostram o potencial restritivo dos dados frente à nossa parametrização. Em uma tentativa de determinar o valor atual do parâmetro de desaceleração, apresentamos também níveis de confiança no espaço de parâmetros zt × τ × qf para dados atuais de Sk /Dv + SNIa. Desta análise, podemos apenas dizer que o parâmetro de desaceleração atualmente possui um valor negativo, mas os intervalos de confiança ainda são muito largos para que algo mais possa ser dito. Uma análise mais detalhada do comportamento desta parametrização para qf 6= −1 ainda se faz necessária. Neste momento, nossa parametrização não é capaz de reproduzir modelos que atualmente apresentem desaceleração mas que no futuro voltarão a acelerar (Frieman et al., 1995; Carvalho et al., 2006). Seria interessante investigar até que ponto nossa parametrização é capaz de reproduzir esse tipo de modelo para z > 0. O caso mais geral, onde qf 6= −1 também pode ser alvo de investigações futuras. Uma versão mais detalhada e atualizada desse tipo de análise está em desenvolvimento atualmente por Giostri et al. (2010). Em um segundo momento, procuramos uma maneira de analisar q(z) sem a necessidade de determinar previamente uma dependência com o valor do desvio para o vermelho. Para tanto, utilizamos ACP. Este procedimento é bastante utilizado em cosmologia a fim de obter contornos de confiança em um determinado espaço de parâmetros. Na análise apresentada nesta tese, chamamos a atenção para um outro aspecto da ACP: a capacidade de proporcionar um espaço de parâmetros de dimensão pequena onde os erros são descorrelacionados e no qual podemos reescrever quantidades cosmológicas. Escolhemos novamente analisar o parâmetro de desaceleração, e neste caso, descobrimos que os cálculos necessários à obtenção da matriz de Fisher podem ser resolvidos analiticamente. Além disso, como não estamos fazendo nenhum tipo de hipótese sobre o conteúdo material do universo, evitamos problemas relacionados a parâmetros cosmológicos não relacionados a q, como discutido em Kitching & Amara (2009). 97 Foi necessário também escolher uma base na qual deveríamos expandir q(z). A única restrição imposta a um potencial conjunto de funções é que o mesmo forme um conjunto completo ortogonal (Kitching & Amara, 2009). Novamente, nossa decisão foi feita de forma a preservar a generalidade. Decidimos expandir q(z) em uma soma de funções degrau, de forma que a resolução de nossos resultados é determinada unicamente pela nossa capacidade de computação, uma vez que qualquer função pode ser exatamente determinada para um número infinito de bins. É importante enfatizar que essa escolha também tem suas consequências. Diferentes funções de base iniciais levam a diferentes formas para os CPs, entretanto, para um número suficientemente grande de bins os CPs tendem ao mesmo comportamento. O fato dos CPs e variâncias associadas serem diferentes para diferentes conjuntos de base iniciais é bastante importante no uso da matriz de Fisher para a determinação de curvas de confiança, mas não é tão grave para o caso apresentado aqui. No nosso caso, os CPs são uma base para a expansão linear e a forma final de q(z) será determinada pelos parâmetros αi . O mesmo tipo de comportamento é observado no caso onde a base inicial é a mesma, mas utilizamos observáveis diferentes. Podemos visualizar tal efeito nos resultados apresentados no capítulo (5). Sabemos que neste caso existem diferenças entre o comportamento dos componentes ao longo do intervalo de desvio para o vermelho para diferentes observáveis (figura (5.4) e (5.5)), o que também se reflete na distribuição da percentagem da variância total entre os CPs (tabelas (5.1) e (5.2)). Apesar disso, diferentes CPs resultarão em diferentes valores αi , mas a forma de q(z) será sempre guiada pelo comportamento dos dados (compare os painéis direitos das figuras (5.11) e (5.15)). Realizamos a reconstrução de q(z) a partir de dados do SDSS. Como era esperado, este procedimento demanda incertezas muito baixas e os dados atuais não são capazes de proporcionar resultados conclusivos. Entretanto, simulações de BAO para um experimento como o SKA mostram que, no futuro, resultados bastante interessantes podem ser obtidos a partir deste procedimento. O ponto crucial aqui é a redução da dimensionalidade do espaço de parâmetros. Por 98 CAPÍTULO 6. DISCUSSÕES E CONCLUSÕES exemplo, para um experimento de estágio 3, tínhamos inicialmente 10 valores de βi correspondentes a bins de ∆z = 0.2 em um intervalo de desvio para o vermelho de 0.2 < z < 2.2. Vemos na figura (5.11), painel direito, a reconstrução feita com 3 CPs em excelente acordo com o modelo fiducial, para 0.2 < z < 1.1. Nossa escolha da quantidade de CPs a serem usados nas reconstruções e o valor de zcut escolhido em cada caso reduziram o intervalo de desvio para o vermelho na reconstrução a aproximadamente metade do intervalo inicial coberto pelos dados. Por outro lado, a reconstrução obtida nesse intervalo de desvio para o vermelho é muito melhor do que aquela que seria obtida a partir da soma de funções degrau em bins de ∆z = 0.2, como tínhamos inicialmente. Vale lembrar que todos os resultados apresentados nesta tese, em se tratando de ACP, foram obtidos analítica e numericamente. Até o momento, nós não encontramos na literatura referências a esse tipo de derivação analítica aplicada à cosmologia. Acreditamos que essa é uma maneira eficaz de obter informações sobre a evolução dinâmica do universo de maneira independente de modelo e praticamente livre de erros numéricos. Apêndice A Desvio para o Vermelho Existem várias maneiras de medir distâncias em escalas cosmológicas. Em todos os métodos nossa única fonte de informação é a radiação emitida pela fonte da qual deseja-se saber a distância. Cada fonte (uma estrela, por exemplo) emite radiação em frequências características, determinadas pelos elementos químicos responsáveis pela radiação emitida. Quando existe movimento relativo entre a fonte e o observador, dois picos de onda que saíram da fonte em um intervalo ∆t chegarão ao observador em um intervalo de tempo menor ou maior, dependendo se a fonte se aproxima ou se afasta de quem a observa. Matematicamente, esta diferença no período entre os picos pode ser representada em termos do comprimento de onda emitido, λe , e aquele medido pelo observador, λ0 . De acordo com a Relatividade Restrita, esta razão é dada por: λ0 1 + vr 1 + v senθ cos φ √ =√ = , 2 λe 1−v 1 − v2 (A.1) onde vr é a velocidade na direção radial e a segunda igualdade é válida para um observador na origem de um sistema de coordenadas esférico. Esse efeito é conhecido como Efeito Doppler e o desvio espectral, z, da radiação emitida, definido como: z= λ0 − λe λe ou 99 1+z = λ0 . λe (A.2) 100 APÊNDICE A. DESVIO PARA O VERMELHO Em um universo em expansão, quando o movimento entre a fonte e o observador se deve à expansão cósmica, o efeito é designado efeito Doppler Cosmológico e a relação entre o desvio para o vermelho e o fator de escala pode ser encontrada a partir da equação (2.1). Considere um observador na origem do sistema de coordenadas e uma onda eletromagnética viajando na direção radial. Lembrando que a luz segue geodésicas nulas, temos: 0 = dt2 − a2 (t) √ dr2 . 1 − kr2 (A.3) Um sinal luminoso deixa a fonte em (re ,θe ,φe ) no instante te e chega ao observador na origem em t0 . Sendo assim, Z t0 te dt = a(t) Z 0 √ re dr . 1 − kr2 (A.4) Note que o lado direito da expressão anterior é independente do tempo. Da mesma forma, se um outro sinal sai da fonte em te + δte , será observado na origem em t0 + δt0 . Consequentemente, Z Z t0 te +δte dt + a(t) t0 +δt0 te +δte Z t0 +δt0 t0 Z t0 +δt0 t0 dt = a(t) dt = a(t) dt = a(t) Z t0 dt , a(t) te Z te +δte te Z te +δte te dt + a(t) (A.5) Z t0 te +δte dt , a(t) (A.6) dt . a(t) (A.7) νe a0 = . ν0 ae (A.8) Como t0 − te = δt ¿ 1, podemos escrever: δte δt0 = a(t0 ) a(te ) ⇒ De acordo com a definição apresentada na equação (A.2), podemos concluir: 1+z = νe a0 λ0 = = . λe ν0 ae (A.9) Apêndice B Cálculo da Matriz de Fisher... Os resultados apresentados no corpo desta tese foram obtidos com base nos cálculos analíticos apresentados a seguir. Para calcular a matrix de Fisher, primeiramente consideramos uma função densidade de probabilidade (PDF) Gaussiana para cada evento, f (x; σdados ; x̄(θ̄)) = 1 √ σdados ¸ · (x − x̄(θ̄))2 , exp − 2 2σdados 2π (B.1) onde θ̄ é o vetor cujos componentes são os parâmetros do modelo em questão e σdados representa o erro associado a cada observação. Seja N o número de observações independentes presentes em nosso conjunto de dados, neste caso, a função de verossimilhança será dada por: L(θ̄) = N Y £ ¤ f (xi , σdadosi ; θ̄) , (B.2) i=1 e a matriz de Fisher é definida como ¿ 2 À ∂ ln L(θ̄) Fkl = − , ∂θk ∂θl (B.3) onde <> representa o valor esperado. Considerando uma variável x, cuja função densidade de probabilidade é dada por P rob(x), 101 102 APÊNDICE B. CÁLCULO DA MATRIZ DE FISHER... o valor esperado será Z hxi = xP rob(x)dx, (B.4) Ω onde Ω representa todo o domínio da variável x. É importante lembrar que, por definição, Z P rob(x)dx = 1. (B.5) Ω B.1 ... a partir da Distância de Luminosidade Mostraremos abaixo alguns passos já apresentados no capítulo 5 a fim de facilitar o acompanhamento dos cálculos posteriores. Como foi discutido no capítulo 3, as duas quantidades resultantes da observação de supernovas quando utilizamos MLCS2k2, são o módulo de distância, µ, e o desvio para o vermelho (z). Ambos podem ser relacionados à cosmologia através da distância de luminosidade (equação (2.24)), módulo de distância: µ(z) = m − Mabs = 5 log10 [DL (z)] + µ0 , onde: distância de luminosidade: parâmetro de desaceleração: µ0 = 42.38 + 5 log(h), DL dL (z) = = (1 + z) H0 q(z) = (1 + z) Z z 0 H 0 (z) − 1, H(z) ·Z parâmetro de Hubble: (B.6) z H(z) = H0 exp du , H(u) (B.7) (B.8) ¸ (q(v) + 1)d ln (1 + v) , (B.9) 0 onde Mabs representa a magnitude absoluta de uma SNIa, a linha na equação (B.8) representa B.1. ... A PARTIR DA DISTÂNCIA DE LUMINOSIDADE 103 a derivada em relação ao desvio para o vermelho, H0 = 100 h km/s/Mpc é o valor atual do parâmetro de Hubble e DL (z) é a distância de luminosidade em unidades de H0 . Agrupando as equações (B.6) à (B.9), temos a expressão para a módulo de distância em função do parâmetro de desaceleração, · Z µ(z) = 5 log (1 + z) z · Z u ¸ ¸ exp − [q(v) + 1]d ln (1 + v) du . 0 (B.10) 0 De acordo com o método proposto por Shapiro & Turner (2006), dividimos o intervalo de desvio para o vermelho em M bins de tamanho ∆z, e consideramos o parâmetro de desaceleração como uma expansão linear de funções degrau. Matematicamente, q(z, β̄) = M X βi ci (z), (B.11) i=1 onde βi são constantes e ci (z) = 1 se 0 caso contrário (i − 1)∆z < z < i∆z . Agora, podemos utilizar a equação (B.11) na equação (B.10) e obter uma expressão para a distância de luminosidade, e consequentemente para módulo de distância, a partir do valor atribuído ao parâmetro de desaceleração em cada bin. Na análise que segue, {βi } será o conjunto de parâmetros do nosso modelo. Nosso objetivo é encontrar o valor de cada β em seu respectivo bin de modo que a concordância com os dados seja a melhor possível. Logo, precisamos encontrar uma expressão para função de verossimilhança, e consequentemente da matriz de Fisher, tendo x̄i (θ) → µ(zi ; β̄) e xi → mi , LSN (θ̄) = N Y i=1 " " (mi − µ(zi ; β̄))2 √ exp − ¡ SN ¢2 SN σdados 2π 2 σdadosi i 1 ## , (B.12) SN onde β̄ é o vetor cujos componentes são os parâmetros βi e σdados são as incertezas de cada i observação, obtidas a partir dos dados. Nosso primeiro passo será marginalizar a equação 104 APÊNDICE B. CÁLCULO DA MATRIZ DE FISHER... (B.12) para todos os valores possíveis de µ0 (Goliath et al., 2001). Para tanto, considere ¡ ¢ yi = 5 log DL (zi ; β̄) , com isso podemos expandir a função de verossimilhança de forma que # 2 (m − y − µ ) i i 0 √ LSN (M, β̄) = exp − ¡ SN ¢2 SN σdadosj 2π i=1 2 σdadosi j=1 " " # # N N Y X 1 (mi − yi )2 − 2µ0 (mi − yi ) + µ20 √ = exp − ¡ SN ¢2 SN σdados 2π 2 σdados j=1 i=1 j i " # " # N N 2 Y X 1 1 (mi − yi ) √ = exp − ¡ SN ¢2 × SN 2 σ 2π σdadosi dados j=1 i=1 j " # N N X 1 (mi − yi ) µ20 X × exp µ0 ¡ SN ¢2 − ¡ SN ¢2 . 2 i=1 σdados i=1 σdados N Y " 1 # " N Y i i Para facilitar a notação, considere N X (mi − yi )2 A ≡ ¡ SN ¢2 , σdadosi i=1 (B.13) N X (mi − yi ) B ≡ ¡ SN ¢2 , i=1 σdadosi (B.14) C ≡ N Y i=1 ¡ 1 SN σdados i ¢2 , (B.15) Dessa forma, a função de verossimilhança se torna SN L µ ¶ µ ¶ C A Cµ20 (β̄, µ0 ) = √ exp − exp Bµ0 − . 2 2 2π (B.16) Por definição, C ∈ <+ , o que nos permite realizar facilmente a marginalização sobre o parâmetro µ0 , Z +∞ −∞ r µ 2¶ ¸ Cµ20 π B exp Bµ0 − exp dµ0 = . 2 2C 2C · (B.17) Logo, a função de verossimilhança marginalizada será dada por Z SN L ∞ √ C exp (β̄) = L(β̄, µ0 )dµ0 = 2 −∞ µ B2 2C ¶ µ A exp − 2 ¶ . (B.18) B.1. ... A PARTIR DA DISTÂNCIA DE LUMINOSIDADE 105 Utilizamos então a equação (B.18) na expressão (B.3) para obter expressões analíticas para os componentes da matriz de Fisher. Para tanto, é necessário derivar o logaritmo da equação (B.18) em relação aos parâmetros βi , £ SN ln L ¤ (β̄) = ln Ã√ ! C B2 A + − 2 2C 2 (B.19) £ ¤ ∂ ln LSN (β̄) B ∂B 1 ∂A = − ∂βl C ∂βl 2 ∂βl £ ¤ ∂ 2 ln LSN (β̄) 1 ∂B ∂B B ∂ 2 B 1 ∂ 2A = + − . ∂βk ∂βl C ∂βk ∂βl C ∂βk ∂βl 2 ∂βk ∂βl (B.20) (B.21) A partir das definições (B.13 e B.14), temos, N X (mi − yi ) ∂yi ∂A = − 2¡ ¢2 SN ∂βl ∂βl σdados i=1 i ( ) N X ∂ 2A ∂yi ∂yi 2 (mi − yi ) ∂ 2 yi = − 2¡ ¡ SN ¢2 ¢2 SN ∂βk ∂βl ∂βk ∂βl σdados ∂βk ∂βl σdados i=1 i ∂B = − ∂βl N X i=1 (B.23) i 1 ∂yi ¡ SN ¢2 σdadosi ∂βl (B.24) N X 1 ∂ B ∂ 2 yi = − , ¡ SN ¢2 ∂βk ∂βl ∂β ∂β k l σ i=1 dados 2 (B.22) (B.25) i consequentemente, ∂ 2 LSN (β̄) 1 = ∂βk ∂βl C N X à ! N X ∂yi 1 1 ∂yj ³ + ¡ SN ¢2 ´2 ∂β ∂β k k SN σ i=1 j=1 dadosi σdadosj # " N N 1 X (mi − yi ) X 1 ∂ 2 yj − + ¡ SN ¢2 ³ ´2 C i=1 σdados ∂β ∂β k l SN j=1 σdados i j − N X i=1 ¡ 1 SN σdados i N ∂yi ∂yi X (mi − yi ) ∂ 2 yi + . ¢2 ¡ SN ¢2 ∂βk ∂βl ∂β ∂β k l σ i=1 dados (B.26) i A aplicação do valor esperado na expressão acima nos permite escrever os elementos da 106 APÊNDICE B. CÁLCULO DA MATRIZ DE FISHER... matriz de Fisher como * FklSN = = £ ¤+ ∂ 2 ln L(β̄) − ∂βk ∂βl 1 C N X à ¡ i=1 − 1 SN σdados i N X i=1 ¡ ¢2 1 SN σdados i ∂yi ∂βk ¢2 ! N X ³ j=1 1 SN σdados j ´2 ∂yj + ∂βk ∂yi ∂yi . ∂βk ∂βl (B.27) Sendo assim, concluímos que para obtermos uma expressão analítica para a matriz de Fisher, é preciso saber calcular analiticamente a derivada da módulo de distância em relação aos parâmetros βi . Lembrando que ∂ loga x 1 = , ∂x x ln a (B.28) ∂yi 5 ∂DL (zi ; β̄) = . ∂βl ∂βl DL (zi ; β̄) ln(10) (B.29) temos Utilizamos então a equação (B.29) na equação (B.27), obtemos FklSN # ¸ N " 1 ∂DL (zi ; β̄) X 1 1 ∂DL (zj ; β̄) + 2 ∂βk σdados ∂βl DL (zi ; β̄) DL (zj ; β̄) j i=1 j=1 ) N X 1 ∂DL (zk ; β̄) ∂DL (zk ; β̄) 1 − . (B.30) 2 2 σ ∂β ∂β D (z ; β̄) k l k dados L k k=1 25 = ln(10)2 ( N · X Nosso próximo passo é calcular a derivada da distância de luminosidade em relação aos parâmetros βi . Para facilitar a notação, dividimos a equação (B.7) em duas integrais: DL (z; β̄) = onde I1 (u, β̄) (1 + z)I2 (I1 (u, β̄)), Z I2 (z, I1 (u; β̄)) u = Z (B.31) 0 = 0 [1 + q(v, β̄)]d ln (1 + v), (B.32) exp [−I1 (u)]du, . (B.33) z B.1. ... A PARTIR DA DISTÂNCIA DE LUMINOSIDADE 107 Começamos por introduzir a equação (B.11) na expressão para I1 (u, β̄), Z u I1 (u, β̄) = [1 + q(v, β̄)]d ln (1 + v), ! Z uà M X = 1+ βi ci (v) d ln (1 + v), (B.34) 0 0 Z i=1 u = d ln (1 + v) + 0 M X Z = ln (1 + u) + M X βi i=1 u βi ci (v)d ln (1 + v), (B.36) 0 i=1 0 Z (B.35) if u < (i − 1)∆z ui d ln (1 + v) if ui−1 Z u d ln (1 + v) if u > i∆z (B.37) . (i − 1)∆z < u < i∆z ui−1 Podemos simplificar a expressão anterior, considerando algumas definições: • J → número de bins inteiros entre 0 e o valor de desvio para o vermelho da i-ésima supernova; • u0 = 0 (z0 = 0); • βJ é o parâmetro correspondente ao bin imediatamente anterior àquele onde se encontra a supernova em questão 1 ; • ui (zi ) corresponde ao limite superior do i-ésimo bin. Com isto, podemos escrever: I1 (u, β̄) = ln(1 + u) + J X µ βi ln i=1 1 + ui 1 + ui−1 µ ¶ + βJ+1 ln ¶ 1+u . 1 + uJ (B.38) Logo, a expressão para I2 a partir da equação (B.38) é dada por Z z I2 (z, β̄) = 0 1 (1 + u) u J=int( ∆z )µ Y i=1 ¶−βi µ ¶−βJ+1 1 + ui 1+u du. 1 + ui−1 1 + uJ (B.39) 1 Por exemplo: se ∆z = 0.1 e zi = 0.34 → J = 3 e zi se encontra no quarto bin, cujo parâmetro correspondente é β4 . 108 APÊNDICE B. CÁLCULO DA MATRIZ DE FISHER... Como o limite do produtório depende da variável de integração, dividimos a integral em uma soma de J + 1 integrais, de modo que dentro de cada intervalo de integração o índice do somatório permaneça constante2 , ou seja, I2 (z, β̄) = (Z J X k=1 "k−1 µ # ) Y 1 + ui ¶−βi µ 1 + u ¶−βk 1 du + 1 + ui−1 1 + uk−1 zk−1 (1 + u) i=1 # " J µ Z z Y 1 + ui ¶−βi µ 1 + u ¶−βJ+1 1 + du. 1 + ui−1 1 + uJ zJ (1 + u) i=1 zk (B.40) Dado que o produtório da expressão acima não depende da variável de integração, podemos escrever ("k−1 µ # ) ¶−βk Z zk Y 1 + zi ¶−βi µ 1 −βk −1 I2 (z, β̄) = (1 + u) du + 1 + zi−1 1 + zk−1 zk−1 i=1 k=1 # " J µ Y 1 + zi ¶−βi µ 1 ¶−βJ+1 Z z (1 + u)−βJ+1 −1 du., + 1 + z 1 + z i−1 J zJ i=1 J X (B.41) e consequentemente, a distância de luminosidade será dada por ( J ""k−1 µ # # ¶−βk Z zk X Y 1 + zi ¶−βi µ 1 DL (z, β̄) = (1 + z) (1 + u)−βk −1 du + 1 + z 1 + z i−1 k−1 zk−1 i=1 k=1 ) ¶ ¶ µ µ Z J −βi −βL+1 z Y 1 + zi 1 (1 + u)−βJ+1 −1 du . (B.42) + 1 + z 1 + z i−1 J z J i=1 Supondo que estamos trabalhando em um caso particular, onde todos os coeficientes β são diferentes de zero (βi 6= 0, ∀i), podemos efetuar a integral obtendo # " ""k−1 µ µ ¶−βk # # Y 1 + zi ¶−βi µ 1 ¶ 1 + zk 1− + DL (z, β̄) = (1 + z) 1 + z β 1 + z i−1 k k−1 i=1 k=1 " J µ # " µ ¶−βJ+1 #) Y 1 + zi ¶−βi µ 1 ¶ 1+z + 1− . (B.43) 1 + zi−1 βJ+1 1 + zJ i=1 ( 2 J X Lembramos que, por definição, P0 i=1 i = 0 e, da mesma forma, Q0 i=1 i = 1. B.1. ... A PARTIR DA DISTÂNCIA DE LUMINOSIDADE 109 Dividimos então a equação (B.43) de forma que DL (z; β̄) = sendo f1 = f2 = (1 + z) [f1 + f2 ] , (B.44) ("k−1 µ # " µ ¶−βk #) Y 1 + zi ¶−βi µ 1 ¶ 1 + zk 1− , (B.45) 1 + zi−1 βk 1 + zk−1 i=1 k=1 # " " J µ µ ¶−βJ+1 # Y 1 + zi ¶−βi µ 1 ¶ 1+z 1− . (B.46) 1 + z β 1 + z i−1 J+1 J i=1 J X Sendo assim, podemos efetuar a derivada dos dois termos separadamente.3 É importante chamar a atenção para os limites do somatório em f1 e f2 . Repare que, quando derivamos em relação a um determinado parâmetro βl , o produtório produzirá um resultado não nulo apenas quando k > l, pois caso contrário o termo dependente de βl . Para representar matematicamente essa característica, definimos Θ(x) = 1, se x ≥ 0 0, se x < 0 . Podemos então escrever J X ∂f1 = ∂βl k=1 ("k−1 µ # Y 1 + zi ¶−βi × 1 + zi−1 i=1 ( µ ¶ "µ à µ ¶−βk µ ¶ ¶−βk !# 1 1 + zk 1 + zk 1 1 + zk × δkl ln − 1− + βk 1 + zk−1 1 + zk−1 βk 1 + zk−1 " µ ¶µ ¶" µ ¶−βk ##)) 1 1 + zk 1 + zl 1− , −Θ(k − 1 − l) ln 1 + zl−1 βk 1 + zk−1 (B.47) onde δ representa a função delta de Kronecker4 . Da mesma forma, a derivada de f2 será x x Lembre-se que ∂a ∂x = a ln a e, analogamente, 4 δkl = 0 se k 6= l e δkl = 1 caso contrário. 3 ∂a−x ∂x = −a−x ln a. 110 APÊNDICE B. CÁLCULO DA MATRIZ DE FISHER... dada por ¶−βi J µ Y ∂f2 1 + zi = × ∂βl 1 + zi−1 i=1 ( "µ " ¶−βJ+1 µ ¶ µ ¶−βJ+1 ## δ(J)l 1 1+z 1+z 1+z × ln − 1− + βJ+1 1 + zJ 1 + zJ βJ+1 1 + zJ " µ ¶" µ ¶−βJ+1 ##) 1 + zl 1+z Θ(J − l) ln 1− . (B.48) − βJ+1 1 + zl−1 1 + zJ Dessa forma, podemos utilizar as equações (B.47 e B.48) para compor a expressão analítica para a derivada da distância de luminosidade, · ¸ ∂DL (z, β̄) ∂f1 (z; β̄) ∂f2 (z; β̄) = (1 + z) + , ∂βl ∂βl ∂βl (B.49) e utilizar esta última na equção (B.30). Assim obtemos uma expressão analítica para o cálculo dos elementos da matriz de Fisher. B.2 ... a partir da Distância de Diâmetro Angular Novamente, consideramos funções densidade de probabilidade gaussianas para cada observação. Somando a isso que cada ponto observacional deve ser independente dos demais, temos que a função de verossimilhança terá a forma dada pela equação (5.2). Mais especificamente, LDA (H0 ; β̄) = N Y ³ dAi − exp − ´ ³ ´2 2 √ dA dA i=1 2π σdados 2 σ dadosi i ³ 1 ´2 , 1 D (z ; β̄) H0 A i (B.50) onde DA (z; β̄) é a distância de diâmetro angular em unidades de H0−1 e N o número de dados disponíveis. Neste caso, a dependência com H0 não nos permite realizar a marginalização sobre H0 como fizemos com µ0 na seção anterior. Sendo assim, utilizaremos o mesmo procedimento B.2. ... A PARTIR DA DISTÂNCIA DE DIÂMETRO ANGULAR 111 adotado por Albrecht et al. (2009), onde á matriz de Fisher é construída a partir de todos os S parâmetros (q r), onde q corresponde ao conjunto de parâmetros de interesse e r representa os parâmetros sob os quais desejamos realizar a marginalização. Neste contexto, a matriz de DA Fisher marginalizada (Fmarg ) será dada por ¡ ¢−1 H0 β DA Fmarg = F ββ − F βH0 F H0 H0 F , (B.51) onde F ββ , F βH0 e F H0 H0 são submatrized da matriz de Fisher. No caso específico que estamos analisando, tais termos são dados por Fklββ βH0 Fk1 = rq F1k H0 H0 F11 ¿ 2 À N ∂ ln LDA (H0 ; β̄) 1 X = − = 2 ³ ∂βk ∂βl H0 i=1 1 dA σdados i ´2 ∂DA (zi ; β̄) ∂DA (zi ; β̄) (B.52) , ∂βk ∂βl ¿ 2 À N ∂ ln LDA (zi ; β̄) 1 X DA (H0 ; β̄) ∂DA (zi ; β̄) = − , = 3 ³ ´2 ∂βk ∂H0 H0 i=1 ∂βk dA σdadosi #2 " ¿ 2 À N ∂ ln LDA (H0 ; β̄) 1 X DA (zi ; β̄) . = − = 4 dA ∂H02 H0 i=1 σdados i (B.53) (B.54) Logo, utilizando a relação entre a distância de luminosidade e distância diâmetro angular DA (dL (z) = (1 + z)2 dA (z)), podemos escrever as expressões necessárias para calcular Fmarg em função da distância luminosidade, obtendo FklDA DA FkH 0 = rq F1k FHD0AH0 N 1 X 1 ∂DL (zi ; β̄) ∂DL (zi ; β̄) = , 2 d A 2 2 H0 i=1 ((1 + zi ) σdados ) ∂βk ∂βl i N DL (H0 ; β̄) 1 X ∂DL (zi ; β̄) , = 3 d A 2 2 H0 i=1 ((1 + zi ) σdados ) ∂βk i " #2 N 1 X DL (zi ; β̄) = . dA H04 i=1 (1 + zi )2 σdados i (B.55) (B.56) (B.57) Podemos então utilizar as derivadas apresentadas na seção anterior (equações (B.44) e (B.49)), juntamente com as equações (B.51) e (B.55) a (B.57) e assim obter uma expressão analítica para a matriz de Fisher a partir da distância de diâmetro angular. 112 APÊNDICE B. CÁLCULO DA MATRIZ DE FISHER... B.3 ... a partir do Parâmetro de Hubble Caso tenhamos em mãos dados de medida do parâmetro de Hubble como função do desvio para o vermelho, a função de verossimilhança para N observações independentes é dada por LH (H0 ; β̄) = N Y i=1 " ( ¡ ¢2 )# hi − H(zi ; β̄) √ exp − . ¡ H ¢2 H σdados 2π 2 σ i dadosi 1 (B.58) Considere g(z; β̄) a expressão para o parâmetro de Hubble em unidades de H0 , e também N X hi g(zi ; β̄) K ≡ ¡ H ¢2 , i=1 σdadosi L ≡ N X h2i (B.59) ¢2 , (B.60) N X g(zi ; β̄)2 M ≡ ¡ H ¢2 . i=1 σdadosi (B.61) ¡ i=1 H σdados i Desta forma, a função de verossimilhança é dada por ¶ µ ¶ µ 1 L H02 M L (H0 ; β̄) = √ CH exp − exp KH0 − . 2 2 2π H (B.62) Integrando sobre H0 , temos Z +∞ −∞ r µ 2¶ ¸ H02 M π K exp KH0 − exp dH0 = , 2 2M 2M · (B.63) e consequentemente, podemos escrever a função de verossimilhança como CH L (β̄) = √ exp 2 M H µ K2 2M ¶ µ exp −L 2 ¶ . (B.64) B.3. ... A PARTIR DO PARÂMETRO DE HUBBLE 113 É possível calcular diretamente o logaritmo e as derivadas dessa função: ln L H ∂ ln LH ∂βl ∂ 2 ln LH ∂βk βl µ ¶ C K2 L 1 , = ln − − ln (M ) + 2 2 2 2M 1 ∂M K ∂K K 2 ∂M = − + − 2M ∂βl M ∂βl 2M 2 ∂βl µ ¶ K2 1 ∂M K ∂K 1+ + , = − 2M ∂βl M M ∂βl (B.65) (B.66) (B.67) µ ¶ µ ¶ 1 ∂M ∂M K2 1 ∂2M K2 K ∂K ∂M = 1+ − 1+ − 2 + 2 2M ∂βk ∂βl M 2M ∂βk βl M M ∂βk ∂βl K 2 ∂M ∂M 1 ∂K ∂K K ∂M ∂K K ∂2K + + − + . (B.68) 2M 3 ∂βk ∂βl M ∂βk ∂βl M 2 ∂βk ∂βl M ∂βk ∂βl As derivadas necessárias ao cálculo da equação anterior são dadas por ∂K ∂βl N X hi 2 σ i=1 dadosH i = ∂g(zi ; β̄) ∂βl N X hi ∂2K ∂ 2 g(zi ; β̄) = , ¡ H ¢2 ∂βk ∂βl ∂β ∂β k l σ i=1 dadosi ∂M ∂βl ∂ 2M ∂βk ∂βl N X 2g(zi ; β̄) ∂g(zi ; β̄) ¡ H ¢2 ∂βl i=1 σdadosi · ¸ N X 2 ∂g(zi ; β̄) ∂g(zi ; β̄) ∂ 2 g(zi ; β̄) = + g(zi ; β̄) . ¡ H ¢2 ∂βk ∂βk ∂βk ∂βl i=1 σdados = (B.69) (B.70) (B.71) (B.72) i Logo, precisamos calcular as derivadas de g(z; β̄) em relação aos parâmetros βi . A partir das equações (B.37) e (B.38), podemos verificar que " J µ # Y 1 + zi ¶βi µ 1 + z ¶βJ+1 ¢ g(z; β̄) = exp I1 (z; β̄) = (1 + z) , 1 + z 1 + z i−1 J i=1 ¡ onde J novamente corresponde à parte inteira de z/dz. (B.73) 114 APÊNDICE B. CÁLCULO DA MATRIZ DE FISHER... Sendo assim, as derivadas serão " J µ # Y 1 + zi ¶βi µ 1 + z ¶βJ+1 ∂g(z; β̄) = (1 + z) × ∂βl 1 + zi−1 1 + zJ i=1 ½ µ ¶ µ ¶¾ 1 + zl 1+z + δJ+1,l ln , × Θ(J + 1 − l) ln 1 + zl−1 1 + zJ " J µ # Y 1 + zi ¶βi µ 1 + z ¶βJ+1 ∂ 2 g(z; β̄) = (1 + z) × ∂βk ∂βl 1 + zi−1 1 + zJ i=1 ½ µ ¶ µ ¶¾ 1 + zk 1+z × Θ(J + 1 − k) ln + δJ+1,k ln × 1 + zk−1 1 + zJ ½ µ ¶ µ ¶¾ 1 + zl 1+z × Θ(J + 1 − l) ln + δJ+1,l ln . 1 + zl−1 1 + zJ (B.74) (B.75) Temos então todas as ferramentas necessárias para obter uma expressão analítica para a matriz de Fisher a partir de medidas do parâmetro de Hubble. Após aplicar o valor esperado à equação (B.68), temos que FklH ¿ 2 À ∂ ln LH (β̄) = − ∂βk ∂βl ¶ ¶ µ µ 1 ∂M ∂M 1 1 1 ∂ 2M ∂ 2K 1 = + − + . 1+ 2M ∂βk ∂βl M 2 2 ∂βk βl M ∂βk ∂βl (B.76) Bibliografia Abdalla F. B., Blake C., Rawlings S., 2010, MNRAS, 401, 743 Abramo L., et al., A Energia Escura e os desafios da Cosmologia Observacional para a próxima década: "white paper"para a comissão especial de astronomia (CEA), 2009, Rio de Janeiro Aguirre A., 1999, ApJ, 525, 583 Aguirre A., Haiman Z., 2000, ApJ, 532, 28 Alam U., Sahni V., Deep Saini T., Starobinsky A. A., 2003, MNRAS, 344, 1057 Alam U., Sahni V., Starobinsky A. A., 2007, JCAP, 2, 11 Albrecht A., et al., 2006, arXiv:astro-ph/0609591 Albrecht A., et al., 2009, arXiv:0901.0721 Amendola L., 2000, PhRvD, 62, 043511 Amendola L., Waga I., Finelli F., 2005, JCAP, 11, 9 Astier P., et al., 2006, A&A, 447, 31 Bassett B. A., Kunz M., Silk J., Ungarelli C., 2002, MNRAS, 336, 1217 Bassett B. A., Kunz M., Parkinson D., Ungarelli C., 2003, PhRvD, 68, 043504 Bassett B. A., Corasaniti P. S., Kunz M., 2004, ApJ, 617, L1 115 116 BIBLIOGRAFIA Bassett B. A., Hlozek R., 2009, arXiv, arXiv:0910.5224 Bennett C. L., et al., 2003, ApJS, 148, 1 Bento M. C., Bertolami O., Sen A. A., 2002, PhRvD, 66, 043507 Bilić N., Tupper G. B., Viollier R. D., 2002, PhLB, 535, 17 Blake C., Glazebrook K., 2003, ApJ, 594, 665 Bond J. R., Efstathiou G., Tegmark M., 1997, MNRAS, 291, L33 Branch D., Livio M., Yungelson L. R., Boffi F. R., Baron E., 1995, PASP, 107, 1019 Carroll S. M., 2001, LRR, 4, 1 Carvalho F. C., Alcaniz J. S., Lima J. A. S., Silva R., 2006, PhRvL, 97, 081301 Chevallier M., Polarski D., 2001, IJMPD, 10, 213 Cole S., et al., 2005, MNRAS, 362, 505 Colistete Jr., R., BayEsian Tools for Observational Cosmology using SNe Ia (BETOCS), disponível em http://www.RobertoColistete.net/BETOCS, (2006) Conley A., Carlberg R. G., Guy J., Howell D. A., Jha S., Riess A. G., Sullivan M., 2007, ApJ, 664, L13 Corasaniti P. S., Copeland E. J., 2002, PhRvD, 65, 043004 Corasaniti P. S., Bassett B. A., Ungarelli C., Copeland E. J., 2003, PhRvL, 90, 091303 Dalal N., Abazajian K., Jenkins E., Manohar A. V., 2001, PhRvL, 87, 141302 Daly R. A., Djorgovski S. G., 2003, ApJ, 597, 9 Dick J., Knox L., Chu M., 2006, JCAP, 7, 1 D R. D’Inverno, Introducing Einstein’s Relativity, Oxford (Oxford Univ. Press, 1992) BIBLIOGRAFIA 117 Dvali G., Gabadadze G., Porrati M., 2000, PhLB, 485, 208 Efstathiou G., Bond J. R., 1999, MNRAS, 304, 75 Efstathiou G., 2002, MNRAS, 332, 193 Eisenstein D., Hu W., Tegmark M., 1998, ApJ, 504, L57 Eisenstein D., 2003, arXiv:astro-ph/0301623 Eisenstein D., White M., 2004, PRD, 70, 103523 Eisenstein D. J., et al., 2005, ApJ, 633, 560 Eisenstein, D. J., http : //cmb.as.arizona.edu/eisenstein/acousticpeak/acousticp hysics.html , (Janeiro de 2005) Elgarøy Ø., Multamäki T., 2006, JCAP, 9, 2 Fabris J. C., Shapiro I. L., Solà J., 2007, JCAP, 2, 16 Filippenko A. V., 1997, ARA&A, 35, 309 Freedman W. L., et al., 2001, ApJ, 553, 47 Frieman J. A., Hill C. T., Stebbins A., Waga I., 1995, PhRvL, 75, 2077 Frieman J. A., et al., 2008, AJ, 135, 338 Galaz G., de Lapparent V., 1998, A&A, 332, 459 Giovanelli R., Dale D. A., Haynes M. P., Hardy E., Campusano L. E., 1999, ApJ, 525, 25 Giostri R., Reis R. R. R., Waga I., Ishida E. E. O., em preparação Goliath M., Amanullah R., Astier P., Goobar A., Pain R., 2001, A&A, 380, 6 Gondolo P., Freese K., 2003, PhRvD, 68, 063509 Gong Y., Wang A., 2007, PhRvD, 75, 043520 118 BIBLIOGRAFIA Gould S. J., The Mismeasure of Man, W. W. Norton (1981), New York Grøn Ø., Elgarøy Ø., 2007, AmJPh, 75, 151 Guy J., Astier P., Nobili S., Regnault N., Pain R., 2005, A&A, 443, 781 Guy J., et al., 2007, A&A, 466, 11 Guo Z.-K., Ohta N., Tsujikawa S., 2007, PhRvD, 76, 023508 Hannestad S., Mörtsell E., 2004, JCAP, 9, 1 Hicken M., Wood-Vasey W. M., Blondin S., Challis P., Jha S., Kelly P. L., Rest A., Kirshner R. P., 2009, ApJ, 700, 1097 Hu W., Holder G. P., 2003, PhRvD, 68, 023001 Hubble E., 1929, PNAS, 15, 168 Huterer D., Starkman G., 2003, PhRvL, 90, 031301 Ishida, Émille E. O., O teste diagnóstico statefinder e a natureza da energia escura, Dissertação de mestrado (2006), IF-UFRJ, Rio de Janeiro Ishida É. E. O., Reis R. R. R., Toribio A. V., Waga I., 2008, APh, 28, 547 Ishida, É. E. O., Reis R. R. R., Waga I., Lago B. L., submetido à publicação Jassal H. K., Bagla J. S., Padmanabhan T., 2005, PhRvD, 72, 103503 Jha S., Riess A. G., Kirshner R. P., 2007, ApJ, 659, 122 Jollife I. T., Principal Component Analysis 2nd. edition, Springer-Verlag (2002), New York Kamenshchik A., Moschella U., Pasquier V., 2001, PhLB, 511, 265 Kessler R., et al., 2009, ApJS, 185, 32 Kitching T. D., Amara A., 2009, MNRAS, 398, 2134 BIBLIOGRAFIA 119 Komatsu E., et al., 2009, ApJS, 180, 330 Kujat J., Linn A. M., Scherrer R. J., Weinberg D. H., 2002, ApJ, 572, 1 Leibundgut, B., in:Fronteirs in Cosmology, ed: Blanchard A. & Signore M., 195, Springer, 2005, Dordrecht Liddle, A., An Introduction to Modern Cosmology, 2a edição, John Wiley & Sons, 2004, West Sussex, England Linder E. V., 2003, PhRvL, 90, 091301 Linder E. V., Huterer D., 2005, PhRvD, 72, 043509 Livio, M. in:Type Ia Supernova: theory and cosmology, J.C. Niemeyer & J. W. Truran, Cambridge Univeristy Press (2000), 33 Lundmark, K. E., 1925, MNRAS, 85, 865 Lundmark, K. E., 1932, Lund Observatory Circ., 8 Mandel, J., 1972, Statistica Neerlandica, 26, 119–129 Makler M., de Oliveira S. Q., Waga I., 2003, PhLB, 555, 1 Marshall, L., The Supernova story, Princeton University Press (1988), New Jersey Misner, C. W., Thorne, K. S., Wheeler, J. A., Gravitation, W. H. Freeman & Company (1973), São Francisco Nesseris S., Perivolaropoulos L., 2004, PhRvD, 70, 043531 Nesseris S., Perivolaropoulos L., 2005, PhRvD, 72, 123519 Nesseris S., Perivolaropoulos L., 2007, JCAP, 1, 18 Nesseris S., Perivolaropoulos L., 2007, JCAP, 2, 25 120 BIBLIOGRAFIA Pakmor R., Kromer M., Röpke F. K., Sim S. A., Ruiter A. J., Hillebrandt W., 2010, Nature, 463, 61 Peebles, P. J. E., Principles of Physical Cosmology, Princeton University Press (1993), Nova Jersey Percival W. J., Cole S., Eisenstein D. J., Nichol R. C., Peacock J. A., Pope A. C., Szalay A. S., 2007, MNRAS, 381, 1053 Perlmutter S., et al., 1999, ApJ, 517, 565 Pogosian L., Zhao G.-B., Silverstri A., Zylberberg J., 2009, APS..NWS., 1002 Quinet, S., 2007, Vínculos Observacionais sobre modelos de Quartessência do tipo Gás de Chaplygin, Tese de doutorado, IF-UFRJ, Rio de Janeiro Rapetti D., Allen S. W., Amin M. A., Blandford R. D., 2007, MNRAS, 375, 1510 Reis R. R., Waga I., Calvão M. O., Jorás S. E., 2003, PhRvD, 68, 061302 Riess A. G., Press W. H., Kirshner R. P., 1995, ApJ, 438, L17 Riess A. G., et al., 1998, AJ, 116, 1009 Riess A. G., et al., 2004, ApJ, 607, 665 Riess A. G., et al., 2007, ApJ, 659, 98 Riess A. G., et al., 2009, ApJS, 183, 109 Robertson, H. P., (1929) Pro- c. Nat. Acad. Science USA, vol. 15, pag. 822-829 Ronen S., Aragon-Salamanca A., Lahav O., 1999, MNRAS, 303, 284 Sami M., 2009, arxiv:0901.0756 Shapiro C., Turner M. S., 2006, ApJ, 649, 563 BIBLIOGRAFIA 121 Sotiriou T. P., Faraoni V., 2008, arXiv:0805.1726 Spergel D. N., et al., 2007, ApJS, 170, 377 Steinhardt P. J., Wang L., Zlatev I., 1999, PhRvD, 59, 123504 Sugiyama, T. and Tong, H., 1976, Commun. Statist., A5, 711–721. Tang J., Abdalla F. B., Weller J., 2008, arXiv:0807.3140 Totsuji, H., Kihara, T. , 1969, PASJ, 21, 221 Turner M. S., Riess A. G., 2002, ApJ, 569, 18 Xu L., Liu H., 2008, MPLA, 23, 1939 Wang, Y. and Garnavich, P., 2001, Astrophys. J., 552, 445 (2001) Wang Y., Freese K., Gondolo P., Lewis M., 2003, ApJ, 594, 25 Wang Y., Freese K., 2006, PhLB, 632, 449 Wang Y., Mukherjee P., 2006, ApJ, 650, 1 Weinberg S., Gravitation and Cosmology: principles and applications of the General Theory of Relativity, 1971, John Wiley & Sons, New York Wood-Vasey W. M., et al., 2007, ApJ, 666, 694 Wu K. K. S., Lahav O., Rees M. J., 1999, Natur, 397, 225 Zehavi I., Riess A. G., Kirshner R. P., Dekel A., 1998, ApJ, 503, 483 Zimdahl W., Pavón D., 2007, CQGra, 24, 5461