Estatísticas para descrever Genética de Populações

Transcrição

Estatísticas para descrever Genética de Populações
INCT: Informação
Genético-Sanitária da
Pecuária Brasileira
SÉRIE TÉCNICA:
GENÉTICA
Publicado on-line em “www.animal.unb.br” em 07/01/2011
Estatísticas para descrever
Genética de Populações
Concepta McManus1, Samuel Paiva2, Patrícia Spoto Corrêa3, Luiza
Seixas3, Cristiano Barros de Melo 3,4
1
Universidade Federal do Rio Grande do Sul, Departamento de Zootecnia, Av. Bento
Gonçalves 7712, Porto Alegre, CEP 91.540-000
2
EMBRAPA Recursos Genéticos e Biotecnologia, Final W5 Norte, Brasília, DF, 70-770-900
3
Instituto Nacional de Ciência e Tecnologia – Informação Genético-Sanitária da Pecuária
Brasileira, Universidade Federal de Minas Gerais
4
Universidade de Brasília (Unb), Faculdade de Agronomia e Veterinária (FAV), Brasília,
DF.
1
Conteúdo
Freqüências alélicas
Heterozigosidade
4
4
Heterozigosidade Observada .............................................................. 5
Heterozigosidade Esperada (He) ......................................................... 5
Porcentagem de locos polimórficos (P) ................................................ 7
Número médio de alelos por loco (Â) .................................................. 8
Distância genética (D) ...................................................................... 8
Índice de identidade genética (Î) ........................................................ 9
Índice de fixação de WRIGHT (F)
Estatística F (Wright, 1951)
10
11
FIT ................................................................................................ 11
FST ................................................................................................ 12
FIS ................................................................................................ 14
Fluxo Gênico (Nm) .......................................................................... 15
Testes de indicação (Assignment Tests): ........................................... 16
Estimativas do fluxo gênico entre as populações
16
Análogos ao FST .............................................................................. 20
Diversidade entre populações (DST) .................................................. 20
Coeficiente de divergência genética entre populações (GST). ................ 20
Índice de Shannon ......................................................................... 21
Definições ..................................................................................... 21
Calculando o índice ......................................................................... 22
Determinando a variabilidade individual e da população ...................... 22
Lei de Hardy-Weinberg ................................................................... 22
Tamanho efetivo (Ne)
26
Conteúdo de Informação Polimórfica (PIC)
31
Probabilidade de exclusão (PE) 31
Teste de Mantel (R) (Mantel, 1976)
33
Coeficiente de consangüinidade (F) .................................................. 34
Exemplo ........................................................................................ 34
2
Consangüinidade
37
Coeficiente de consangüinidade do individuo...................................... 38
Método Tabular de computar relacionamentos aditivos e de dominância entre
animais ......................................................................................... 40
Programas de computador
42
Referências 45
3
Freqüências alélicas
•
Contagem direta dos alelos encontrados.
•
Assumindo que existe um estado ideal de equilíbrio Hardy-Weinberg
(EHW), a variância de uma freqüência alélica:
x é a freqüência alélica e n, o número de indivíduos das amostras.
Heterozigosidade
•
Medida de variabilidade genética;
•
Considera-se um loco polimórfico quando o alelo mais comum tem
freqüência inferior a 0,9;
•
A heterozigosidade de um marcador é a probabilidade de um indivíduo ser
heterozigoto no loco marcador e depende do número de alelos e de sua
freqüência na população;
•
A heterozigosidade observada é a proporção de indivíduos heterozigotos
nas amostras da população;
•
A heterozigosidade média esperada ou a diversidade genética de um loco
é equivalente à heterozigosidade observada, considerando-se apenas as
populações em completo equilíbrio.
4
Heterozigosidade Observada
•
Determinação da proporção de genes que são heterozigotos e o número
de indivíduos que são heterozigotos para cada gene em particular;
•
Para apenas um loco:
Heterozigosidade observada =
Nºde Heterozigotos em cada Loco
nº total de indivíduos pesquisados
Exemplo: 25 Heterozigotos = 0.25
100 indivíduos
Sobre todos os locos:
Exemplo: 5 locos
onde H=
Loco 1
25/100= 0.25
Loco 2
0/100 = 0.00
Loco 3
10/100 = 0.10
Loco 4
5/100 = 0.05
Loco 5
25/100 = 0.25
HO = (.25 + 0 + .10 + .05 + .25)/5 = 0.13
Heterozigosidade Esperada (He)
•
Heterozigose estimada como base NEI (1978):
•
Sendo Pi – a freqüência estimada do iésimo alelo.
5
A heterozigosidade média esperada foi obtida pela média aritmética de todos os
locos estudados.
•
Definida como uma fração estimada de todos os indivíduos que poderiam
ser heterozigóticos de um loco escolhido randomicamente;
•
He difere de Ho porque ela é uma previsão baseada na freqüência alélica
conhecida, oriunda de amostras individuais;
•
Desvio observado esperado pode ser usado como um importante indicador
da dinâmica populacional (ver princípio de Hardy-Weinberg, abaixo);
•
He é calculado com base na freqüência de alelos;
o
Por exemplo, para uma simples característica gênica com dois
alelos, A e a, cujas freqüências são expressas como p(A) e q(a),
onde p + q = 1, as freqüências de três genótipos possíveis são
dadas pela seguinte equação:
Exemplo: 80 indivíduos amostrados (160 alelos).
Número de
indivíduos
observados
com cada
genótipo
Freqüências de genótipos
observados
Freqüência
de genótipo
esperado
Nota que:
p2 + 2pq+q2 = 1
AA=10
A = ((2*10) + 10)/(2*80) p2=.0352
Aa= 10
=1875
2pq=.3046
aa=60
A=1-.1875 = .8125
q2=.6602
6
Homozigotos = p2 + q2
Heterozigotos = 2pq
Heterozigosidade observada (Ho ) para cada loco:
•
A quantidade de heterozigose de um determinado loco seguiu os
procedimentos de BROWN e WEIR (1983):
Ho = 1-ΣPii
•
Sendo: Pii - a freqüência observada de genótipos homozigotos do
alelo i;
•
A heterozigosidade média observada foi obtida pela soma dos
valores de cada loco, dividindo-se pelo número total de locos
estudados.
Diversidade gênica esperada ou heterozigosidade esperada (He) para
cada loco segundo Nei (1987)
He = 1 – Σpi2
onde pi= freqüência alélica estimada do i-ésimo alelo;
Estimativa média sobre os locos de Ho e He
•
Média aritmética entre todos os locos analisados;
Porcentagem de locos polimórficos (P)
•
Média aritmética do número de locos polimórficos pelo número total de
locos;
7
•
Considerando-se como loco aquele cuja freqüência do alelo mais
comum não ultrapassasse 95%;
Número médio de alelos por loco (Â)
•
Divisão do número total de alelos pelo número total de locos;
Distância genética (D)
Estimativas de diferenciação genética - interpopulacional
•
Distância
genética
entre
duas
populações
segundo NEI (1972):
•
Sendo (Î) - o índice de identidade genética;
•
D varia de 0 a infinito;
I = Identidade genética (varia de 0 a 1);
pix = freqüência do alelo i na população x
piy = freqüência do alelo i na população y
m = número de alelos por loco
8
estimadas
•
Se duas populações tem freq de alelos similar (pix ≈ piy);
I≈1eD≈0
•
Se duas populações não têm alelos em comum;
I≈0eD≈1
Freqüência do loco Pgm (isoenzima) em duas pop de D. pulex
Alelo Pgm
Illinois
Indiana
F
0,146
0,491
M
0,818
0,106
S
0,036
0,403
I Illinois = 0,173
I Indiana = 0,323
D = 1,13
Índice de identidade genética (Î)
•
Índice de identidade genética (Î), segundo NEI (1972);
•
Baseia-se em freqüências alélicas de locos homólogos nas
diferentes populações:
sendo:
9
•
Jxy, Jx e Jy, respectivamente, as médias aritméticas de jxy,
jx e jy sobre todos os locos polimórficos e monomórficos;
jxy = Σ
•
Probabilidade de 2 genes escolhidos ao acaso na população
x, serem idênticos;
jx = Σ
•
Probabilidade de 2 genes escolhidos ao acaso na população
y, serem idênticos;
jy = Σxiyi
•
Probabilidade de identidade de um gene da população x e
um gene da população y, ser idênticos.
Índice de fixação de WRIGHT (F)
•
WRIGHT (1965) ou o coeficiente de endogamia;
•
Estimado com base na heterozigosidade observada (Ho) e esperada
(He).
10
Estatística F (Wright, 1951)
•
Utiliza coeficientes de endocruzamento para descrever a partição
da variação genética dentro e entre populações (variabilidade intra
e interpopulacional);
FIT
o Índice de fixação para a população;
o Probabilidade total de identidade num determinado
indivíduo I;
•
Medida de heterozigosidade de um indivíduo em relação
ao
total
da
população
(todas
as
subpopulações
combinadas);
FIT = (Het– Ho)/ Het
Ho = heterozigosidade observada (do indivíduo);
He = heterozigosidade esperada da população total;
FIT = FIS + FST
11
•
Particionado
o FST devido ao efeito Wahlund;
o FIS devido a consangüinidade;
Considera uma população com uma estrutura em dois níveis:
•
Do individuo (I) a subpopulação (S);
•
Da subpopulação ao total (T);
O total F (FIT) pode ser dividido em FIS (ou f) e FST (ou θ):
1-FIT = (1-FIS)(1-FST)
•
Pode ser mais dividido para subestruturas da população;
•
De acordo com as regras de expansão binomial;
•
para I partições:
•
Relação da média da diferença de pares de cromossomos de
FST
indivíduos diplóides amostrados com a média obtida de uma
amostragem aleatória de cromossomos de uma população
(excluindo o agrupamento por indivíduo).
•
Considerar agrupamentos, como uma sub-população, ao
invés de individuais.
12
•
Geneticistas populacionais têm utilizado a medida do grau
de estrutura de uma população;
•
Diversas
definições
para
Fst,
sugerem
um
fator
de
confusão na literatura científica;
•
Abaixo, uma definição mais comum:
onde a variância de p é calculada através de sub-populações e
p(1 −p) é a freqüência esperada de heterozigotos.
•
WRIGHT (1965);
•
Medindo a diversidade genética:
o Índice de fixação para alelos por locos;
o Probabilidade de que dois genes sejam homólogos;
combinados
ao
acaso
na
população,
originários de um gene na população;
13
ambos
•
Estimativa
de
diferenciação
genética
entre
subpopulações - Mede o grau de isolamento das
mesmas;
•
Populações isoladas não cruzam ao acaso, e devem
apresentar
algum
grau
de
endogamia
quando
considerada em relação ao total da população;
•
Medida do grau de endocruzamento dentro de uma
subpopulação em relação ao total da população (todas
as subpopulações combinadas);
FST = (Het – Hes)/ Het
•
Hes= heterozigosidade esperada se a população está em
HWE (da subpopulação);
•
Het = heterozigosidade esperada da população total;
•
FST = 0
o As populações têm freqüência de alelos idênticas;
•
FST = 1
o As populações fixaram alelos diferentes.
FIS
o Índice de fixação que ocorre dentro de população;
o Probabilidade de que dois genes sejam homólogos no
indivíduo
I, derivado
do
mesmo
gene de um
ancestral comum, dentro da população;
14
•
Mede o grau de endocruzamento dentro de indivíduos
em relação ao resto da sua subpopulação;
•
Reflete a probabilidade de que dois alelos dentro do
mesmo indivíduo sejam idênticos por descendência;
FIS = (Hes – Ho)/ Hes
o
Ho = heterozigosidade observada (do indivíduo);
•
He = heterozigosidade esperada se a pop. está em HWE
(da subpopulação).
Fluxo Gênico (Nm)
•
Nm= 0,5 (1-GST)/GST (McDermott e McDonald, 1993)
i) Indireto: Estatística F
FST = 1/ (4Nem + 1)
Ne = tamanho efetivo da população
m = taxa de migração entre populações m = 1/(N)
Nem = número de
adultos sexualmente
maduros
migrantes
Nem = (1/FST - 1) /4
FST = 0, 009
Nem = (1/FST - 1)/4
15
que
são
Nem = (1/0,009 – 1)/4 = 27,5
27,5 indivíduos migrantes entre as duas populações por geração
FST = 1/(4Nem + 1)
Se m = 1/(N) – somente um indivíduo migrante por geração,
Nem = 1, Fst = 0,20.
Até um pequeno fluxo gênico mantém as populações similares em relação a
freqüência de alelos
•
Muito usado;
•
Série de críticas;
•
Premissas improváveis;
•
No entanto, uma análise de 230 estudos com insetos fitófagos mostrou
que os valores estimados de Nem, normalmente concordam com os dados
obtidos pela marcação-recaptura.
Testes de indicação (Assignment Tests):
o
Indica a origem de um indivíduo pertencente a uma provável
população através da comparação dos seus genótipos com os perfis
de várias populações.
Estimativas do fluxo gênico entre as populações
Nm = [(1/FST)–1] /4a
16
•
Proposta por Crow e Aoki (1984);
a = [n / (n–1)]2
•
Nm o número de migrantes;
•
n o número de populações;
•
Variância:
Hh = 2pNm.
Fst = 1/(4Nem +1)
Ne = tamanho efetivo da população;
m = taxa de migração entre populações;
Nem = número de adultos cruzantes que são migrantes.
Numero de indivíduos
Freqüência dos genótipos
A1A1
A1 A2
A2A2
A1A1
A1 A2
A2A2
Subpopulação 1
352
63
12
0.824
0.148
0.028
Subpopulação 2
312
77
27
0.750
0.185
0.065
•
Ho (heterozigosidade observada media)
= (0,148 + 0,185)/2 = 0,167
•
Hes (heterozigosidade esperada se a subpopulação
HWE) – precisamos calcular p e q
População 1
p = freqA1 = 0,824 + 0,148/2 = 0,898
q = freqA2 = 0,028 + 0,148/2 = 0,102
freqA1A2 = 2pq = 0,898 X 0,102 = 0,183
17
População 2
p = freqA1 = 0,750 + 0,185/2 = 0,842
q = freqA2 = 0,065 + 0,185/2 = 0,157
freqA1A2 = 2pq = 0,842 X 0,157 = 0,265
Hes = (0,183 + 0,265)/2 = 0,224
Het = heterozigosidade esperada para
a população total
(p1 +p2)/2 = (0,898 + 0,842)/2 = 0,871
(q1 +q2)/2 = (0,102 + 0,157)/2 = 0,130
HeT= 2pq = 2 (0,871) (0,130) = 0,226
FST = (HeT – Hes)/Het = (0,226 – 0,224)/0,226 = 0,009
Interpretando o FST
•
FST 0-0,05: indicativo de pouca (baixo nível) diferenciação
genética;
•
FST 0,05-0,25: diferenciação genética moderada;
•
FST >0,25: nível alto de diferenciação genética;
o Mesmo
níveis
representar
muito
níveis
baixos
importantes
de
FST
podem
de
diferenciação
genética;
•
0 051 a 0, 150 - nível médio;
•
0,151 a 0,250 um alto nível de diferenciação (Yeh 2000).
18
Segundo Wright (1978),
o Há casos em que a estimativa de FST pode ser de 0, 050
ou menos, não implicando necessariamente em uma
diferenciação genética negligível (Giles & Goudet 1997).
•
Rápidos ciclos de extinção e colonização afetam a estrutura genética
de populações, onde freqüentes eventos de fundação (founder events)
durante a colonização podem aumentar o valor de FST (Wright 1940);
•
Porém, este valor, depende do modo de colonização, isto é, da fonte
que
se
originam
os
migrantes
(Slatkin
1977).
Slatkin
(1977)
desenvolveu duas variações ao modelo de ilha:
o “propagule pool” (migrantes originados de uma ou
poucas populações);
o “migrant pool” (migrantes originados igualmente de
amostras de várias populações – metapopulações);
o O modelo “propagule pool”;
Mais efetivo em aumentar o fluxo gênico entre
populações;
Diminui os componentes da diversidade genética
tanto dentro de populações (HS), como entre
populações (FST) - que o modelo “migrant pool”;
19
A probabilidade de identidade por descendência de
um propágulo derivado de uma simples população
é maior que um derivado de um grande número
de populações (metapopulação).
Análogos ao FST
θ: equivalente ao FST que considera tamanhos desiguais de amostras
RST
•
Desenvolvido para análises de microsatélites;
•
Assume o modelo SSM (stepwise – perda ou ganho de uma
única repetição por vez).
Diversidade entre populações (DST)
•
DST=Het-Hes
Coeficiente de divergência genética entre populações
(GST).
•
GST=DST/Het
•
Equivalente ao FST quando só existem dois alelos em um
loco.
Genetic evenness (E)
•
Calculado através da diversidade genética/ln richness individual
(ln 27 = 3.296) (Nei, 1973, 1978).
20
Índice de Shannon
• Índice Shannon-Weaver;
• Índice do Shannon-Wiener;
• Mede o grau de certeza em se preve a proximidade genética entre
indivíduos;
• Quanto menor o valor do índice de Shannon, menor o grau de incerteza e,
portanto, a diversidade da amostra é baixa. A diversidade tende a
ser mais alta quanto maior o valor do índice;
•
• Informação entropica da distribuição, tratamento das espécies como
símbolos e o tamanho da respectiva população como uma
probabilidade.
Definições:
•
ni – O número dos indivíduos em cada espécie; a abundância de cada
espécie;
•
S – O número de espécies. Chamado também de riqueza;
•
N – O número total de todos os indivíduos:
•
pi – A abundância relativa de cada espécie, calculada pela proporção dos
indivíduos
de
uma
espécie
pelo
comunidade:
21
número
;
total
dos
indivíduos
na
Calculando o índice
Aplicando o cálculo, que pode ser demonstrado para qualquer dado númerico de
espécies, onde há um máximo possível
,
Hmax = lnS
o qual ocorre quando todas as espécies que estão presentes ocorrem em igual
número.
Determinando a variabilidade individual e da população
•
Baseada em genética mendeliana;
•
Possível predizer a probabilidade de aparecimento de um alelo particular
em filhos quando se conhece ambos os pais;
•
Pode se realizado também para populações;
•
Comparar freqüências esperadas e atuais ou observadas através de
fatores externos (consanguinidade ou seleção).
Lei de Hardy-Weinberg
•
Verificada por Hardy e Weinberg, em 1908;
•
Em uma população grande, com um acasalamento aleatório, sem seleção,
mutação ou migração, as freqüências alélicas e genotípicas permanecem
22
constantes de geração a geração, considerando-se uma população em
completo equilíbrio;
•
A constituição genética de uma população é descrita pela especificidade e
a proporção dos diferentes alelos em cada loco;
•
Os desvios do EHW podem originar-se de fatores como: acasalamentos
direcionados,
subdivisões
dentro
das
populações;
coancestrais
e
antepassados comuns; seleção natural; migração ou fluxo de genes a
partir de uma população externa; técnica de amostragem incorreta; e
presença de alelos nulos não detectáveis experimentalmente;
•
Qualquer desvio significativo do EHW indica que a população está
subdividida, e que existe uma endogamia significativa ou fluxo de genes
de outra população.
A Lei de Hardy-Weinberg
"Observada em um grande e randômico cruzamento (diploide) populacional,
onde a freqüência alélica poderá permanecer a mesma de geração para geração,
assumindo que não há mutação, migração gênica, seleção ou deriva genética
Quando uma população reúne todas as condições de Hardy- Weinberg, significa
estar em equilíbrio de Hardy- Weinberg.
•
Este equilíbrio pode ser matematicamente demonstrado baseando-se em
uma binominal simples (para dois alelos) ou multinominal (alelos
multiplos) e na distribuição da freqüência gênica, como descrito a seguir:
p2 +2pq + q2
23
Calculando o Equilibrio de Hardy-Weinberg
•
Populações em seu ambiente natural nunca apresentarão todas as
condições necessárias para alcançar o equilíbrio de Hardy-Weinberg. Neste
sentido sua freqüência alélica poderá mudar de uma geração para a
próxima, podendo a população evoluir;
•
Uma população pode se desviar de Hardy-Weinberg como um indicador de
intensidade de fatores externos, o qual pode ser determinado por uma
formula
estatística
denominada,
(qui-quadrado),
utilizado
para
comparar os resultados observados versus o esperado:
Onde:
O - é o número observado de indivíduos com genótipo específico, e E é o
número esperado de indivíduos com base no equilíbrio de Hardy-Weinberg
(ex., para AA, o número esperado de indivíduos é: p2*N);
K – é o número de genótipos.
24
Abaixo exemplo de calculo do equilibro de Hardy-Weinberg discussion continuação:
Numero de
indivíduos
observados
com cada
genótipo
AA=10
Freqüências
genótipos
observados
Freqüência
genótipo
esperado
Numero
esperado de
individuos
(Total = 80)
(O-E)
(O-E)2/E
A = ((2*10) +
10)/(2*80) =
.1875
A=1-.1875 =
.8125
p2=.0352
2.816
7.184
18.32736
2pq=.3046
q2=.6602
p2 + 2pq+q2
=1
24.368
52.816
14.386
7.194
8.471743
0.977163
X2 -27.77
Aa= 10
aa=60
Total 80 individuos, 169
alelos
X2
•
Usado para determinar a probabilidade, ou chance, de um número
observado ser diferente do numero esperado;
•
A
padronização
de
gráficos
estatísticos
tem
sido
desenvolvida
correlacionando os valores de X2 e o grau de liberdade (o número de
variáveis independentes), com valores de probabilidade (p);
•
No exemplo abaixo, o valor do X2 de 27.77 apresenta a uma chance de
ser 99% maior do que a diferença entre o valor observado e o
esperado
•
Esta alta probabilidade indica que alguns fatores externos (ex.
migração, seleção, endogamia) influenciaram na freqüência alélica;
•
Este é um calculo estatístico usado não somente para genética de
populações,
mas
também
para
associações de dados.
25
comparação
de
determinadas
Tamanho efetivo (Ne)
•
Baseado na variância das freqüências alélicas dos adultos de uma
simples população;
Ne = n / 1 + f,
•
(Vencovsky, 1992).
Uma das inúmeras variáveis da dinâmica populacional que pode
influenciar na variação da taxa e tamanho da freqüência alélica é o
tamanho da população;
•
A variação genética, o aumento randômico ou a diminuição da
freqüência alélica, afetam pequenas populações mais severamente do
que as grandes, uma vez que os alelos são oriundos de um pool de
genes parentais.
•
A taxa de variação da freqüência alélica em uma população é
determinada pelo tamanho real da mesma;
•
O tamanho real da população é o número de indivíduos que contribuem
uniformemente para o pool de genes;
•
O número real de indivíduos em uma população raramente é o
tamanho efetivo da mesma;
•
Tal fato se deve pelas seguintes razões: alguns indivíduos possuem
uma taxa de reprodução maior do que outras (tem um maior
desempenho reprodutivo ou fitness); a distribuição de machos e
fêmeas podem resultar na dificuldade de
26
alguns indivíduos se
acasalarem, ou devido
a endogamia reduzir
a sua capacidade
individual;
•
O tamanho da população efetiva é uma medida teórica que compara o
comportamento genético de uma população com o comportamento de
uma população "ideal". À medida que o tamanho efetivo da população
torna-se menor, a chance da freqüência alélica mudar devido ao acaso
(deriva), só se torna maior.
Existem inúmeras fórmulas para se calcular o tamanho da população efetiva
(Ne). Uma delas (abaixo) leva em consideração o número de acasalamentos
entre machos e fêmeas e a relação numérica entre eles:
A aplicação desta fórmula exige os mesmos pressupostos do equilíbrio de HardyWeinberg. Existem outras versões mais complicadas desta fórmula, que levam
em consideração algumas excessões, como a endogamia e fitness
27
Consanguinidade e Parentesco
•
Um pequeno tamanho populacional efetivo pode resultar em uma alta
ocorrência de consanguinidade, ou em acasalamento entre parentes
próximos;
•
A diminuição da heterozigosidade (aumento da homozigotia) da
população como um todo;
•
Maior risco de indivíduos adquirirem doenças com caráter homozigoto
recessivo, herdada de uma cópia do mesmo alelo recessivo de ambos
os pais;
•
O impacto do acúmulo de características deletérias homozigóticas é
chamado de depressão endogâmica, ou seja, a perda de vigor da
população devido à perda de variabilidade ou opções genéticas
•
Na década de 1950, Sewell Wright desenvolveu um conjunto de
parâmetros denominados Estatísticas F;
•
A mais simples delas é o coeficiente de endogamia, definida como a
probabilidade de que dois alelos homólogos (o mesmo) do
mesmo
indivíduo, sejam idênticos por descendência;
•
O coeficiente de endogamia (F) é calculado através da comparação da
heterozigosidade esperada, com heterozigosidade observada (Ho), e
varia de, -1 (sem consangüinidade) para +1 (identidade completa);
28
•
Se os valores para heterozigosidade observada e esperada é 0, o F
mesmo será zero;
•
Um valor positivo indica que há um maior número de homozigotos, ou
seja, a população pode ser pura. Assim, quanto maior o número, maior
o grau de endogamia;
•
Um valor negativo indica que há mais indivíduos heterozigotos do que
o esperado, o que poderia acontecer para as primeiras gerações após
duas populações anteriormente isoladas se tornarem somente uma;
Como o exemplo X2 abaixo:
He - 10 e Ho= 24.368 para o heterozigoto,
F = (10 - 24.368) / 10 = -1.43
•
Utilizando X2 , a diferença entre o observado e esperado não é devido a
chance
•
No
entanto,
havendo
um
aumento
no
número
esperado
de
heterozigotos, a consanguinidade pode ser descartada como uma
possível dinâmica populacional que está influenciando as freqüências
genotípicas.
29
Coeficiente de Relacionamento de Wright (RC)
•
O grau de endogamia que ocorreu pode ser matematicamente calculado
a partir de análise de pedigree;
•
A probabilidade de que alelos homólogos presentes em diferentes
indivíduos sejam idênticos por descendência;
•
Em um organismo diplóide, 50% dos alelos de seus filhos (ou
descendentes) são herdados de somente um dos pais.
•
Assim, seguindo o caminho das relações de pedigree, o RC pode ser
determinada a partir da multiplicação de cada da ordem do parentesco.
Essas relações são exemplos muito simples e diretos, porém as relações entre os
indivíduos, particularmente em espécies domésticas e ameaçadas de extinção,
podem ser muito mais complexas, inclusive cruzamentos entre irmãos, e
retrocruzamentos entre os filhos-neto e avós.
Para pedigrees (raças) complexos, o RC global pode ser calculado com base em
um coletivo de um RC individual, através de:
30
Onde:
RCxy - é a soma de todas as associações de X e Y, e indica a probabilidade
de que qualquer gene é homozigoto por descendência;
Nis – é o o número de associações entre X e Y através de cada um
ancestral comum;
Fa - é o coeficiente de endogamia do ancestral;
Fx e Fy – são o coeficiente de endogamia para X e Y.
Conteúdo de Informação Polimórfica (PIC)
•
Botstein et al. (1980);
•
Indicador da qualidade do marcador em estudos genéticos (segregação,
identificação de populações e controle de paternidade);
•
A probabilidade de identificar qual homólogo de um dado pai, foi
transmitido a uma dada prole, como também o outro progenitor ser
genotipado;
•
A probabilidade de que o pai seja heterozigoto X a probabilidade que os
seus filhos sejam informativos;
•
PIC superiores a 0,5 são considerados muito informativos, com valores
entre 0,25 e 0,50 mediamente informativos, e com valores inferiores a
0,25, pouco informativos.
Probabilidade de exclusão (PE)
•
PE1 - quando os genótipos de uma mãe, seu filho e o pai são
comparados. Calculada por meio da 1ª fórmula: de, e apropriada para
quando a matriz é confirmada como mãe no momento do nascimento;
31
•
PE2 - quando não está disponível um ou outro genótipo parental,
calculada segundo a fórmula simplificada 2ª: com base em:
o
Os valores por loco de PD, PE1 e PE2 foram combinados para a
população por meio da fórmula:
P=1-(1-P1)(1-P2)(1-P3)…(1-Pk)
o
•
para k, número de locos.
A probabilidade de exclusão (PE) para os pais, quando o DNA genômico de
ambos e de um filho esta disponível, é calculada usando a fórmula abaixo,
de Jamieson e Taylor (1997):
•
Após o cálculo da PE, para cada loco individualmente, a PE combinada
sobre n marcadores independentes foi calculada utilizando a seguinte
fórmula;
PE= 1- (1-P1) (1-P2) (1-P3) … (1-Pn) (Jamieson and Taylor, 1997).
•
A probabilidade de exclusão de paternidade (Q) (Weir, 1996), que
corresponde ao poder com o qual um loco exclui um animal erroneamente
atribuído de ser a mãe de uma determinada prole, através da seguite
fórmula:
•
Onde p é a freqüência populacional do alelo ith ou jth. A probabilidade de
exclusão de paternidade combinada foi calculado utilizando a seguinte
fórmula:
32
As etapas para aplicação da probabilidade de exclusão (PE) são a soma de
todos os homozigotos e heterozigotos representados dentro de um perfil misto.
Para um determinado loco, supondo o equilíbrio de Hardy-Weinberg,
PE
loco
= 1-p2
Ou se não há equilíbrio de Hardy-Weinberg:
PE
loco
= 1-p2 - θp(1-p)
A probabilidade de exclusão (PE) é calculada para cada loco homozigoto,
repetindo
os
passos
acima,
realizando
o
cálculo
equivalente
para
heterozigotos, e somando os valores calculados.
A probabilidade Total de Exclusão excluindo o Theta:
PE = 1 - (p1 + p2 + ... + pn)2
PEmix = plocos(1) + plocos(2)+ ... + plocos(n)
A Probabilidade total de exclusão utilizando Theta
PE = 1 - (p1 + p2 + ... + pn)2 - θ[p1(1-p1) + p2(1-p2) + ... + pn(1-pn)]
PEmix = plocos(1) + plocos(2)+ ... + plocos(n)
Teste de Mantel (R) (Mantel, 1976)
•
Realizados para analisar os efeitos da distância geográfica, sobre a
distância genética, por meio da seguinte fórmula:
33
os
Onde:
xey
= Localização geográfica e distância genética nas localizações i e j;
n
= O número de entradas de dados nas matrizes de distância.
Sx e Sy = Os desvios-padrão para a variável X e Y.
Coeficiente de consangüinidade (F)
Probabilidade de que dois genes à qualquer loco de um indivíduo sejam idênticos
por descendência
Exemplo
Quatro populações de Drosophila mantidas com número fixo de adultos,
permitindo acasalar aleatoriamente. Todas possuem 10 mães, no entanto 10, 5,
2 ou 1 pais. Calcular o tamanho populacional efetivo de cada população e
coeficiente de consangüinidade depois de 10 gerações. Assumir a ausência de
Ne =
4N m N f
Nm + N f
diferenças na fertilidade.
∆F = 1/2Ne
Coeficiente de consangüinidade = Ft = 1-(1-∆F)t
Número de
fêmeas
Númeo de
machos
Ne
∆F
F(t=10)
10
10
10
10
10
5
2
1
20
0.025
0.224
13.33
0.0375
0.318
34
6.67
0.075
0.541
3.636
0.1375
0.772
Uma população isolada naturalmente tem um ciclo regular de 5 anos de
números: 500, 50,
1 1 1
1
1
1 
= 
+
+
+ ... +

N e t  N1 N 2 N 3
Nt 
100,
200,
400.
Qual
é
o
tamanho
populacional
efetivo
e
taxa
de
1 1 1
1
1
1
1 
= 
+
+
+
+
N e 5  500 50 100 200 400 
consangüinidade?
Ne = 253
∆F = 1/2Ne = 0.20%
Comparar a taxa de consangüinidade de duas variedades de planta: uma autofértil e outra auto- estéril, as duas com propagação por polinização aleatória
dentro de 20 plantas individuais.
população auto- fértil – população idealizada : N = Ne
∆F = 1/2Ne = 2,5%
população auto- estéril - ∆F = 1/(2N + 1) = 2,44%
A exclusão de auto-fertilidade faz pouca diferença especialmente quando N é
maior.
• Planejar e manter uma população de animais com oito pares,
cruzando-se as gerações com o mínimo de consangüinidade;
• Alguns dos pares não dão duas progênies como planejado;
• Em uma geração, os oito cruzamentos deram 0, 1, 1, 2, 2, 3, 3 e 4
progênie;
• Qual é o tamanho efetivo da população?
35
k = número de progênie
Número de pais (incluindo pais estéreis) = 16
Ne = 4N/(Vk+2)
Vk = variância de tamanho de família;
Calcular desvios (-2, -1, -1, 0 , 0, 1, 1, 2):
−
∑(k − k ) 2 = 12
Vk = 12/8
Ne = 18.3
• O plano de cruzamentos para a linha 6, foi usar 8 pares e duas
progênies por par, para a próxima geração;
• Se esse plano tivesse sido seguido, qual seria o tamanho efetivo das
linhas?
• Qual era o tamanho atual?
Plano – consangüinidade mínima
N= 16
Ne = 2N-1 = 31
F(t =27) = 0.447
Ft = (1-(1-∆F)t
27
(1-∆F) = 1-0.447 = 0.553
27 log(1-∆F) = -0.2573
1-∆F = 0.9783
∆F = 0.0217
Ne = 1/2∆F = 23
36
Consangüinidade
Cruzamentos de indivíduos que são parentes
Indivíduos têm réplicas de um dos genes dos ascendentes
Pode ter 2 genes no mesmo loco, réplicas do mesmo gene
↓
2 genes com mesmo
2 genes com mesma
efeito fenotípico
origem
↓
idênticos por descendência
↓
coeficiente de consangüinidade
↓
F
Fo
↓
N indivíduos
↓
2N gametas
↓
P(gametas unificando = 1/2N = F1 (1 geração)
tem genes idênticos)
↓
P(gametas unificando = 1/2N
tem genes idênticos)
+
(1-1/2N)F1
=
F2
outros gametas
∴ Ft = 1/2N + (1-1/2N) Ft-1
∆F = 1/2N
Ft = ∆F + (1-∆F)Ft-1
∆F = Ft - Ft-1
1-Ft-1
taxa de consangüinidade
Conhece “pedigree” - calcula F diretamente
37
Coeficiente de consangüinidade do individuo
A probabilidade de um par de alelos levados pelos gametas que o produziram ser
idênticos por descendência:
A1A2
A
B
C
P
Q
X
P(X) = A1A1 = (½)4 = 1/16
P(X) = A2A2 = (½)4 = 1/16
P(X) = A1A2 ou A2A1 = (½)3 = 1/8
A pode ser homozigoto idêntico ∴ P(X) = A1A2 ou A2A1 = (½)3 (2 (½)4)
P(A) homozigoto idêntico = FA
∴P(X) ident. homo. via A = (½)3 FA
Fx = (½)3 + (½)3FA = (½)3 (1+FA)
3 = número de indivíduos no caminho conectando os pais p.ex.
A
B
↓
D
↓
P
C
↓
.
↓
Q
X
Fx = (½)6(1+FA)
Fx = Σ(½)n(1+FA)
38
A
B
C
D
E
F
G
J
K
H
L
I
M
N
O
P
Q
X
Trilha
n
PLDAEJNQ
PLDBEJNQ
PLDBFJNQ
PLDBFKNQ
PMJEBFKNQ
PMJFKNQ
PMJNQ
8
8
8
8
9
7
5
F do ancestral em
comum
0
0
0
0
0
0
1/8
39
Contrib p/ Fx
(½)8
(½)8
(½)8
(½)8
(½)9
(½)7
(½)5 + 9/8
FX = 0,0606
Outro Método
F = probabilidade de 2 genes em 1 loco serem idênticos por descendência,
quando se faz a média sobre todos os locos.
FP = ½ asd
app = 1 + ½ asd
As
AD
x
BS
A
aAB = ¼ (aAs
Bs
+ aAs
Bd
B
+ aAd
BD
Bs
+ aAa
Bd
)
= ½ (aABs + aABd)
dAB = ¼ (aAsBs aAdBd + aAsBd aAdBs)
FA = ½ a
FB = ½ aBsBd
AsAd
aAA = 1 + FA = 1 + ( ½ ) (aAsAd)
aBB = 1 + FB = 1 + ( ½ ) (aBsBd)
Método Tabular de computar relacionamentos aditivos e de dominância
entre animais
Relacionamentos Aditivos
• Fazer lista de todos os animais – do mais velho para o novo;
• Estabelecer matriz n x n e nomear colunas e linhas com os animais mais velho até o mais novo;
• Caso tenha informação dos pais, colocar acima do número do
animal;
• Colocar o numeral (1) em toda a diagonal - relacionamento básico
aditivo do animal com ele mesmo com consangüinidade;
40
• Começar na primeira linha em cima a esquerda - vai na primeira
linha;
• Relacionamento do primeiro animal com animal i:
a1I = ½ (a1sI + a1dI)
Pai do animal i
A
H
D
K
A
1
0
Mãe do animal i
B
D
0
1
A
D
H
K
B
aAH = ½ (aAA + aAD) = ½ (1+0) = ½
A-D
H
½
½
1
A-D
K
½
½
½
1
aAK = ½ (aAA + aAD) = ½ (1+0) = ½
aAB = ½ (aAK ) = ½ ( ½ ) = ¼
aDH = ½ (aDA + aDD) = ½ (0+1) = ½
aDK = ½ (aDA + aDD) = ½ (0+1) = ½
aDB = ½ (aDK) = ½ ( ½ ) = ¼
aHH = ½ (aAD) + 1 = ½ (0) + 1 = 1
aHK = ½ (aHA + aHD) = ½ ( ½ + ½ ) = ½
aHB = ½ (aHK = ½ ( ½ ) = ¼
aKB = ½ aKK = ½ (1) = ½
Matrix simétrica
Se consanguinidade na diagonal > 1
aII = 1 + ½ (aSIDI)
Relacionamento aditivo entre pais de I
Coeficiente de consangüinidade
41
K
B
¼
¼
¼
½
1
Programas de computador
(SOMENTE EXEMPLOS – LISTA COMPLETA EM OUTRAS PUBLICAÇÕES DA SÉRIE)
Programa
FSTAT
Estatística
Site
Número
da
freqüência
alélica
estimada
de
uma
ou
várias
amostras.
- Números esperados e observados de cada genótipo por amostra e loco.
- Diversidade genética imparcial por amostra e loco.
- Número de alelos amostrados por loco, de uma ou várias amostras.
- Riqueza alélica de uma ou várias amostras.
- Fis por loco e amostra, além de teste de significância positive ou negative (deficit
significativo e excess de heterozogotos, respectivamente).
- Nei's (1987) Autores da diversidade gênica e de diferenciação.
- Weir & Cockerham (1984) Capf (Fit), theta (Fst) and smallf (Fis) Autoresestimated per
allele, per loco and overall. FSTAT também calcula Hamilton's (1971) Parentesco
relat=2Fst/(1+Fit), calculado usando um estimador restritivo, equivalente ao Queller e
Goodnight’s (1989). Esta medida é o parentesco médio de indivíduos dentro de amostras
quando comparado aos dados de todo o conjunto.
http://www2.unil.ch/popgen/softw
Os intervalos de confiança baseado em esquemas de reamostragem são fornecidas para
as estatísticas Weir & Cockerham:
- Jackknifing por loco de todas as amostras.
- Jackknifing por locos.
- Bootstrapping por locos.
- Estimativa de Estatística R (Slatkin, 1995).
- Estimativa de Fst (theta) por par de amostra.
- Teste geral para avaliar se cada amostra de cada loco esta em equilíbrio de HW
- Teste para avaliar se todo o conjunto de dados esta em equilíbrio de HW.
- Teste para avaliar se todas as amostras são diferenciadas.
- Teste para avaliar se todas as amostras são diferenciadas assumindo se existe ou não
equilíbrio de HW.
- Teste para avaliar se cada para de loco de cada amostra estão em equlíbrio genotípico.
- Teste para avaliar a existência de amostras diferentes para um grande painel
estatístico.
- Teste para avaliar se as categorias de indivíduos diferem nas taxas de dispersão (quatro
testes diferentes)
- Converte do formato FSTAT para o formato GENEPOP e vice-versa
42
ares/fstat.htm
ARLEQUIN
- Realiza regressão múltipla ou parcial para os testes de Mantel.
- Índices Standard: Algumas medidas de diversidade como o número de sítios
polimórficos, diversidade genética.
- Diversidade Molecular: Calcula vários índices de diversidade, como diversidade
nucleotídica, estimadores diferentes para o parâmetro populacional q.
- Incompatibilidade de distribuição: A diferença na distribuição do número de pares entre
os haplótipos, a partir do qual os parâmetros de uma expansão demográfica ou espacial
pode ser estimada
- Estimativa da frequencia haplótica: Estima a frequencia da presence de haplótipos
presents na população através de métodos máximos de semelhança
- Estimativa da fase gamética: Estima a fase gamética de genótipos de multi-loco
utilizando uma abordagem pseudo-Bayesiana (algoritmo ELB).
- Desequlíbrio de Linkage: teste de associação não-randômica de alelos de diferentes
loco.
- Equilíbrio de Hardy-Weinberg: Teste de associações não randômicas com indivíduos
diplóides.
- Teste de neutralidade de Tajima’s. Teste de neutralidade seletiva de uma amostra
randômica de sequencias de DNA ou haplótipos RFLP obtidos de modelos de inúmeros
sites.
- Teste de neutralidade Fu's FS: teste de neutralidade de amostras randomicas ou
selecionadas de sequencias de DNA ou haplótipos de RFLP.obtidos de modelos de
inúmeros sites.l.
- Teste de neutralidade de Ewens-Watterson: Teste de neutralidade seletiva baseado em
amostras teóricas de Ewens obtidos de inúmeros modelos alélicos.
- Teste de amalgamação de Chakraborty’s: Um teste de neutralidade seletiva e
homogeneidade da população. Este teste pode ser usado quando a heterogeneidade da
amostra é suspeita.
Minimum Spanning Network (MSN):Calcula uma árvore geradora mínima (MST) e
Network (MSN) entre os haplótipos. Esta árvore também pode ser utilizada para todos os
haplótipos em diferentes populações, se for ativado na seção AMOVA.
Métodos Inter-Populacional:
- AMOVA: Análises hierárquicas de variância molecular diferentes para avaliar a
quantidade de estrutura genética populacional.
- DISTÂNCIA GENÉTICA PAIRWISE: A distância genética de FST baseada no tempo de
divergência curto.
- TESTES PRECISOS DE DIFERENCIAÇÃO ENTRE POPULAÇÕES: Teste de distribuição nãoaleatória de haplótipos em amostras da população sob a hipótese de panmixia.
- TESTES DE GENOTIPAGEM ATRIBUÍDA: Atribuição de genótipos individuais para
determinadas populações de acordo com a estimativa de freqüências alélicas.
- TESTE DE MANTEL: Correlações parciais ou não entre um conjunto de duas ou três
43
http://cmpg.unibe.ch/software/arl
equin3/
Cervus
Genepop
MTDFREML
matrizes. Pode ser usado para testar a presença de isolamento por distância.
Análise de Freqüência Alélica
- Probabilidade de paternidade requer testes usando freqüências alélicas. .
- Calcula a freqüência de cada alelo de cada loco na população, juntamente com uma
série de estatísticas resumidas, incluindo testes de equilíbrio de Hardy-Weinberg e a
presença de alelos nulos.
Simulação da Análise de Paternidade
A simulação de análise de paternidade é útil por duas razões.
Quatro tipos diferentes de testes de paternidade podem ser simulados: análise da
maternidade, análise de paternidade, análise de pai par onde os sexos dos pais
candidatos são conhecidos e análise de pai-mãe, onde os sexos dos pais candidatos são
desconhecidos.
Análise de Parestesco (paternidade)
Para cada filho (descendente) testado, o parentesco, é tanto atribuído ao pai candidato
mais provável com um nível pré-determinado de confiança, ou é deixada sem atribuição.
Análise de Identidade
Essa análise é utilizada para identificar os indivíduos que tenham sido amostrados,
mesmo não sendo os dois genótipos exatamente iguais.
Equilíbrio de Hardy Weinberg,Linkage Disequilibrium, Diferenciação de população,
Número efetivo de migrants, Fst ou outras correlações.
componentes de variância de estimação relação numerador Incluindo matriz
e wombat
http://www.fieldgenetics.com/pag
es/aboutCervus_Using.jsp
http://genepop.curtin.edu.au/
http://www.aipl.arsusda.gov/curtv
t/mtdfreml.html
http://agbu.une.edu.au/~kmeyer/wombat.h
tml
ENDOG
Funções primárias realizadas por ENDOG
• consanguinidade individual (F) (Wright, 1931)
• coeficiente da relação média (AR) (Gutiérrez et al, 2003;. Goyache et al, 2003).
• parâmetros em genética de populações, como a descrita para Biochard et al.
(1997).
• Para o número de ancestrais explicar a variabilidade genética ou aqueles
propostos por Rodrigues (1953) e Vassallo et al. (1996),
• estatística F (Wright, 1978) a partir de informações genealógicas propostas por
Caballero e Toro (2000, 2002).
• tamanho efetivo da população seguindo metodologias diferentes, incluindo
abordagens de regressão e, em especial o tamanho da população. Foi realizada
recentemente uma proposta efetiva de aumento individual de endogamia
(Gutiérrez et al., 2008), que foi modificada a fim de se evitar uma autofertilização (Gutiérrez et al., 2009).
44
http://www.ucm.es/info/prodanim/
html/JP_Web.htm
Referências
Alderson, L.1992. A system to maximize the maintenance of genetic
variability in small populations. In Genetic Conservation of Domestic
Livestock II, Eds. Alderson, L. and Bodo, I., CABI, Wallingford, U.K., 1829.
Ballou, J.D, Lacy, R.C.1995. Identifying genetically important individuals for
management of genetic variation in pedigreed populations. In: Ballou
JD, Gilpin M, Foose TJ, editors. Population management for survival and
recovery: analytical methods and strategies in small population
management. New York: Columbia University Press, 76-111.
Banos, G.; Wiggans, G.R. and Powell, R.L. 2001. Impact of paternity errors
in cow identification on genetic evaluations and international
comparisons. J. Dairy Sci., 84: 2523-2529.
Bartolomé, E.; Goyache, F., Molina, A., Cervantes, I., Valera, M., Gutiérrez,
J.P. 2010. Pedigree estimation of the (sub) population contribution to
the total gene diversity: the horse coat colour case. Animal, 4, 867-875.
Boichard, D. 2002. PEDIG: a FORTRAN package for pedigree analysis suited
for large populations, in: Proc. 7th World Cong. Genet. Appl. to Livest.
Prod., Montpellier, 19_23 August 2002, INRA, Castanet-Tolosan,
France, CD-Rom, comm. 28-13.
Boichard, D.; Maignel, L.; Verrier, E. 1997. The value of using probabilities
of gene origin to measure genetic variability in a population. Genet Sel
Evol 29: 5-23.
Botstein, D.; White, R.L.; Skolnick, M.H. & Davies, R.W. 1980. Construction
of a genetic linkage map in man using restriction fragment length
polymorphisms. American Journal of Human Genetics, 32, 314–31.
Brinkmann, B.; Pfeiffer, H.; Schtirenkamp, M.; Hohoff, C. 2001.The
evidential value of STRs: an analysis of exclusion cases. Internal
Journal Legal Medicine 114:173-177
Brown, A.H.D.; and Weir, B.A. 1983. Measuring genetic variability in plant
populations. In: Tanksley, S. D. and Orton, T. J. (eds) Isozymes in Plant
Genetics and Breeding, Elsevier, Amsterdam, pp. 219–239.
Caballero, A.; Toro, M.A. 2000. Interrelations between effective population
size and other pedigree tools for the management of conserved
populations. Genetics Research Camb 75: 331-343.
Caballero, A.; Toro, M.A. 2002. Analysis of genetic diversity for the
management of conserved subdivided populations. Conservation
Genetics 3: 289-299.
Caldwell, J. 1996. DNA and ancestry verification. Proceedings of World
Holstein-Friesian Conference, Japan.
Cervantes, I.; Goyache, F., Molina, A.; Valera, M.; Gutiérrez, J.P. 2008.
Application of individual increase in inbreeding to estimate effective
sizes from real pedigrees. Journal of Animal Breeding and. Genetics,
125, 301-310.
Cervantes, I.; Goyache, F.; Molina, A.; Valera, M.; Gutiérrez, J.P. 2010.
Estimation of effective population size from the rate of coancestry in
pedigreed populations. Journal of Animal Breeding and Genetics,
Chakraborty, R.; Shaw, M.W.; Schull, W.J. 1974. Exclusion of paternity: the
current state of the art. American Journal of Human of Genetics,
26:477--488
45
Chakraborty, R and Stivers, D.N. 1996. Paternity exclusion by DNA
markers: effects of paternal mutations. Journal of Forensic Sciences,
41:671-677
Dodds, K.G.; Tate, M.L.; Mcewan, J.C. et al. 1996. Exclusion probabilities
for pedigree testing farm animals. Theoretical and Applied Genetics.,
92:966-975.
Doods, K.G., M.L. Tate and J.A. Sise, 2005. Genetic evaluation using
parentage information from genetic markers. Journal of Animal Science,
83: 2271-2279.
Eding, H.; Meuwissen, T.H.E. 2001. Marker-based estimates of between and
within population kinships for the conservation of genetic diversity.
Journal of Animal Breeding and Genetics, 118:141-59.
Falconer, D.S.; and Mackay, T.F.C. 1996 Introduction to Quantitative
Genetics, Ed 4. Longmans Green, Harlow, Essex, UK.
Francisco, L.V.; Langston, A.A.; Mellersh, C.S.; Neal, C.L. & Ostrander, E.A.
1996. A class of highly polymorphic tetranucleotide repeats for canine
genetic mapping. Mammalian Genome, 7, 359–62.
Garber, R.A.; Morris, J.W. 1983. General equations for the average power of
exclusion for genetic systems of n codominant alleles in one-parent and
no-parent cases of disputed parentage. In:Walker RH (ed) Inclusion
probabilities in parentage testing. American Association of Blood Banks,
Arlington, VA, pp 277- 280
Glowatzki-Mullis, M.L.; Gaillard, C.; Wigger, G. et al. 1995. Microsatellitebased parentage control in cattle. Animal of Genetics, 26:7-12.
González-Recio, O.; López de Maturana, E.; Gutiérrez, J.P. 2007. Inbreeding
depression on female fertility and calving ease in Spanish dairy cattle.
Journal of Dairy Science., 90, 5744-5752.
Goyache, F.; Gutiérrez, J.P.; Fernández, I.; Gómez, E.; Álvarez, I.; Díez, J.;
Royo, L.J; 2003. Using pedigree information to monitor genetic
variability of endangered populations: the Xalda sheep breed of Asturias
as an example. Journal of Animal Breeding of Genetics, 120: 95-103.
Gunn, P.R.; Trueman, K.; Stapleton, P.; Klarkowski, D.B. 1997. DNA
analysis in disputed parentage: the occurrence of two apparently false
exclusions of paternity, both at short tandem repeat (STR) locos, in the
one child. Electrophoresis 18:1650-1652
Gutiérrez, J.P.; Altarriba, J.; Díaz, C.; Quintanilla, A.R.; Cañón J, Piedrafita
J, 2003. Genetic analysis of eight Spanish beef cattle breeds. Genet Sel
Evol 35:43-64.
Gutiérrez, J.P.; Cervantes, I.; Molina, A.; Valera, M.; Goyache, F. 2008.
Individual increase in inbreeding allows estimating realized effective
sizes from pedigrees. Genetics Selection Evolution, 40, 359-378.
Gutiérrez, J.P., Cervantes, I., Goyache, F. 2009. Improving the estimation
of realized effective population sizes in farm animals. Journal of Animal
Breeding Genetics.
Halverson, J.; Dvorak, J. & Stevenson, T. 1995. Microsatellite sequences for
canine genotyping. US Patent 05874217.
Hansen, C.; Shrestha, J.N.; Parker, R.J.; Crow, G.H.; McAlpine, P.J. and
Derr, J.N. 2002. Genetic diversity among canadienne, brown swiss,
holstein and jersey cattle of Canada based on 15 bovine microsatellite
markers. Genome, 45: 897-904.
46
Henegariu, O.; Neerema, N.A.; Dlouhy, S.R.; Vance, G.H. and Vogt, P.H.
1997. Multiplex PCR: Critical parameters and step-by-step protocol.
Biotechniques, 23: 504-511.
Heyen, D.W.; Beever, J.E.; Da, Y.; Evert, R.E. and Green, C. et al. 1997.
Exclusion probabilities of 22 bovine microsatellite markers in fluorescent
multiplexes for semiautomated parentage testing. Animal of Genetics,
28: 21-27.
Hill, W.G. 1979. A note on effective population size with overlapping
generations. Genetics, 92: 317-322.
http://www.nfstc.org/pdi/Subject07/pdi_s07_m02_03.htm
Ichikawa, Y.; Tagagi, K.; Tsumagari, S.; Ishima, K. and Morita, M. et al.
2001. Canine parentage testing based on microsatellite polymorphisms.
Journal of Veterinary of Medical Science, 63: 1209-1213.
Israel, C. and Seller, J.I. 2000. Effect of misidentification on genetic gain
and estimation of breeding value in dairy cattle populations. Journal of
Dairy Science, 83: 181-187.
James, J. 1972. Computation of genetic contributions from pedigrees.
Theoretical and Applied. Genetics. 42: 272-273.
James, J.W. 1977. A note on selection differentials and generation length
when generations overlap. Animal of Prod. 24:109-112.
Jamieson, A.; Taylor, S.C.1997. Comparisons of three probability formulae
for parentage exclusion. Animal of Genetics, 28:397-400
Jamieson, A. 1965. The genetics of transferrin in cattle. Heredity 20, 419–
41.
Kaye, D.H. 1990. DNA paternity probabilities. Faro Law Quart 24:280-303
Lacy, R.C. 1989. Analysis of Founder Representation in Pedigrees: Founder
Equivalent and Founder Genome Equivalents. Zoo Biology, 8:111-123.
Lacy, R.C.; Alaks, G.; Walsh, A. 1996. Hierarchical analysis of inbreeding
depression in Peromyscus polionotus. Evolution 50: 2187–2200.
Lee, C.L.; Lebeck, L.; Pothiawala, M. 1980. Exclusion of paternity without
testing the mother. American Journal of Clinical Pathology, 74:809-812
Li, C.C.; Sacks, L. 1954. The derivation of joint distribution and correlation
between relatives by the use of stochastic matrices. Biometrics,
10:247-260
Liron, J.P.; Ripoli, M.V.; Garcia, P.P. and Giovambattista, G. 2004.
Assignment of paternity in a judicial dispute between 2 neighbor
holstein dairy farmers. Journal of Forensic Science. 49: 96-98.
MacCluer, J.; Boyce, B.; Dyke, L.; Weitzkamp, D.; Pfenning, A.; Parsons, C.
1983. Inbreeding and pedigree structure in Standardbred horses.
Journal of Hereditary. 74: 394-399.
Maignel, L.; Boichard, D.; Verrier, E.1996. Genetic variability of French
dairy breeds estimated from pedigree information. Interbull Bull 14: 4954.
Man, W.Y.N.; Nicholas, F.W.; James, J.W. 2007. A pedigree-analysis
approach to the descriptive epidemiology of autosomal-recessive
disorders. Preventive Veterinary Medicine, 78: 262-273.
Maudet, C.; Luikart, G. and Taberlet, P. 2002. Genetic diversity and
assignment tests among seven French cattle breeds based on
microsatellite DNA analysis. Journal of Animal Science, 80: 942-950.
Melvin, J.R.; Kateley, J.R.; Oaks, M.K.; Simson, L.R.; Maldonado, W.E.
1988. Paternity testing. In: Saferstein R (ed) Forensic science
handbook, vol II. Prentice-Hall, Englewood Cliffs, NJ, pp 273- 346
47
Meuwissen, T.I.; Luo, Z.1992. Computing inbreeding coefficients in large
populations, Genetics Seletion Evolution, 24: 305-313.
Mullis, M.L.G.; Gaillard, C.; Wigger, G. and Fries, R. 1995. Microsatellitebased parentage control in cattle. Animal Genetics, 26: 7-12.
Neff, B.D.; Repka, J. and Gross, M.R. 2000. Statistical confidence in
parentage analysis with incomplete sampling: How many locos and
offspring are needed? Molecular Ecology, 9: 529-539.
Neff, B.D.; Repka, J. and Gross, M.R. 2001. A bayesian framework for
parentage analysis: The value of genetic and other biological data.
Theoretical of Population of Biology, 59: 315-331.
Nei, M. 1987. Molecular Evolutionary Genetics. Columbia University Press,
New York, 512 pp.
Ohno, Y.; Sebetan, I.M.; Akaishi, S. 1982. A simple method for calculating
the probability of excluding paternity with any number of codominant
alleles. Forensic Sci Int 19:93-98
Ostrander, E.A.; Mapa, F.A.; Yee, M. & Rine, J. 1995 One hundred and one
simple sequence repeat-based markers for the canine genome.
Mammalian Genome 6, 192–5.
Ostrander, E.A.; Sprague, G.F.; Jr & Rine J. (1993) Identification and
characterization of dinucleotide repeat (CA)n markers for genetic
mapping in dog. Genomics 16, 207–13.
Pérez-Enciso, M. 1995. Use of the uncertain relationship matrix to compute
effective population size, Journal of Animal. Breeding.of Genetics. 112:
333-340.
Quaas, R.L. 1976. Computing the diagonal elements of a large numerator
relationship matrix. Biometrics 32: 949-953.
Raymond M. & Rousset F. 1995. GENEPOP (version 1.2): population
genetics software for exact tests and ecumenicism. Journal of Heredity,
86:248-249
Robertson, A. 1953. A numerical description of breed structure. Journal of
Agric Science, 43: 334-336.
Ron, M., Blanc, Y., Band, M. et al. 1996. Misindetification rate in the Israeli
dairy cattle population and its implications for genetic improvment. J.
Dairy Sci., 79:676-681.
Ron, M.; Yoffe, O.; Ezra, E. et al. 1994. Determination of effects of milk
protein genotyping on production traits of Israeli Holstein. Journal of
Dairy Science, 77:1106-1113.
Rousset, F. 2008. Genepop'007: a complete reimplementation of the
Genepop software for Windows and Linux. Molecular Ecology Resources
8: 103-106.
Salmon, D.B.; Brocteur, J.1978, Probability of paternity exclusion when
relatives are involved. American Journal of Human Genetics, 30:65-75.
Savolainen, P.; Zhang, Y.; Luo, J.; Lundeberg, J. & Leitner, T. 2002. Genetic
evidence for an East Asian origin of domestic dogs. Science 298, 1610–
13.
Shannon, C. E., and W. Weaver. 1949. The Mathematical Theory of
Communication. Urbana, University of Illinois Press, 117 pp.
Sherman, G.B.; Kachman, S.D.; Hungerford, L.L.; Ropp, G.P. and Fox, C.P.
et al. 2004. Impact of candidate sire number and sire relatedness on
DNA polymorphisms-based measures of exclusion probability and
probability of unambiguous parentage. Animal Genetics, 35: 220-226.
48
Tozaki, T., H. Kakoi, S. Mashima, K. Hirota and T. Hasegawa et al. 2001.
Population study and validation of paternity testing for thoroughbred
horses by 15 microsatellite locos. Journal of Veterinary Medical Science,
63: 1191-1197.
Usha, A.P., Simpson, S.P. and Williams, J.L. 1995. Probability of random
sire exclusion using microsatellite markers for parentage verification.
Animal Genetics, 26: 155-161.
Vankan, D.M. and M.J. Faddy, 1999. Estimations of the efficacy and
reliability of paternity assignments from DNA microsatellite analysis of
multiple-sire matings. Animal Genetics, 30: 355-361.
Vassallo, J.M.; Díaz, C.; García-Medina, J.R, 1986. A note on the population
structure of the Avileña breed of cattle in Spain, Livestock Production
Science, 15: 285-288.
Vila, C.; Savolainen, P.; Maldonado, J.E.; Amorim, I.R. Rice, J.E.;
Honeycutt, R.L.; Crandall, J.; Lundeberg, K.A. & Wayne, R.K. 1997,
Multiple and ancient origins of the domestic dog. Science 276, 1687–89.
Visscher, P.M.; Wooliams, J.A.; Smith, D. and Williams, J.L. 2002.
Estimation of pedigree errors in the UK dairy population using
microsatellite markers and the impact on selection. Journal of Dairy
Science, 85: 2368-2375.
Wahlberg, N. 2000. The ecology and evolution of Melitaeine butterflies.
Faculty of Science of the University of Helsinki (Academic dissertation).
25p.
Weir, B.S. & Cockerham, C.C. 1984. Estimating F-statistics for the analysis
of population structure. Evolution 38: 1358-1370.
Weir, B.S. 1996. Genetic Data Analysis II: Methods for discrete population
genetic data. Sinauer Associates, Sunderland. 445p.
WEIR, B.S. 1996. Genetic data analysis: methods for discrete population
genetic data. 2.ed. Massachusetts: Sinauer Associates. 445p.
Wenk, R.E, Traver, M.; Chiafari, F.A. 1996. Determination of sibship in any
two persons. Transfusion 36:259-262.
Werner, P.; Mellersh, C.S.; Roducha, M.G.; De Rose S.; Acland, G.M.;
Prociuk U., Wiegand, N.; Agurre, G.D.; Henthorn P.S., Patterson D.F. &
Ostrander E.A. (1999) Anchoring of canine linkage groups with
chromosome-specific markers. Mammalian Genome 10, 814–23.
Whitlock, M.C. & MacCauley, D.E. 1990. Some populations genetic
consequences of colony formation and extinction: genetic correlations
within fouding groups. Evolution 44(7): 1717-1724.
Willis, C.F. & Guries, R.P. 1995. Evolution v.48: 791-805.
Woolliams JA, Pong-Wong R, Villanueva B, 2002. Strategic optimisation of
short and long term gain and inbreeding in MAS and non-MAS schemes,
in: Proc. 7thWorld.
Wright, S. 1931. Evolution in mendelian populations. Genetics 16: 97-159.
Wright, S. 1943. Isolation by distance. Genetics 28: 114-138.
Wright, S. 1951. The genetical structure of populations. Annual Eugenics
15: 223-354.
Wright, S. 1965. The interpretation of population structure by F-statistics
with special regard to systems of mating. Evolution 19: 395-420.
Wright, S. 1978. Evolution and the genetics of populations: Vol. 4.
Variability within and among natural populations. University of Chicago
Press: Chicago. USA
49
Yeh, F.C. 2000. Population genetics. In: Forest conservation genetics:
principles and practice. A.Young, D. Boshier & T.Boyle (eds.). pp. 2137. Collingwood: CSIRO Publishing.
Zupanik, P.I.; H. Sterlinko, J.; Balaic, R.; Komel, 2001. Parentage testing
with 14 STR locos and population data for 5 STRs in the slovenian
population. Int. J. Legal Med., 114: 178-180.
50