Projeto do curso

Transcrição

Projeto do curso
COE241 - Estatı́stica e Modelos Probabilı́sticos
Segundo Semestre de 2014 - Professora: Rosa Maria Meri Leão
Projeto do Curso
1
Objetivo
O objetivo deste trabalho é analisar um log de ações de alunos que assistem uma videoaula no
seu computador. As videoaulas são de um curso de tecnologia em sistemas de computação.
A videoaula é composta por um vı́deo do professor sincronizado com os slides. Os alunos
podem executar ações como avanço, pausa e retrocesso (semelhantes a quando você está
assistindo um filme).
O principal objetivo da análise do log de ações é estudar o comportamento do aluno.
Conhencendo o comportamento do aluno é possı́vel dimensionar e planejar o sistema de
distribuição de videoaulas.
2
Formato do Log
Cada linha do log de ações possui dados de uma determinada sessão de um aluno, ou seja,
é um resumo das ações executadas pelo aluno durante a sessão. O log de ações dos alunos
possui os campos descritos abaixo.
1. TimeStamp em UnixTime - hora de inı́cio da sessão.
2. Nome da Aula - videouala que o aluno está assistindo.
3. PlayTime em Segundos - tempo que o aluno ficou assistindo a videoaula, ou seja,
tempo em play.
4. SessionTime em Segundos - duração da sessão.
5. Numero de pulos para frente - número de vezes que o aluno executou um comenado
de avanço.
6. Numero de pulos para trás - número de vezes que o aluno executou um comando
de retrocesso.
1
O tempo que o aluno ficou pausado pode ser obtido fazendo: SessionTime−PlayTime.
Denominaremos este tempo PauseTime.
3
3.1
Análises a serem realizadas
Histograma
Você deve calcular o histograma para as seguintes variáveis aleatórias: PlayTime, SessionTime, PauseTime, Numero de pulos para frente, Numero de pulos para trás.
Você deve obter quatro histogramas para cada uma das variáveis: um considerando todas
as Aulas e outros três para cada uma das Aulas (Aula01, Aula02, Aula03).
3.2
Função Distribuição Empı́rica
Você deve calcular a função distribuição empı́rica para as seguintes variáveis aleatórias:
PlayTime, SessionTime, PauseTime, Numero de pulos para frente, Numero de
pulos para trás.
Você deve obter quatro gráficos para cada uma das variáveis: um considerando todas as
Aulas e outros três para cada uma das Aulas (Aula01, Aula02, Aula03).
3.3
Média e Variância
Você deve calcular a média e variância para as seguintes variáveis aleatórias: PlayTime,
SessionTime, PauseTime, Numero de pulos para frente, Numero de pulos para
trás.
Você deve obter valores de média e variância para cada uma das variáveis considerando
todas as Aulas e também para cada uma das Aulas (Aula01, Aula02, Aula03).
2
3.4
BoxPlot
Você deve construir o gráfico BoxPlot para as seguintes variáveis aleatórias: PlayTime,
SessionTime, PauseTime, Numero de pulos para frente, Numero de pulos para
trás para cada uma das aulas. Dessa forma, para cada uma das variáveis, você terá um
gráfico com três BoxPlots, uma para cada Aula.
3.5
Parametrizando distribuições
Neste item o objetivo é você parametrizar um conjunto de distribuições da literatura usando
os dados do log. Após a parametrização você irá verificar se alguma das variáveis aleatórias
do log pode ser representada por uma distribuição da literatura. Utilize o método dos momentos ou o método da máxima verossimilhança para parametrizar as seguintes distribuições:
exponencial, gaussiana, lognormal, weibull.
As variáveis aleatórias que você deve considerar são: PlayTime, SessionTime, PauseTime. Ou seja, você deve obter para cada dessas variáveis o valor dos parâmetros das
distribuições citadas acima. Neste item você deve utilizar todas as Aulas. Após a obtenção
dos valores dos parâmetros, você deve fazer um gráfico para cada uma das variáveis aleatórias
com a função distribuição empı́rica e as quatro distribuições que você parametrizou. Observando o gráfico você deve identificar se existe ou não uma das distribuições da literatura que
pode ser usada para representar a variável aleatória.
3.6
Gráfico QQplot ou ProbabilityPlot
Os gráficos QQplot ou ProbabilityPlot servem para analisar se duas variáveis aleatórias
possuem a mesma distribuição. Você deve traçar os gráficos para os seguintes casos:
1. Numero de pulos para frente x Numero de pulos para trás.
2. PlayTime x cada uma das distribuições parametrizadas (exponencial, gaussiana, lognormal, weibull).
3. SessionTime x cada uma das distribuições parametrizadas (exponencial, gaussiana,
lognormal, weibull).
4. PauseTime x cada uma das distribuições parametrizadas (exponencial, gaussiana,
lognormal, weibull).
3
4
Relatório
Você deve fazer um relatório contendo todos os resultados que você obteve e explicando como
você os obteve. É importante comentar cada um dos resultados e explicar como o resultado
que você obteve poderá influenciar no planejamneto e desempenho do sistema. A avaliação
do projeto será feita com base na qualidade do relatório.
4