Projeto do curso
Transcrição
Projeto do curso
COE241 - Estatı́stica e Modelos Probabilı́sticos Segundo Semestre de 2014 - Professora: Rosa Maria Meri Leão Projeto do Curso 1 Objetivo O objetivo deste trabalho é analisar um log de ações de alunos que assistem uma videoaula no seu computador. As videoaulas são de um curso de tecnologia em sistemas de computação. A videoaula é composta por um vı́deo do professor sincronizado com os slides. Os alunos podem executar ações como avanço, pausa e retrocesso (semelhantes a quando você está assistindo um filme). O principal objetivo da análise do log de ações é estudar o comportamento do aluno. Conhencendo o comportamento do aluno é possı́vel dimensionar e planejar o sistema de distribuição de videoaulas. 2 Formato do Log Cada linha do log de ações possui dados de uma determinada sessão de um aluno, ou seja, é um resumo das ações executadas pelo aluno durante a sessão. O log de ações dos alunos possui os campos descritos abaixo. 1. TimeStamp em UnixTime - hora de inı́cio da sessão. 2. Nome da Aula - videouala que o aluno está assistindo. 3. PlayTime em Segundos - tempo que o aluno ficou assistindo a videoaula, ou seja, tempo em play. 4. SessionTime em Segundos - duração da sessão. 5. Numero de pulos para frente - número de vezes que o aluno executou um comenado de avanço. 6. Numero de pulos para trás - número de vezes que o aluno executou um comando de retrocesso. 1 O tempo que o aluno ficou pausado pode ser obtido fazendo: SessionTime−PlayTime. Denominaremos este tempo PauseTime. 3 3.1 Análises a serem realizadas Histograma Você deve calcular o histograma para as seguintes variáveis aleatórias: PlayTime, SessionTime, PauseTime, Numero de pulos para frente, Numero de pulos para trás. Você deve obter quatro histogramas para cada uma das variáveis: um considerando todas as Aulas e outros três para cada uma das Aulas (Aula01, Aula02, Aula03). 3.2 Função Distribuição Empı́rica Você deve calcular a função distribuição empı́rica para as seguintes variáveis aleatórias: PlayTime, SessionTime, PauseTime, Numero de pulos para frente, Numero de pulos para trás. Você deve obter quatro gráficos para cada uma das variáveis: um considerando todas as Aulas e outros três para cada uma das Aulas (Aula01, Aula02, Aula03). 3.3 Média e Variância Você deve calcular a média e variância para as seguintes variáveis aleatórias: PlayTime, SessionTime, PauseTime, Numero de pulos para frente, Numero de pulos para trás. Você deve obter valores de média e variância para cada uma das variáveis considerando todas as Aulas e também para cada uma das Aulas (Aula01, Aula02, Aula03). 2 3.4 BoxPlot Você deve construir o gráfico BoxPlot para as seguintes variáveis aleatórias: PlayTime, SessionTime, PauseTime, Numero de pulos para frente, Numero de pulos para trás para cada uma das aulas. Dessa forma, para cada uma das variáveis, você terá um gráfico com três BoxPlots, uma para cada Aula. 3.5 Parametrizando distribuições Neste item o objetivo é você parametrizar um conjunto de distribuições da literatura usando os dados do log. Após a parametrização você irá verificar se alguma das variáveis aleatórias do log pode ser representada por uma distribuição da literatura. Utilize o método dos momentos ou o método da máxima verossimilhança para parametrizar as seguintes distribuições: exponencial, gaussiana, lognormal, weibull. As variáveis aleatórias que você deve considerar são: PlayTime, SessionTime, PauseTime. Ou seja, você deve obter para cada dessas variáveis o valor dos parâmetros das distribuições citadas acima. Neste item você deve utilizar todas as Aulas. Após a obtenção dos valores dos parâmetros, você deve fazer um gráfico para cada uma das variáveis aleatórias com a função distribuição empı́rica e as quatro distribuições que você parametrizou. Observando o gráfico você deve identificar se existe ou não uma das distribuições da literatura que pode ser usada para representar a variável aleatória. 3.6 Gráfico QQplot ou ProbabilityPlot Os gráficos QQplot ou ProbabilityPlot servem para analisar se duas variáveis aleatórias possuem a mesma distribuição. Você deve traçar os gráficos para os seguintes casos: 1. Numero de pulos para frente x Numero de pulos para trás. 2. PlayTime x cada uma das distribuições parametrizadas (exponencial, gaussiana, lognormal, weibull). 3. SessionTime x cada uma das distribuições parametrizadas (exponencial, gaussiana, lognormal, weibull). 4. PauseTime x cada uma das distribuições parametrizadas (exponencial, gaussiana, lognormal, weibull). 3 4 Relatório Você deve fazer um relatório contendo todos os resultados que você obteve e explicando como você os obteve. É importante comentar cada um dos resultados e explicar como o resultado que você obteve poderá influenciar no planejamneto e desempenho do sistema. A avaliação do projeto será feita com base na qualidade do relatório. 4