02 - Mestrado - Matemática Aplicada e Computacional
URI Permanente para esta coleção
Navegar
Navegando 02 - Mestrado - Matemática Aplicada e Computacional por Assunto "Análise de componentes principais"
Agora exibindo 1 - 2 de 2
Resultados por página
Opções de Ordenação
Item Estimação dos redshift de galáxias utilizando dados de fotometria: uma abordagem GAMLSS(2023-02-24) Debastiani Neto, João; Pescim, Rodrigo Rossetto; Urbano, Mariana Ragassi; Nakamura, Luiz RicardoCosmologia é um ramo da astronomia que busca por interpretar as origens do Universo, bem como investigar os objetos nela presentes. Compreender como os elementos celestes interagem e quais os fatores que influenciam para tal aspecto, são alguns dos anseios dos pesquisadores que se debruçam nestas questões. Desde o início do século XX, pesquisadores referem-se a expansão constante do Universo, de maneira que galáxias e estrelas estão, em geral, se afastando da Terra a uma certa velocidade. Astrônomos e pesquisadores desta área são capazes de identificar tal afastamento (ou aproximação), por meio de uma medida denominada redshift, que refere-se ao deslocamento da luz originária destes objetos celestes para o infravermelho baseado em seu comprimento de onda. Algumas técnicas possibilitam obter uma estimativa destes redshift, dentre os quais se destacam o redshift espectroscópico e o redshift fotométrico. Embora a primeira destas técnicas seja mais apurada no que se refere aos valores estimados, o segundo método propõe uma diminuição de tempo e de recursos, sendo assim, a mais considerada. Diversas alternativas na estimação de redshift fotométricos se mostraram extremamente eficazes e altamente utilizadas, dentre os quais se destacam modelos estatísticos vinculadas a técnicas de Machine Learning e Decision Tree. Buscando-se apresentar uma nova alternativa para tal problemática, foi proposta a presente pesquisa, cujo objetivo consiste na implementação de um Modelo Aditivo Generalizado para Locação, Escala e Forma (GAMLSS) visando a estimativa de desvios para o vermelho fotométricos de galáxias, segundo a fotometria de diferentes comprimentos de ondas (bandas). Entende-se que devido a natureza mais robusta e flexível dos GAMLSS, pode-se obter resultados mais satisfatórios do que os encontrados na literatura para os Modelos Lineares Generalizados (GLM), bem como uma alternativa viável para pesquisas fundamentadas em redes neurais e decision tree. Para tanto, considerou-se para a análise e interpretação dos dados o software R, de maneira que o conjunto de dados utilizado foi proveniente do pacote CosmoPhotoz, em particular, o conjunto denominado PHoto-z Accuracy Testing (PHAT0). Devido a elevada quantidade de observações contidas nesta base de dados (169520 dados), foi estabelecido, para análise desta pesquisa, um total de 8476 observações (5% da base PHAT0), sendo composta 12 variáveis (redshift fotométrico e 11 magnitudes de filtros). Por meio da análise realizada, observou-se que as variáveis explicativas são altamente correlacionadas, sendo necessário a utilização da técnica de análise de componentes principais (PCA). O modelo GAMLSS ajustado que apresentou melhores resultados contou com suavizadores (thin plate spline s(·)) para os quatro parâmetros da distribuição Box-Cox t (BCTo). Em síntese, a classe de modelos GAMLSS é uma alternativa eficaz para estimação de redshift fotométrico, apresentando-se como uma opção interessante para modelagem de dados desta natureza.Item Uma nova proposta metodológica de análise para dados multivariados sobre absenteísmoCalcagnoto, Laryssa Ribeiro; Santana, Tiago Viana Flor [Orientador]; Pescim, Rodrigo Rossetto; Nakamura, Luiz RicardoResumo: O absenteísmo é a prática ou costume de um colaborador se ausentar de seu local de trabalho Suas causas são diversas e afetam a renda do trabalhador, provoca transtornos operacionais, estressa a administração e causa prejuízos financeiros para empresa A análise de clusters é uma ferramenta multivariada que pode ser utilizada para determinar grupos de modo que cada grupo apresente características próprias de acordo com as variáveis observadas Assim, pode se utilizar essa técnica como suporte para determinar as características que contribuem para o absenteísmo O método para construção dos clusters utilizado foi o algorítimo hierárquico de Ward e para comparação dos grupos o teste não paramétrico de Kruskal-Wallis foi adotado Por fim, um estudo sobre a força de associação entre as variáveis foi desenvolvido utilizando-se a correlação de Spearman e para a relação entre variáveis relacionadas à ausência e os aspectos sociais, utilizou-se a análise de componentes principais, assim como a construção de um biplot para resumir os resultados da correlação e componentes principais Por meio desse estudo foi possível determinar três grupos heterogêneos na empresa e evidenciar características que são potenciais fatores causadores do absenteísmo em maior ou menor grau