Explainable Time Series Tree: an explainable top-down time series segmentation framework

dc.contributor.advisorZarpelão, Bruno Bogaz
dc.contributor.authorSilva, Vitor de Castro
dc.contributor.bancaKaster, Daniel dos Santos
dc.contributor.bancaMiani, Rodrigo Sanches
dc.contributor.coadvisorBarbon Junior, Sylvio
dc.coverage.extent83 p.
dc.coverage.spatialLondrina
dc.date.accessioned2024-10-22T17:41:16Z
dc.date.available2024-10-22T17:41:16Z
dc.date.issued2024-04-19
dc.description.abstractExistem diversos algoritmos de Aprendizado de Máquina para modelar séries temporais para problemas de classificação, previsão e clusterização. Entretanto, séries temporais podem apresentar características que complicam essas tarefas, como padrões recorrentes e variações sazonais. A segmentação de séries temporais pode ser uma solução para esses problemas, mas as abordagens existentes precisam ser melhoradas. Várias delas utilizam regressão linear para solucionar problemas como detecção de mudanças no comportamento da série, ignorando ferramentas desenvolvidas especificamente para resolver esse tipo de problema, como detectores de mudança. Além disso, o conceito de explicabilidade raramente é abordado na segmentação de séries temporais. Para identificar diferentes padrões de séries temporais usando técnicas apropriadas e ao mesmo tempo prover explicabilidade, nós criamos a eXplainable Time Series Tree, ou XTSTree. A XTSTree transforma uma série temporal em uma árvore binária, dividindo-a de forma hierárquica de acordo com um critério baseado em detectores de mudança e encontrando um ponto de corte que cria as duas sub-séries mais diferentes entre si. O processo de segmentação continua até que chegue em um critério de parada baseado em um teste de estacionariedade que indica que a série tem um comportamento suficientemente homogêneo. A XTSTree abre caminho para uma explicação mais compreensível de padrões e também oferece suporte para o uso de outras abordagens explicáveis. Nosso estudo aplicou a XTSTree em diversas séries temporais reais para isolar os seus diferentes comportamentos. Para avaliar a eficácia da XTSTree, nós usamos uma implementação de Regressão Simbólica usando programação genética para encontrar a melhor representação da série e suas divisões usando fórmulas algébricas, e comparamos as diferenças em diversas métricas antes e depois da XTSTree. Mostramos uma melhora em complexidade da fórmula, melhorando a acurácia do modelo quando comparado com a série temporal original
dc.description.abstractother1A wide range of Machine Learning algorithms can model time series to address classification, forecasting, and clustering problems. However, time series may exhibit characteristics that complicate these tasks, such as repeating patterns and seasonal variations. Time series segmentation could be a solution to these problems, but current approaches need to be improved. Most of them employ linear regression to solve problems such as detecting changes in a series’ behaviour, bypassing tools specifically designed for these challenges, such as change detectors. Moreover, explainability is seldom taken into account during time series segmentation. To automatically identify different time series patterns using appropriate techniques while leveraging explainability, we proposed the eXplainable Time Series Tree (XTSTree). XTSTree divides a time series into a binary tree, hierarchically splitting it according to a criterion based on change detectors, ideally finding a cutting point that creates the two most different sub-series. The segmentation process continues until it reaches a stopping criterion, which relies on a stationarity test that assesses whether the series has a sufficiently homogeneous behaviour. Based on well-behaved segments, XTSTree paves the way for a more comprehensive pattern explanation and also supports the application of explainable approaches. We applied XTSTree on several reallife time series to isolate the series’ different behaviours. To evaluate the effectiveness of our method, we used an implementation of Symbolic Regression using genetic programming to find the best representation of the time series and its splits using algebraic expressions, comparing the differences before and after XTSTree. We show an improvement in terms of formula complexity, improving the model accuracy compared to the original time series
dc.identifier.urihttps://repositorio.uel.br/handle/123456789/18196
dc.language.isoeng
dc.relation.departamentCCE - Departamento de Computação
dc.relation.institutionnameUniversidade Estadual de Londrina - UEL
dc.relation.ppgnamePrograma de Pós-Graduação em Ciência da Computação
dc.subjectMudança de Conceito
dc.subjectSéries Temporais
dc.subjectMeta-learning
dc.subjectSegmentação de Séries Temporais
dc.subjectRegressão Simbólica
dc.subjectCiência da computação
dc.subjectAlgoritmos computacionais
dc.subjectAlgoritmos
dc.subjectProgramação genética (Computação)
dc.subjectFramework (Programa de computador)
dc.subject.capesCiências Exatas e da Terra - Ciência da Computação
dc.subject.cnpqCiências Exatas e da Terra - Ciência da Computação
dc.subject.keywordsConcept Drift
dc.subject.keywordsTime Series
dc.subject.keywordsMeta-learning
dc.subject.keywordsTime Series Segmentation
dc.subject.keywordsSymbolic Regression
dc.subject.keywordsComputer science
dc.subject.keywordsComputational algorithms
dc.subject.keywordsAlgorithms
dc.subject.keywordsGenetic programming (Computing)
dc.subject.keywordsFramework (Computer program)
dc.titleExplainable Time Series Tree: an explainable top-down time series segmentation framework
dc.title.alternativeExplainable Time Series Tree: um framework de segmentação topdown de séries temporais explicável
dc.typeDissertação
dcterms.educationLevelMestrado Acadêmico
dcterms.provenanceCentro de Ciências Exatas

Arquivos

Pacote Original
Agora exibindo 1 - 2 de 2
Carregando...
Imagem de Miniatura
Nome:
CE_COM_Me_2024_Silva_Vitor_C.pdf
Tamanho:
11.43 MB
Formato:
Adobe Portable Document Format
Descrição:
Texto completo ID. 192567
Nenhuma Miniatura disponível
Nome:
CE_COM_Me_2024_Silva_Vitor_C_TERMO.pdf
Tamanho:
167.26 KB
Formato:
Adobe Portable Document Format
Descrição:
Termo de autorização
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
555 B
Formato:
Item-specific license agreed to upon submission
Descrição: