분류 전체보기 (95) 썸네일형 리스트형 [Paper Review] BALM-TSF: Balanced Multimodal Alignment for LLM-Based Time Series Forecasting [Introduction]LLM은 왜 시계열 예측에서 잘 안 맞을까? 최근 대규모 언어 모델(LLM)이 다양한 분야에서 강력한 성능을 보이면서, 시계열 예측(Time Series Forecasting) 분야에서도 LLM을 활용하려는 시도가 활발해지고 있다. 특히 텍스트는 뉴스, 리포트, 설명적 맥락 등 풍부한 정보를 담고 있기 때문에, 단순한 숫자 시계열만으로는 포착하기 어려운 고수준 의미 정보를 보완해 줄 수 있다. 하지만 문제는 LLM은 텍스트에 최적화된 모델이며, 시계열 데이터는 연속적이고 정밀한 수치 패턴을 가진다. 이 둘을 그대로 결합하면 다음과 같은 문제가 발생한다.의미적 불균형(Semantic Imbalance): LLM은 숫자를 “연속 값”이 아닌 “토큰”으로 인식하여, 미세한 변화나 패.. 프로그래머스 - 문자열 나누기 문제 설명알고리즘 고민먼저, 처음 입력된 수와 다른 수의 개수를 저장하는 로직이 필요하겠다 라고 생각하고 이후에 예외 처리를 해주어서 쉽게 해결하였다.코드시간복잡도 프로그래머스 - 지폐 접기 문제 설명알고리즘 고민의사코드처럼 wallet의 큰값보다 큰 bill이 있으면 그거 나누고 작은게 있으면 또 작게 만들어서 어쨌든 wallet에 bill이 들어갈 수 있도록 구현하면 된다고 생각했고 wallet과 bill의 최대 최소값을 비교하여 해당 의사코드를 수행하도록 구현하였다. 코드시간복잡도 [Paper Review] TimeCMA: Towards LLM-Empowered Multivariate Time Series Forecasting viaCross-Modality Alignment [Introduction] Data Entanglement란?Data Entanglement란 데이터 얽힘이라는 의미로 본 논문에서는 두 개 이상의 모달리티에 대한 데이터가 서로 섞여있는 상태를 말한다. 시계열을 처리하는 방법들 중에 LLM을 활용하는 방법들이 제안되고 있는데 최근 제안된 연구들에서는 모두 데이터 얽힘 문제가 발생한다고 지적하고 있으며 본 논문의 방법론인 TimeCMA를 통해 이러한 데이터 얽힘 문제를 해소하였다라고 주장하고 있다. [Method]Model Structure 제안하는 TimeCMA 모델은 크게 네 가지 부분인 입력, 인코딩, Cross Modality Alignment, Time Series Forecasting으로 나눌 수 있다. Input입력 부분에서는 다변량 시계열에.. [Paper Review] Understanding Why Large Language Models Can Be Ineffectivein Time Series Analysis: The Impact of Modality Alignment [Background]본 논문은 아래 논문에 대한 확장 연구로 아래 연구가 Time Series Forecasting에 중점적으로 LLM을 활용한 시계열 예측 모델에 대한 LLM의 효용성에 대해서 다뤘다. 본 논문은 여기서 확장하여 Imputation, Classification, Forecasting, Anomaly Detection의 시계열 분석 분야에 대해 LLM의 필요성을 분석하였다.https://arxiv.org/abs/2406.16964 Are Language Models Actually Useful for Time Series Forecasting?Large language models (LLMs) are being applied to time series forecasting. But a.. [Paper Review] Large Language Models can Deliver Accurate and InterpretableTime Series Anomaly Detection [Summary]Introduction시계열 이상탐지에 LLM을 활용하고자 한 연구들이 최근 활발히 연구되고 있다. 하지만 LLM을 활용하는 시계열 이상탐지는 방대한 학습 데이터를 사용하고, 설명하지 않는 Black Box로써 추론을 수행한다. 또한 추론한 결과에 대한 설명이 부족하여 탐지한 이상에 대한 근거가 없는 점은 딥러닝 기반 시계열 이상탐지 방법들이 제안되어도 실제 산업에 적용하기 어려운 이유이다. 따라서 본 논문에서는 LLMAD 모델을 제안한다.Contributions정확한 TSAD를 수행하며 예측한 답에 대한 결과를 설명하는 LLM 기반 프레임워크인 LLMAD를 제안한다.Data Context, 도메인 지식, 인간의 전문성을 주입하여 성능과 해석력을 향상시켰다.세 개의 데이터셋으로 실험을 진.. [Paper Review] CATCH: Channel-Aware Multivariate Time Series Anomaly Detection via Frequency Patching [Background]푸리에 변환● 고속 푸리에 변환 (Fast Fourier Transform) 푸리에 변환은 이산 푸리에 변환(DFT)와 고속 푸리에 변환(FFT)가 있지만 현재는 FFT가 일반적으로 사용된다. 그 이유는 고속 푸리에 변환은 이산 푸리에 변환의 시간 복잡도를 줄인 알고리즘이기 때문이다. 이산 푸리에 변환은 O(N2)">O(N2)의 시간복잡도를 가지는 반면, 고속 푸리에 변환은 O(NlogN)">O(NlogN)의 시간복잡도를 가진다. 계산 효율을 비교한 그래프는 다음과 같다. 푸리에 변환에 대해 간단하게 설명하자면 시간에 따라 측정된 신호를 주파수 영역으로 변환하는 방법이다. 즉, 모든 신호는 여러 개의 사인파와 코사인파의 합으로 표현 가능하다는 것이다. 이는 신호 처리, 이미지 처리,.. [자격증] 제10회 빅데이터 분석기사 실기 합격 후기(feat. 100점) 2025년 마지막 대학 생활에서 나중에 필요할지 모를 자격증들을 따기로 마음 먹었고, 지금까지 ADsP, 정보처리기사 필기, 빅데이터 분석기사 필기, 실기 시험을 보았고, 다행이도 모두 합격했다. 오늘은 제 10회 빅데이터 분석기사 실기 시험에서 100점 맞은 기념(?)으로 시험 후기 및 난이도에 대해 얘기해보려고 한다. 1. 필기 시험 필기 시험 준비는 "2025 빅데이터분석기사 모든 것" 책을 통해 준비하였다. 다행히 중간고사 기간과 겹치지 않아서 여유롭게 한 달 기준을 잡고 준비하였고 무난하게 합격하였다. 모델링과 결과 해석 부분은 자신 있다고 생각했는데 막상 결과를 보니 시험에서 실수를 좀 했던 것 같다. 그래도 72.5점으로 합격하였다. https://product.kyobobook.co.k.. 이전 1 2 3 4 ··· 12 다음