본문 바로가기

분류 전체보기46

[9] Time Series Analysis [응용데이터분석] 수업 요약created: 2026-05-21last modified: 2026-05-27이번에는 시계열 데이터 (Time Series Data)를 분석하는 방법을 배운다. 시계열 데이터를 분석하는 방법은 매우 많지만, 여기서는 기본적인 방법들만 제한적으로 다룬다. 0. Time Series DataTime Series Data는 시간에 따라 변화하는 값들의 데이터로, 예를 들어 주식 가격이 있다.시간에 따라 오르내리며,x축이 표시하는 범위가 넓어지면, 작은 변화는 묻히고 큰 변화들만 강조된다.반대로 좁아지면, 짧은 기간에 대한 변화만 강조된다. 1. Components Of Time SeriesTime Series Data의 값들이 변화하는 원인(요소)들은 아래와 같다.- Trend :.. 2026. 5. 21.
[8] Text Analysis [응용데이터분석] 수업 요약created: 2026-05-21last modified: 2026-05-26이번에는 text(문장들)을 분석하는 방법을 배운다. 결론은 비정형적인 text data를 어떻게 model이 이해할 수 있게 정형화시키느냐이다. 요즘은 LLM이 워낙 잘 나와서 알아서 다 이해하긴 하지만, 이건 대충 그 전의 이야기이다. Text Analysis를 하면, 예를 들어 아래와 같은 task를 해 볼 수 있다.- 요약 : 내 상품에 어떤 댓글들이 달렸는지 분석할 수 있다.- 모니터링 : 소셜 미디어의 트렌드/반응/유행 등을 분석해 볼 수 ㅣㅇㅆ다.- 콘텐츠 추천- 스팸 메일/광고를 차단할 수 있다. 1. Text NormalizatinText는 비정형적인 데이터이다. 숫자로 나타내기 어렵.. 2026. 5. 21.
[13] SAC [강화학습] 수업 요약created: 2026-05-21last modified: 2026-05-21기존 Actor Critic에, Entropy의 개념과 +α를 추가한 알고리즘이다. 26년 현재 아래(↓)와 같이 가장 대표적인 Model Free RL방법 중 하나로 평가받는다. 분야알고리즘장점단점Model-freeOn-policyPPO어느 분야에서나 안정적으로 학습된다.학습이 쉽다.sample 효율성이 나빠서(On-Policy) 많이 돌려야 한다.Off-policySAC특히 Continuous한 환경에서 쓰며, Exploration이 잘 된다. (local optima에 덜 빠진다=global optima를 잘 찾는다.=최고의 성능을 얻을 수 있다.)discrete 환경에서는 잘 안어울림Off-poli.. 2026. 5. 21.
[paper] LiM3D (2023/03) 오역, 의역, 생략 및 제 맘대로 해석한 글임에 주의. 논문 정보 :https://arxiv.org/abs/2303.11203Less is More: Reducing Task and Model Complexity for 3D Point Cloud Semantic Segmentation Abstract최근 몇 년간 3D LiDAR Point Cloud data의 가용성은 크게 증가했지만, Annotation은 여전히 시간이 많이 들기에, semi-supervised learning을 적용하기도 한다.기존의 방법들에서는 Ground Truth를 줄이기 위해 uniform sampling을 사용하지만, 성능을 하락시키기도 한다.이런 문제를 해결하기 위해, 우리는 더 작은 아키텍처를 사용하는 새로운 파이프라인을.. 2026. 5. 20.
[paper] Guided Point Contrastive Learning (2021/10) 오역, 의역, 생략 및 제 맘대로 해석한 글임에 주의. 논문 정보 :https://openaccess.thecvf.com/content/ICCV2021/papers/Jiang_Guided_Point_Contrastive_Learning_for_Semi-Supervised_Point_Cloud_Semantic_Segmentation_ICCV_2021_paper.pdf Guided Point Contrastive Learning for Semi-supervised Point Cloud Sementic Segmentatoin Abstract 3D sementic segmentation은 학습에 대규모의 annotated data를 필요로 하는 DNN의 발전과 아주 밀접하다. 3D Point에 labeling하.. 2026. 5. 16.
[11] TRPO, PPO, GRPO [강화학습] 수업 요약created: 2026-05-07last modified: 2026-05-07 Policy-based 방법을 포함하는 REINFORCE부터, Actor Critic, TD Actor Critic까를 지나고 나서, 성능이 정체되기 시작했다.policy network를 update하는 방식을 다시 살펴보자. (그림)$\theta \leftarrow \theta + \alpha \nabla_\theta J(\theta)$ 이들은 학습이 별로 효율적이지 못했다. 이들은 on-policy, 즉 현재의 policy와 target의 policy가 $\pi_{now}$로 동일해야 했기 때문이다. TRPO와 PPO도 대표적인 on-policy algorithm이긴 하다. 왜 과거의 policy로.. 2026. 5. 7.