Domain Knowledge/Deep Learning4 [paper] mamba 오역, 의역, 생략 및 제 맘대로 해석한 글임에 주의.논문 정보 :https://arxiv.org/pdf/2312.00752 Mamba: Linear Time Squence Modeling with Selective State Spaces Abstract 1. Intoduction현대 Machien Learning에서는, 대규모 데이터(광범위한 도메인)로 pretraining된 후, downstream task에(개별 도메인에 맞게) 적용하는 Foundation Model이 효과적인 패러다임으로 자리잡았다. 이러한 model의 핵심은 언어, 이미지 등의 sequential data 입력을 처리하는 Sequence Model이다.현재 대부분의 Foundation Model은 Transformer 아키텍쳐.. 2026. 5. 5. [survey paper] GNN (2018/12) 오역, 의역, 생략 및 제 맘대로 해석한 글임에 주의하세요.부분적으로 AI가 쓴 글임에 주의하세요.논문 정보:https://arxiv.org/pdf/1812.08434그래프 신경망(GNN)의 개념부터 다양한 모델 분류, 그리고 실제 응용 사례까지 체계적으로 정리한 논문이다. [목차]1. Introduction (서론)2. General design pipeline of GNNs (GNN의 일반적인 설계 파이프라인)2.1. Find graph structure (그래프 구조 찾기)2.2. Specify graph type and scale (그래프 유형 및 규모 명시)2.3. Design loss function (손실 함수 설계)2.4. Build model using computational modul.. 2026. 4. 25. CNN [실전기계학습] 수업 요약created: 2026-04-10last modified: 2026-04-10- Machine Learning에 대한 배경지식이 있다고 가정한다.- Deep Learning에 대해서는 이미 배운적이 있으므로, cheating sheet 느낌으로 간단하게 정리한다. 1. Convolution Neural Network (CNN)Convolution은 신호처리 이론에서 '주파수의 유사도' 를 검출하는데 쓰는 대표적인 기법이다.주파수 형태로 된 데이터에는 이미지(Image), 동영상(Video), 음성(Audio), 전자기파(Radiowave) 등 다양한 종류가 있을 수 있다. CNN을 설명할 때는 이 중에서 가장 흔하고 직관적인 Image를 통해 설명한다Image는 아래의 특징들.. 2026. 4. 10. Perceptron부터 DNN까지 [동아리] KHUDA 9기 : 학기 스터디created: 2026-03-10last modified: 2026-03-17- Machine Learning에 대한 배경지식이 있다고 가정한다.- Deep Learning에 대해서는 이미 배운적이 있으므로, cheating sheet 느낌으로 간단하게 정리한다. 1. PerceptronPerceptron은 실제 뇌의 뉴런의 동작을 모방한 최초의 인공 신경망이다. 1957년에 나온 개념이다.위의 그림은 뉴런의 구조이다.자세한 구조는 알 필요 없고, 핵심 기능만 대강 알면 된다.- 입력(dentrites): 다른 뉴런들로부터 신호를 받는다.- (cell body / axon): 받은 신호를 모은다. 모은 신호를 뒤로 전달할 지 말지 결정한다.- 출력(axon .. 2026. 3. 10. 이전 1 다음