전체 글265 [2025-1] 최민서 - Score-based Generative Modeling through Stochastic Differential Equations [논문링크] https://arxiv.org/abs/2011.13456 Score-Based Generative Modeling through Stochastic Differential EquationsCreating noise from data is easy; creating data from noise is generative modeling. We present a stochastic differential equation (SDE) that smoothly transforms a complex data distribution to a known prior distribution by slowly injecting noise, and a correarxiv.orgSMLD와 DDPM 논문을 읽지 않았.. 2025. 4. 4. [2025-1] 박지원 - InternVL Abstract (초록)InternVL은 60억 개의 파라미터를 가진 비전 인코더(이미지를 다루는 부분)와 80억 개의 파라미터를 가진 언어 미들웨어(언어를 다루는 부분)로 구성된 대규모 vision-language foundation 모델이다.이 모델은 웹에서 수집한 방대한 양의 이미지와 텍스트 데이터를 점진적으로 정렬하며 학습함으로써, 다양한 그림-글 관련 작업에서 성능과 효율을 극대화한 바 있으며 챗봇처럼 사람과 대화하는 기능에서도 뛰어난 성능을 보인다. 또 여러 그림-글 처리 작업에 유연하게 활용될 수 있는 구조를 가지고 있고 특히 다국어 언어 모델(LLaMA)을 언어 미들웨어 초기값으로 활용함으로써, 그림을 보는 능력과 말을 이해하는 능력 사이의 균형을 맞추고 표현 간 일관성을 확보했다는 장점이.. 2025. 4. 3. [2025-1] 정성윤 - Visualizing the Loss Landscape of Neural Nets Introductionneural network 훈련은 매우 복잡하고 non-convex한 함수의 최소를 찾는 과정이다.훈련 parameter를 잘 설정하거나, optimizer를 잘 사용해 global minimum을 쉽게 구할 수 도 있지만 이론보다는 실제 코드 실행으로 결과를 얻어내는 딥러닝의 특성상 이는 매우 불확실한 알고리즘. → 우리는 더 확실하게 loss를 구할 수 있는 이론적 배경이 필요하다.본 논문에서는 더 쉽게 loss를 구할 수 있는 방법으로 주어진 함수의 ‘시각화’가 선행되어야 한다고 주장. → 주어진 loss에서 서로 다른 network의 선택이 최소화하는 과정, loss landscape에 어떠한 영향을 주는지 평가하고자 함.Contributions일반적인 시각화 방법으로는 복잡.. 2025. 3. 30. [2025-1] 김지원 - Forecasting price movements using technical indicators: Investigatingthe impact of varying input window length 논문 제목: Forecasting price movements using technical indicators: Investigatingthe impact of varying input window length논문 인용수: 237회논문 정보 : Neurocomputing 저널에 2017년 개제된 논문논문 링크: https://www.sciencedirect.com/science/article/pii/S0925231217311074 1. 소개머신러닝/딥러닝을 활용한 Financial forecasting은 입력 feature로 Techniqal Indicator(TI)들을 사용한다.여기서 말하는 TI란 주식 시장에서 차트 분석에 많이 사용되는 지표들인데 예를 들어 RSI, MA, EMA, ATR, ADM.. 2025. 3. 30. 이전 1 2 3 4 ··· 67 다음