본문 바로가기
  • 책상 밖 세상을 경험할 수 있는 Playground를 제공하고, 수동적 학습에서 창조의 삶으로의 전환을 위한 새로운 라이프 스타일을 제시합니다.

Natural Language Processing73

[2025-2] 김지원 - From Transcripts to Insights:Uncovering Corporate Risks UsingGenerative AI 논문 정보: Kim, A., Muhn, M., & Nikolaev, V. (2023). From transcripts to insights: Uncovering corporate risks using generative ai. arXiv preprint arXiv:2310.17721.논문 링크 : https://arxiv.org/pdf/2310.17721 전세계적 정치적 불안정, 기후 불확실, 그리고 갑작스러운 기술 변화의 시대에 기업들은 전통적 금융 평가들이 의미가 없어진 다양한 리스크들을 직면하고 있다.이 연구는 생성형 AI 기술과 리스크 평가 방법론 사이의 갭을 메우기 위해 진행되었다.즉 LLM의 이러한 기업 리스크들의 치명적인 측면들을 감지하고 분석하는 잠재성을 평가하고자 한다. 최근 LLM 기.. 2025. 7. 13.
[2025-1] 정유림 - Attention Is All You Need Fig. 1 Transformer의 Encoder-Decoder 구조를 도식화한 것왼쪽은 Encoder, 오른쪽은 Decoderself-attention과 feed-forward 사이사이에 반복적으로 Residual Connection과 Layer Normalization이 들어감. Transformer 블록은 (Self-Attention → Add & Norm → Feed-Forward → Add & Norm) 순서로 구성됨Encoder (왼쪽)Input Embedding:입력 문장(예: 영어)을 각 단어별로 벡터로 변환(임베딩).Positional Encoding:단어의 위치 정보를 반영하기 위해 임베딩에 위치 인코딩을 더함.N개의 인코더 블록 반복: 각 블록(레이어)은 아래와 같은 두 부분으로 구성.. 2025. 5. 29.
[2025-1] 정유림 - MTEB: Massive Text Embedding Benchmark 1. 논문 개요논문 제목: MTEB: Massive Text Embedding Benchmark게재 연도: 2022 (arXiv:2210.07316)인용 횟수: 2025.04.06 기준 739회 인용.주요 성과:텍스트 임베딩 모델의 평가 한계를 극복하기 위해 8개 Task(Clustering, Classification, Retrieval 등)를 포괄하는 벤치마크 제시총 58개 데이터셋과 112개 언어를 포함하여 단일 평가 프레임워크 내에서 다양한 실제 사용 사례 반영모델 성능뿐만 아니라, latency(지연 시간) 및 임베딩 크기와의 trade-off 분석을 통한 효율성 평가 제공2. 연구 배경 및 필요성Text Embedding의 정의 및 활용:텍스트 데이터를 수치 벡터로 변환하여 NLP 작업(Clu.. 2025. 4. 6.
[2025-1] 김지원 - Forecasting price movements using technical indicators: Investigatingthe impact of varying input window length 논문 제목:  Forecasting price movements using technical indicators: Investigatingthe impact of varying input window length논문 인용수: 237회논문 정보 : Neurocomputing 저널에 2017년 개제된 논문논문 링크: https://www.sciencedirect.com/science/article/pii/S0925231217311074 1. 소개머신러닝/딥러닝을 활용한 Financial forecasting은 입력 feature로 Techniqal Indicator(TI)들을 사용한다.여기서 말하는 TI란 주식 시장에서 차트 분석에 많이 사용되는 지표들인데 예를 들어 RSI, MA, EMA, ATR, ADM.. 2025. 3. 30.