본문 바로가기
  • 책상 밖 세상을 경험할 수 있는 Playground를 제공하고, 수동적 학습에서 창조의 삶으로의 전환을 위한 새로운 라이프 스타일을 제시합니다.

Miscellaneous63

[2025-2] 박제우 - FLAT REWARD IN POLICY PARAMETER SPACE IMPLIES ROBUST REINFORCEMENT LEARNING https://openreview.net/forum?id=4OaO3GjP7k Flat Reward in Policy Parameter Space Implies Robust Reinforcement...Investigating flat minima on loss surfaces in parameter space is well-documented in the supervised learning context, highlighting its advantages for model generalization. However, limited attention...openreview.net 강화학습은 지도학습, 비지도학습과 함께 대표적인 인공지능 모델의 학습 방법 중 하나이다. Data Point와 Label로 학.. 2025. 7. 18.
[2025-2] 박지원 - GPTQ 논문) https://arxiv.org/abs/2210.17323 GPTQ: Accurate Post-Training Quantization for Generative Pre-trained TransformersGenerative Pre-trained Transformer models, known as GPT or OPT, set themselves apart through breakthrough performance across complex language modelling tasks, but also by their extremely high computational and storage costs. Specifically, due to their massarxiv.org 1. GPTQ란 GPTQ.. 2025. 7. 1.
[2025-1] 유경석 - nnDetection: A Self-configuring Method for Medical Object Detection https://arxiv.org/abs/2106.00817 nnDetection: A Self-configuring Method for Medical Object DetectionSimultaneous localisation and categorization of objects in medical images, also referred to as medical object detection, is of high clinical relevance because diagnostic decisions often depend on rating of objects rather than e.g. pixels. For this task, tharxiv.orghttps://github.com/MIC-DKFZ/nnDet.. 2025. 5. 24.
[2025-1] 이루가 - Machine learning based recommender system for e-commerce 논문 링크: https://www.researchgate.net/publication/373328673_Machine_learning_based_recommender_system_for_e-commerce 0. Abstract전자상거래의 핵심 성공 요소 중 하나는 맞춤형 상품 추천추천 시스템은 사용자 경험을 향상시키고 구매율을 높임본 연구에서는 FP-Growth 기반의 연관 규칙 알고리즘을 사용추천된 상품의 평균 구매 확률이 높아 실제 적용 가능성 있음 1. Introduction오늘날 디지털 기술의 발전과 인터넷 접근의 용이성 덕분에 우리는 점점 더 많은 정보에 노출 → 사용자에게 다양한 콘텐츠를 제공하지만, 동시에 정보 과잉과 다수의 정보 출처로 인해 혼란 초래이러한 문제의 해결을 위해서 사용자에게 .. 2025. 5. 10.