본문 바로가기
  • 책상 밖 세상을 경험할 수 있는 Playground를 제공하고, 수동적 학습에서 창조의 삶으로의 전환을 위한 새로운 라이프 스타일을 제시합니다.

전체 글75

[2023-2] 김동한 - Improving Library User Experience with A/B Testing: Principles and Process A/B 테스트를 실제로 진행했던 사례연구에 대한 논문 https://quod.lib.umich.edu/w/weave/12535642.0001.101?view=text;rgn=main Abstract 사용자 경험 연구 방법론에 해당하는 A/B 테스트를 통해 사용자 상호작용 측정 및 평가 A/B 테스트 가장 성과가 좋은 변형을 결정하기 위해 제품이나 서비스의 다양한 변형을 사용자에게 무작위로 제공하는 통제된 실험과정을 수반 A/B테스트 진행과정에서 수집되고 분석된 데이터를 통해 도서관은 사용자 중심의 웹사이트 변경을 시작, 사용자 경험을 개선 : 이 논문에서는 도서관 사이트에서의 A/B 테스트 프로세스를 설명함. Introduction - UX(사용자 경험 : User Experience) 연구자는 도서관 .. 2024. 2. 20.
[2023-2] 김경훈 - Mask R-CNN 원본 논문 링크 : https://arxiv.org/abs/1703.06870 Mask R-CNN We present a conceptually simple, flexible, and general framework for object instance segmentation. Our approach efficiently detects objects in an image while simultaneously generating a high-quality segmentation mask for each instance. The method, called arxiv.org Introduction 이번 포스팅에서는 Mask R-CNN에 대해 소개하려고 합니다. Mask R-CNN은 주로 인스턴스 분할 작업에 사.. 2024. 2. 20.
[2023-2] 염제원 - Topology of Learning in Artificial Neural Networks https://arxiv.org/abs/1902.08160 Topology of Learning in Artificial Neural Networks Understanding how neural networks learn remains one of the central challenges in machine learning research. From random at the start of training, the weights of a neural network evolve in such a way as to be able to perform a variety of tasks, like classif arxiv.org Abstract Neural Network의 학습과정을 Topological Data.. 2024. 2. 19.
[2023-2] 양소정 - KOSMOS-G: Generating Images in Context with Multimodal Large Language Models Figure 1 KOSMOS-G는 입력된 이미지를 “외국어”로 간주하며 여러 이미지를 포함하는 일반화된 비전-언어 입력을 이해하고 이미지를 생성하는 능력을 가지고 있음. Abstract 최근 텍스트에서 이미지로의 변환 (T2I, text-to-image) 및 비전-언어에서 이미지로의 생성 (VL2I, vision-language-to-image) 분야에서 상당한 발전이 있었음. 특히 여러 이미지를 포함하는 일반화된 비전-언어 입력에서의 생성은 미개척된 분야임. 본 논문에서는 MLLMs(Multimodal Large Language Models)의 고급 지각 능력을 활용하여 이러한 도전 과제에 대처하는 KOSMOS-G 모델을 제안함. KOSMOS-G는 제로샷 다중 개체 주체 구동 생성(zero-shot m.. 2024. 2. 19.