본문 바로가기

책상 밖 세상을 경험할 수 있는 Playground를 제공하고, 수동적 학습에서 창조의 삶으로의 전환을 위한 새로운 라이프 스타일을 제시합니다.

Audio AI1

[2026-1] 김지원 - WAVENET: A GENERATIVE MODEL FOR RAW AUDIO 논문 제목: WAVENET: A GENERATIVE MODEL FOR RAW AUDIO논문 링크: https://arxiv.org/pdf/1609.03499논문 인용수: 7000회+(26.01.28 기준)논문 정보: WaveNet은 2016년 Google DeepMind에서 발표한 획기적인 음성 생성 모델임. 기존의 음성 합성이 "음성의 특징을 추출하고 재조합"하는 방식이었다면, WaveNet은 오디오 파형 자체를 샘플 단위로 직접 생성함.1. 배경 지식: 오디오 신호와 음성 합성의 이해1.1 디지털 오디오의 기초소리는 공기의 진동으로, 본래 연속적인 아날로그 신호임. 이를 컴퓨터에서 처리하려면 두 가지 과정이 필요함.샘플링 (Sampling)연속 신호를 일정 간격으로 측정하여 이산적인 값들로 변환함.샘.. 2026. 1. 28.

이전 1 다음

티스토리툴바