일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 부스트캠프 AI Tech
- Dilated convolution
- Item2Vec
- FastSpeech2
- NEG
- Recommender System
- Collaborative Filtering
- wavenet
- Skip-gram
- ANNOY
- Tacotron2
- word2vec
- Noise Contrastive Estimation
- TTS
- Neural Collaborative Filtering
- SGNS
- RecSys
- 백준
- CV
- Tacotron
- FastSpeech
- ALS
- Ai
- CF
- 논문리뷰
- matrix factorization
- 추천시스템
- Negative Sampling
- BOJ
- Implicit feedback
- Today
- Total
목록AI/논문 리뷰 (17)
devmoon
https://ieeexplore.ieee.org/document/5694074 Factorization Machines In this paper, we introduce Factorization Machines (FM) which are a new model class that combines the advantages of Support Vector Machines (SVM) with factorization models. Like SVMs, FMs are a general predictor working with any real valued feature vector. ieeexplore.ieee.org 이번에 살펴볼 논문은 sparse한 데이터를 사용해서도 평점 예측을 효과적으로 하고, 선형 시간..
https://arxiv.org/abs/2006.04558 FastSpeech 2: Fast and High-Quality End-to-End Text to Speech Non-autoregressive text to speech (TTS) models such as FastSpeech can synthesize speech significantly faster than previous autoregressive models with comparable quality. The training of FastSpeech model relies on an autoregressive teacher model for duratio arxiv.org 한국어 음성합성 프로젝트를 진행하기 위해서 살펴본 TTS 논문들 ..
https://arxiv.org/abs/1905.09263 FastSpeech: Fast, Robust and Controllable Text to Speech Neural network based end-to-end text to speech (TTS) has significantly improved the quality of synthesized speech. Prominent methods (e.g., Tacotron 2) usually first generate mel-spectrogram from text, and then synthesize speech from the mel-spectrogram us arxiv.org Abstract FastSpeech 이전 등장하는 TTS 모델들은 공통적으..
https://arxiv.org/abs/1809.08895 Neural Speech Synthesis with Transformer Network Although end-to-end neural text-to-speech (TTS) methods (such as Tacotron2) are proposed and achieve state-of-the-art performance, they still suffer from two problems: 1) low efficiency during training and inference; 2) hard to model long dependency using arxiv.org Abstract End-to-End TTS를 지원하는 Tacotron2는 TTS분야에서 뛰..
https://arxiv.org/abs/1712.05884 Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions This paper describes Tacotron 2, a neural network architecture for speech synthesis directly from text. The system is composed of a recurrent sequence-to-sequence feature prediction network that maps character embeddings to mel-scale spectrograms, followed arxiv.org Tacotron1에 이어 나온 Taco..
https://arxiv.org/abs/1609.03499 WaveNet: A Generative Model for Raw Audio This paper introduces WaveNet, a deep neural network for generating raw audio waveforms. The model is fully probabilistic and autoregressive, with the predictive distribution for each audio sample conditioned on all previous ones; nonetheless we show that arxiv.org 1. Introduction WaveNet 논문은 텍스트를 음성으로 바꾸어주는 TTS에서 적용가능한 모..
ABSTRACT 2017년도 당시 딥러닝은 음성인식, 컴퓨터 비전, 자연어 처리 분야에서 뛰어난 성능을 보여주며 인기를 끌고 있었다. 하지만 추천시스템 분야에 대해서는 딥러닝이 많이 적용되거나 연구가 활발하게 이루어지지 않았다. 몇 가지 연구들이 추천시스템에 딥러닝을 적용시켜보기는 하였지만, 직접적으로 모델의 핵심 부분이 딥러닝으로 구성된 것이 아니라, 일부분만 딥러닝 연산을 사용하고 있었다. 따라서 딥러닝이 적용된 협업필터링(Collaborative Filtering)이더라도 여전히 두 잠재 벡터의 내적 연산은 필요했다. 저자들은 이번에 내적 연산의 문제점에 대해 소개하며 딥러닝 구조를 사용하여 내적 연산을 대체하도록 만들고자 했고 여러가지 실험을 통해 딥러닝을 핵심 부분으로 모델링하는 Neural n..
ABSTRACT 당시 NLP분야에서 Neural embedding algorithm을 통해 단어를 잠재 벡터로 표현하는 방법에 대한 뛰어난 성과가 발표되었다. 그 방법 중 하나로 word2vec 이라고도 알려진 Skip-gram with Negative Sampling (SGNS)가 특히 좋은 성능을 보여주었다. 여기에 영감을 받아 저자들은 추천 시스템의 아이템 기반 협업 필터링(IBCF)에 word2vec을 적용시킨 item2vec을 발표한다. INTRODUCTION AND RELATED WORK 당시 추천 시스템의 핵심은 아이템 간 유사도를 구하는 것이었다. 저자는 많은 추천 시스템들이 유저와 아이템의 저차원 입베딩을 학습하는데 초점을 맞추고 있지만, 아이템 유사도 자체를 구하는 것이 중요하다고 한다..