Generative Model Generative Model 2025. 3. 17. CIDEr Score 본 글은 [CIDEr: Consensus-based Image Description Evaluation]을 바탕으로 작성하였음을 명시합니다. ▶️ Consensus-based Image Description Evaluation(CIDEr) ScoreCIDEr는 Image captioning에서 생성된 문장이 정답 문장과 얼마나 유사한 지를 평가하는 지표입니다.Image captioning은 입력 데이터 Image $X_0$에 대하여 인간의 개입 없이 Image $X_0$을 묘사하는 sentence 혹은 text를 출력하는 모델을 의미합니다. CIDEr을 이해하기 전에 "n-gram"와 "TF-IDF(Term Frequency-Inverse Document Frequency)" 개념에 대한 이해가 필요합.. Generative Model 2025. 3. 16. [Image Captioning] ExpansionNet-v2 본 글은 [논문] ExpansionNet-v2를 바탕으로 작성하였음을 명시합니다. ▶️ Image CaptioningImage captioning은 입력 데이터 Image $X_0$에 대하여 인간의 개입 없이 Image $X_0$을 묘사하는 sentence 혹은 text를 출력하는 모델을 의미합니다. 또한, Image를 이해하는 기술 ( → visual understanding )과 text를 이해하는 기술 ( → language understanding )이 필요한 multimodal task입니다. 이전 연구들에는 Image Captioning 모델로 Encoder-Decoder 기반 모델을 사용했습니다.Encoder : Image $X_0$로부터 visual feature를 추출합니다.Deco.. Generative Model/Stable Diffusion 2024. 9. 1. Diffusion Model OverviewDiffusion model은 대표적인 이미지 생성 모델(Image Generative Model)입니다. "Diffusion"이 "확산" 현상을 의미하듯이입력 데이터에 노이즈(noise)를 매 스텝(step, $t$)마다 추가한 후 다시 제거하는 과정을 학습하면서 데이터를 생성하는 deep generative model입니다. Diffusion model은 크게 2가지 단계로 구성됩니다.1️⃣ Forward process(diffusion process)입력 데이터($x_0$)로부터 노이즈(noise; $\epsilon \sim N(\mu, \sigma^2)$)를 조금씩 더해가면서 입력 데이터($x_0$)는 완전한 noise 이미지($x_T$)가 생성됩니다.⭐ 정규분포의 모수인 $\mu,.. 이전 1 다음