Continuous Birdsong Recognition Using Gaussian Mixture Modeling of Image Shape Features

Source

Evernote/Papers/Continuous Birdsong Recognition Using Gaussian Mixture Modeling of Image Shape Features.md

Summary

이 논문은 새 노래 종 식별을 위해 전통적인 음향 특징 대신 스펙트로그램을 회색조 이미지로 간주하여 이미지 형태 특징을 추출하는 새로운 방법을 제안합니다. MPEG-7 ART(Angular Radial Transform) 디스크립터를 사용하여 스펙트로그램의 주파수 및 시간적 변동을 포착하며, 이를 위해 섹터 확장 알고리즘을 도입했습니다. 가우시안 혼합 모델(GMM)을 활용한 28 종 분류 실험에서 제안된 ART 디스크립터는 기존 LPCC, MFCC, TDMFCC 등보다 높은 정확도(3 초 구간 86.30%, 5 초 구간 94.62%)를 달성했습니다.

Key Points

새 노래 인식에 음향 모델 대신 스펙트로그램의 이미지 형태 특징 활용
MPEG-7 ART 디스크립터를 통한 주파수/시간 변동의 효율적 기술
스펙트로그램을 ART 기저 함수에 맞게 변환하는 섹터 확장 알고리즘 제안
GMM 기반 28 종 분류에서 기존 특징(LPCC, MFCC 등) 대비 우수성 입증

AncomWiki

탐색기

Continuous Birdsong Recognition Using Gaussian Mixture Modeling of Image Shape Features

Continuous Birdsong Recognition Using Gaussian Mixture Modeling of Image Shape Features

Source

Summary

Key Points

그래프 뷰

목차

백링크

AncomWiki

탐색기

Continuous Birdsong Recognition Using Gaussian Mixture Modeling of Image Shape Features

Continuous Birdsong Recognition Using Gaussian Mixture Modeling of Image Shape Features

Source

Summary

Key Points

Related

그래프 뷰

목차

백링크