인하대 김성호 석사과정생, 음성 신호 기반 실감 동영상 생성기술 발표

(왼쪽부터) 인하대 컴퓨터 비전·영상처리 연구실 소속 김성호 석사과정생과 지도교수인 송병철 전기컴퓨터공학과 교수. 인하대 제공
(왼쪽부터) 인하대 컴퓨터 비전·영상처리 연구실 소속 김성호 석사과정생과 지도교수인 송병철 전기컴퓨터공학과 교수. 인하대 제공

 

인하대학교 송병철 전기컴퓨터공학과 교수가 이끄는 컴퓨터 비전·영상처리 연구실 소속 김성호 석사과정생이 음성 신호 기반 실감 동영상 생성 기술을 발표한다.

 

2일 인하대에 따르면김성호 학생은 참조 신원 영상에 의한 감정 편향 문제와 프레임별 감정 세기의 포화 문제를 완화할 수 있는 방법을 새롭게 제시했다.

 

이는 신원 정보 분리 기술과 연속적인 감정 인식 기술을 생성 연구에 접목시켰다는 점에서 기대를 모은다. 또 음성 신호만을 이용해 알고리즘을 개발했다는 점에서 기존 연구와 차별성을 보인다.

 

김성호 학생은 이 같은 내용을 담은 ‘필요한 건 목소리뿐: 감정적 얼굴 표현을 위한 오디오 관점의 감정적 대화 얼굴 생성’ (All You Need is Your Voice: Emotional Face Representation with Audio Perspective for Emotional Talking Face Generation) 논문의 제1저자로 이름을 올렸다.

 

그는 오는 9월29일부터 10월4일까지 열리는 ‘유럽 컴퓨터 비전 학술대회(European Conference on Computer Vision·ECCV)’에서 논문을 발표할 예정이다.

 

ECCV는 국제 컴퓨터 비전·패턴 인식 학술대회(CVPR), 국제 컴퓨터 비전학회 학술대회(ICCV)와 함께 세계 3대 컴퓨터비전 학술대회로 손꼽힌다.

 

송병철 인하대 전기컴퓨터공학과 교수는 “최근 큰 주목을 받는 생성형 인공지능 분야에서 의미 있는 성과를 내 만족스럽다”며 “이번 연구 성과는 음성 신호를 이용한 감정 동영상 생성 기술 분야 발전에 중요한 역할을 할 것”이라고 말했다.

© 경기일보(www.kyeonggi.com), 무단전재 및 수집, 재배포금지
댓글 댓글 운영규정