본문 바로가기
Issue&Topic/정보 스크랩

멀티모달' AI 서비스가 최근 속속 출시

by 뉴질랜드고구마 2023. 12. 25.

이미지, 음성 등 여러 종류의 데이터를 동시에 처리할 수 있는 '멀티모달' AI 서비스가 최근 속속 출시되고 있다.

지난달(11/2023) 스테이블 디퓨전 개발사인 스테이블 AI(Stable AI)는 기존 텍스트·이미지 모델의 확장판인 최신 AI 모델 '스테이블 비디오 디퓨전(Stable Video Diffusion)'를 선보였다.

메타도 텍스트와 이미지 입력을 기반으로 비디오를 제작하는 '에뮤 비디오(Emu Video)'를 공개했다.

틱톡 개발사 바이트댄스도 텍스트와 사진으로 비디오를 생성할 수 있는 '픽셀댄스(PixelDance)'를 내놓았다.

런웨이는 지난 3월 텍스트, 이미지, 비디오를 입력하면 새로운 비디오를 생성하는 '젠-2(Gen-2)'를 출시.

어도비(Adobe)도 최근 텍스트·비디오 AI 플랫폼 리프레이즈(Rephrase.ai)를 인수했다고 발표.

한국에서도 딥브레인AI이 영상 메시지를 전달할 수 있는 AI 휴먼 서비스를 제공하고, 플루닛 역시 AI 기반 영상 생성·방송 플랫폼 '플루닛 스튜디오'로 가상인간 영상을 제작할 수 있도록 하는 서비스들이 내놓고 있다.