중국 연구진, Open AI의 Sora 텍스트-비디오 기능을 복제하는 것을 목표

중국 연구진, Open AI의 Sora 텍스트-비디오 기능을 복제하는 것을 목표

퀘이사존

중국 기업들이 텍스트-투-비디오 경쟁에 뛰어들었습니다.

북경대학교의 연구원들과 선전의 AI 회사인 Rabbitpre가 협력하여 Open-Sora라는 프로젝트를 시작했습니다. 이들의 목표는 오픈소스 커뮤니티의 도움을 받아 보다 사용하기 쉽고 확장성이 뛰어난 OpenAI의 텍스트-비디오 모델인 Sora 버전을 만드는 것이라고 사우스차이나모닝포스트는 보도했습니다. OpenAI의 Sora는 출시 이후 AI 업계에서 많은 화제를 불러일으켰으며, 이 프로젝트는 AI 경쟁에서 중국의 가장 최근 움직임입니다. 가장 큰 문제는 이것이 성공할 수 있을지 여부입니다.

프로젝트의 깃허브 페이지에 따르면, 오픈소라 프로젝트는 세 부분으로 구성된 프레임워크를 개발하고 재구성된 비디오 데모 4편을 발표하는 등 상당한 진전을 이루었습니다. 이 동영상은 해상도와 종횡비가 다양하며 길이는 3초에서 24초까지입니다.

이 프로젝트의 향후 목표는 더 높은 해상도의 동영상을 제작할 수 있도록 기술을 개선하고, 추가 데이터와 더 많은 그래픽 처리 장치로 훈련을 강화하여 서비스에 더 많은 컴퓨팅 파워를 제공하는 것입니다. 이러한 단계는 모델의 성능을 개선하고 더 상세하고 긴 동영상을 생성할 수 있도록 기능을 확장하는 데 매우 중요합니다.

OpenAI의 소라 도입은 중국 비즈니스 및 기술 분야에서 다양한 반응을 불러일으켰습니다. 일부 기업들은 텍스트-비디오 AI 모델을 활용하고 싶어합니다. 다른 기업들은 이 분야에서 중국의 경쟁력에 대해 더 우려하고 있는데, 이는 주로 미국의 수출 규정 강화로 인해 엔비디아 같은 기업이 중국에 기반을 둔 기업에 고성능 GPU를 판매할 수 없게 되어 중국의 AI 기술 개발이 크게 둔화되고 있기 때문입니다.

텐센트 AI와 바이트댄스 같은 중국의 대형 기술 기업들도 텍스트-비디오 영역에 뛰어들었습니다. 텐센트 AI는 2초 동영상으로 제한되긴 했지만 텍스트로 동영상을 생성할 수 있는 오픈소스 동영상 생성 및 편집 툴박스인 비디오 크래프터2를 출시했습니다. ByteDance의 MagicVideo-V2는 다양한 모듈을 결합하여 엔드투엔드 비디오 생성 파이프라인을 생성합니다.

오픈소라 이니셔티브는 북경대학교 선전 대학원과 Rabbitpre가 협력하여 ‘Rabbitpre AIGC 공동 연구소’를 설립한 것입니다. 2023년 6월에 설립된 이 공동 연구소는 AI 제작 콘텐츠를 연구하는 데 전념하고 있습니다. 프로젝트 팀은 북경대학교의 위안 리 조교수와 티안 용홍 교수, 래빗프레의 설립자이자 CEO인 동 샤오링, 최고기술책임자 저우 싱 등 13명으로 구성됩니다.




Scroll to Top