ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 챗GPT 개발 오픈AI, 텍스트로 동영상 생성 AI '소라' 공개
    주식이야기 2024. 2. 16. 09:40
    728x90
    300x250
    SMALL

    챗GPT 개발사 오픈AI가 15일(현지시간) 텍스트를 동영상으로 만들어주는 인공지능(AI) 시스템을 공개했다.


    오픈AI는 이날 블로그를 통해 이 AI 시스템의 이름을 '소라'(Sora)라고 소개하며
    "여러 캐릭터와 특정 유형의 동작, 복잡한 장면 등 최대 1분 길이의 동영상을 빠르게 제작할 수 있다"고 밝혔다.

    또 소라는 "언어에 대한 깊은 이해를 갖고 있어 프롬프트를 정확하게 해석하고 생생한 감정을 표현하는 매력적인 캐릭터를 생성할 수 있다"고 설명했다.

    소라는 텍스트만으로 동영상을 생성할 수 있고
    기존의 이미지를 동영상으로 생성할 수도 있다.
    기존 동영상을 확장하거나 누락된 프레임을 채울 수도 있다.
    오픈 AI는 "'소라'는 등장인물 여러 명, 특정한 움직임, 피사체와 배경의 구체성 등을 살려 복잡한 장면을 생성할 수 있다"고 소개했다. 또 "한 영상 안에서 등장인물의 시각적 디테일을 정확하게 유지할 수 있다"고 설명했다.

    이어 블로그에 공개한 영상 '도쿄 워크(Tokyo Walk)'의 명령어를 공개했다. '스타일리시한 여성이 따뜻하게 빛나는 네온사인과 애니메이션 도시 간판으로 가득찬 도쿄거리를 걷고 있다. 그는 검은색 가죽 재킷, 빨간색 긴 드레스, 검은색 부츠를 신고 있고 검은색 지갑을 들고 있다. 그는 선글라스를 끼고 빨간 립스틱을 바르고 있다. 그는 자신감 있고 자연스럽게 걷는다.' 등이다.

    활용 방법은 오픈 AI가 내놓은 이미지 생성 AI '달리(DALL-E)'와 비슷하다. 원하는 장면을 묘사한 명령어(프롬프트)를 입력하면 고화질 영상 클립을 만들어준다. 기존 영상의 '확장판'을 만들거나 누락된 프레임을 채워넣는 기능도 있다.


    다만, 이 AI는 처음에는 '제한된 수의 창작자'만 사용할 수 있도록 허용된다고 오픈AI의 최고경영자(CEO) 샘 올트먼이 엑스(X·옛 트위터)에서 밝혔다.
    아직 한계도 있다고 밝혔다. 복잡한 장면을 묘사할 때 등장인물의 움직임이 다소 어색하게 느껴질 수 있다. 장면과 장면 사이의 인과관계를 이해하는 데 한계가 있어 영상 흐름이 어설플 수 있다. 등장인물이 과자를 한 입 베어 물었지만 다음 장면에 나오는 과자엔 베어 문 자국이 없는 식이다.

    오픈AI는 또 소라를 회사의 제품에 통합하기 전에 전문가팀에 맡겨 안전성 여부를 평가할 계획이다.

    앞서 페이스북 모회사 메타와 구글, 스타트업 런어웨이 AI 등도 '텍스트 투 비디오'(Text to Video) 모델을 개발한 바 있다.

    한편 오픈AI는 웹 검색 서비스를 개발하고 있다고 정보통신(IT) 전문매체 디인포메이션이 보도했다.

    다만, 이 서비스가 독립적인지, 챗GPT의 일부 서비스로 제공될지에 대해서는 알려지지 않았다.

    오픈AI의 검색 서비스 개발 소식 영향으로 이날 뉴욕 증시에서 구글 모회사 알파벳 주가는 전날보다 2.17% 하락 마감했다.

    그러나 오픈AI가 검색 서비스를 개발해도 구글에 큰 영향을 주지는 못할 것이라는 전망이 나온다.

    투자은행 베어드의 콜린 세바스찬 분석가는 "오픈AI의 검색 제품이 구글에 미칠 영향은 크지 않다"며 "검색은 제대로 하기가 매우 어려운 분야로, 사용자의 행동을 바꾸려면 구글보다 더 뛰어나야 한다"고 말했다.

    728x90
    반응형
    LIST
Designed by Tistory.