텍스트 이미지 영상 생성 AI 추천 모델

텍스트, 이미지, 비디오 생성에서 인기 AI 모델은?

Quora의 데이터 분석 플랫폼 'Poe'에서 텍스트, 이미지, 비디오 생성에 사용된 주요 AI 모델들에 대한 유저 선호도를 조사한 결과가 발표됐다. 수백만 건의 상호작용을 분석해 도출된 주요 트렌드를 살펴본다.


텍스트 생성 모델: 두 거대 기업의 경쟁

Anthropic과 OpenAI의 박빙 경쟁

Poe 사용자들 사이에서 Anthropic의 텍스트 생성 모델이 OpenAI에 필적할 만큼 인기를 얻고 있다. 특히 최근 공개된 'Claude 3.5 Sonnet' 덕분에 두 회사의 이용 비율은 거의 동등한 수준에 도달했다.

새로운 모델에 빠른 적응

사용자들은 선호하는 브랜드가 있더라도 새로운 모델이 출시되면 이를 빠르게 채택하는 경향이 있다. OpenAI의 GPT-4에서 GPT-4o로, Claude 3에서 Claude 3.5로의 전환이 그 사례다.

신흥 업체의 등장

DeepSeek의 R1과 V3 모델이 Poe 내에서 약 7%의 이용률을 기록하며 주목받고 있다. 한편, Google의 Gemini 모델 군은 이용 비중이 소폭 감소했지만 여전히 주요 플레이어로 자리 잡고 있다.


이미지 생성 모델: 시장 변화 속 선두 모델

초기 리더들의 점유율 하락

한때 이미지 생성 분야에서 선두를 달리던 DALL-E-3와 StableDiffusion의 점유율이 약 80% 하락하며 신규 모델들의 진입이 가속화됐다.

새로운 선두주자

BlackForestLabs의 FLUX 모델이 현재 40%에 가까운 점유율을 차지하며 이미지 생성에서 가장 큰 역할을 하고 있다. Google의 Imagen3 모델군은 30%의 점유율로 뒤를 잇고 있다. 그 외에 Playground 및 Ideogram과 같은 소규모 제공업체들이 잦은 서비스 업데이트로 충성도 높은 사용자층을 유지하고 있지만, Poe 전체 점유율에서는 10%에 불과하다.


비디오 생성 모델: 급성장하는 신흥 산업

빠르게 확장 중인 비디오 생성

2024년 후반까지 비디오 생성이 Poe에서 거의 사용되지 않았지만, 이제 최소 8개의 제공업체가 참여하며 빠르게 성장하고 있다.

Runway와 Google Veo-2의 치열한 경쟁

Runway의 비디오 모델은 전체 요청의 30~50%를 처리하며 높은 선호도를 자랑하고 있다. 그러나 Google의 Veo-2는 출시 직후 시장 점유율에서 약 40%를 차지하며 급격한 성장세를 보이고 있다.


사용자 선호도 변화와 모델 선택의 중요성

새로운 모델이 이전 버전을 빠르게 대체하는 양상이 두드러지며, 최신 버전을 사용하는 것이 높은 성능을 제공한다는 점이 입증되고 있다. 그러나 앞으로는 비용이 모델 채택의 큰 제한 요인이 될 가능성도 있다.

Poe는 앞으로 다가올 보고서를 통해 각 모델이 다양한 작업과 가격대에서 어떻게 활용될 수 있는지에 대한 인사이트를 제공할 예정이다.

출처 : 원문 보러가기