2024-03-14

跨境电商资讯:OpenAI 又一次血洗了

OpenAI又一次血洗了整个 AI 界!

「Sora」能根据使用者给予的文字提示生成短影片,内容包含多个角色及特定类型的动态画面,影片长度最多60秒,也可依据静态图像制作动画。

一、关于Sora模型

OpenAI 官方文档介绍:Sora是一种扩散模型,主要通过静态噪音的视频开始生成视频,然后再通过多个步骤去除噪音,逐渐转换视频。

Sora 与 ChatGPT 一样采用 Transformer 架构,并使用了 DALL-E 3 中的重述技术,是一种为视觉训练数据生成高精准描述性的字幕。

所以,Sora 在生成视频过程中精准还原用户的文本提示语义。

除了文本生成视频之外,Sora 还能根据图像生成视频,并能准确地对图像内容进行动画处理。也能提取视频中的元素,对其进行扩展或填充缺失的帧,功能非常全面。

二、Sora案例演示

案例1:一个简单的指令,60s 视频一镜到底Prompt:“A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually. the street is damp and reflective, creating a mirror effect of the colorful lights. many pedestrians walk about.”中文指令:“一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信而随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。很多行人走来走去。”

No comments:

Post a Comment