近期,国内大型模型在AI视频生成领域取得了令人瞩目的进展。 4月27日,圣树科技联合清华大学在中关村论坛未来人工智能先锋论坛上发布国内首个Sora级视频模型Vidu,引发市场热议。 4月28日,AIGC A股上市公司万兴科技宣布旗下首款国内大型音视频多媒体模型“”正式公测,受到市场广泛关注。
公开资料显示,Vidu采用与AV集成的U-ViT架构,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。 Vidu不仅可以模拟真实的物理世界,还具有丰富的想象力、多镜头生成、高时空一致性。 从演示视频可以看出,Vidu视频生成的效果已经达到了很高的水平。 例如,在生成的柯基犬游泳视频中,Vidu 对柯基犬游泳时腿部浮毛的细节处理得更加精细。
在4月28日举办的万兴天屏大模型公测体验暨“AI重塑视频创作”创新论坛上,万兴科技宣布将正式向公众逐步开放万兴天屏,并将提供给部分第三方。 开放API接口。 据现场体验的参与者反馈,效果也令人满意。
参与现场体验的创作者认为,视频创作能力是从业者迫切追求的。 的“顶屏”可以通过简洁的文字描述生成创意视频内容,提高创意效率并降低成本,有利于视频制作、电影制作和广告行业等市场带来新的动力。 同时,营销行业的体验者看好万兴科技“顶屏”的多媒体内容生成能力,认为“顶屏”将成为简化工作流程、提高工作效率的“一站式”AI内容生成平台。创意效率和创意表达。
据了解,“天目”是国内首个专注于数字创意领域的大型音视频多媒体模式。 它依托15亿用户行为数据和百亿本地化音视频数据,利用先进的音视频生成AI技术,为全球创作者提供全链路创作支持。 该型号已在国家网信办注册,拥有近百项音视频原子能力,并已在其Virbo、Virbo等产品中大规模商用。 其文声视频功能可以实现不同风格的连贯性、丰富的场景和主题。 密钥生成时间率先支持60秒+。
(万星“天目”视频《男孩的冒险之旅》)
从Sora到 、Vidu,大型AI模型正在加速音视频领域的技术变革。 据研究预测,到2030年,90%的数字内容将由AI生成,2032年全球AIGC市场规模预计将达到1.3万亿美元。此外,目前全球有3.05亿视频创作者,4.3亿级视频覆盖群体,每天视频观看量超过200亿次。 音视频领域市场潜力巨大。
当前,随着全球AI领域企业财报密集发布,具有前瞻性的企业在广阔市场的带动下,正迎来业绩加速增长的新时期。 例如,微软第三财季报告显示,微软云Azure的收入增长了31%,其中人工智能增长了7个百分点。
国内方面,万星科技2023年财报显示,公司全年实现营业收入14.81亿元,同比增长25.49%; 归属于母公司净利润8620.57万元,同比增长113.20%,扣非净利润8968.31万元,同比增长8.1745%%。 公司投入研发费用4.03亿元,加速人工智能技术研发、产品功能创新和产品矩阵拓展,利用先进的人工智能技术打造多元化的创意软件产品和服务。
此外,美图发布的2023年财报显示,2023年总营收为27亿元,净利润为3.7亿元。 财报特别强调,营收和利润的双增长是由AI驱动的。 其中,在AI的推动下,美图影像及设计产品业务2023年全年营收13.3亿元,同比增长52.8%。 目前,美图用户每天处理数亿张图片和视频,其中约83%使用泛AI功能。