Page 1 of 1

最简单的可控就是我说什么模型

Posted: Mon Apr 21, 2025 8:55 am
by sami
“即便我们用可灵在一个火神和水神打架的镜头上还‘抽卡’不下100次但也并未抽到我特别满意的镜头后来实际用的画面其实也是带了一定畸变的。”陈坤说道。 从现阶段的技术手段来看短期内可能无法解决这一问题。

张鹏认为:“最简单的可控就是我说什么模型做什么而想要实现这一可控强烈依赖于模型能不能够理解这个内容而这也是多模态大模型发展的初衷。” 用发展中的技术去解决发展中的问题将是AI视频大模型未来发展迭代升级的关键。

“内容生成尤其是视频内容生成绝大部分情况下还是由‘人用语 多米尼加电话号码列表 言描述’的方式来控制。从自然语言到视频生成这才是真正的可控更高层面的可控这是技术层面的事情。”张鹏如此说道。 现阶段AI视频大模型技术仍处于比较早期阶段并未有任何一家AI视频生成工具爬到了山顶。

而在各家攀登山顶的过程中生态体系的建设以及商业化变现也成为关键。 、黄金赛道的起点 “技术应用到行业的速度远慢于技术自身的发展。”陈万锋如此说道“AI技术发展很快但渗透到产业中产生价值的速度可能要慢十倍。

” 纯技术路线发展的角度来看从单模态到多模态最终的目标是达成AGI。但将AI进行产业化落地应用与技术升级迭代是两码事。 现阶段国内众多大模型公司的技术追赶已经过了一个阶段将会把更多的精力聚焦在落地和应用上通过与场景的结合数据的反馈再推进底层技术迭代升级。