WePoker-正版官网www.wpk.com

走进微扑克WePoker 公司简介 企业文化 荣誉&认证 下属公司 联系我们 产业布局 音频事业部 电器事业部 智能事业部 电声事业部 智能锁事业部 资讯中心 公司新闻 媒体报导 行业洞察 微扑克WePoker官方唯一正版APP下载 WePoker-正版官网www.wpk.com 加入我们 社会责任

CN / EN




行业洞察

2025-07-17
微扑克安卓app下载|联邦真优美|AI视频影像革命还是泡沫?

  wepoker官网中文版★ღ✿★。wepoker官网登录★ღ✿★,微扑克★ღ✿★,wepoker官网★ღ✿★。微扑克WePoker官方APP微扑克官网★ღ✿★,微扑克WePoker官方唯一正版APP下载★ღ✿★!人工智能(AI)推动视频生成技术又迈出新的一步★ღ✿★。一条发布在社交媒体平台X上的AI视频里★ღ✿★,角色集体开口戏谑道★ღ✿★:“我们不过是0和1的排列组合?醒醒吧★ღ✿★,伙计★ღ✿★。”

  让他们“开口说话”的是美国搜索引擎公司谷歌在今年5月发布的视频生成模型Veo 3★ღ✿★,其最大的特点是在视频中融合音频★ღ✿★,直接生成话语流畅★ღ✿★、口型自然的人物★ღ✿★,且自带符合场景特征的音效★ღ✿★。而此之前★ღ✿★,AI视频一直是默片★ღ✿★,需要后期配音★ღ✿★,再借助工具让角色嘴唇动作看起来合理★ღ✿★。

  2022年以来★ღ✿★,以ChatGPT聊天机器人程序为代表的生成式人工智能引发关注★ღ✿★,行业像被按下了快进键★ღ✿★,几乎每个月都有AI热点出现★ღ✿★。相比之下★ღ✿★,视频生成技术在最初一段时间里不温不火★ღ✿★。不过★ღ✿★,历经近3年的发展★ღ✿★,AI视频已逐渐从最初类似PPT★ღ✿★、动图的形态★ღ✿★,进化至直接产出主体和场景一致的视频★ღ✿★。基座模型能力迭代★ღ✿★,带来了画质★ღ✿★、流畅度★ღ✿★、真实感的提升★ღ✿★,影响面不断扩展★ღ✿★、渗透性不断增强★ღ✿★。

  如今★ღ✿★,学界★ღ✿★、业界已在眺望AI视频迎来“技术奇点”的时刻★ღ✿★。我们该如何理解视频生成模型的核心突破意义?它又会给生产生活带来什么影响?

  2023年初★ღ✿★,AI生成视频与生成图像★ღ✿★,几乎在同一时期进入公众视野英国人工智能公司Stability.ai的“稳定扩散”模型(Stable Diffusion)带火了“文生图”★ღ✿★,美国人工智能公司Runway的视频生成模型“Gen-1”则是激起了“人人都能制作电影大片”的无限遐想★ღ✿★。

  彼时★ღ✿★,“稳定扩散”模型用时数月★ღ✿★,让AI生成的图像几近照片级真实★ღ✿★。Runway创始人不由兴奋★ღ✿★:“我们已经看到了图像生成模型的爆发★ღ✿★,相信2023年将会是视频之年★ღ✿★。”

  起初★ღ✿★,AI视频主要分为两条技术路径★ღ✿★:或是与“文生图”的技术一脉相承★ღ✿★,着重“还原呈现”微扑克安卓app下载★ღ✿★,打上扩散模型(Diffusion Model)的烙印★ღ✿★;或是沿用ChatGPT的技术脉络★ღ✿★,采用自回归模型(Autoregressive model)方法★ღ✿★,讲究“逻辑推理”★ღ✿★,靠大参数★ღ✿★、大数据★ღ✿★,从零开始构建模型体系★ღ✿★。

  “走纯粹的自回归路径★ღ✿★,至今尚未出现很好的产品★ღ✿★。”浙江大学艺术与考古学院副教授沈华清说★ღ✿★。同时★ღ✿★,他认为更普遍的扩散模型“缺陷也明显”★ღ✿★。

  这位自称“无门无派★ღ✿★、兴趣广泛的教书先生”★ღ✿★,2006年起接触AI★ღ✿★,生成图片★ღ✿★、创作视频★ღ✿★,19年间从“好奇尝鲜”变成“深度沉迷”★ღ✿★。沈华清类比帧动画原理★ღ✿★,向记者解释扩散模型的技术难点★ღ✿★:“按最低的24fps(帧/秒)算★ღ✿★,5秒的视频需要120张图★ღ✿★。每张图间都要保持相互的人物一致★ღ✿★、动作连贯★ღ✿★,连光影的斑驳细节都不能穿帮这相当于让120位画家同时画同一幅画★ღ✿★,每一幅每一笔都要严丝合缝★ღ✿★。”

  的确★ღ✿★,静态图像生成只需解决“是什么”的问题★ღ✿★。视频却要在此基础上★ღ✿★,在回答“如何变化”命题的同时★ღ✿★,保证主体是统一的★ღ✿★、运动是符合常识的★ღ✿★。人们发现★ღ✿★,2023年底美国人工智能初创公司“米德朱尼”(Midjourney)同名的“文生图”工具已经能生成以假乱真的图像★ღ✿★,同期美国AI初创公司Pika labs发布的AI视频产品Pika 1.0还局限在风格特定的3秒片段上★ღ✿★。

  沈华清回忆起那段使用经历★ღ✿★,即便先用“文生图”模型生成了不错的分镜图★ღ✿★,再通过“图生视频”模型拼接成片★ღ✿★,但在最终呈现的几秒视频里★ღ✿★,人物总是畸形★ღ✿★、画面常有畸变★ღ✿★,“这哪是人在动★ღ✿★,分明是算法在抽搐★ღ✿★,看得人脊背发凉”★ღ✿★。

  生成视频技术始终“小步快走”★ღ✿★,没有根本性的突破★ღ✿★。就在大家快失去耐心时★ღ✿★,时间来到2024年2月★ღ✿★:美国开放人工智能研究中心(OpenAI)继ChatGPT后★ღ✿★,再发布“文生视频”模型Sora★ღ✿★。

  这一全新模型用ChatGPT背后的神经网络架构(Transformer)替换传统扩散模型中的卷积U-Net网络★ღ✿★,迭代出一条新的DiT(Diffusion Transformer)路径★ღ✿★,如此★ღ✿★,Sora可以精准根据文本指令★ღ✿★,生成最长为1分钟的高清视频★ღ✿★,画面逼真微扑克安卓app下载★ღ✿★、丝滑连贯★ღ✿★。

  忽如一夜春风来★ღ✿★。眼下★ღ✿★,腾讯“混元”★ღ✿★、华为“诺亚”......各家厂商谋局落子★ღ✿★,可谓“神仙打架”★ღ✿★。其中★ღ✿★,又以拥有海量视频数据的字节跳动★ღ✿★、快手增势最为迅猛★ღ✿★,其分别在2024年3月微扑克安卓app下载★ღ✿★、6月推出的即梦和可灵★ღ✿★,迅速跻身AI视频产品的第一梯队★ღ✿★。

  一位技术人员笑称★ღ✿★,这条DiT新路径似乎达成了一个“成年”模型的“既要又要”用大语言模型里学到的世界知识来帮助生成视觉世界★ღ✿★。“视频就这样成了从大模型根上生长出来的一项功能★ღ✿★,上升轨迹飞快★ღ✿★。”

  但即便是Sora问世一年后的今天★ღ✿★,一键“文生视频”仍难有良品★ღ✿★。“毕竟★ღ✿★,语言是高度压缩的信息★ღ✿★。”沈华清说★ღ✿★,一千个读者眼中尚且有一千个哈姆雷特★ღ✿★,将抽象文字直接转为具体的时空连续体★ღ✿★,这对算力和工程化的要求实在太高★ღ✿★,“不是谁都能做的★ღ✿★,也不是在短时间内就能做好的★ღ✿★。”

  一位技术人员告诉记者★ღ✿★,不同于此前大模型简单直接的“文本输入-文本输出”交互逻辑★ღ✿★,视频生成技术因视觉模态的复杂性★ღ✿★,用起来要棘手得多★ღ✿★。而“能用”与“好用”之间★ღ✿★,又横亘着训练数据★ღ✿★、算力★ღ✿★、成本控制等多重障碍★ღ✿★。

  “套用多种工具很有必要★ღ✿★。”中国传媒大学导演系科班出身的罗翀★ღ✿★,拍过豆瓣8.3分传记式宣传片★ღ✿★、拿过中国纪录片学院奖今年年初★ღ✿★,他从杭州某大厂离开★ღ✿★,转型自由AI导演★ღ✿★。在制作多个商片的过程中★ღ✿★,他迅速摸到了生成视频的一条路子★ღ✿★。

  罗翀介绍★ღ✿★,不同视频生成模型有不同的优缺点★ღ✿★,比如快手的可灵强于对多镜头★ღ✿★、物理规律的理解★ღ✿★;美国人工智能公司Runway的模型性价比更高★ღ✿★,生成速度更快★ღ✿★。

  但毕竟AI生成如同“抽卡”★ღ✿★,他告诉记者★ღ✿★,即便套用了多个AI视频产品不断打磨★ღ✿★、筛选★ღ✿★,得到了比较满意的结果★ღ✿★,还是需要借助PS等编辑软件再进行微调★ღ✿★。“不过★ღ✿★,最后成品完全可以和传统商片掰掰手腕★ღ✿★。”

  “虽然缺少故事线★ღ✿★,但未来★ღ✿★,意识流的赛博视频或将成为一个门类★ღ✿★。”罗翀说★ღ✿★,自己仿佛遇见了共创者★ღ✿★,“我负责想象★ღ✿★、尝试★ღ✿★,AI负责调整★ღ✿★、展现★ღ✿★,降本增效的同时★ღ✿★,极大地拓宽创作的自由度★ღ✿★。”

  院线影视讲究起承转合★ღ✿★、质量要求更高★ღ✿★。AI离这个目标仿佛还远★ღ✿★,但在浙江★ღ✿★,AI好像又很近★ღ✿★。一家老牌影视企业★ღ✿★,便提供了可供分析的落地样本★ღ✿★。

  第27届上海国际电影节启幕前夕★ღ✿★,浙江博采传媒有限公司一条3分钟创意短片《两代悟空对战》★ღ✿★,在B站传播量近百万★ღ✿★。网友纷纷赞叹所用技术之精妙无论是六小龄童饰演的86版美猴王★ღ✿★,还是网游《黑神话★ღ✿★:悟空》的天命人★ღ✿★,“大圣风采依旧”★ღ✿★。

  记者也去凑了个热闹★ღ✿★。湖州市德清县博采AI虚拟影视基地★ღ✿★,导演的监视器中★ღ✿★,两代悟空对战正酣★ღ✿★,远处宫殿群光影流动★ღ✿★。但现场★ღ✿★,只有两位动捕老师★ღ✿★,拿着特殊棍棒★ღ✿★,在一块“空地”“打”得激烈★ღ✿★,无论是角色样貌★ღ✿★、服饰★ღ✿★,还是建筑★ღ✿★、云雾★ღ✿★,都是LED显示屏“附上”的画面★ღ✿★。工作人员用鼠标一点联邦真优美★ღ✿★,上天入地★ღ✿★,切换只在分秒间★ღ✿★,演员置身其中★ღ✿★,画面真假难辨★ღ✿★。

  “单靠AI★ღ✿★,肯定跑不出这样的片子★ღ✿★。”博采传媒研发中心总监王伟东告诉记者联邦真优美★ღ✿★,《两代悟空对战》融合了影视行业所用的4D扫描★ღ✿★、Holo身体扫描★ღ✿★、LED拍摄等技术★ღ✿★,“我们称之为虚拟制片★ღ✿★。”据他介绍★ღ✿★,团队专门开发了一套虚拟制片管理软件Kmoke★ღ✿★,融合各类AI工具★ღ✿★,“效率直接提高了3倍★ღ✿★、成本起码节省了三分之一★ღ✿★。”

  博采传媒总裁办项目统筹牛聪说★ღ✿★,在电影创作中★ღ✿★,相比导演和制片★ღ✿★,AI其实是做好了一份助理的工作通过AI实时预演★ღ✿★,让创意的好坏“尽在眼前”★ღ✿★;传统影视的各个环节也从“线性等待”转为“动态协同”★ღ✿★,无论是调整剧本还是场景★ღ✿★,在AI的“协同”下★ღ✿★,都更加高效★ღ✿★。

  “今年★ღ✿★,我们引入AI大模型★ღ✿★,继续迭代一整套AI创作系统墨客★ღ✿★,实现连贯性的剧本创作★ღ✿★,并产出精准可控的视频★ღ✿★。”牛聪坦言★ღ✿★,针对现在AI视频像素细节不够的问题★ღ✿★,“通过改进的AI增分技术★ღ✿★,也实现从720p跃升为5K联邦真优美★ღ✿★,直接达到电影放映级画面质量★ღ✿★。”

  美国开放人工智能研究中心(OpenAI)在一份技术报告中★ღ✿★,对AI视频的定义是“世界模拟器”★ღ✿★。这个远景表明★ღ✿★,AI视频有潜力成为一种通用人工智能★ღ✿★,理解世界★ღ✿★、改变世界★ღ✿★。

  不可否认★ღ✿★,这种颠覆性在技术细节中确有显露★ღ✿★。有从业者根据Sora产品表现出的不错的“3D一致性”★ღ✿★,推测它或许能通过参数的再叠加★ღ✿★,冲破智能阈值★ღ✿★,触摸到对世界完整理解和创造的边界★ღ✿★。

  北京通用人工智能研究院院长朱松纯曾明确★ღ✿★:过去★ღ✿★,“大数据+大算力+大模型”的思维定式★ღ✿★,过度简化了通用人工智能的复杂性★ღ✿★。美国互联网公司Meta(原Facebook)人工智能研究负责人杨乐昆更是直言★ღ✿★:“生成式模型是建立世界模型的死胡同★ღ✿★,通过生成像素来模拟世界的动作★ღ✿★,既浪费又注定失败★ღ✿★。”

  实践也证明★ღ✿★,AI视频实现如此“暴力美学”的代价极高★ღ✿★:运行一个动辄超百亿参数规模的视频生成模型★ღ✿★,尖端显卡要“跑”数十秒甚至数分钟★ღ✿★,才能制作一个一分钟★ღ✿★、分辨率高达1080p的视频★ღ✿★,算力成本高昂得惊人★ღ✿★。

  不可忽视的还有生成式人工智能的固有症结“幻觉”联邦真优美★ღ✿★。从“0.8<0.09”的数学对答★ღ✿★,到四条腿的蚂蚁图★ღ✿★,再到在跑步机上倒着跑的人★ღ✿★,AI擅长计算却拙于纠错★ღ✿★,因为它没有自主意识★ღ✿★,对现实世界“知之甚少”微扑克安卓app下载★ღ✿★。北京大学新闻与传播学院教授胡泳坦言★ღ✿★,幻觉或许会在技术的迭代中减少★ღ✿★,但永远无法彻底修复★ღ✿★,失败风险始终存在★ღ✿★。

  技术障碍外★ღ✿★,高质量训练数据又从何而来?一如ChatGPT问世引发的深度造假★ღ✿★、版权侵权★ღ✿★、隐藏偏见等法律伦理争议★ღ✿★,AI视频同样绕不开这些熟悉而严重的“老问题”★ღ✿★。

  但不可否认★ღ✿★,AI视频正加速被市场接纳微扑克安卓app下载★ღ✿★,其价值与影响力持续攀升★ღ✿★。《2025中国广告主营销趋势调查报告》显示★ღ✿★:今年4月★ღ✿★,超50%的广告主已将生成式AI纳入创意生产★ღ✿★,AI营销内容占比超过10%★ღ✿★。

  也是在4月★ღ✿★,美国电影艺术与科学学院宣布★ღ✿★,2026年第98届奥斯卡金像奖将正式允许AI参与创作的电影参评★ღ✿★,这标志着AI正式进入主流评价体系★ღ✿★。但评审标准中★ღ✿★,“将综合考虑人类创作者在创意创作过程中所发挥的核心作用★ღ✿★,来决定最终的获奖者”的微妙表述★ღ✿★,也暗示着人类艺术本质的不可替代性★ღ✿★。

  AI视频正处落地的“中场哨”阶段★ღ✿★。热潮过后★ღ✿★,玩家纷纷沉下心来★ღ✿★,打磨产品的基础能力联邦真优美★ღ✿★、拓宽模型的适应边界微扑克安卓app下载★ღ✿★、重构与用户的长期关系★ღ✿★。

  其中★ღ✿★,可以确定的是★ღ✿★,AI正成为创作的基底★ღ✿★。正如快手联合创始人程一笑将可灵定位为“更多行业创作的新基础设施”★ღ✿★,AI将拉平所有人的起始点★ღ✿★。

  “我们不要放大AI的影响★ღ✿★,也不要低估AI的长期影响★ღ✿★。”5年前★ღ✿★,沈华清选择将AI带入课堂★ღ✿★,鼓励学生借助工具尝试不同风格的拓展★ღ✿★、延伸★ღ✿★、融合★ღ✿★,从中吸取灵感★ღ✿★。他认为★ღ✿★,在这个技术愈发平权的时代★ღ✿★,竞争已转向快速捕捉创意并落地的原创能力★ღ✿★,考验的是使用者的积累“拥有审美★ღ✿★、分析★ღ✿★、判断能力★ღ✿★,成为跨领域★ღ✿★、跨学科的融合通才★ღ✿★,是AI时代的新要求”★ღ✿★。

  技术在逼近极限★ღ✿★,创意却仍是无边的疆域★ღ✿★。正如那句在X上被反复转发的AI台词★ღ✿★:“我们不过是0和1的排列组合?醒醒吧★ღ✿★,伙计★ღ✿★。”但如果能以这串“0与1”为笔★ღ✿★,谁又说人类不能写出更广阔★ღ✿★、更深刻的未来图景?