ai 神器“看图生音”？其实是字节跳动发布的seedance2.0 模型

最近，全球社交媒体平台上出现了一个热门话题：AI神器“看图生音”？其实这个话题讨论的是字节跳动发布的Seedance2.0模型。影视飓风的创始人Tim（潘天鸿）分享了他对这个模型的看法，他被Seedance2.0给震撼到了。Tim提到，这个模型在生成视频时不仅精细度高、流畅度好，还能保证画面与声音的匹配度极高。就连《黑神话：悟空》的制作人冯骥都评价Seedance2.0是当前最强的视频生成模型，没有之一。Tim也承认Seedance2.0的能力相当惊人，但与此同时也给出了一些思考。他发现把自己的人脸照片上传到模型里，系统就会自动生成与自己声音非常相似的音频。实际上，这种做法是当前AI行业普遍采用的技术路径。Hugging Face亚太生态负责人Wang Tiezhen也转发了Seedance2.0演示视频，表示效果非常棒。YouTube上订阅人数超过40万的创作者也说这是真正的技术突破。现在市场上还没有什么能与之媲美的产品。Seedance2.0在国外社交媒体平台上引发热议，话题登上了热门趋势。彭博社提到这个模型让分析师印象深刻，甚至带动了相关公司股价上涨。对于这个问题，北京航空航天大学人工智能研究院教授沙磊指出，国内外大部分AI大模型都是基于公开数据进行训练的。例如谷歌的Gemini多模态模型和Veo3视频生成模型就使用了超过200亿个YouTube视频片段。张立波教授也表示为了实现更好的模型效果，就需要更多公开数据进行训练，普通用户无需过度焦虑。Seedance2.0现在还在小范围内测试阶段，字节跳动给它限制了一部分功能来防止滥用。这次讨论引发了大家对AI技术发展与隐私保护之间平衡问题的思考。另外在这次讨论中还有提到了Face和Sora这两个名字。其实AI技术发展和应用是一个复杂而广泛的领域。我们需要清醒认识到保护公众个人隐私并确保生成内容安全可靠是亟待解决的重要课题。