Video Diffusion Models Video Diffusion Models项目展示了扩散模型在视频生成领域的潜力,通过创新的梯度条件方法和自回归扩展技术,生成了具有高度时间连贯性和质量的视频样本。 Ai绘画生成 2026年06月22日 0 点赞 0 评论 545 浏览
URO URO-Bench 是一个面向端到端语音对话模型的综合评估工具,支持多语言、多轮对话及副语言信息处理。它包含基础和高级两个赛道,分别涵盖16个和20个数据集,覆盖开放性问答、情感生成、多语言任务等。支持多种评估指标,提供简单易用的评估流程,并兼容多种语音对话模型。适用于智能家居、个人助理、语言学习等多个实际应用场景。 AI项目与工具 2025年06月12日 47 点赞 0 评论 545 浏览
谷歌DeepMind推出V2A技术,可为无声视频添加逼真音效 DeepMind推出的V2A(Video-to-Audio)模型能够将视频内容与文本提示相结合,生成包含对话、音效和音乐的详细音频轨道。它不仅能够与DeepMind自身的视频生成模型Veo协同工作,还能与其他视频生成模型,如Sora、可灵或Gen 3等,进行集成,从而为视频添加戏剧性的音乐、逼真的音效或与视频中角色和情绪相匹配的对话。V2A的强大之处在于其能够为每个视频输入生成无限数量的音轨。该模 AI项目与工具 2025年06月12日 21 点赞 0 评论 545 浏览
VMix VMix是一款提升文本到图像生成美学质量的工具,通过解耦文本内容与美学描述,并引入细粒度美学标签,增强图像在色彩、光线、构图等方面的视觉表现。其核心技术为交叉注意力混合控制模块,可在不改变原有模型结构的情况下注入美学条件,保持图文一致性。VMix兼容多种扩散模型及社区模块,支持多源输入、高质量视频处理、实时直播与远程协作,广泛应用于电视直播、网络直播、现场活动及虚拟演播室等场景。 AI项目与工具 2025年06月12日 97 点赞 0 评论 545 浏览
造物云AI 造物云是一个在线3D营销设计平台,通过几千套虚拟影棚、仿真材质、高级动效和3D模型等模板库,让人人都能在浏览器创作商业摄影级的3D图片/视频营销内容,用3D可视化的技术帮企业大... 创作工具 2026年06月22日 0 点赞 0 评论 544 浏览
ArtStation 一个全球性的数字艺术社区平台,它为艺术家和设计师提供了一个展示自己作品的在线平台。这个平台支持多种艺术形式,包括绘画、插图、建模、动画、游戏设计等。 免商图片 2025年06月05日 15 点赞 0 评论 544 浏览
EPLB EPLB是DeepSeek推出的专家并行负载均衡工具,用于优化大规模模型训练中的资源分配。它通过冗余专家策略和分层/全局负载均衡机制,提升GPU利用率和训练效率。支持多层MoE模型,减少通信开销,适应不同场景需求。 AI项目与工具 2025年06月12日 10 点赞 0 评论 543 浏览
GameFactory GameFactory 是由香港大学与快手科技联合研发的AI框架,专注于解决游戏视频生成中的场景泛化问题。它基于预训练视频扩散模型,结合开放域数据与高质量游戏数据,通过多阶段训练实现动作可控的多样化场景生成。具备高精度动作控制、交互式视频生成及丰富场景支持,适用于游戏开发、自动驾驶模拟及具身智能研究等领域。 AI项目与工具 2025年06月12日 31 点赞 0 评论 543 浏览
AI.LS 一个基于gpt-3.5、gpt-4和Claude的优雅ChatGPT用户界面,作为ChatGPT的替代品。它提供了一个用户友好的界面,可以进行聊天机器人对话。 AI写作对话 2025年06月05日 66 点赞 0 评论 543 浏览