模型 - 智狐AI导航

Video Diffusion Models

Video Diffusion Models项目展示了扩散模型在视频生成领域的潜力，通过创新的梯度条件方法和自回归扩展技术，生成了具有高度时间连贯性和质量的视频样本。

Ai绘画生成 2026年06月22日 0 点赞 0 评论 545 浏览

URO

URO-Bench 是一个面向端到端语音对话模型的综合评估工具，支持多语言、多轮对话及副语言信息处理。它包含基础和高级两个赛道，分别涵盖16个和20个数据集，覆盖开放性问答、情感生成、多语言任务等。支持多种评估指标，提供简单易用的评估流程，并兼容多种语音对话模型。适用于智能家居、个人助理、语言学习等多个实际应用场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 545 浏览

谷歌DeepMind推出V2A技术，可为无声视频添加逼真音效

DeepMind推出的V2A（Video-to-Audio）模型能够将视频内容与文本提示相结合，生成包含对话、音效和音乐的详细音频轨道。它不仅能够与DeepMind自身的视频生成模型Veo协同工作，还能与其他视频生成模型，如Sora、可灵或Gen 3等，进行集成，从而为视频添加戏剧性的音乐、逼真的音效或与视频中角色和情绪相匹配的对话。V2A的强大之处在于其能够为每个视频输入生成无限数量的音轨。该模

AI项目与工具 2025年06月12日 21 点赞 0 评论 545 浏览

VMix

VMix是一款提升文本到图像生成美学质量的工具，通过解耦文本内容与美学描述，并引入细粒度美学标签，增强图像在色彩、光线、构图等方面的视觉表现。其核心技术为交叉注意力混合控制模块，可在不改变原有模型结构的情况下注入美学条件，保持图文一致性。VMix兼容多种扩散模型及社区模块，支持多源输入、高质量视频处理、实时直播与远程协作，广泛应用于电视直播、网络直播、现场活动及虚拟演播室等场景。

AI项目与工具 2025年06月12日 97 点赞 0 评论 545 浏览

造物云AI

造物云是一个在线3D营销设计平台，通过几千套虚拟影棚、仿真材质、高级动效和3D模型等模板库，让人人都能在浏览器创作商业摄影级的3D图片/视频营销内容，用3D可视化的技术帮企业大...

创作工具 2026年06月22日 0 点赞 0 评论 544 浏览

Character AI

通过AI 驱动的创意增加销售额

创作工具 2026年06月22日 0 点赞 0 评论 544 浏览

ArtStation

一个全球性的数字艺术社区平台，它为艺术家和设计师提供了一个展示自己作品的在线平台。这个平台支持多种艺术形式，包括绘画、插图、建模、动画、游戏设计等。

免商图片 2025年06月05日 15 点赞 0 评论 544 浏览

EPLB

EPLB是DeepSeek推出的专家并行负载均衡工具，用于优化大规模模型训练中的资源分配。它通过冗余专家策略和分层/全局负载均衡机制，提升GPU利用率和训练效率。支持多层MoE模型，减少通信开销，适应不同场景需求。

AI项目与工具 2025年06月12日 10 点赞 0 评论 543 浏览

GameFactory

GameFactory 是由香港大学与快手科技联合研发的AI框架，专注于解决游戏视频生成中的场景泛化问题。它基于预训练视频扩散模型，结合开放域数据与高质量游戏数据，通过多阶段训练实现动作可控的多样化场景生成。具备高精度动作控制、交互式视频生成及丰富场景支持，适用于游戏开发、自动驾驶模拟及具身智能研究等领域。

AI项目与工具 2025年06月12日 31 点赞 0 评论 543 浏览

AI.LS

一个基于gpt-3.5、gpt-4和Claude的优雅ChatGPT用户界面，作为ChatGPT的替代品。它提供了一个用户友好的界面，可以进行聊天机器人对话。

AI写作对话 2025年06月05日 66 点赞 0 评论 543 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期