模型 - 智狐AI导航

造物云AI

造物云是一个在线3D营销设计平台，通过几千套虚拟影棚、仿真材质、高级动效和3D模型等模板库，让人人都能在浏览器创作商业摄影级的3D图片/视频营销内容，用3D可视化的技术帮企业大...

创作工具 2026年06月22日 0 点赞 0 评论 544 浏览

Character AI

通过AI 驱动的创意增加销售额

创作工具 2026年06月22日 0 点赞 0 评论 544 浏览

ArtStation

一个全球性的数字艺术社区平台，它为艺术家和设计师提供了一个展示自己作品的在线平台。这个平台支持多种艺术形式，包括绘画、插图、建模、动画、游戏设计等。

免商图片 2025年06月05日 15 点赞 0 评论 544 浏览

Reka Flash 3

Reka Flash 3 是一款由 Reka AI 开发的开源推理模型，拥有 21 亿参数，支持多模态输入（文本、图像、视频、音频），并可处理最长 32k 个令牌的上下文。它具备高效的推理能力和多语言支持，适用于日常对话、编码辅助、指令执行等多种场景。模型可在本地部署，支持 4 位量化以降低资源占用，适合广泛的应用需求。

AI项目与工具 2025年06月12日 70 点赞 0 评论 545 浏览

Video Diffusion Models

Video Diffusion Models项目展示了扩散模型在视频生成领域的潜力，通过创新的梯度条件方法和自回归扩展技术，生成了具有高度时间连贯性和质量的视频样本。

Ai绘画生成 2026年06月22日 0 点赞 0 评论 545 浏览

URO

URO-Bench 是一个面向端到端语音对话模型的综合评估工具，支持多语言、多轮对话及副语言信息处理。它包含基础和高级两个赛道，分别涵盖16个和20个数据集，覆盖开放性问答、情感生成、多语言任务等。支持多种评估指标，提供简单易用的评估流程，并兼容多种语音对话模型。适用于智能家居、个人助理、语言学习等多个实际应用场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 545 浏览

谷歌DeepMind推出V2A技术，可为无声视频添加逼真音效

DeepMind推出的V2A（Video-to-Audio）模型能够将视频内容与文本提示相结合，生成包含对话、音效和音乐的详细音频轨道。它不仅能够与DeepMind自身的视频生成模型Veo协同工作，还能与其他视频生成模型，如Sora、可灵或Gen 3等，进行集成，从而为视频添加戏剧性的音乐、逼真的音效或与视频中角色和情绪相匹配的对话。V2A的强大之处在于其能够为每个视频输入生成无限数量的音轨。该模

AI项目与工具 2025年06月12日 21 点赞 0 评论 545 浏览

VMix

VMix是一款提升文本到图像生成美学质量的工具，通过解耦文本内容与美学描述，并引入细粒度美学标签，增强图像在色彩、光线、构图等方面的视觉表现。其核心技术为交叉注意力混合控制模块，可在不改变原有模型结构的情况下注入美学条件，保持图文一致性。VMix兼容多种扩散模型及社区模块，支持多源输入、高质量视频处理、实时直播与远程协作，广泛应用于电视直播、网络直播、现场活动及虚拟演播室等场景。

AI项目与工具 2025年06月12日 97 点赞 0 评论 545 浏览

CatVTON

CatVTON是一款基于先进AI算法的虚拟试衣工具，能够将服装从一个人无缝转移到另一个人身上，同时保留服装细节的一致性。该工具采用轻量级网络架构，减少了计算资源的需求，无需复杂的预处理步骤，即可实现高效的服装试穿效果。CatVTON适用于电子商务、时尚设计、个性化推荐等多个领域，为用户提供了便捷且真实感强的虚拟试衣体验。

AI项目与工具 2025年06月12日 42 点赞 0 评论 546 浏览

灰色AI | GreyAi

一键实现无缝AI换脸等操作，使用数字人虚拟人解放生产力。灰色AI基于多年人工智能经验，大幅简化ai换脸操作方式。

AI服务商 2025年06月05日 24 点赞 0 评论 546 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期