一致性

首页

一致性

列表

默认

浏览次数

发布日期

GoCharlie

GoCharlie

GoCharlie 是一个专为零售行业设计的全栈 AI 平台，集成了定制化的大型语言模型 Charlie。它支持多模态数据处理，包括文本、图像、视频和音频，为企业提供内容创作、客户服务、营销活动策划及数据分析等全方位解决方案，帮助企业提升运营效率和客户满意度。

AI项目与工具 2025年06月12日 32 点赞 0 评论 650 浏览

CosyVoice 2.0

CosyVoice 2.0

CosyVoice 2.0是一款基于深度学习的语音生成大模型，通过有限标量量化技术和新型架构设计，在发音准确性、音色一致性和韵律表达方面表现出色。其支持流式推理，延迟低至150ms，广泛应用于智能助手、有声读物、视频配音及语言学习等领域，同时具备多语言支持和情感控制等功能。

AI项目与工具 2025年06月12日 10 点赞 0 评论 650 浏览

Prometheus

Prometheus

Prometheus是一款基于潜在扩散模型的3D生成工具，能够从文本描述中快速生成高质量、高保真的3D场景。其核心技术包括两阶段训练框架、RGB-D潜在空间解耦、前馈生成策略和无分类器引导，确保生成结果在视觉和几何上的准确性与一致性。适用于内容创作、游戏开发、建筑设计等多个领域，显著提升了3D内容生成的效率和质量。

AI项目与工具 2025年06月12日 27 点赞 0 评论 650 浏览

Vidu主体参照功能

Vidu主体参照功能

Vidu的主体参照功能是一项由Vidu AI首次推出的参考一致性功能，旨在保持视频中单一主体（如真人、2D或3D角色）的一致性。该功能不仅支持对角色的面容、半身、全身特征进行精确控制，还涵盖多种角色类型和画风，包括写实风格和各种艺术风格。它能有效解决视频制作中的一致性问题，提升创作效率，并降低技术门槛，适用于艺术创作、商业广告、社交媒体内容、教育和培训、游戏开发以及电影和电视剧制作等多种应用场景。

AI项目与工具 2025年06月12日 26 点赞 0 评论 654 浏览

FLOAT

FLOAT

FLOAT是一款基于音频驱动的虚拟人像生成模型，利用运动潜在空间和流匹配技术，实现时间一致性视频生成。它支持情感增强，生成自然且富有表现力的虚拟人物，广泛应用于虚拟主播、视频会议、社交媒体、游戏以及电影制作等多个领域，同时具备高效的采样和生成能力。

AI项目与工具 2025年06月12日 18 点赞 0 评论 655 浏览

Decktopus

Decktopus

世界上排名第一的AIPPT生成器

PPT资源 2026年06月21日 0 点赞 0 评论 661 浏览

Story

Story

Story-Adapter是一种无需额外训练的长篇故事可视化框架，通过迭代优化和全局参考交叉注意力模块，提升图像生成的质量与细节表现。该工具适用于多种场景，包括故事创作、教育学习、娱乐游戏、广告营销以及影视制作等，特别适合需要将文字转化为视觉化内容的场合。

AI项目与工具 2025年06月12日 93 点赞 0 评论 662 浏览

WorldMem

WorldMem

WorldMem是由多所高校与研究机构联合开发的AI世界生成模型，通过引入记忆机制解决传统模型在长时间序列生成中的一致性问题。它支持动态环境模拟、多场景交互及长期一致性保持，适用于虚拟游戏、VR/AR、自动驾驶等多个领域，具备高度真实性和可扩展性。

AI项目与工具 2025年06月11日 47 点赞 0 评论 664 浏览

CityDreamer4D

CityDreamer4D

CityDreamer4D是由南洋理工大学S-Lab开发的4D城市生成模型，通过分离动态与静态元素，结合模块化架构生成逼真城市环境。支持无边界扩展、风格化处理、局部编辑及多视角一致性，适用于城市规划、自动驾驶和虚拟现实等领域。采用高效鸟瞰图表示法与神经场技术，提升生成效率与质量。

AI项目与工具 2025年06月12日 55 点赞 0 评论 666 浏览

LTX Video

LTX Video

LTX Video是一款基于开源架构的AI视频生成工具，利用先进的扩散Transformer技术和2亿参数的DiT架构，能够在短时间内生成高质量视频。其功能涵盖实时生成、运动一致性保障、开源可扩展性及广泛的硬件兼容性，适用于游戏、广告、影视等多种行业，为用户提供高效的视频生成解决方案。

AI项目与工具 2025年06月12日 34 点赞 0 评论 669 浏览

微信公众账号

微信扫一扫加关注