人工智能 - 智狐AI导航

AISong

一个使用AI生成歌曲的平台，支持歌词和纯音乐创作，免费提供两次生成机会。

Ai语音工具 2025年06月05日 26 点赞 0 评论 848 浏览

PGTFormer是一款先进的视频人脸修复框架，通过解析引导的时间一致性变换器恢复视频中的高保真细节，同时增强时间连贯性。该方法无需预对齐，通过语义解析选择最佳人脸先验，并结合时空Transformer模块和时序保真度调节器，实现了高效且自然的修复效果。其主要功能包括盲视频人脸修复、语义解析引导、时间一致性增强、时空特征提取、端到端修复和时序保真度调节。PGTFormer适用于电影和视频制作、视频

AI项目与工具 2025年06月12日 90 点赞 0 评论 848 浏览

SignLLM

SignLLM是一款支持多语言手语生成的AI模型，能将文本转换为自然流畅的手语视频，覆盖包括ASL、GSL、LSA、KSL在内的八种手语。其核心技术包括离散化与层次化表示、自监督学习、符号-文本对齐等。该工具可用于教育、医疗、法律、媒体等多个场景，提升听障人群的沟通便利性与信息获取能力。

AI项目与工具 2025年06月12日 86 点赞 0 评论 847 浏览

Stable Video Diffusion

Stable Video Diffusion是一种先进的生成式人工智能视频模型，将图像转换为视频，从而改变了视频生成领域。

Ai视频生成 2025年06月05日 32 点赞 0 评论 846 浏览

ProductScope Ai

一种基于AI，旨在帮助小型企业所有者和营销人员在几分钟内创建令人惊叹的AI商品图照片并优化产品列表的工具。

电商运营 2025年06月05日 21 点赞 0 评论 846 浏览

Long

Long-VITA是一款由腾讯优图实验室、南京大学和厦门大学联合开发的多模态AI模型，支持处理超长文本（超过100万tokens）及多模态输入（图像、视频、文本）。通过分阶段训练提升上下文理解能力，结合动态分块编码器与并行推理技术，实现高效处理长文本和高分辨率图像。模型基于开源数据训练，适用于视频分析、图像识别、长文本生成等场景，性能在多个基准测试中表现突出。

AI项目与工具 2025年06月12日 65 点赞 0 评论 845 浏览

SketchVideo

SketchVideo是一款基于草图和文本提示的视频生成与编辑框架，由多所高校与企业联合研发。它利用DiT模型和草图控制网络，实现对视频内容的精细控制，支持动态调整与细节保留。该工具适用于多种场景，如影视制作、教育、游戏开发等，具备高效生成与高质量输出能力。

AI项目与工具 2025年06月11日 83 点赞 0 评论 844 浏览

Wish AI

一个适合各种场合的个性化AI祝福语生成器，有了 Wish AI，可让您轻松地为您所爱的人生成独特的个性化愿望。

生活创意 2025年06月05日 67 点赞 0 评论 844 浏览

OmniSync

OmniSync是由中国人民大学、快手科技和清华大学联合开发的通用对口型框架，基于扩散变换器实现视频中人物口型与语音的精准同步。它采用无掩码训练范式，直接编辑视频帧，支持无限时长推理，保持自然面部动态和身份一致性。通过渐进噪声初始化和动态时空分类器自由引导（DS-CFG）机制，提升音频条件下的口型同步效果。OmniSync适用于影视配音、虚拟现实、AI内容生成等多个场景。

AI项目与工具 2025年06月11日 27 点赞 0 评论 844 浏览

FacePoke

FacePoke是一款基于AI的开源实时面部编辑工具，支持通过简单拖拽操作调整人物头部姿态和面部表情，使静态图像更加生动。其采用深度学习技术，具备高分辨率输出和精确控制能力，适用于数字艺术、内容创作及影视制作等领域。工具基于LivePortrait技术开发，支持本地和Docker部署，便于用户灵活使用。

AI项目与工具 2025年06月12日 86 点赞 0 评论 843 浏览

人工智能

首页

人工智能

列表

默认

浏览次数

发布日期