学习 - 智狐AI导航

PGTFormer

PGTFormer是一款先进的视频人脸修复框架，通过解析引导的时间一致性变换器恢复视频中的高保真细节，同时增强时间连贯性。该方法无需预对齐，通过语义解析选择最佳人脸先验，并结合时空Transformer模块和时序保真度调节器，实现了高效且自然的修复效果。其主要功能包括盲视频人脸修复、语义解析引导、时间一致性增强、时空特征提取、端到端修复和时序保真度调节。PGTFormer适用于电影和视频制作、视频

AI项目与工具 2025年06月12日 90 点赞 0 评论 848 浏览

AI Reality

AI Reality 是一个网站，它提供了一个使用人工智能（AI）学习和创建增强现实（AR）的平台。

Ai编程建站 2025年06月05日 64 点赞 0 评论 849 浏览

OmniCorpus

OmniCorpus是上海人工智能实验室联合多家知名高校和研究机构共同创建的一个大规模多模态数据集，包含86亿张图像和16960亿个文本标记，支持中英双语。它通过整合来自网站和视频平台的文本和视觉内容，提供了丰富的数据多样性。OmniCorpus不仅规模庞大，而且数据质量高，适合多模态机器学习模型的训练和研究。它广泛应用于图像识别、视觉问答、图像描述生成和内容推荐系统等领域。

AI项目与工具 2025年06月12日 75 点赞 0 评论 849 浏览

Dubbing AI

DubbingAI 语音生成器作为实时变声器，可以将任何语音转换为优质语音和克隆语音。从游戏玩家到直播主播和内容创作者。每个人都可以使用 Dubbing AI 生成跨年龄、语言和口音的逼真配音。

Ai语音工具 2025年06月05日 19 点赞 0 评论 849 浏览

TeleAI

TeleAI-t1-preview是中国电信人工智能研究院开发的复杂推理大模型，具有强大的数学与逻辑推理能力。它在多项国际评测中表现优异，尤其在数学竞赛和古籍解析方面表现突出。模型融合了强化学习与思考范式，支持从文言文到现代汉语的数学题解析，并具备策略推理与单位换算等功能。该模型即将上线天翼AI开放平台，未来将在教育、科研等领域广泛应用。

AI项目与工具 2025年06月12日 88 点赞 0 评论 850 浏览

SWEET

SWEET-RL是Meta开发的多轮强化学习框架，专为提升大型语言模型在协作推理任务中的表现而设计。通过引入训练时的额外信息优化“批评者”模型，实现精准的信用分配与策略优化。在ColBench基准测试中，其在后端编程和前端设计任务中表现出色，成功率提升6%。适用于文本校对、社交媒体审核、广告合规等多种场景，具备高度的通用性和适应性。

AI项目与工具 2025年06月12日 15 点赞 0 评论 850 浏览

GPT-SoVITS

一个强大的语音合成工具，特别适合需要快速生成特定人声的场景。它通过先进的技术实现了高质量的语音克隆和文本到语音转换，支持多种语言，并提供了易于使用的WebUI工具。

Ai平台模型 2026年06月21日 0 点赞 0 评论 850 浏览

TripoSR

TripoSR是一款由Stability AI与VAST联合开发的开源3D生成模型，能够在不到0.5秒内从单张2D图像生成高质量的3D模型。基于Transformer架构和大型重建模型（LRM）设计，采用先进的图像编码、三平面NeRF表示及优化训练策略，支持无GPU设备运行。适用于游戏开发、影视制作、建筑设计、产品设计等多个领域，具有高效、高精度和广泛适用性的特点。

AI项目与工具 2025年06月12日 80 点赞 0 评论 850 浏览

ChatTS

ChatTS-14B 是一款由字节跳动开发的大型语言模型，专为时间序列数据的理解与推理设计，具备 140 亿参数规模。通过合成数据对齐技术提升任务表现，支持自然语言交互，可应用于金融、气象、工业、医疗和运维等多个场景，提供数据分析、预测与诊断功能。模型已开源，便于开发者使用和扩展。

AI项目与工具 2025年06月11日 73 点赞 0 评论 851 浏览

VQAScore

VQAScore是一种基于视觉问答（VQA）模型的评估工具，用于衡量文本提示生成图像的质量。它通过计算回答“是”概率的方式评估图像与文本提示的对齐程度，无需额外标注，提供更精确的结果。VQAScore支持多种生成任务，包括图像、视频及3D模型，并能作为多模态学习的研究工具，在自动化测试和质量控制中发挥重要作用。

AI项目与工具 2025年06月12日 86 点赞 0 评论 852 浏览

学习

首页

学习

列表

默认

浏览次数

发布日期