方法 - 智狐AI导航

VALL-E

VALL-E一种用于文本到语音合成 (TTS) 的语言建模方法。具体来说，我们使用从现成的神经音频编解码器模型派生的离散代码来训练神经编解码器语言模型（称为 VALL-E），并将 TTS 视为...

Ai平台模型 2026年06月21日 0 点赞 0 评论 860 浏览

MachineLearningMastery

5 个步骤对机器学习入门的最佳建议

Ai编程建站 2026年06月21日 0 点赞 0 评论 691 浏览

VALL

VALL-E一种用于文本到语音合成 (TTS) 的语言建模方法。具体来说，我们使用从现成的神经音频编解码器模型派生的离散代码来训练神经编解码器语言模型（称为 VALL-E），并将 TTS 视为...

Ai平台模型 2026年06月21日 0 点赞 0 评论 581 浏览

Learning Prompt

更好使好地使用 GPT 和其他 AI 产品的免费教程

AI写作对话 2026年06月21日 0 点赞 0 评论 684 浏览

GPTKit

欢迎使用GPTKit，一个AI文本...

AI写作对话 2026年06月21日 0 点赞 0 评论 667 浏览

StudyCorgi

通过分析文本中单词的选择可预测性来判断文本是否由机器生成。选择越可预测，文本看起来更人工。

AI写作对话 2026年06月21日 0 点赞 0 评论 342 浏览

I2VGen

一个强大的图像到视频的生成模型，它通过创新的方法解决了AI视频合成过程中的语义准确性、清晰度和时空连续性的挑战。用户可以轻松地将静态图像转换为高质量的动态视频，生成的视...

Ai平台模型 2026年06月21日 0 点赞 0 评论 336 浏览

SUPIR

SUPIR是一种创新的图像修复和画质增强方法，基于大规模生成模型StableDiffusion-XL（SDXL）和模型扩展技术。它通过深度学习和多模态方法实现低质量图像的高质量恢复，支持通过文本提示进行图像恢复的精细控制。SUPIR适用于多种应用场景，如老照片修复、模糊图像增强、噪点去除和色彩校正与增强。

AI项目与工具 2024年01月01日 88 点赞 0 评论 698 浏览

LongWriter

LongWriter是一款由清华大学与智谱AI合作开发的长文本生成模型，能够生成超过10,000字的连贯文本。该模型基于增强的长上下文大型语言模型，采用了直接偏好优化（DPO）技术和AgentWrite方法，能够处理超过100,000个token的历史记录。LongWriter适用于多种应用场景，包括学术研究、内容创作、出版行业、教育领域和新闻媒体等。

AI项目与工具 2025年06月12日 67 点赞 0 评论 688 浏览

MMRole是一个由中国人民大学高瓴人工智能学院研究团队开发的多模态角色扮演智能体（MRPA）框架。该框架通过整合图像和文本，使智能体能够以特定角色进行更为自然和沉浸式的对话。MMRole框架包括一个大规模、高质量的多模态数据集和一个全面的评估方法，用于开发和评估MRPAs的性能。该框架为创建能够理解和生成与图像相关对话内容的智能体提供了新的可能，并扩展了其在教育、娱乐、客户服务、社交模拟和内容创

AI项目与工具 2025年06月12日 28 点赞 0 评论 672 浏览

方法

首页

方法

列表

默认

浏览次数

发布日期