模型 - 智狐AI导航

UniToken

UniToken 是一种面向多模态理解与生成任务的自回归模型，结合了离散与连续视觉表示，实现对图像语义与细节的全面捕捉。它支持图文理解、图像生成、多模态对话、复杂指令执行等多种任务，并具备细粒度视觉处理能力。适用于内容创作、智能客服、教育、医疗及自动驾驶等多个领域。

AI项目与工具 2025年06月11日 67 点赞 0 评论 479 浏览

RWKV

RWKV-7是一种先进的大模型架构，超越传统注意力机制，具备强大的上下文学习能力和高效的训练稳定性。其动态状态更新和学习率调整机制提升了模型性能，适用于文本生成、机器翻译、情感分析、对话系统及多语言处理等多种应用场景。

AI项目与工具 2025年06月12日 37 点赞 0 评论 479 浏览

Haiper AI

一家专注于视觉内容创作的生成式AI解决方案的人工知智能公司， Haiper AI的使命就是开发将文本和图片转换为动态视频或3D的模型。

Ai视频生成 2025年06月05日 75 点赞 0 评论 479 浏览

Sweep AI

Sweep AI 是一款利用人工智能技术优化软件开发流程的工具，集成了大型语言模型与代码分析引擎，主要功能涵盖代码搜索、重构、测试生成以及文档创建等。它旨在帮助开发者提高工作效率，简化代码管理，并支持灵活定制化设置以满足不同团队的需求。

AI项目与工具 2025年06月12日 96 点赞 0 评论 479 浏览

TANGOFLUX

TANGOFLUX是一款高效文本到音频生成模型，具备约5.15亿参数量，能够在3.7秒内生成30秒高质量音频。它采用CLAP-Ranked Preference Optimization框架优化音频输出，支持多种应用场景，包括多媒体内容创作、音频制作、播客、教育及虚拟助手开发。其开源特性推动了相关领域的技术进步。

AI项目与工具 2025年06月12日 73 点赞 0 评论 479 浏览

豆包·语音播客模型

豆包·语音播客模型是字节跳动旗下火山引擎推出的语音播客工具，基于流式模型构建，可将文本秒级转化为双人对话式播客。具有低成本、高时效、强互动特点，解决了传统AI播客内容重复、不够口语化的问题。支持低时延与可打断、深度搜索、高效创作、超长文本转播客等功能，适用于教育、娱乐、心理咨询、内容营销和有声读物制作等场景。

AI项目与工具 2025年06月11日 72 点赞 0 评论 478 浏览

LayerDiffusion是一种创新的AI工具，利用大规模预训练的潜在扩散模型生成具有透明度的图像。该技术引入了“潜在透明度”的概念，将图像的alpha通道透明度信息编码到潜在空间中。LayerDiffusion不仅可以生成单个透明图像，还能生成多个透明图层，支持条件控制生成和图层内容结构控制，确保高质量的图像输出。此外，它还能够生成多个透明图层，并通过共享注意力机制和低秩适应确保图层间的和谐混

AI项目与工具 2024年01月01日 69 点赞 0 评论 478 浏览