生成 - 智狐AI导航

LuminaBrush

LuminaBrush是一款基于深度学习的图像照明生成工具，采用两阶段处理流程：首先提取图像的均匀光照状态，再根据用户涂鸦生成具体光照效果。它支持实时调整光照参数，适用于复杂图像细节处理，广泛应用于数字艺术、游戏设计、影视后期等领域。工具提供交互式界面，便于用户高效创作。

AI项目与工具 2025年06月12日 81 点赞 0 评论 641 浏览

Spark

Spark-TTS是一款基于大型语言模型的高效文本转语音工具，支持中英文双语及跨语言合成。它无需额外生成模型，通过LLM预测编码直接生成音频，实现零样本语音克隆。用户可自定义语音参数，如音色、语速等，适用于语音助手、多语言内容创作、智能客服及虚拟角色配音等多种场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 572 浏览

ViDoRAG

ViDoRAG是阿里巴巴通义实验室联合高校开发的视觉文档检索增强生成框架，采用多智能体协作与动态迭代推理技术，提升复杂文档的检索与理解能力。通过高斯混合模型优化多模态信息整合，支持精准检索与高质量生成，适用于教育、金融、医疗等多个领域，显著提升文档处理效率与准确性。

AI项目与工具 2025年06月12日 26 点赞 0 评论 771 浏览

Shandu

Shandu 是一款基于 LangChain 和 LangGraph 技术的开源 AI 研究自动化工具，支持多引擎搜索、递归探索和智能网页爬取，能自动生成结构化研究报告。用户可通过命令行输入主题并设置参数，快速输出包含引用的 Markdown 格式文档。适用于学术研究、市场分析、技术探索及教育等多个领域，具备高度灵活性和信息处理能力。

AI项目与工具 2025年06月12日 79 点赞 0 评论 566 浏览

Jobscan

Jobscan 是一款专注于简历优化的 AI 工具，主要功能包括 ATS 匹配分析、关键词优化、简历生成和 LinkedIn 优化。它帮助求职者提升简历通过招聘系统的概率，并提供实时编辑建议。适用于求职准备、简历调整及职业发展等多个场景，支持免费和付费版本，满足不同用户需求。

AI项目与工具 2025年06月12日 98 点赞 0 评论 736 浏览

Mochii AI

Mochii AI 是一款多功能AI助手，支持智能对话、文档分析、网页总结、图像识别等功能，兼容多种AI模型。用户可跨平台使用，适用于文档处理、内容创作、代码生成及数据分析等场景，具备个性化定制和上下文理解能力，提升工作效率与体验。

AI项目与工具 2025年06月12日 80 点赞 0 评论 761 浏览

LCVD

LCVD是一种由四川大学开发的高保真肖像动画生成框架，支持光照可控的动态视频生成。它通过分离肖像的内在与外在特征，并结合多条件分类器自由引导机制，实现对光照和姿态的精细控制。LCVD在图像质量、视频一致性和光照真实感方面表现突出，适用于虚拟现实、视频会议、影视制作及内容创作等多个领域。

AI项目与工具 2025年06月12日 93 点赞 0 评论 708 浏览

CogView4

CogView4是一款由智谱推出的开源文生图模型，具有60亿参数，支持中英文输入与高分辨率图像生成。在DPG-Bench基准测试中表现优异，达到当前开源模型的领先水平。模型具备强大的语义理解能力，尤其在中文文字生成方面表现突出，适用于广告设计、教育、儿童绘本及电商等领域。其技术架构融合扩散模型与Transformer，并采用显存优化技术提升推理效率。

AI项目与工具 2025年06月12日 83 点赞 0 评论 806 浏览

MindLLM

MindLLM是由多所高校联合开发的AI模型，可将功能性磁共振成像（fMRI）信号解码为自然语言文本。其采用主体无关的fMRI编码器与大型语言模型结合，并引入脑指令调优技术，实现跨个体的高精度解码。该模型在多项任务中表现优异，具备广泛的应用潜力，包括医疗康复、脑机接口、神经科学研究及人机交互等领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 546 浏览

Fractal Generative Models

Fractal Generative Models 是一种基于分形架构的图像生成技术，通过递归调用“原子模块”实现逐像素生成高分辨率图像。该模型结合 Transformer 模块，采用分而治之策略，大幅提升计算效率。不仅适用于图像生成，还可扩展至分子结构、蛋白质等高维数据建模，具有广泛的应用潜力。

AI项目与工具 2025年06月12日 69 点赞 0 评论 693 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期