学习 - 智狐AI导航

PhotoDoodle

PhotoDoodle是一种基于少量样本学习的艺术化图像编辑框架，能够精准复现艺术家风格并应用于照片涂鸦。它采用两阶段训练策略，结合位置编码重用和无噪声条件范式，确保生成效果与背景一致。支持装饰元素添加、背景保留、指令驱动编辑等功能，并通过低秩适应技术实现高效风格定制。项目提供高质量数据集和开源资源，适用于数字艺术创作、商业设计、社交媒体等多个场景。

AI项目与工具 2025年06月12日 13 点赞 0 评论 773 浏览

WebThinker

WebThinker是一款由多家科研机构联合开发的AI工具，旨在增强大型推理模型在复杂任务中的表现。它支持自主搜索、网页导航与实时报告生成，结合深度网页探索器和强化学习策略，提升信息获取与内容创作的效率与质量。适用于科学研究、数据分析、教育辅助等多种场景，显著增强了模型在知识密集型任务中的可靠性与实用性。

AI项目与工具 2025年06月11日 60 点赞 0 评论 773 浏览

天工SkyMusic

天工SkyMusic是由昆仑万维公司推出的一款AI音乐生成模型，它基于昆仑万维的天工3.0超级大模型构建而成。

创作工具 2026年06月22日 0 点赞 0 评论 774 浏览

PaddleOCR 2.9

PaddleOCR 2.9 是一个基于深度学习的开源 OCR 工具库，提供了强大的文本识别、版面分析和信息抽取功能。支持多语言识别和多种硬件平台，通过低代码开发模式简化了模型的部署和定制，广泛应用于文档数字化、智能办公、身份验证、物流管理和金融服务等领域。

AI项目与工具 2025年06月12日 56 点赞 0 评论 775 浏览

Ciallo TTS

Ciallo TTS是一款开源的文本转语音工具，支持300多种语言和口音，提供语速、语调调节功能，并具备即时试听和长文本处理能力。适用于学习、工作、创作等场景，提升信息获取与内容制作的效率。

AI项目与工具 2025年06月12日 60 点赞 0 评论 775 浏览

Luvvoice

Luvvoice 是一款基于 AI 技术的在线文本到语音转换平台，提供超过 200 种高质量 AI 声音和 70 多种语言选项。用户可以通过上传 PDF 或 TXT 文件，将文本快速转换为自然语音，适用于教育、内容创作、营销及无障碍服务等多个场景。平台支持多种语言调节功能，生成的音频文件支持 MP3 格式下载。

AI项目与工具 2025年06月12日 33 点赞 0 评论 775 浏览

TableGPT2

TableGPT2是一种由浙江大学开发的多模态人工智能模型，专注于结构化数据的处理与分析。它具备强大的表格数据理解能力，支持SQL查询执行、数据分析以及数据增删改查等功能。通过创新的表格编码器和双维注意力机制，TableGPT2在处理不规则表格和模糊查询方面表现优异。其应用场景广泛，涵盖商业智能、财务分析、市场研究及供应链管理等领域。

AI项目与工具 2025年06月12日 34 点赞 0 评论 775 浏览

QwenLong

QwenLong-L1-32B是阿里巴巴集团Qwen-Doc团队开源的首个长文本推理大模型，基于渐进式上下文扩展、课程引导的强化学习和难度感知的回顾性采样策略，显著提升长文本场景下的推理能力。该模型在多个DocQA基准测试中表现优异，平均准确率达70.7%，超越多个现有旗舰模型。其功能包括长文本推理、稳定训练、混合奖励、广泛适用性和高性能表现，适用于法律、金融、科研等多个领域。

AI项目与工具 2025年06月11日 24 点赞 0 评论 776 浏览

TPDM

TPDM是一种基于扩散模型的图像生成技术，通过引入时间预测模块（TPM）和强化学习优化策略，实现了对去噪步骤的自适应调整，从而在保证图像质量的同时提高了生成效率。该模型适用于多种应用场景，包括文本到图像生成、艺术创作辅助以及数字媒体内容生产等，广泛应用于广告、游戏设计、影视制作等领域。

AI项目与工具 2025年06月12日 15 点赞 0 评论 776 浏览

Fireworks f1

Fireworks f1 是一款专为复杂推理任务设计的复合型 AI 模型，通过整合多个开源模型提升性能与可靠性。支持开发者通过提示词快速构建复杂 AI 应用，已在编码、对话及数学领域展现卓越能力。同时提供标准版和轻量版供用户选择，并在 AI Playground 提供免费体验。

AI项目与工具 2025年06月12日 25 点赞 0 评论 776 浏览

学习

首页

学习

列表

默认

浏览次数

发布日期