AI工具 - 智狐AI导航

FunAudioLLM

FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目，包含SenseVoice和CosyVoice两个子模型。SenseVoice擅长多语言语音识别和情感辨识，支持超过50种语言；CosyVoice则专注于自然语音生成，支持多种语言、音色和情感控制。该项目适用于多语言翻译、情感语音对话等场景，其相关模型和代码已公开发布。

AI项目与工具 2025年06月12日 66 点赞 0 评论 697 浏览

FastGPT

FastGPT是一款开源的AI知识库构建平台，支持多种文档格式导入和自动预处理，提供可视化工作流设计、多模型兼容及API集成功能。用户可快速构建智能问答系统和自动化流程，适用于客服、知识管理、教育、医疗和旅游等多个场景。平台提供不同版本的定价方案，满足个人、团队及企业的需求。

AI项目与工具 2025年06月12日 58 点赞 0 评论 697 浏览

Dreamina

Dreamina，用户可以根据一段文字生成四幅由AI生成的创意图，用户还可以对生成的图片进行修整，包括调整图片的大小比例和选择不同的模板类型。

Ai绘画生成 2025年06月05日 53 点赞 0 评论 697 浏览

Styldod

良好的房源图片是房屋销售过程的基石。Styldod 帮助您快速、轻松、低成本地编辑和增强照片、消除杂乱背景。

Ai图片处理 2025年06月05日 84 点赞 0 评论 698 浏览

ImageRAG

ImageRAG 是一种基于检索增强生成（RAG）技术的图像生成工具，通过动态检索相关图像提升文本到图像模型的生成能力。它能够增强对罕见概念的理解与生成，提升图像的真实度和相关性，支持多模态生成与个性化定制。无需额外训练即可适配多种 T2I 模型，广泛应用于创意设计、品牌推广、教育及影视等领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 698 浏览

千川AI

通过使用自然语言处理（NLP）技术，AI可以理解给定内容的上下文、语气和意图，并生成相关且吸引人的书面输出。

AI写作对话 2025年06月05日 27 点赞 0 评论 699 浏览

Decode Investing

Decode Investing是一款基于人工智能技术的股票市场研究与分析平台，主要功能包括AI股票分析、SEC文件搜索、收益电话记录查看、股票筛选器、投资排行榜、行业能力圈分析、智能聊天助手及股市分析工具等。它为投资者提供详尽的数据支持和专业建议，帮助用户高效地进行投资决策和股票研究。

AI项目与工具 2025年06月12日 23 点赞 0 评论 699 浏览

Gemma 3n

Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态 AI 模型，基于 Gemini Nano 架构，采用逐层嵌入技术，将内存占用压缩至 2-4B 参数模型水平。支持文本、图像、短视频和音频输入，可生成结构化文本输出，并具备音频转录、情感分析等功能。可在本地设备运行，响应时间低至 50 毫秒，适用于语音助手、内容生成和学术任务定制。

AI项目与工具 2025年06月11日 87 点赞 0 评论 700 浏览

SlideSpeak

SlideSpeak是一款基于AI技术的多功能工具，支持用户上传多种文档格式并生成演示文稿或摘要。其主要功能包括AI生成的演示文稿、文档总结、交互式聊天机器人、视觉内容分析及语音旁白生成。此外，SlideSpeak强调数据安全性，适用于学术研究、商业演示、教育培训等多个领域。

AI项目与工具 2025年06月12日 11 点赞 0 评论 700 浏览

CAT4D

CAT4D是一种由Google DeepMind、哥伦比亚大学及加州大学圣地亚哥分校共同开发的工具，它利用多视图视频扩散模型，从单目视频中生成动态3D（4D）场景表示。该工具可以合成新视图、重建动态3D模型，并支持独立控制相机视点和场景动态，适用于电影制作、游戏开发、虚拟现实等多种领域。

AI项目与工具 2025年06月12日 72 点赞 0 评论 701 浏览

AI工具

首页

AI工具

列表

默认

浏览次数

发布日期