开源工具 - 智狐AI导航

LTX Video

LTX Video是一款基于开源架构的AI视频生成工具，利用先进的扩散Transformer技术和2亿参数的DiT架构，能够在短时间内生成高质量视频。其功能涵盖实时生成、运动一致性保障、开源可扩展性及广泛的硬件兼容性，适用于游戏、广告、影视等多种行业，为用户提供高效的视频生成解决方案。

AI项目与工具 2025年06月12日 34 点赞 0 评论 590 浏览

Crack Coder

Crack Coder 是一款开源的 AI 编程辅助工具，专为技术面试设计。它能够在后台运行，不被检测到，并提供实时代码建议，支持多种编程语言。该工具具备精准的上下文分析能力，适用于面试准备、编程学习及算法练习等场景，同时支持本地部署以保障隐私和性能。

AI项目与工具 2025年06月12日 22 点赞 0 评论 588 浏览

Video2PPT

一个开源、免费的可以将任意视频智能转换为精美PPT的工具，它支持多种视频来源，包括本地视频文件、在线视频链接（如 YouTube、Bilibili 等），还支持实时录屏。

PPT资源 2025年06月05日 94 点赞 0 评论 579 浏览

BLIP3

BLIP3-o是Salesforce Research等机构推出的多模态AI模型，结合自回归与扩散模型优势，实现高效图像理解和生成。基于CLIP语义特征，支持文本与图像间的双向转换及图像编辑。采用顺序预训练策略，提升模型性能。完全开源，适用于创意设计、视觉问答、艺术生成等多种场景。

AI项目与工具 2025年06月11日 12 点赞 0 评论 573 浏览

Oneimg

文字转图片应用，无需拖拽排版，直接输入内容，一键导出长图。

Ai图片处理 2025年06月05日 17 点赞 0 评论 567 浏览

RAG Logger

RAG Logger 是一款专为检索增强生成（RAG）应用设计的开源日志记录工具，支持查询跟踪、检索结果记录、LLM 交互记录及性能监控等功能。其核心特性包括结构化 JSON 日志存储、每日日志组织、事件驱动架构和灵活配置选项。RAG Logger 能够帮助开发者有效监控和优化 RAG 管道的运行效率，广泛适用于搜索引擎优化、智能问答系统、内容推荐系统、NLP 研究及教育辅助工具等领域。

AI项目与工具 2025年06月12日 24 点赞 0 评论 557 浏览

PaintsUndo

PaintsUndo是一款AI驱动的绘画过程生成工具，适合数字艺术创作者和绘画爱好者。用户只需提供一张静态图像，PaintsUndo便能自动生成该图像的绘画全过

Ai绘画生成 2025年06月05日 48 点赞 0 评论 554 浏览

WhisperChain

WhisperChain 是一款开源语音识别工具，支持实时语音转文本并提供文本优化功能，可去除填充词、优化语法。用户可通过全局热键快速启动语音输入，处理结果自动复制到剪贴板。支持 Streamlit 界面与 FastAPI 架构，适用于会议记录、写作辅助等场景。

AI项目与工具 2025年06月12日 57 点赞 0 评论 553 浏览

VideoTuna

VideoTuna是一款基于AI的开源视频生成工具，支持文本到视频、图像到视频以及文本到图像的转换。它提供预训练、微调和后训练对齐等功能，兼容U-Net和DiT架构，并计划引入3D视频生成能力。VideoTuna旨在简化视频内容创作流程，提升生成质量与可控性，适用于内容创作、电影制作、广告营销、教育培训等多个领域。

AI项目与工具 2025年06月12日 30 点赞 0 评论 550 浏览

IDIFY

IDIFY是一款开源在线证件照生成工具，借助人工智能技术实现自动抠图和标准化处理。支持本地图像处理、多平台兼容及多样化编辑功能，适用于个人、教育机构、企业和政府部门等场景，确保用户数据安全且操作便捷。

AI项目与工具 2025年06月12日 44 点赞 0 评论 550 浏览

开源工具

首页

开源工具

列表

默认

浏览次数

发布日期