支持 - 智狐AI导航

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库，具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别，适用于语音助手、会议记录、实时字幕等场景，提供灵活的音频输入与预处理机制，便于开发者快速集成和扩展。

AI项目与工具 2025年06月12日 97 点赞 0 评论 856 浏览

Weebo

Weebo是一款基于AI技术的实时语音交互工具，支持语音识别与生成，实现自然流畅的语音对话。具备多语言支持和实时响应能力，适用于个人助理、娱乐互动和教育辅导等场景。技术上融合了Whisper Small、Llama 3.2等模型，提供便捷高效的语音交互体验。

AI项目与工具 2025年06月12日 72 点赞 0 评论 610 浏览

T2A

T2A-01-HD是一款支持声音克隆与多语言合成的AI语音模型，可精准还原原声特征与情感表达。具备智能情感系统、多语言支持及高级参数控制功能，适用于有声读物、影视配音、教育、语言学习等多种场景，提供高质量、个性化的语音输出。

AI项目与工具 2025年06月12日 46 点赞 0 评论 486 浏览

Zerox

Zerox是一款基于GPT-4o-mini模型的开源OCR工具，支持多种文件格式，具备零样本识别能力，可高效处理扫描文档和复杂布局内容。其输出为Markdown格式，便于编辑与使用，同时提供API接口，适用于企业文档管理、学术研究、法律金融等多个场景，显著提升文档处理效率和准确性。

AI项目与工具 2025年06月12日 20 点赞 0 评论 535 浏览

NovaMSS

NovaMSS是一款基于AI技术的音乐源分离工具，可精准分离人声、伴奏、贝斯、鼓点等音轨。支持多种音频格式和批量处理，操作简便，适用于音乐制作、音频修复及教学资源开发等多种场景。提供普通与专业模型，满足不同用户的音质需求，适合创作者和音乐爱好者使用。

AI项目与工具 2025年06月12日 90 点赞 0 评论 689 浏览

彩漩

彩漩是一款基于AI技术的PPT制作平台，支持一键生成高质量演示文稿，提供智能配图、内容优化及多人协作功能。平台具备安全分享机制，支持多种格式转换和数据追踪，适用于教育、企业培训及市场营销等多种场景，兼容多端使用，提升内容创作与传播效率。

AI项目与工具 2025年06月12日 93 点赞 0 评论 601 浏览

Textoon

Textoon是阿里巴巴通义实验室推出的AI工具，可根据文本生成Live2D格式的2D卡通角色，具备文本解析、外观生成、动画增强等功能。支持多语言输入，适用于游戏、影视、教育等多个场景，提升角色设计效率与表现力。

AI项目与工具 2025年06月12日 19 点赞 0 评论 769 浏览

WebWalker

WebWalker是阿里巴巴研发的AI工具，用于评估和优化大型语言模型在网页浏览任务中的表现。它通过多智能体框架、垂直探索策略及WebWalkerQA数据集，提升模型处理长上下文和多源信息的能力。支持多语言、多领域和多难度任务，适用于信息检索、数据分析和内容监控等场景，具备良好的适应性和可扩展性。

AI项目与工具 2025年06月12日 22 点赞 0 评论 513 浏览

PaywallBuster

PaywallBuster是一款免费的在线工具，用于绕过新闻和学术内容的付费墙，帮助用户无需订阅即可访问完整信息。它集成了多种第三方绕过技术，如 Archive.is 和 Google 缓存，支持多工具并行尝试，提升访问成功率。操作简单，支持跨设备使用，且注重用户隐私与合法性。适用于学生、研究人员、记者等需要广泛获取信息的群体。

AI项目与工具 2025年06月12日 67 点赞 0 评论 2133 浏览

EmoLLM

EmoLLM 是一款基于多模态技术的心理健康支持工具，能通过文本、图像和视频分析用户情绪，提供情绪识别、心理辅导和情感支持。其核心包括多视角视觉投影、情感引导提示和指令微调技术，支持个性化辅导、角色扮演及多轮对话，适用于心理健康评估与干预场景。

AI项目与工具 2025年06月12日 60 点赞 0 评论 481 浏览

支持

首页

支持

列表

默认

浏览次数

发布日期