学习 - 智狐AI导航

DeepTutor

DeepTutor 是一款基于人工智能的智能辅导系统，支持文本、图表、公式等多种内容的深度理解与解析。用户可上传 PDF 文档并选择不同模式进行提问，系统提供上下文相关的详细解答，并具备视觉内容解读、学习进度跟踪等功能。适用于学生学习、文献分析、知识图谱构建等场景，支持多语言界面，提升学习与研究效率。

AI项目与工具 2025年06月12日 81 点赞 0 评论 836 浏览

AVD2

AVD2是由多所高校联合开发的自动驾驶事故视频理解框架，通过生成高质量事故视频并结合自然语言描述与推理，提升对复杂事故场景的理解能力。其功能涵盖事故视频生成、原因分析、预防建议及数据集增强，支持自动驾驶系统的安全优化与研究。基于先进模型如Open-Sora 1.2和ADAPT，AVD2在多项评估中表现优异，为自动驾驶安全提供了重要技术支撑。

AI项目与工具 2025年06月12日 62 点赞 0 评论 781 浏览

Chat2SVG

Chat2SVG 是一种基于大语言模型和图像扩散模型的文本到 SVG 生成工具，能够自动创建高质量矢量图形。通过多阶段处理流程，包括模板生成、细节增强和形状优化，确保图形在视觉质量和语义对齐方面达到较高标准。支持自然语言指令编辑，适用于设计原型、图标创作、教育演示及艺术创作等多种场景。

AI项目与工具 2025年06月12日 74 点赞 0 评论 684 浏览

Granite 3.2

Granite 3.2是IBM推出的开源多模态AI模型系列，具备强大的推理、视觉理解和预测能力。其核心功能包括链式推理、多模态融合、稀疏嵌入和时间序列预测，适用于复杂任务自动化、文档理解、安全监控等领域。Granite 3.2通过优化资源利用和安全性设计，提升了模型性能与实用性。

AI项目与工具 2025年06月12日 68 点赞 0 评论 774 浏览

TicVoice 7.0

TicVoice 7.0 是一款基于 Spark-TTS 的语音合成引擎，采用 BiCodec 技术实现音色与语义的精准控制，支持 3 秒语音克隆、多角色、多情绪表达及中英切换，语音自然流畅，接近广播级水平，适用于智能客服、有声书、影视配音等场景。

AI项目与工具 2025年06月12日 29 点赞 0 评论 558 浏览

Duck.ai

Duck.ai 是一款由 DuckDuckGo 提供的隐私保护型 AI 聊天工具，支持多模型切换并提供匿名访问。用户无需注册即可使用，聊天内容不被用于模型训练，同时支持本地存储对话历史，提升使用便捷性与数据安全性。

AI项目与工具 2025年06月12日 38 点赞 0 评论 784 浏览

Character

Character-3 是 Hedra Studio 推出的全模态 AI 视频生成工具，支持图像、文本和音频输入，生成高质量动态视频。具备全身动作捕捉、情感控制、精准对口型等功能，适用于创意视频、虚拟形象、教育、营销等多个场景。采用多模态融合与先进 AI 技术，提升视频自然度与连贯性，提高内容创作效率。

AI项目与工具 2025年06月12日 66 点赞 0 评论 533 浏览

AppAgentX

AppAgentX是西湖大学开发的智能GUI代理框架，通过记忆和进化机制优化手机交互效率。它能自动归纳高效操作模式，减少重复计算，支持跨应用复杂任务。基于视觉识别，无需API即可通用操作，适用于自动化任务、智能助手、企业流程等领域。在多项测试中表现优异，为智能代理技术提供新思路。

AI项目与工具 2025年06月12日 28 点赞 0 评论 613 浏览

GO

GO-1是智元机器人推出的首个通用具身基座模型，采用ViLLA架构，结合多模态大模型与混合专家系统，具备场景感知、动作理解和精细执行能力。支持小样本快速泛化、跨本体部署与持续进化，广泛应用于零售、制造、家庭及科研等领域，推动具身智能技术发展。

AI项目与工具 2025年06月12日 74 点赞 0 评论 591 浏览

Gemini Embedding

Gemini Embedding 是 Google 推出的文本嵌入模型，能将文本转化为高维向量以捕捉语义和上下文信息。支持超过 100 种语言，具备高效的检索、分类、聚类和相似性检测能力。其支持长文本输入和灵活的维度调整，适用于多场景应用，如智能搜索、数据分析和自然语言处理。模型基于 Gemini 训练，具有优秀的语言理解能力。

AI项目与工具 2025年06月12日 17 点赞 0 评论 573 浏览

学习

首页

学习

列表

默认

浏览次数

发布日期