学习 - 智狐AI导航

ToddlerBot

ToddlerBot是由斯坦福大学开发的开源人形机器人平台，具备30个主动自由度，采用Dynamixel电机，总成本低于6000美元。它支持模拟到现实的零样本迁移，可通过远程操作采集高质量数据，适用于运动控制、强化学习及多机器人协作等研究场景。其高保真数字孪生技术与易维护设计，使其成为科研和教育领域的理想工具。

AI项目与工具 2025年06月12日 15 点赞 0 评论 704 浏览

Phantom

Phantom是由字节跳动研发的视频生成框架，支持从参考图像中提取主体并生成符合文本描述的视频内容。它采用跨模态对齐技术，结合文本和图像提示，实现高质量、主体一致的视频生成。支持多主体交互、身份保留等功能，适用于虚拟试穿、数字人生成、广告制作等多种场景。模型基于文本-图像-视频三元组数据训练，具备强大的跨模态理解和生成能力。

AI项目与工具 2025年06月12日 72 点赞 0 评论 679 浏览

快对

快对是一款基于AI技术的教育辅助工具，覆盖小学至大学全学科，提供作业检查、错题管理、英语翻译、视频讲解及学习资料等功能。通过智能识别与解析，帮助用户高效解决学习难题，优化学习体验。支持错题分类整理、资料收藏与分享，适用于自主学习、家长辅导及备考复习等多种场景。

AI项目与工具 2025年06月12日 44 点赞 0 评论 554 浏览

Magma

Magma是微软研究院开发的多模态AI基础模型，具备理解与执行多模态任务的能力，覆盖数字与物理环境。它融合语言、空间与时间智能，支持从UI导航到机器人操作的复杂任务。基于大规模视觉-语言和动作数据预训练，Magma在零样本和微调设置下表现优异，适用于网页操作、机器人控制、视频理解及智能助手等多个领域。

AI项目与工具 2025年06月12日 100 点赞 0 评论 567 浏览

流畅阅读

FluentRead 是一款开源的浏览器翻译插件，基于AI技术提供精准、自然的翻译服务。支持多种翻译引擎和双语对照显示，具备隐私保护和高度定制化功能。适用于学术研究、工作场景、语言学习及日常阅读，兼容主流浏览器，保障用户数据安全。其开源特性增强了透明度与灵活性，满足多样化翻译需求。

AI项目与工具 2025年06月12日 68 点赞 0 评论 856 浏览

HealthGPT

HealthGPT是由多家高校与企业联合开发的医学视觉语言模型，支持医学图像分析、视觉问答、文本生成及多模态融合等任务。其核心技术包括异构低秩适应（H-LoRA）、分层视觉感知（HVP）和三阶段学习策略（TLS），可高效处理复杂医疗数据。模型适用于医学诊断、教育、研究及健康管理等多个场景，具有良好的适应性和实用性。

AI项目与工具 2025年06月12日 80 点赞 0 评论 818 浏览

PaliGemma 2 mix

PaliGemma 2 Mix 是谷歌 DeepMind 推出的多任务视觉语言模型，支持图像描述、目标检测、OCR、文档理解等功能。模型提供多种参数规模和分辨率选项，适用于不同场景。其基于开源框架开发，易于扩展，可通过简单提示切换任务。适用于科学问题解答、文档分析、电商内容生成等多个领域。

AI项目与工具 2025年06月12日 23 点赞 0 评论 582 浏览

BioEmu

BioEmu是由微软研究院开发的生成式深度学习系统，用于高效模拟蛋白质的动态结构和平衡态构象。它能在单个GPU上每小时生成数千种蛋白质结构样本，误差控制在1 kcal/mol以内，支持功能构象变化模拟和热力学性质预测。该工具适用于科学研究、药物开发、个性化医疗等多个领域，显著提升蛋白质结构模拟的效率和精度，为生物医学研究提供强大计算支持。

AI项目与工具 2025年06月12日 76 点赞 0 评论 522 浏览

OSUM

OSUM是一款由西北工业大学研发的开源语音理解模型，结合Whisper编码器与Qwen2 LLM，支持语音识别、情感分析、说话者性别分类等多种任务。采用“ASR+X”多任务训练策略，提升模型泛化能力和稳定性。基于约5万小时语音数据训练，性能优异，适用于智能客服、教育、心理健康监测等多个领域。

AI项目与工具 2025年06月12日 46 点赞 0 评论 814 浏览

Signs

Signs是由英伟达推出的AI手语学习平台，通过实时手势识别与3D虚拟教学，帮助用户精准掌握美式手语。平台支持用户上传视频，丰富学习资源，具备互动性与个性化反馈，适用于初学者及进阶学习者，同时为无障碍技术开发提供数据支持。

AI项目与工具 2025年06月12日 69 点赞 0 评论 814 浏览

学习

首页

学习

列表

默认

浏览次数

发布日期