实时 - 智狐AI导航

HRAvatar

HRAvatar是由清华大学联合IDEA团队推出的单目视频重建技术，能够从普通单目视频中生成高质量、可重光照的3D头像。它采用可学习的形变基和线性蒙皮技术，结合精确的表情编码器和物理渲染模型，实现高精度重建和实时渲染（约155 FPS）。支持材质编辑、跨视角渲染和动画化，适用于数字人、虚拟主播、AR/VR、游戏开发和影视制作等领域。

AI项目与工具 2025年06月11日 43 点赞 0 评论 849 浏览

Google Beam

Google Beam是谷歌推出的AI驱动的3D视频通信平台，能够将2D视频流转换为逼真的3D效果，提升远程通话的自然度和直观性。用户可实现眼神交流和细微表情识别，增强沟通效果。支持实时语音翻译，打破语言障碍，并基于Google Cloud提供企业级可靠性，适用于远程协作、教育、医疗、国际合作和个人社交等多种场景。

AI项目与工具 2025年06月11日 76 点赞 0 评论 548 浏览

DeepWiki MCP是Cognition Labs推出的远程服务器，基于开放标准的Model Context Protocol（MCP），为AI应用提供访问和搜索GitHub代码库文档的能力。它包含三个主要工具：获取文档主题列表、查看文档内容以及针对仓库提问获得AI回答。支持SSE和Streamable HTTP传输协议，确保信息实时性和准确性，适用于快速查询文档、技术问题解答、代码库结构概览

AI项目与工具 2025年06月11日 90 点赞 0 评论 828 浏览

Macaly

Macaly是一款创新的无代码应用开发工具，通过自然语言处理技术，让用户能够将想法转化为可运行的应用程序。用户可通过文字描述或语音指令参与应用创建和修改，并实时看到视觉效果反馈，提升开发效率和协作体验。Macaly与GitHub深度集成，支持代码管理和协作，适用于个人创业者、小型团队、市场营销人员和企业内部项目，支持多环境部署，增强现有项目或从零开始构建。

AI项目与工具 2025年06月11日 16 点赞 0 评论 803 浏览

Company Research Agent

Company Research Agent是一款基于多智能体框架的公司研究工具，支持一键生成全面的公司研究报告。它从公司网站、新闻文章、财务报告和行业分析等多源数据中收集信息，并利用Gemini 2.0 Flash和GPT-4.1-mini模型进行高语境研究综合与精确报告格式化。该工具具备AI内容过滤功能，确保信息的相关性和准确性，并通过WebSocket实现实时进度更新，提升研究效率和用户体验

AI项目与工具 2025年06月11日 78 点赞 0 评论 864 浏览

Airtop

Airtop是一款AI浏览器自动化工具，基于低成本可扩展的云浏览器，让用户能轻松抓取和控制任何网站。其AI Agent能像人类一样登录浏览网页，支持OAuth、2FA和验证码解决。用户可通过自然语言指令引导浏览器完成任务，无需复杂脚本。Airtop提供实时人工干预功能，适用于数据抓取、自动化测试、内容生成、自动化营销等多种场景，帮助用户高效完成自动化任务。

AI项目与工具 2025年06月11日 67 点赞 0 评论 727 浏览

EVI 3

EVI 3是Hume AI推出的全新语音语言模型，能够同时处理文本和语音标记，实现自然、富有表现力的语音交互。它支持高度个性化，根据用户提示生成任何声音和个性，并实时调节情感和说话风格。在与GPT-4o等模型的对比中，EVI 3在情感理解、表现力、自然度和响应速度等方面表现更优，具备低延迟响应能力，可在300毫秒内生成语音回答。EVI 3适用于智能客服、语音助手、教育辅导、情感支持和内容创作等多个

AI项目与工具 2025年06月11日 45 点赞 0 评论 768 浏览

Olovka AI

Olovka AI是一款专为学生设计的AI学习辅助平台，旨在帮助学生更高效地撰写学术论文并提升学习效果。其核心功能包括AI写作辅助、智能写作建议、互动式学习以及实时反馈与协作。Olovka AI能够根据学生的学术水平和论文类型提供精准的写作建议，并将论文转化为互动式测验以巩固知识。此外，它还支持研究与写作一体化，帮助学生克服写作障碍，提高写作效率和质量。

AI项目与工具 2025年06月11日 26 点赞 0 评论 657 浏览

SignGemma

SignGemma是由谷歌DeepMind团队开发的全球最强大的手语翻译AI模型，专注于将美国手语（ASL）实时翻译成英语文本。通过多模态训练方法，结合视觉和文本数据，实现高准确率和低延迟的翻译，响应时间低于0.5秒。支持端侧部署，保护用户隐私，适用于教育、医疗和公共服务等场景。

AI项目与工具 2025年06月11日 24 点赞 0 评论 713 浏览

TEN VAD

TEN VAD是一款高性能的实时语音活动检测系统，专为企业级应用设计。它基于深度学习技术，能够精确区分语音和非语音信号，具有低延迟、轻量级和高精度的特点。支持多种平台和编程接口，适用于智能助手、客服机器人等场景，帮助构建更高效、更智能的对话系统。

AI项目与工具 2025年06月11日 47 点赞 0 评论 677 浏览

实时

首页

实时

列表

默认

浏览次数

发布日期