实时 - 智狐AI导航

Avatar IV

Avatar IV 是 HeyGen 推出的 AI 数字人模型，支持用户通过上传照片和语音快速生成逼真视频。该工具基于音频驱动的表情引擎，能精准捕捉语音中的语调、节奏和情感，生成自然流畅的面部表情和动作。操作简单，无需专业技能，适用于多种角色形象，涵盖社交媒体、企业营销、在线教育等多个领域，是高效内容创作的理想选择。

AI项目与工具 2025年06月11日 45 点赞 0 评论 790 浏览

Offer蛙

Offer蛙是一款AI驱动的面试辅助工具，支持实时语音识别与答案生成，结合高频题库和简历信息，为用户提供专业级回答。具备代码题优化、多平台适配及隐私保护功能，适用于技术面试和线上面试场景，提升面试表现与专业形象。

AI项目与工具 2025年06月11日 31 点赞 0 评论 782 浏览

Multiverse

Multiverse是由Enigma Labs开发的全球首个基于AI生成的多人游戏模型，支持实时交互与动态世界生成，确保玩家视角一致。其核心技术包括联合动作向量和双视角通道堆叠，有效解决多人游戏中的同步难题。模型训练成本低，可在普通PC上运行，且项目全面开源，适用于多人游戏开发、VR/AR、AI训练、教育等多个领域。

AI项目与工具 2025年06月11日 56 点赞 0 评论 818 浏览

VITA

VITA-Audio 是一款开源的端到端多模态语音大模型，具备低延迟、高推理效率和多模态交互能力。其核心创新包括轻量级 MCTP 模块和四阶段渐进式训练策略，使模型在语音识别、文本转语音和口语问答等任务中表现优异。支持实时对话、智能客服、教育辅助、医疗辅助及内容创作等多种应用场景，适用于各类语音交互系统。

AI项目与工具 2025年06月11日 19 点赞 0 评论 916 浏览

Parakeet TDT 0.6B

Parakeet TDT 0.6B 是一款由英伟达开发的开源自动语音识别（ASR）模型，采用 FastConformer 和 TDT 架构，具备高速转录、高精度识别、歌词转录、文本格式化等功能。模型在 Hugging Face Open ASR Leaderboard 中表现优异，实时因子高达 3386，适用于会议记录、法律医疗、字幕生成及音乐索引等多种场景。

AI项目与工具 2025年06月11日 36 点赞 0 评论 700 浏览

ZenCtrl

ZenCtrl 是一款基于 AI 技术的图像生成工具，可从单张图像生成多视角、多样化场景，支持实时元素再生。具备高精度控制功能，适用于产品摄影、虚拟试穿、人物肖像控制、插画等场景。提供预处理与后处理能力，提升图像质量，架构模块化，适应多种创意需求。

AI项目与工具 2025年06月11日 43 点赞 0 评论 699 浏览

Hedy AI

Hedy AI 是一款提升会议与对话效率的AI工具，支持19种语言，提供实时转录、智能总结、个性化提示及上下文敏感的见解。适用于商务会议、面试、课堂及医疗预约等场景，帮助用户更好地理解信息、提出有效问题并提升参与度。支持跨设备使用，注重隐私保护，适合多语言环境下的高效沟通。

AI项目与工具 2025年06月11日 72 点赞 0 评论 513 浏览

StreamBridge

StreamBridge是一款由苹果与复旦大学联合开发的端侧视频大语言模型框架，支持实时视频流的理解与交互。通过内存缓冲区和轮次衰减压缩策略，实现长上下文处理与主动响应。项目配套发布Stream-IT数据集，包含60万样本，适用于多种视频理解任务，展现出在视频交互、自动驾驶、智能监控等领域的应用前景。

AI项目与工具 2025年06月11日 41 点赞 0 评论 739 浏览

AI Meeting Notes

AI Meeting Notes 是 Notion 提供的智能会议记录工具，支持实时转录、自动生成会议摘要、提取行动项及团队协作。用户可通过快捷键或日历集成快速启动，支持多设备同步和多语言使用，提升会议管理效率与信息整理能力。

AI项目与工具 2025年06月11日 21 点赞 0 评论 884 浏览

Nooka

Nooka是一款基于AI技术的听书应用，提供全球非虚构类书籍的20分钟音频摘要，适合碎片化时间学习。用户可随时提问并获得AI即时回答，实现深度互动。应用支持多语言字幕、音频剪辑分享及社区交流，适用于通勤、运动、家务等多种场景，提升学习效率与趣味性。

AI项目与工具 2025年06月11日 16 点赞 0 评论 490 浏览

实时

首页

实时

列表

默认

浏览次数

发布日期