实时

LOOK

LOOK是一款面向时尚设计师的AI设计工具,通过AIGC技术实现设计概念的实时可视化。支持草图转图像、批量生产、文生图、图生图及模特试穿等功能,提高设计效率与创意表达。集成多种工具,简化设计流程,适用于教育、创意开发、产品设计等多个场景。

Open Deep Research

Open Deep Research 是一个开源 AI 智能体,支持多语言模型和 Firecrawl 数据提取,用于执行复杂的研究任务。它提供统一 API 和 Next.js 框架,具备实时数据处理、结构化信息提取及多维度分析能力,适用于文献综述、行业分析、投资研究等场景。

Hika

Hika 是一款由国内团队开发的免费 AI 知识搜索工具,通过交互式探索、可视化知识映射和多维度信息整合,帮助用户深入理解复杂主题。支持多语言、实时数据更新及个性化知识图谱,适用于学术研究、信息分析和个人知识管理等场景。

Granola

Granola是一款AI驱动的会议助手工具,支持实时转录、发言者识别、笔记记录和重点标记,自动生成会议总结并支持任务管理。它可与主流会议平台集成,根据会议类型智能调整笔记模板,具备高精度语音识别能力,适用于多种会议场景,帮助用户提升会议效率与信息整理能力。

NewsBang

NewsBang是一款基于AI技术的新闻应用,提供无偏见、深度的新闻洞察。通过整合多源信息生成简洁摘要,并支持实时问答、语音播放及个性化推荐等功能,帮助用户高效获取关键信息。适用于忙碌人群、新闻爱好者及投资者等,满足多样化信息需求。

SyncAnimation

SyncAnimation是一款基于音频驱动的实时动画生成框架,能够生成与音频同步的上半身姿态和面部表情,包括嘴唇动作。采用NeRF技术,结合音频到姿态和表情的同步模块,实现实时渲染与高精度动画生成。支持多种推理方式,具备高同步性和自然表现力,适用于虚拟主播、视频会议、动画制作、游戏开发及智能客服等多个领域。

SpeechGPT 2.0

SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队开发的拟人化实时交互系统,基于大量中文语音数据训练,支持低延迟、高自然度的语音与文本交互。具备情感控制、实时打断、多风格语音生成等功能,适用于智能助手、内容创作及无障碍通信等场景,技术上融合了语音-文本联合建模与多阶段训练策略,提升语音表现力与智能化水平。

Whisper Input

Whisper Input 是一款开源语音输入工具,基于 Python 和 OpenAI Whisper 模型开发,支持多语言语音识别与实时转录。用户可通过快捷键操作录音并生成文本,具备翻译、自动标点、高效处理及本地运行等功能。适用于会议记录、教育、智能交互及媒体制作等多种场景。

Sonar

Sonar是Perplexity推出的AI搜索API,支持实时联网搜索、结构化输出及定制化数据源,适用于多种企业级应用场景。其核心优势在于高准确性和上下文处理能力,提供基础版和高级版服务,满足不同复杂度的搜索需求,广泛应用于IT、财务、客户服务等领域。

万物追踪

万物追踪是一款基于生成式AI技术的信息推送工具,能从全球数据中精准捕捉用户关心的事件,如政策变化、股票动态、体育赛事等,并实时生成定制内容推送给用户。用户可自由订阅感兴趣的主题,系统自动持续追踪并推送更新。适用于财经、科技、体育、教育和娱乐等多个领域,提供高效、个性化的信息获取体验。