实时

猫眼专业版

中国猫眼电影推出的一个电影行业数据服务平台。它为用户提供了最新的电影票房信息、电影排片情况、观众评分和评论等在内的一系列专业电影行业数据分析详细数据。

Parakeet TDT 0.6B

Parakeet TDT 0.6B 是一款由英伟达开发的开源自动语音识别(ASR)模型,采用 FastConformer 和 TDT 架构,具备高速转录、高精度识别、歌词转录、文本格式化等功能。模型在 Hugging Face Open ASR Leaderboard 中表现优异,实时因子高达 3386,适用于会议记录、法律医疗、字幕生成及音乐索引等多种场景。

Lemon Slice Live

Lemon Slice Live 是一款基于扩散变换器模型(DiT)的实时视频聊天工具,可将图片转化为可互动的动画角色,支持多语言和实时对话。通过优化模型提升流畅度与响应速度,适用于娱乐、教育、营销等多种场景,结合语音识别、文本生成等技术,提供完整的交互体验。

ResolveAI

ResolveAI是一款企业级AI聊天机器人平台,支持用户利用自有数据创建个性化的AI助手。该平台无需编程技能即可使用,支持快速整合网站和文档等资源。它提供全天候客户服务、多语言支持,并通过多种渠道(如网站小部件、WhatsApp等)进行集成。ResolveAI旨在提升客户服务质量和销售流程效率,优化内部知识管理和市场调研,帮助企业提高运营效率和客户满意度。

TECHSPECS

TechSpecs Ray是一款由AI驱动的媒体播放器,主要功能包括实时多语言字幕生成与翻译、智能媒体搜索及分类、主流流媒体平台集成等。它支持上千种媒体格式,可跨多平台运行,致力于消除语言壁垒,提升全球用户的媒体访问体验。

ZenCtrl

ZenCtrl 是一款基于 AI 技术的图像生成工具,可从单张图像生成多视角、多样化场景,支持实时元素再生。具备高精度控制功能,适用于产品摄影、虚拟试穿、人物肖像控制、插画等场景。提供预处理与后处理能力,提升图像质量,架构模块化,适应多种创意需求。

CAT4D

CAT4D是一种由Google DeepMind、哥伦比亚大学及加州大学圣地亚哥分校共同开发的工具,它利用多视图视频扩散模型,从单目视频中生成动态3D(4D)场景表示。该工具可以合成新视图、重建动态3D模型,并支持独立控制相机视点和场景动态,适用于电影制作、游戏开发、虚拟现实等多种领域。

Open Deep Research

Open Deep Research 是一个开源 AI 智能体,支持多语言模型和 Firecrawl 数据提取,用于执行复杂的研究任务。它提供统一 API 和 Next.js 框架,具备实时数据处理、结构化信息提取及多维度分析能力,适用于文献综述、行业分析、投资研究等场景。

Grimo

Grimo 是一款集成多种 AI 技术的写作辅助工具,支持语音输入、提示管理、实时网络搜索和团队协作等功能,适用于作家、内容创作者及专业人员。其提供多个版本以满足不同需求,具备高度定制化和智能化特性,有效提升写作效率和内容质量。

Westlake

Westlake-Omni是西湖心辰推出的一款开源中文情感端到端语音交互大模型,融合了语音识别、自然语言处理、情感理解和对话管理等功能,具备实时性和端到端交互特性。它通过深度学习技术和离散表示法,实现从语音输入到语音输出的全流程自动化,生成自然流畅的语音回应,并广泛应用于智能助手、客户服务、教育辅助、健康医疗等领域。