实时

Vozard

一款由iMobie开发的AI驱动的实时语音变声软件,提供超过100种逼真的语音效果。用户可以在在线聊天、游戏等场景中使用。

Huru

Huru是一款基于AI技术的面试准备工具,通过模拟真实面试场景,提供即时反馈与个性化建议,覆盖多语言及多行业职位需求,帮助用户有效提升面试技能。支持Web、iOS和Android设备,适用于求职者、职业培训机构及招聘公司,助力求职者获取理想工作。

Claude Dev

Claude Dev 是一款基于 Claude 3.5 Sonnet 模型的 AI 编程助手,专为 Visual Studio Code 设计。它支持自动化处理复杂编程任务,包括文件操作、代码生成、项目初始化等,并通过实时监控资源消耗和智能权限管理保障安全性。此外,其互动式开发辅助功能和直观界面显著提升了代码编写与项目管理的效率,适用于教育、游戏开发及专业编程等多个领域。

Deepfake Defenders

Deepfake Defenders 是一个由中国科学院自动化研究所的 VisionRush 团队开发的开源 AI 模型,主要用于检测和防御 Deepfake 技术生成的伪造图像和视频。它通过分析媒体内容中的细微像素变化来识别伪造内容,并提供像素级分析、实时检测等功能。该模型采用卷积神经网络(CNN)、生成对抗网络(GAN)等技术,支持多模态分析,具备开源协作特性,广泛应用于社交媒体监控、新闻验证

翻译狗

免费在线文档翻译_PDF/Word/Excel/PPT文件全文翻译-翻译狗,翻译狗的“神经网络智能翻译系统NITS”结合强大的集群服务器运算能力及专业语料术语训练,致力于打造智能翻译第一品牌。

Open Deep Research

Open Deep Research 是一个开源 AI 智能体,支持多语言模型和 Firecrawl 数据提取,用于执行复杂的研究任务。它提供统一 API 和 Next.js 框架,具备实时数据处理、结构化信息提取及多维度分析能力,适用于文献综述、行业分析、投资研究等场景。

Pika Twists

Pika Twists 是 Pika Labs 推出的 AI 视频编辑工具,支持用户精准操控视频中的主体动作和场景,实现创意效果。通过简单描述即可完成角色或物体的动作修改,同时保持画面自然。功能包括主体操控、元素调整、风格化处理、逼真渲染等,适用于短视频、广告、教学等多种场景,提高视频创作效率和表现力。

Moonshine

Moonshine是一款专为资源受限设备设计的高效语音识别模型,支持实时语音转文本,具有低延迟、高准确率的特点。它基于编码器-解码器架构和旋转位置嵌入技术,适应不同长度的音频输入,计算需求随音频长度变化而调整,适合边缘设备部署。主要应用于会议转录、语音助手、听力辅助及多语言翻译等领域。

Fish Speech 1.5

Fish Speech 1.5是一款基于深度学习的文本转语音(TTS)工具,支持多语言文本输入,通过Transformer、VITS、VQVAE和GPT等技术实现高质量语音合成。它具备零样本和少样本语音合成能力,延迟时间短,无需依赖音素,泛化性强,且支持本地化部署。Fish Speech 1.5可应用于有声读物、辅助技术、语言学习及客户服务等多个领域。

SignGemma

SignGemma是由谷歌DeepMind团队开发的全球最强大的手语翻译AI模型,专注于将美国手语(ASL)实时翻译成英语文本。通过多模态训练方法,结合视觉和文本数据,实现高准确率和低延迟的翻译,响应时间低于0.5秒。支持端侧部署,保护用户隐私,适用于教育、医疗和公共服务等场景。