AI

EVI 3

EVI 3是Hume AI推出的全新语音语言模型,能够同时处理文本和语音标记,实现自然、富有表现力的语音交互。它支持高度个性化,根据用户提示生成任何声音和个性,并实时调节情感和说话风格。在与GPT-4o等模型的对比中,EVI 3在情感理解、表现力、自然度和响应速度等方面表现更优,具备低延迟响应能力,可在300毫秒内生成语音回答。EVI 3适用于智能客服、语音助手、教育辅导、情感支持和内容创作等多个

Mobvoi MCP Server

Mobvoi MCP Server是出门问问推出的一站式AI工具,集成语音生成、声音克隆、图片驱动数字人、视频配音等多模态能力。用户可通过简单输入文本调用功能,支持多客户端和多场景应用。基于标准化接口和开源生态,提供高效、灵活的数字生产力解决方案,适用于内容创作、虚拟主播、在线教育等多个领域。

OmniSync

OmniSync是由中国人民大学、快手科技和清华大学联合开发的通用对口型框架,基于扩散变换器实现视频中人物口型与语音的精准同步。它采用无掩码训练范式,直接编辑视频帧,支持无限时长推理,保持自然面部动态和身份一致性。通过渐进噪声初始化和动态时空分类器自由引导(DS-CFG)机制,提升音频条件下的口型同步效果。OmniSync适用于影视配音、虚拟现实、AI内容生成等多个场景。

FLUX.1 Kontext

FLUX.1 Kontext是由Black Forest Labs推出的图像生成与编辑模型,支持上下文感知的图像处理。它基于文本和图像提示进行生成与编辑,具备对象修改、风格转换、背景替换、角色一致性保持和文本编辑等功能。FLUX.1 Kontext Pro版本支持快速迭代编辑,Kontext Max版本在提示词遵循和排版生成方面表现优异,而dev开源版本适合定制化开发。

Chai

Chai是一款AI伴侣应用,提供强大的内容生成能力和独特的交互体验。用户可以与各种AI角色进行聊天,角色具有不同的性格、背景和对话风格。Chai支持用户创建自定义AI角色,个性化推荐适合的AI角色,并提供数千个预设角色。用户可主导剧情走向,探索成人向内容,享受自由度极高的互动体验。同时,Chai支持多语言交流,适用于AI陪伴、角色扮演、语言学习和情感支持等多种场景。

Olovka AI

Olovka AI是一款专为学生设计的AI学习辅助平台,旨在帮助学生更高效地撰写学术论文并提升学习效果。其核心功能包括AI写作辅助、智能写作建议、互动式学习以及实时反馈与协作。Olovka AI能够根据学生的学术水平和论文类型提供精准的写作建议,并将论文转化为互动式测验以巩固知识。此外,它还支持研究与写作一体化,帮助学生克服写作障碍,提高写作效率和质量。

Fish Audio

Fish Audio是一款生成式AI文本转语音(TTS)和声音克隆平台,支持多种语言和声音风格,可将文本转换为自然流畅的语音。用户可上传音频样本克隆特定人物的声音,并通过API接口集成到应用程序中。Fish Audio适用于视频制作、有声读物、语音助手、教育与培训以及娱乐创意等领域,满足个性化语音内容生成需求。

Fairies

Fairies 是一款功能强大的 AI Agent 智能体,支持 1000 多种操作,包括文件管理、代码生成、邮件发送等。用户可通过自然语言与 Fairies 交互,实现多任务执行。它注重隐私保护,采用端到端加密,所有数据处理在本地完成。Fairies 可与 Slack、Gmail、Google Drive 等应用集成,提供免费版和 Pro 版,适合个人和团队提升生产力。

SignGemma

SignGemma是由谷歌DeepMind团队开发的全球最强大的手语翻译AI模型,专注于将美国手语(ASL)实时翻译成英语文本。通过多模态训练方法,结合视觉和文本数据,实现高准确率和低延迟的翻译,响应时间低于0.5秒。支持端侧部署,保护用户隐私,适用于教育、医疗和公共服务等场景。

AltPage.ai

AltPage.ai是一款AI驱动的营销工具,能够自动生成SEO优化的对比页面,帮助用户捕获竞争对手的搜索流量。它能自动识别竞争对手,创建数据支持的比较页面,并动态更新竞品信息,确保内容始终最新。用户无需技术背景,可在短时间内部署和优化页面,适用于电商竞争、软件推广、品牌营销和市场拓展等场景。