AI

VITA

VITA-Audio 是一款开源的端到端多模态语音大模型,具备低延迟、高推理效率和多模态交互能力。其核心创新包括轻量级 MCTP 模块和四阶段渐进式训练策略,使模型在语音识别、文本转语音和口语问答等任务中表现优异。支持实时对话、智能客服、教育辅助、医疗辅助及内容创作等多种应用场景,适用于各类语音交互系统。

Multi

Multi-Speaker 是 AudioShake 推出的高分辨率多说话人分离工具,支持将音频中不同说话人的语音精准分离至独立轨道,适用于广播级音频处理。它具备高保真音频处理能力,支持高采样率,能处理长达数小时的录音,在复杂场景下仍能保持稳定效果。广泛应用于影视、播客、无障碍服务及内容创作等领域,提升音频编辑效率与质量。

Picarta

Picarta是一款基于AI技术的图像位置识别工具,可自动分析照片并提供地理信息,支持旅行照片整理、摄影管理、新闻验证和历史研究等功能。平台注重隐私保护,提供多样化的服务模式,满足个人和企业用户的需求。

Supademo

Supademo是一款基于AI技术的交互式产品演示平台,支持屏幕录制、AI语音旁白、多语言翻译及个性化编辑。用户可创建高质量、高转化率的演示内容,并通过多渠道分享。平台提供丰富的分析功能,适用于销售、营销、客户支持和产品培训等多个场景。其灵活的定价策略满足不同规模企业的需求。

Kotae

Kotae是一款专为中小企业设计的智能聊天机器人平台,基于ChatGPT技术开发,支持80多种语言,可快速自然地响应客户咨询。用户无需编程即可在5分钟内完成配置和部署,通过分析网站内容、培训材料和FAQ生成准确回答。支持品牌定制和实时对话管理,适用于自动化客户服务、提升满意度及收集客户反馈等场景。

Filmfotos

Filmfotos是一款基于Flux架构的LoRA模型,专注于模拟和还原胶片质感。其低饱和度的日系胶片风格适用于多种场景,包括人物、风景、静物、食物和动物等,能够提升照片的艺术感和复古氛围。Filmfotos利用LoRA技术、深度学习和图像处理算法,实现高精度的图像生成,适用于摄影爱好者、专业人士及创意工作者。

百雀AI外贸员

一款专为外贸企业量身定制的AI工具,具备24小时不间断工作能力,精通多国语言。它能自主识别竞争对手的采购商,并通过邮件、WhatsApp等多种渠道主动联系对方。

TransPixar

TransPixar是由多所高校及研究机构联合开发的开源文本到视频生成工具,基于扩散变换器(DiT)架构,支持生成包含透明度信息的RGBA视频。该技术通过alpha通道生成、LoRA微调和注意力机制优化,实现高质量、多样化的视频内容生成。适用于影视特效、广告制作、教育演示及虚拟现实等多个领域,为视觉内容创作提供高效解决方案。

羚珑

羚珑是京东旗下的智能设计平台,由京东零售用户体验设计部自主研发。这款平台旨在解决商家及企业在运营过程中的设计效率、品质、一致性问题,提供智能设计解决方案。

PromptFolder

专为大型语言模型 (LLM)和大型模型 (LM) 以及LMOps设计的提示词优化助手,不管是文字、还是图片的提示词,都可以一键优化。