R

Fugatto

Fugatto是一款由英伟达开发的音频合成与转换模型,利用增强型Transformer架构实现了从文本到音频的高效转化。它支持多种音频生成任务,如音乐创作、声音效果设计及语音合成,并可通过ComposableART技术实现对声音属性的精细调控。此外,Fugatto擅长生成动态变化的声音景观,广泛应用于音乐创作、声音设计及广告音频制作等领域。

Inworld

Inworld是一家生成式 AI 数字人/虚拟角色开发公司,人工智能角色就像虚拟人一样,可以说话、行动和感受情感。它们可用于游戏、娱乐和客户服务。

BGE

BGE-VL是由北京智源研究院联合高校开发的多模态向量模型,基于大规模合成数据MegaPairs训练,具备高效的多模态数据合成方法和强大的泛化能力。它支持图文检索、组合图像检索和多模态嵌入等功能,适用于智能搜索、内容推荐、图像编辑辅助等多个领域。模型在多种任务中表现优异,尤其在组合图像检索方面取得显著成果。

Google Vids

一款由谷歌在2024年推出的人工智能驱动的视频创作工具,专为职场设计,目的在于简化和加强工作环境中的视频创建和编辑流程。

Chroniclehq

Chroniclehq是一家演示工具软件开发商,平台开发了一系列用于制作PowerPoint的设计工具,提供拖放交互式的预设计模块,简化演示文稿的过程。

PromptVibes

PromptVibes是一个大量有用的chatGPT提示的集合,用户可以窃取这些提示来成为chatGPT专家。它提供了各种类别的提示,如从ChatGPT学习,有趣的提示,专家ChatGPT,生产力,编码提示...

巧闻AI

巧闻AI是基于对接原版GPT3.5-4.0的系统,使用的是原汁原味的GPT,人工智能对话,支持高级Midjourney AI 绘画,拥有四十多个应用场景,AI协作完成各种内容创作。

Ovis2

Ovis2是阿里巴巴国际团队开发的多模态大语言模型,采用结构化嵌入对齐技术提升视觉与文本的融合效果。支持视频、图像和多语言处理,强化了思维链推理和复杂场景下的OCR能力。提供多个参数规模的版本,适用于研究、开发及各类应用场景,展现卓越性能。

馆长

馆长是一款基于RAG技术的浏览器插件式AI问答工具,支持本地知识库管理,可导入PDF、Word、网页等内容,通过语义搜索提供精准答案。所有数据存储于本地,保障隐私安全,支持离线使用。具备中英文搜索、无限文档导入、多平台集成等特性,适用于个人知识管理、企业内部知识库、在线学习及图书馆服务等场景。

PPLeGPT

PPLeGPT 是一款网络应用程序,可根据您的喜好和目标为您生成个性化健身锻炼方案。您只需要简要描述您的锻炼经历并选择您的目标区域。