AI项目与工具

URM

URM是由阿里妈妈开发的通用推荐模型,结合大语言模型与电商领域知识,提升推荐效果。其采用多模态融合与Sequence-In-Set-Out生成方式,支持多场景、多目标、长尾及发现性推荐。具备高效率、零样本学习能力,适用于工业级推荐系统,已应用于阿里妈妈展示广告场景,优化用户体验与商家投放效果。

Science Navigator

Science Navigator是由北京科学智能研究院与深势科技联合打造的AI4S科研知识库与学术搜索平台,覆盖“读文献-做计算-做实验-多学科协同”的全流程科研需求。平台提供全维度科研知识库、个性化问题推荐、多模态搜索、批量文献问答、校内资源整合、数据存储管理及文献管理等功能,助力科研人员高效探索学术前沿。

SigLIP 2

SigLIP 2 是 Google DeepMind 开发的多语言视觉-语言模型,具有强大的图像与文本对齐能力。它支持多种语言输入,具备零样本分类、图像-文本检索等功能,并通过 Sigmoid 损失函数和自监督学习技术提升训练效率与模型性能。其支持多种分辨率的变体,适用于文档理解、视觉问答及开放词汇任务。该模型基于 Vision Transformer 架构,具备良好的兼容性。

GradeAssist

GradeAssist是一款面向教师的AI辅助论文评分工具,支持自定义评分标准、抄袭检测及AI写作分析等功能,可快速生成客观一致的评分结果并提供个性化反馈,有助于提升评分效率、维护学术诚信及减轻教师工作压力。

悦灵犀AI

悦灵犀AI是一款基于先进AI技术的创作平台,支持文生图、文生视频、背景替换、证件照生成及照片修复等多种功能。其智能助手和丰富工具使用户能够高效创作艺术作品,并广泛应用于艺术设计、广告营销、教育等领域。

Valley

Valley是一款由字节跳动开发的多模态大语言模型,擅长处理文本、图像和视频数据,广泛应用于内容分析、图像和视频描述、电子商务及短视频平台等领域。其Eagle版本通过引入VisionEncoder增强了模型性能,支持灵活调整令牌数量,实现了更高效的多模态数据处理。Valley在多项基准测试中表现出色,尤其在参数规模较小的情况下依然保持优异的成绩。

Motion Prompting

Motion Prompting 是一种利用点轨迹表示的视频生成技术,支持对象控制、相机控制及物理现象模拟等功能。它通过将用户输入转化为详细的运动轨迹,结合预训练的视频扩散模型与控制网络,在保持灵活性的同时提高生成质量。这项技术广泛应用于电影制作、游戏开发、虚拟现实等领域,为用户提供了强大的交互式视频生成工具。 ---

Spotter Studio

Spotter Studio 是一款专为 YouTube 创作者设计的 AI 创意工具,通过个性化头脑风暴、数据驱动的研究和全面的项目管理工具,帮助创作者生成新视频的创意、优化内容策略,并提高团队协作效率。该平台利用 AI 分析创作者的内容和观众偏好,提供定制化的视频概念和缩略图建议,从而提升视频表现并增加观众参与度。

Co

Co-op Translator是一款基于Azure AI服务的开源多语言翻译工具,支持Markdown文件及图像文本的自动化翻译。它采用先进的大型语言模型(LLM)技术,确保翻译质量的同时保持语义准确性和上下文连贯性。该工具可无缝集成到现有项目中,帮助简化本地化流程,适用于开源项目文档、软件开发、技术博客、教育材料以及企业内部文档等多种应用场景。

Livensa

Livensa是一款创新的AI视频生成应用,主要功能包括文本到视频的转换、视频合成以及创意多样性。它允许用户通过简单的文字描述生成具有叙事性的视频内容,无需任何视频编辑技能。Livensa在西班牙、智利、德国等地的图形与设计应用中表现突出,其应用场景广泛,涵盖社交媒体内容创作、广告和营销、教育和培训、个人娱乐以及企业宣传等多个领域。