AI项目与工具

URM

URM是由阿里妈妈开发的通用推荐模型,结合大语言模型与电商领域知识,提升推荐效果。其采用多模态融合与Sequence-In-Set-Out生成方式,支持多场景、多目标、长尾及发现性推荐。具备高效率、零样本学习能力,适用于工业级推荐系统,已应用于阿里妈妈展示广告场景,优化用户体验与商家投放效果。

Science Navigator

Science Navigator是由北京科学智能研究院与深势科技联合打造的AI4S科研知识库与学术搜索平台,覆盖“读文献-做计算-做实验-多学科协同”的全流程科研需求。平台提供全维度科研知识库、个性化问题推荐、多模态搜索、批量文献问答、校内资源整合、数据存储管理及文献管理等功能,助力科研人员高效探索学术前沿。

WorldScore

WorldScore是由斯坦福大学推出的统一世界生成模型评估基准,支持3D、4D、图像到视频(I2V)和文本到视频(T2V)等多种模态。它从可控性、质量和动态性三个维度进行评估,涵盖3000个测试样本,包括静态与动态、室内与室外、逼真与风格化等多种场景。WorldScore具备多场景生成、长序列支持、图像条件生成、多风格适配等功能,适用于图像到视频、图像到3D生成以及自动驾驶场景模拟等应用,为研究

GradeAssist

GradeAssist是一款面向教师的AI辅助论文评分工具,支持自定义评分标准、抄袭检测及AI写作分析等功能,可快速生成客观一致的评分结果并提供个性化反馈,有助于提升评分效率、维护学术诚信及减轻教师工作压力。

TrackGo

TrackGo是一种先进的AI视频生成技术,利用自由形状的遮罩和箭头提供精确的运动控制。其核心技术TrackAdapter无缝集成到预训练的视频生成模型中,通过调整时间自注意力层来激活与运动相关的区域。TrackGo在视频质量、图像质量和运动忠实度方面表现出色,适用于影视制作、动画制作、虚拟现实(VR)、增强现实(AR)和游戏开发等多个领域。

可灵2.1

可灵2.1是快手推出的AI视频生成模型,现已上线可灵AI视频平台。该模型包含标准版、高品质版和大师版,分别满足不同创作需求,支持图生视频和文生视频功能。标准版生成速度快,高品质版效果出色,大师版提供影视级效果。用户可通过上传图片或输入文字生成视频,并设置参数后下载使用。适用于短视频、营销广告、AI短剧、专业影视及教育培训等场景。

微博嘴替

微博嘴替是一款AI趣味分析工具,主要功能涵盖神吐槽、MBTI性格分析、优点识别、人生Emoji、情感分析、健康分析和财运预测。它能分析微博用户的行为和内容,生成幽默而具洞察力的评论,帮助用户从不同角度了解自己。微博嘴替可用于个人娱乐、社交媒体互动、内容创作及心理调适等多种场景。

XiYan

XiYan-SQL是一款由阿里巴巴开发的自然语言到SQL转换框架,利用多生成器集成策略、提示工程和监督微调技术生成高质量SQL查询。它支持多种数据库类型,具备强大的数据库结构解析能力和错误纠正功能,适用于数据查询简化、数据分析、智能助手及教育等多个领域。

AniTalker

AniTalker是一款先进的AI工具,能将单张静态人像与音频同步转化为生动的动画对话视频。它通过自监督学习捕捉面部动态,采用通用运动表示和身份解耦技术减少对标记数据的依赖,同时结合扩散模型和方差适配器生成多样且可控的面部动画。AniTalker支持视频驱动和语音驱动两种方式,并具备实时控制动画生成的能力。

MacWhisper

MacWhisper是一款基于OpenAI Whisper技术的AI音频转文字工具。它能够在本地设备上将音频文件快速转录成文本,并支持多种语言。该工具具有多种音频和视频格式兼容性,提供不同的转录模型选择,支持字幕导出,且具备视频播放功能。最新版本增加了基于Apple芯片的硬件加速,提升了实时语音识别效率,并集成了OpenAI语言模型以提高转录和翻译的准确性。MacWhisper适用于记者、媒体工作