AI项目与工具

Svg.la

Svg.la 是一款基于人工智能的 SVG 文件生成与转换工具,支持文本转 SVG 和图像转 SVG 功能。用户可以输入文本提示或上传图像,生成高质量、可缩放的矢量图形,广泛应用于品牌设计、图标制作、艺术作品转换及网页和移动应用开发等领域,满足多语言需求。

朱雀AI检测

朱雀AI检测是腾讯混元安全团队推出的AI内容识别工具,具备图像和文本检测功能,可精准识别AI生成内容。系统通过分析图像差异、隐层特征及文本模式,提供快速、可靠的检测服务。广泛应用于医疗、法律、教育、新闻等领域,助力内容真实性验证与版权保护,提升数字环境的信任度。

Motionshop

Motionshop是一款由阿里巴巴智能计算研究院开发的AI角色动画框架,能够将视频中的角色转换为3D化身,同时保持视频中其他元素的完整性。该框架利用视频处理、角色检测与分割、姿态分析、模型提取及动画渲染等多项技术,实现了视频中角色从现实到虚拟的无缝转换。用户只需上传一段视频,Motionshop将自动识别视频中的主要人物,并将其转换为3D角色,同时精确复制原视频中人物的动作细节,确保3D角色的动

TokenFD

TokenFD是由上海交通大学与美团联合开发的细粒度图文对齐基础模型,专为文档理解任务设计。通过图像与语言Token的统一特征空间对齐,支持Token级图文交互,提升了多模态任务性能。其基于自研的TokenIT数据集进行训练,涵盖2000万张图像和18亿高质量Token-Mask对,覆盖多种文本图像类型。TokenFD可用于文档处理、图像审查、文字检索及大模型知识增强等多个领域,具有广泛的适用性和

FaceApp

FaceApp是一款结合AI技术的照片和视频编辑工具,提供多样化的滤镜和效果,帮助用户轻松实现自拍照的逼真编辑,包括年龄、性别、发型、发色等多维度的调整,同时支持创意场景融合和艺术化处理,适用于社交媒体分享、娱乐、时尚、创意摄影及广告营销等多个领域。

Fox

Fox-1是一系列由TensorOpera开发的小型语言模型,基于大规模预训练和微调数据,具备强大的文本生成、指令遵循、多轮对话和长上下文处理能力。该模型在多个基准测试中表现出色,适用于聊天机器人、内容创作、语言翻译、教育辅助和信息检索等多种应用场景。

MTVCrafter

MTVCrafter是由中国科学院深圳先进技术研究院计算机视觉与模式识别实验室、中国电信人工智能研究所等机构推出的新型人类图像动画框架,基于4D运动标记化(4DMoT)和运动感知视频扩散Transformer(MV-DiT)实现高质量动画生成。该工具直接对3D运动序列建模,支持泛化到多种角色和风格,保持身份一致性,并在TikTok基准测试中取得优异成绩。其应用场景包括数字人动画、虚拟试穿、沉浸式内

MovieDreamer

MovieDreamer是一个由浙江大学与阿里巴巴联合开发的AI视频生成框架,专为长视频设计。该框架结合自回归模型和扩散渲染技术,生成复杂的长视频内容。它支持多层次叙事一致性、高质量视觉渲染和多模态脚本,适用于电影预告片、VR叙事、教育视频和游戏内剧情等多种场景。

SeniorTalk

SeniorTalk是全球首个面向中文超高龄老年人的语音数据集,涵盖202位75岁以上老人的55.53小时语音数据,覆盖16个省市,包含多种口音。数据通过两两自发对话采集,内容贴近真实交流场景,并附有多维标注,如说话人信息、时间戳、口音分类等。该数据集可用于语音识别、说话人验证、语音编辑等研究,支持适老化设备、健康管理和辅助养老系统的开发,推动相关技术进步。

京点点

京点点是京东零售技术推出的AI内容生成平台,专为电商场景设计,支持商品图片、营销文案等多模态内容的高效生成。基于DiT框架、Flow Matching等先进技术,平台可精准提取商品信息并生成高质量素材,适用于多种电商场景。面向京东商家、合作伙伴及内部员工开放,助力提升内容生产效率与质量。