AI项目与工具

pixble

Pixble 是一款利用 AI 技术的在线照片编辑平台,可自动优化照片的光线、色彩和清晰度,同时具备降噪和锐化功能。它支持多种应用场景,如营销、电商、房地产及创意设计,并提供 Face Swap 等趣味性功能。Pixble 的 API 还便于开发者集成其服务,是一款高效易用的工具。

Taipy

Taipy是一款面向数据科学家和机器学习工程师的工具,专注于将数据和AI算法快速转化为生产级别的Web应用。其核心功能包括用户界面生成、场景与数据管理、大规模数据处理、高性能优化以及与主流数据平台的无缝集成。Taipy支持多种数据源,并提供实时数据可视化功能,广泛适用于数据可视化、机器学习模型部署、财务分析、销售预测及供应链优化等领域。

Motionshop

Motionshop是一款由阿里巴巴智能计算研究院开发的AI角色动画框架,能够将视频中的角色转换为3D化身,同时保持视频中其他元素的完整性。该框架利用视频处理、角色检测与分割、姿态分析、模型提取及动画渲染等多项技术,实现了视频中角色从现实到虚拟的无缝转换。用户只需上传一段视频,Motionshop将自动识别视频中的主要人物,并将其转换为3D角色,同时精确复制原视频中人物的动作细节,确保3D角色的动

databutton

Databutton 是一款面向非技术人员的 AI 驱动零代码开发平台,支持通过自然语言快速生成 Web 应用和 SaaS 产品。平台提供代码生成、界面设计、数据库管理、一键部署及 API 集成功能,适用于创业者、产品经理、教育工作者等各类用户,简化开发流程,提升效率。

NVLM

NVLM是NVIDIA研发的多模态大型语言模型,涵盖图像理解、语言理解、跨模态融合、图像描述生成、视觉推理及多模态翻译等功能。它具备多种架构(NVLM-D、NVLM-X、NVLM-H),并采用动态高分辨率输入、1-D平铺标签设计及多模态预训练与微调技术,广泛应用于图像描述、视觉问答、文档理解、多模态搜索及辅助驾驶等领域。

如意 AI Stick

如意AI Stick是一款基于人工智能技术的桌面助手,集成了搜索、写作、聊天等多项功能。它通过豆包大模型实现精准的信息检索和多领域知识解答,支持个性化界面定制,并提供办公辅助、生活娱乐等多种智能服务,旨在提升用户的工作效率和生活便利性。

SeniorTalk

SeniorTalk是全球首个面向中文超高龄老年人的语音数据集,涵盖202位75岁以上老人的55.53小时语音数据,覆盖16个省市,包含多种口音。数据通过两两自发对话采集,内容贴近真实交流场景,并附有多维标注,如说话人信息、时间戳、口音分类等。该数据集可用于语音识别、说话人验证、语音编辑等研究,支持适老化设备、健康管理和辅助养老系统的开发,推动相关技术进步。

Wavy

Wavy是一款利用AI技术的照片编辑工具,可将普通照片转换为具有艺术风格的作品。它提供多种功能,包括AI艺术生成、图像放大、照片优化以及对象移除等,适用于个人摄影、社交媒体内容创作、艺术设计等多个场景,帮助用户实现创意表达与个性化展示。

启元重症大模型

启元重症大模型是一款面向ICU环境的医疗人工智能系统,依托于腾讯的混元大模型架构,集成了庞大的医学知识库和先进的自然语言处理技术,能够快速生成病历、总结病情、提供诊疗建议等,大幅提升了重症医疗的服务质量和工作效率。其核心技术包括医学知识图谱构建、数据处理与分析、模型压缩优化以及临床逻辑推理能力,适用于多种应用场景如ICU监护、智能辅助诊疗、病历自动化生成等。

MTVCrafter

MTVCrafter是由中国科学院深圳先进技术研究院计算机视觉与模式识别实验室、中国电信人工智能研究所等机构推出的新型人类图像动画框架,基于4D运动标记化(4DMoT)和运动感知视频扩散Transformer(MV-DiT)实现高质量动画生成。该工具直接对3D运动序列建模,支持泛化到多种角色和风格,保持身份一致性,并在TikTok基准测试中取得优异成绩。其应用场景包括数字人动画、虚拟试穿、沉浸式内