AI项目与工具

Polymet

Polymet是一款基于AI的产品设计平台,支持用户通过描述需求或上传图片快速生成原型,并提供可直接部署的代码输出。它与Figma等工具无缝集成,具备强大的编辑与迭代能力,适用于产品开发、设计迭代、跨部门协作以及教育等领域,助力团队高效完成创意到产品的转化过程。

PxBee

PxBee是一款在线AI图片编辑平台,基于先进的人工智能技术,帮助用户快速移除图片背景、增强图片质量以及生成新的背景。用户只需上传图片,PxBee的AI工具能自动识别并移除背景,在复杂的图像上也能保持边缘的精确性。平台提供一键式的图片增强功能,能修复模糊的照片、减少噪点、改善光照并提升分辨率。此外,PxBee还支持背景替换、场景生成和透明背景应用,适用于创意设计、社交媒体内容创作、品牌展示和旅行摄

MM

MM-StoryAgent是由上海交通大学X-LANCE实验室与阿里巴巴集团联合开发的开源多模态、多智能体框架,用于生成沉浸式有声故事绘本视频。它结合大型语言模型与多模态生成技术,通过多阶段写作流程和模态对齐优化,提升故事内容的质量与连贯性。支持灵活模块化设计,适用于儿童教育、数字内容创作、在线教育等多个场景,为故事创作提供高效、可定制的解决方案。

Fineshare FineVoice

Fineshare FineVoice 是一款多功能 AI 配音生成工具,支持文本转语音、语音转文本、AI 变声、声音克隆和音频生成等功能。提供超过 1500 种声音和 149 种语言选项,适用于视频制作、播客、教育、营销等多种场景,助力用户高效创作高质量的多语言内容。具备强大的自定义能力和便捷操作,适合个人与企业用户使用。

Amazon Bedrock

Amazon Bedrock是一款由AWS推出的完全托管型AI服务平台,集成了多家顶级AI公司的基础模型,支持企业通过单一API访问高性能模型。它提供了从基础模型接入、微调到代理构建的一系列功能,包括检索增强生成(RAG)、自动推理检查及多Agent协作等特性。此外,其模型蒸馏技术能够有效提升效率并降低运行成本,广泛适用于文本生成、虚拟助手、图像生成等多种应用场景。

Gemini 2.5 Pro

Gemini 2.5 Pro 是谷歌推出的高性能 AI 模型,具备深度推理能力,可在多模态输入下进行复杂任务处理。支持文本、图像、音频、视频及代码等多种输入形式,拥有 100 万 token 的上下文窗口。在推理、代码生成和多模态任务中表现优异,适用于学术研究、软件开发、创意工作和企业应用等多个领域。

Style AI

Style AI 是一款支持图像、视频生成与编辑的 AI 工具,能够将照片转换为各种艺术风格,如古典绘画或现代数字艺术,同时保留图像核心元素。用户可通过自然语言指令轻松编辑图像,支持无缝合并多张照片,生成集体照或新场景,并能根据文字描述直接生成图像和视频。该工具提供高效、精准的解决方案,适用于艺术创作、创意设计、视频制作、照片编辑及虚拟场景合成等多种场景。

SHMT

SHMT是一种基于自监督学习的高级化妆转移技术,由阿里巴巴达摩院与武汉理工大学联合研发。该技术无需成对训练数据,可将多种化妆风格自然迁移到目标面部图像上,通过“解耦-重建”策略和迭代双重对齐模块,实现高精度的纹理控制与对齐校正。适用于图像处理、虚拟试妆、影视设计等多个领域,具有高效、灵活、高质量的特点。

OpenScholar

OpenScholar是一款由华盛顿大学与艾伦AI研究所联合研发的检索增强型语言模型,专为科学家设计,能够高效检索并综合海量科学文献信息,生成基于文献的事实性回答。该工具具备强大的跨学科适用性,涵盖计算机科学、生物医学等多个领域,同时支持自我反馈迭代优化,显著提升回答质量和引用可靠性。所有相关资源已完全开源,便于全球学者使用与研究。

Glasp

Glasp是一款集高亮标注、笔记管理和AI辅助于一体的多功能工具,支持用户在网页和PDF文档上标记重要信息,并通过AI技术生成个性化见解。它具备社交共享功能,支持多平台集成,适合学术研究、在线学习及团队协作等多种场景,助力用户高效管理知识资产。