AI工具

PhysGen3D

PhysGen3D 是一款能够将单张图像转换为交互式 3D 场景并生成物理真实视频的工具。它结合图像分析与物理模拟技术,支持精确控制物体属性、动态效果整合及高质量渲染。适用于影视、VR/AR、教育、游戏和广告等多个领域,提供高效且逼真的视觉内容生成能力。

Vidu Q1

Vidu Q1是清华大学朱军教授团队研发的高可控视频生成模型,支持1080p高清视频生成,具备精准音效控制、多主体一致性调节、局部超分重建等功能。在多项国际评测中表现优异,包括VBench和SuperCLUE榜单均获第一。模型基于扩散模型与U-ViT架构,融合文本、图像和视频信息,适用于影视制作、广告宣传及动画创作等领域。

Math24o

Math24o 是 SuperCLUE 开源的高中奥林匹克数学竞赛级别数学推理测评基准,基于 2024 年全国高中数学竞赛预赛试题,包含 21 道高难度解答题。评测通过程序自动判断答案一致性,客观评估模型正确率。支持自动化评估流程,适用于教育、学术研究和模型优化等领域,为数学推理能力的提升提供重要工具。

Ideogram 3.0

Ideogram 3.0 是一款先进的 AI 图像生成工具,具备高精度文本渲染、风格参考与随机风格探索功能,支持复杂排版和高质量图像生成。适用于商业设计、创意艺术、内容创作等多个领域,提升设计效率与视觉表现力。其强大的语言理解和图像生成能力,使其成为专业设计和创意工作的有力助手。

BizGen

BizGen是由清华大学与微软研究院联合开发的AI信息图生成工具,能将长篇文章自动转化为专业级的信息图和幻灯片。其核心技术包括高质量数据集Infographics-650K和“布局引导的交叉注意力机制”,可精准控制图像中各区域的文本与视觉元素。支持多语言和多种风格,适用于商业汇报、产品展示、学术研究等多个场景,具备高准确性与排版质量。

ModelEngine

ModelEngine 是华为开源的全流程 AI 开发工具链,涵盖数据处理、模型训练与应用开发三大核心模块。支持多模态数据清洗、知识向量化及模型推理,提供低代码编排和 RAG 框架,适用于医疗、金融、制造等领域的 AI 应用开发与行业化落地。

Smithery

Smithery 是一个基于 Model Context Protocol(MCP)的服务器托管平台,提供集中化发现、托管与分发服务。通过标准化接口,简化 AI 系统与外部数据源的集成,提升开发效率和系统可扩展性。适用于智能 IDE、客服系统、推荐引擎、自动化工作流及研究分析等多种场景,助力 AI 应用的高效开发与部署。

Bolt3D

Bolt3D是由谷歌研究院、牛津大学VGG团队与谷歌DeepMind联合开发的3D场景生成技术,基于潜在扩散模型,能在单块GPU上仅需6.25秒生成高质量3D场景。支持多视角输入,具备良好泛化能力,采用高斯溅射技术实现高保真表示,并支持实时交互。适用于游戏开发、VR/AR、建筑设计和影视制作等领域。

ima知识号

IMA知识号是腾讯推出的用于知识库创作与管理的平台,支持知识发布、数据分析及云存储等功能。用户可通过该平台创建、编辑和管理知识库,并利用数据洞察优化内容。适用于企业、教育、社区和个人知识分享等场景,提升信息管理效率和内容质量。

Mureka V6

Mureka V6是昆仑万维推出的AI音乐创作平台基座模型,支持多语言音乐生成及纯音乐创作。采用自研ICL技术,提升音乐结构连贯性与情感表达。用户可通过文本、音频或音色参考进行个性化创作,适用于多种音乐风格与情绪。支持从简单模式到高级模式的灵活操作,广泛应用于音乐爱好者、专业音乐人及内容创作等领域。