模型

Deep Paint 3D

Deep Paint 3D是一个为 Blender 这个 3D 制作软件设计的插件。可以在 3D 中交互式地绘制 3D 模型并为其添加纹理。它使用可以直接刷涂或投影到 3D 模型和场景上的纹理或自然介质。

Mobile

Mobile-Agent 是一种具备移动能力的智能代理系统,能够跨设备执行任务并优化资源使用。基于多模态大语言模型和视觉感知技术,支持自动操作、自我规划与反思,适用于多应用协同、跨平台操作及纯视觉交互。其技术架构包含多个智能体协作机制,提升了移动设备任务处理的效率与灵活性。

Audio2Photoreal

从音频生成全身逼真的虚拟人物形象。它可以从多人对话中语音中生成与对话相对应的逼真面部表情、完整身体和手势动作。

AgentReview

AgentReview是一款基于大型语言模型构建的学术同行评审模拟工具,通过模拟评审者、作者和领域主席的角色,研究评审偏见和决策机制对评审结果的影响。它支持隐私保护,无需真实敏感数据,同时验证了多种社会学理论在评审中的应用,为优化学术评审流程提供了重要参考。

GameGen

GameGen-O 是一款基于 Transformer 架构的AI工具,专注于开放世界游戏视频的生成。它具备角色生成、环境构建、动作模拟及交互式控制等功能,通过两阶段训练方法提升了生成质量和灵活性,可应用于游戏原型设计、场景生成及开发辅助等领域,有助于降低开发成本并提高创作效率。

CHRONOS

CHRONOS是由上海交通大学与阿里巴巴集团联合开发的新闻时间线生成框架,基于大型语言模型(LLMs)实现开放域与封闭域的时间线构建。其核心机制包括迭代自问自答、问题重写与分而治之策略,能够高效处理信息过载与数据噪声,生成结构清晰、逻辑连贯的事件摘要。适用于新闻整理、金融分析、政府决策、教育研究及品牌宣传等多个领域。

FineZip

FineZip 是一种基于大型语言模型的无损文本压缩工具,利用在线记忆和动态上下文大小技术优化压缩效率,显著提升压缩速度和压缩比。它适用于多种场景,包括数据存储、传输、数据库管理和大数据分析等,同时支持无损解压和高效批量处理。

万兴天幕多媒体大模型

一个涵盖了视觉、音频、语言等多模态AI生成和优化能力的多媒体大模型,万兴天幕多媒体大模型核心功能包括一键成片、AI美术设计、文生音乐、音频增强、音效分析、多语言对话等。

GenMAC

GenMAC是一款基于多代理协作的迭代框架,旨在解决文本到视频生成中的复杂场景生成问题。它通过任务分解为设计、生成和重新设计三阶段,结合验证、建议、修正和输出结构化子任务,利用自适应自路由机制优化视频生成效果。该工具可应用于电影制作、游戏开发、广告设计、教育培训和新闻报道等多个领域,显著提升视频生成的效率和质量。