工具

MoMask

MoMask是一款基于生成式掩码建模的3D人体动作生成工具,支持文本驱动的动作创建与编辑。采用分层量化与Transformer架构,实现高精度、连贯的3D动作序列生成,在HumanML3D数据集上的FID值仅为0.045。支持动作时序控制、多平台部署及动作评估功能,适用于游戏开发、动画制作、VR及体育分析等多个领域。

potion

Potion是一款专注于AI视频生成的专业平台,通过深度学习技术实现用户面部表情、声音的精准模拟,支持文本到视频的自动化转换。其主要功能涵盖个性化视频创作、唇形同步、动态视频生成及多场景应用(如销售、营销、教育和客户服务)。产品设计注重效率与灵活性,适合各类企业提升品牌影响力与客户互动效果。

ImagetoCartoon

ImagetoCartoon是一款在线AI漫画家,可以将人脸转换成卡通或动漫风格的图像。它可以在几秒钟内将图像转换为卡通,并创建10+具有不同背景和姿势的卡通头像。

职达AI简历

职达AI简历是一款智能简历优化平台,通过AI技术为用户提供简历生成、优化和诊断服务。用户输入基本信息后,平台可在短时间内生成专业个性化简历,并分析内容问题提供优化建议。结合岗位推荐系统,精准推送匹配岗位,提高求职效率。内置2800+模板,覆盖多种岗位,支持多端同步与个性化定制,还提供面试辅导等增值服务。

NaturalReader

NaturalReaders是一个提供文本到语音转换服务的网站。

UI2Code

UI2Code是一款基于AI技术的在线工具,可将UI设计图像快速转换为多种编程语言的代码。它支持HTML、CSS、JavaScript、React、Vue、Flutter、Swift等主流框架,具备智能识别、多框架适配和高效生成等功能。适用于设计师快速原型设计、开发者优化前端开发、跨平台项目以及教育领域的教学实践,有效提升开发效率和代码质量。

混元图像2.0

混元图像2.0是腾讯开发的AI图像生成工具,支持文本、语音、草图等多种输入方式,具备实时生成能力。其采用单双流DiT架构和多模态大语言模型,生成图像写实性强、细节丰富,且响应速度快,适用于创意设计、广告营销、教育、游戏等多个领域。用户可通过网页端直接操作,实现高效的图像创作体验。

CLaMP 3

CLaMP 3是由清华大学朱文武教授团队开发的多模态、多语言音乐信息检索框架,支持文本、图像、音频和乐谱等多种模态之间的跨模态检索。其基于对比学习技术,将不同模态数据与多语言文本对齐至统一语义空间,适用于文本到音乐、图像到音乐检索、零样本分类及音乐推荐等任务。支持27种语言,可扩展至100种,广泛应用于音乐创作、教育、分析及多媒体内容制作。

MMedAgent

MMedAgent是一款面向医疗领域的多模态AI平台,集成了指令优化的多模态大型语言模型(MLLM)及一系列定制化医疗工具,支持多种医学成像模式(如MRI、CT、X射线等),可高效处理视觉问答、分类、定位、分割、医学报告生成(MRG)及检索增强生成(RAG)等任务,显著提升了医疗数据处理效率与准确性。

塔猫AI对话PPT

塔猫AI对话PPT是一款利用深度学习与自然语言处理技术的智能PPT分析工具,可解析文本、图表等内容,支持智能问答、摘要生成及逻辑优化建议等功能。它适用于信息检索、演讲准备、教育培训等多个场景,助力用户高效获取所需信息。