生成

AiExcelBot

AiExcelBot是一款利用人工智能快速、轻松生成Excel和Google Sheets公式的工具。

Bgrem.AI

一款可提供包括去除视频背景、生成图像、重新设计室内装饰、AI 滤镜、生成插图、去除不需要的对象等多种服务的AI工具,用户不需具备编辑技能或技术知识,就可使用 Bgrem.ai 进行图像和视频的编辑。

HunyuanCustom

HunyuanCustom是腾讯混元团队开发的多模态视频生成框架,支持图像、音频、视频和文本等多种输入条件,生成高质量定制化视频。采用文本-图像融合与图像ID增强技术,提升身份一致性和视频真实性。适用于虚拟人广告、虚拟试穿、视频编辑等场景,具备音频驱动和视频驱动两种生成方式,展现强大可控性与灵活性。

World Labs 空间智能模型

World Labs 空间智能模型是一款基于人工智能技术的工具,能够通过单张图片生成逼真的3D世界,并支持实时渲染与交互操作。其核心功能包括3D几何估算、场景补全、内容生成及相机效果模拟,广泛应用于电影、游戏、虚拟现实、教育以及建筑设计等多个领域,大幅提升了创作效率与视觉表现力。

MetaMorph

MetaMorph是一款基于多模态大模型的工具,通过Visual-Predictive Instruction Tuning(VPiT)技术实现文本和视觉token的生成。它在视觉理解和生成领域表现优异,能够克服其他生成模型的常见失败模式,同时有效处理专业术语和复杂语义问题。MetaMorph展示了统一建模方法的优势,支持多模态数据的高效处理,并在视觉生成与理解基准测试中取得竞争力表现。

AIOOTD

AIOOTD是一款基于AI技术的时装生成平台,专注于将上传的服装照片转换为不同风格的AI时装图像,包括动漫、插画和写实风格。它支持图片上传、编辑、批量处理以及个性化定制,可直接适配社交媒体平台。该工具广泛应用于时装品牌推广、设计师作品展示、社交媒体内容创作及电商销售等领域,助力提升品牌形象和产品吸引力。

VASA

VASA-1是一个由微软亚洲研究院开发的生成框架,能够将静态照片转化为动态的口型同步视频。该框架利用精确的唇音同步、丰富的面部表情和自然的头部运动,创造出高度逼真的虚拟人物形象。VASA-1支持在线生成高分辨率视频,具有低延迟的特点,并且能够处理多种类型的输入,如艺术照片、歌唱音频和非英语语音。此外,通过灵活的生成控制,用户可以调整输出的多样性和适应性。

飞算JavaAI

飞算JavaAI是一款智能Java开发辅助工具,支持从需求分析到代码生成的全流程自动化开发。它能精准理解自然语言需求,生成完整代码框架,并提供多种设计方案供选择。支持全栈代码生成、代码优化及与主流IDE集成,适用于新项目开发、模块扩展及高并发场景,提升开发效率与代码质量。

Llasa TTS

Llasa TTS是基于LLaMA架构的开源文本转语音模型,支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构,具备多语言支持及长文本处理能力,适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本,支持零样本学习,提升语音自然度和表现力。

TheoremExplainAgent

TheoremExplainAgent(TEA)是一款基于多模态技术的AI工具,可生成超过5分钟的数学与科学定理解释视频,涵盖多个STEM领域。它结合文本、动画和语音,提升抽象概念的理解效果,并具备自动错误诊断功能。通过TheoremExplainBench基准评估,TEA在准确性、逻辑性和视觉表现上均表现优异,适用于在线教育、课堂教学和学术研究等多种场景。