生成

GroundingBooth

GroundingBooth 是一种创新的文本到图像定制框架,通过结合文本-图像对齐模块和遮罩交叉注意力层,实现了前景主体与背景对象的空间精准对齐。其核心功能包括单主题与多主题定制、身份保留、文本-图像一致性保障及复杂场景下的高精度生成。该工具广泛应用于个性化商品定制、艺术创作、游戏设计、广告营销等多个领域,为视觉内容创作提供了强大的技术支持。

OmniParse

OmniParse是一款开源数据解析平台,支持多种文件类型的非结构化数据转换为结构化格式,包括文档、图像、视频、音频及网页内容。其核心功能涵盖表格提取、图像字幕生成、音视频转录以及网页内容结构化处理,利用自然语言处理、光学字符识别及深度学习技术提升解析效率与准确性。OmniParse完全在本地运行,确保数据隐私与安全,广泛应用于文档自动化处理、客户服务、市场研究、法律合规及医疗记录管理等领域。

通义代码模式

通义代码模式是一款基于大语言模型的AI工具,支持用户通过自然语言指令生成代码并实时预览结果。它适用于快速开发动态网页和交互式应用,涵盖前端页面生成、数据可视化、小游戏开发等多种功能。无论是开发者还是非专业人士,都能通过此工具轻松创建各类应用,降低开发门槛,提升效率。

标智客

标智客是一款基于人工智能的LOGO设计工具,能够根据用户提供的公司或品牌信息自动生成多样化的设计方案。它支持在线编辑LOGO元素,提供原创设计服务并确保版权保护,适用于企业、产品、个人品牌等多种应用场景。

Insight

Insight-V是一款由南洋理工大学、腾讯和清华大学联合研发的多模态大型语言模型,专为提升长链视觉推理能力而设计。该模型通过多智能体系统将任务分解为推理与总结两步,并采用两阶段训练流程优化性能。其渐进式数据生成和多粒度评估方法进一步提升了模型的推理精度,在多个视觉推理基准测试中表现出色。

Loong

Loong是一种基于自回归大型语言模型的长视频生成工具,能够生成长达一分钟以上的高质量视频。其核心技术包括统一序列建模、渐进式训练方法及损失重新加权策略,确保生成视频在内容连贯性、动态丰富性和场景过渡上的卓越表现。Loong广泛适用于娱乐、教育、广告等多个领域,助力用户快速生成个性化、专业化的视频内容。

爱推文

一款漫画小说推文视频创作赚钱利器,爱推文帮助用户将小说推文快速转化成漫画视频解说且原创度高的工具,帮助小说推文作者进行快速变现。

Peech AI

Peech 是一个生成式 AI 视频平台,可帮助您自动转录、编辑、重新利用和标记您的视频内容,可以将讲话内容转换为自动生成的视频。

Pixite.Ai

Pixite是一个创新平台,它使用 AI 技术让您从T恤开始设计个性化服装,我们用户友好的界面将指导您选择设计元素、图案、颜色等,从而制作出反映您风格的独特时尚单品。

Kaiber

Kaiber是一个视频生成引擎,用户可以根据自己的图片或文字描述创建视频。它为音乐家提供了Spotify Canvas等功能,为艺术家提供了灵感,为创作者提供了内容,为未来主义者提供了乐...