生成

词爪网

词爪网,禁词,极限词,敏感词,新广告法违禁词查询检测工具。

PuLID

PuLID是一种由字节跳动团队开发的个性化文本到图像生成技术,主要通过对比对齐和快速采样方法实现高效ID定制。该技术能够生成高度逼真的面部图像,同时保留原始图像的风格元素,支持灵活的个性化编辑。PuLID具有快速出图能力,无需繁琐的模型调整,且与多种现有模型兼容。它适用于艺术创作、虚拟形象定制、影视制作、广告和社交媒体等多个领域。

Scenethesis

Scenethesis是NVIDIA推出的AI框架,可通过文本生成高质量的3D场景。它结合LLM与视觉技术,经过布局规划、视觉细化、物理优化和场景验证四个阶段,确保生成结果具备物理合理性和空间连贯性。支持用户交互与多样化场景构建,广泛应用于VR/AR、游戏开发、具身智能及虚拟内容创作等领域。

理想同学

理想同学是一款基于AI技术打造的智能助手,集成了知识问答、视觉识别、绘画创作和播客等多种功能。它支持多领域的信息查询、语言翻译、文本生成及视觉分析,通过跨平台协作实现数据同步与连续对话。此外,用户可根据需求选择不同模型以优化推理能力,广泛适用于日常生活、学习和工作场景。

QA

QA-MDT是一款基于文本生成高质量音乐的开源工具,其核心技术包括质量感知训练、掩蔽扩散变换器以及音乐与文本的同步优化。它能够根据用户提供的文本描述生成多样化的音乐作品,并通过质量控制确保输出结果的高保真度。此外,QA-MDT支持音乐与文本的一致性增强,适用于广告、影视配乐、音乐教育及智能设备等多个领域。

Stitch

Stitch是谷歌实验室推出的基于生成式AI的工具,能够将简单的英语描述或图像快速转化为用户界面(UI)设计及前端代码。它基于Gemini 2.5 Pro模型的多模态能力,支持文本、图像输入,并能识别图像生成UI组件。Stitch可生成简洁可用的前端代码,支持HTML、CSS和JavaScript,同时与Figma无缝集成,便于团队协作和优化设计。其功能包括文本生成设计、图像生成设计、代码生成与优

VideoLLaMB

VideoLLaMB 是一个创新的长视频理解框架,通过引入记忆桥接层和递归记忆令牌来处理视频数据,确保在分析过程中不会丢失关键的视觉信息。该模型专为理解长时间视频内容而设计,能够保持语义上的连续性,并在多种任务中表现出色,例如视频问答、自我中心规划和流式字幕生成。VideoLLaMB 能够有效处理视频长度的增加,同时保持高性能和成本效益,适用于学术研究和实际应用。 ---

2PR

2PR是一款基于AI技术的LinkedIn内容创作工具,能够快速生成高质量、个性化的帖子。用户可通过音频访谈或总结外部内容,将想法转化为适合平台的优质内容。工具支持多种角色使用,提升内容创作效率与个人品牌影响力,具备灵感库、多模型支持及多种订阅选项,适用于博主、求职者、B2B销售专家等群体。

文心iRAG

文心iRAG是百度推出的一种检索增强型文生图技术,它通过结合百度搜索引擎中的海量图片资源与先进基础模型能力,解决了大模型在文生图时容易出现的幻觉问题,显著提高了生成图片的真实性和准确性。此技术不仅适用于广告、媒体、教育等多个领域,还具备低成本、高效率的特点,能够快速生成满足需求的高质量图像。