生成

Edicho

Edicho 是一种基于扩散模型的图像编辑工具,能够在多图像间实现一致性编辑,无需额外训练。其核心技术包括 Corr-Attention 注意力模块和 Corr-CFG 去噪策略,通过显式图像对应关系提升编辑质量与一致性。适用于图像修复、风格转换、内容创作、医学影像增强等场景,具备良好的兼容性与扩展性。

VITA

VITA-Audio 是一款开源的端到端多模态语音大模型,具备低延迟、高推理效率和多模态交互能力。其核心创新包括轻量级 MCTP 模块和四阶段渐进式训练策略,使模型在语音识别、文本转语音和口语问答等任务中表现优异。支持实时对话、智能客服、教育辅助、医疗辅助及内容创作等多种应用场景,适用于各类语音交互系统。

Supademo

Supademo是一款基于AI技术的交互式产品演示平台,支持屏幕录制、AI语音旁白、多语言翻译及个性化编辑。用户可创建高质量、高转化率的演示内容,并通过多渠道分享。平台提供丰富的分析功能,适用于销售、营销、客户支持和产品培训等多个场景。其灵活的定价策略满足不同规模企业的需求。

Visual Electric

一款基于 AI 的图像生成器,专为创意而设计。它提供了无限的画布和直观的界面,以简化用户的创作过程。

蓝字典AI

蓝字典AI是一款AI求职工具,包含AI简历生成,AI面试,AI职业咨询

PromptFolder

专为大型语言模型 (LLM)和大型模型 (LM) 以及LMOps设计的提示词优化助手,不管是文字、还是图片的提示词,都可以一键优化。

Minister AI

Minister AI是一款免费使用的AI绘图工具,登录即用的在线Stable Diffusion,支持海量模型上传下载。

LatentSync

LatentSync是由字节跳动与北京交通大学联合研发的端到端唇形同步框架,基于音频条件的潜在扩散模型,无需中间3D或2D表示,可生成高分辨率、动态逼真的唇同步视频。其核心技术包括Temporal Representation Alignment (TREPA)方法,提升视频时间一致性,并结合SyncNet监督机制确保唇部动作准确。适用于影视制作、教育、广告、远程会议及游戏开发等多个领域。

Formularizer

Formularizer是一个功能强大的AI平台,帮助用户为Excel、Google Sheets、Notion等生成和解释公式。它通过快速将想法转化为公式并借助AI的帮助来节省时间,提高生产效率。

ARTalk

ARTalk是由东京大学与日本理化学研究所联合开发的语音驱动3D头部动画生成框架,基于自回归模型实现实时、高同步性的唇部动作和自然表情生成。它通过多尺度运动码本和滑动时间窗口技术提升动画质量,并引入风格编码器实现个性化风格适配。该工具在唇部同步、表情自然性和风格一致性方面优于现有技术,适用于虚拟现实、游戏开发、动画制作及人机交互等领域。