AI

自得语音

自得语音技术可通过简单的步骤创造出属于你的角色。类似GPT,可生成与真人无异的语音片段,在情感、音色和语速等方面与真人一致。

出门问问api

出门问问(Chumen Wenwen)是一家中国的人工智能公司,以其智能语音助手和相关技术而闻名。出门问问提供的OPEN API(开放应用程序编程接口)允许开发者将出门问问的技术集成到自己...

JoyGen

JoyGen是由京东科技与香港大学联合开发的音频驱动型3D说话人脸视频生成框架,能够实现唇部动作与音频信号的精准同步,并提供高质量的视觉效果。该工具采用单步UNet架构进行高效视频编辑,基于130小时中文视频数据集训练,在唇音同步和视觉质量方面表现优异。适用于虚拟主播、动画制作、在线教育及多语言视频生成等多个领域,为视频内容创作提供了创新解决方案。

海豚配音TTS Online

海豚配音TTS Online是一个多功能的在线TTS服务平台,它通过先进的语音合成技术,为用户提供了一种便捷的方式来生成高质量的语音内容。

Knowt

Knowt 是一款人工智能学习工具,可将笔记、PDF 和视频内容转化为抽认卡,支持多种学习模式如练习测试和间隔重复。具备实时讲座笔记、PPT/PDF 摘要、拍照解题等功能,适合备考复习、课堂笔记和自主学习,提供丰富的学习资源和多设备同步支持。

Word-As-Image

我们的文字作为图像插图在不同的字体和不同的文本概念。使用我们的方法,语义调整的字母完全自动创建,然后可以用于进一步的创造性设计,正如我们在这里所演示的那样。

Lyrics Into Song AI

一个利用AI将文本歌词转换为原创歌曲的在线音乐平台,Lyrics Into Song AI通过分析您的文本,并生成与您的歌词情绪、风格和结构相匹配的音乐,包括完整的歌曲,包括旋律、和声和伴奏。

FLUX.1 Kontext

FLUX.1 Kontext是由Black Forest Labs推出的图像生成与编辑模型,支持上下文感知的图像处理。它基于文本和图像提示进行生成与编辑,具备对象修改、风格转换、背景替换、角色一致性保持和文本编辑等功能。FLUX.1 Kontext Pro版本支持快速迭代编辑,Kontext Max版本在提示词遵循和排版生成方面表现优异,而dev开源版本适合定制化开发。

WonderWorld

WonderWorld是一款基于斯坦福大学和麻省理工学院合作研发的3D场景生成框架,通过Fast LAyered Gaussian Surfels(FLAGS)表示法与引导深度扩散技术,从单张图片快速生成连贯且多样化的虚拟场景。用户可实时交互,生成包括城市、自然、幻想等多种风格的3D环境,并适用于游戏开发、虚拟现实、增强现实以及建筑设计等多个领域。