生成

Seer

Seer是一款由多家科研机构联合开发的端到端机器人操作模型,基于Transformer架构实现视觉预测与动作执行的高度协同。它能够融合多模态信息,具备强大的泛化能力和数据效率,在真实机器人任务中表现优异。Seer适用于工业自动化、服务机器人、医疗健康等多个领域,支持精准动作预测和未来状态预判,显著提升了机器人系统的智能化水平。

Stability AI

Stability AI提供了一套完整的生成式AI模型,覆盖图像、视频和音频等多个领域,旨在推动AI技术的普及和应用。

TurboScribe Ai

一项语音AI转文字服务,提供无限音频和视频转录。TurboScribe Ai可以将音频和视频文件转换为98+种语言的文本,准确率极高。

拍我AI

拍我AI是爱诗科技推出的PixVerse国内版,是一款强大的AI视频生成平台。用户可通过文本提示或上传图片快速生成高质量动态视频,支持V4.5版本,提升视频质量与动画流畅度。平台提供多种特效模板和风格选择,支持文生视频、图生视频、首尾帧功能等,适用于社交媒体内容创作、电商营销、视频制作及企业应用。同时,开放API接口,助力企业高效生成营销视频和电商素材,降低传统视频制作成本和时间。

PicFinder.AI

PicFinder.AI是一个让您通过 AI 生成的图像的在线工具网站。它使用人工智能将您的描述转换为令人惊叹的艺术品。您可以将它用于娱乐、灵感或任何需要视觉内容的项目。

Lipsync

Lipsync-2 是 Sync Labs 推出的全球首个零样本嘴型同步模型,无需预训练即可快速生成符合说话者风格的嘴型动作。支持多语言、个性化表达和温度参数调节,具备高精度、高真实感和高效处理能力,广泛应用于视频翻译、动画制作、多语言教育及 AI 内容生成等领域。

EyeDiff

EyeDiff是一款基于扩散模型的文本到图像生成工具,专为多模态眼科图像生成设计。通过自然语言提示,EyeDiff能够捕捉常见及罕见眼病的关键特征,显著提升诊断准确性。该工具采用CLIP文本编码器与交叉注意力机制,结合潜在扩散模型(LDM),生成高质量、与文本高度一致的图像,适用于数据增强、疾病筛查、数据共享及医学教育等场景。

aiXcoder

一款智能编程机器人,aiXcoder利用了类似ChatGPT的生成式AI技术,用于代码生成、代码补全和智能搜索等功能。

World Labs 空间智能模型

World Labs 空间智能模型是一款基于人工智能技术的工具,能够通过单张图片生成逼真的3D世界,并支持实时渲染与交互操作。其核心功能包括3D几何估算、场景补全、内容生成及相机效果模拟,广泛应用于电影、游戏、虚拟现实、教育以及建筑设计等多个领域,大幅提升了创作效率与视觉表现力。

AI Singing

一款可以免费生成音乐的AI歌声生成器。您可以通过输入歌词并点击“生成”来制作人工智能歌声。 AI Singing 会将您的歌词转换为音乐。