创作

CogView3

CogView3是一款基于中继扩散技术的开源AI图像生成模型,由清华大学与智谱AI联合研发。它通过分阶段生成图像,从低分辨率逐步提升至高分辨率,提高了生成效率并降低了运行成本。CogView3在生成质量和速度上超越了现有的开源模型SDXL,在保持图像细节的同时大幅减少推理时间。其核心特性包括高性能、多分辨率支持及多种优化技术,适用于艺术创作、数字娱乐、广告营销等多个领域。

Multi

Multi-Speaker 是 AudioShake 推出的高分辨率多说话人分离工具,支持将音频中不同说话人的语音精准分离至独立轨道,适用于广播级音频处理。它具备高保真音频处理能力,支持高采样率,能处理长达数小时的录音,在复杂场景下仍能保持稳定效果。广泛应用于影视、播客、无障碍服务及内容创作等领域,提升音频编辑效率与质量。

Story.com

Story.com 是一款专注于 AI 驱动的故事创作平台,支持用户通过智能生成技术快速创作包含角色、对话和视觉效果的故事内容。平台具备动画加速、社交媒体内容生成、视频初剪等多功能特性,广泛应用于动画制作、社交媒体营销、教育及个人故事分享等领域,帮助创作者提升效率并优化作品质量。 ---

绘影字幕

为视频自动添加字幕,自动识别视频中的人声,转化成字幕,字幕翻译,字幕制作软件

KindlePPT

KindlePPT是一款利用AI技术快速生成演示文稿、视频脚本、测验及论文的多功能工具。其核心功能包括智能演示文稿生成、视频脚本创作、论文辅助撰写以及测验设计,支持多语言操作与格式导出。凭借高效的自动化处理能力和灵活的编辑选项,KindlePPT成为教育、企业和个人创作者的理想选择。

A1.art

A1.art是一款结合AI技术的在线艺术创作平台,提供超3400种艺术风格选择,支持从静态到动态(GIF)的多样化创作需求。平台兼具智能推荐、社区互动及个性化服务功能,适用于个人、设计师、企业和教育领域的艺术创作与教学应用。

OmniSync

OmniSync是由中国人民大学、快手科技和清华大学联合开发的通用对口型框架,基于扩散变换器实现视频中人物口型与语音的精准同步。它采用无掩码训练范式,直接编辑视频帧,支持无限时长推理,保持自然面部动态和身份一致性。通过渐进噪声初始化和动态时空分类器自由引导(DS-CFG)机制,提升音频条件下的口型同步效果。OmniSync适用于影视配音、虚拟现实、AI内容生成等多个场景。

Taplio

Taplio是一款基于AI的LinkedIn自动化工具,专为个人和团队设计,提供从内容创意生成到分析优化的一站式解决方案。其核心功能包括AI驱动的帖子创意生成、热门帖子库参考、互动转化、智能帖子计划、数据分析以及浏览器扩展支持。此外,Taplio还具备强大的内容优化能力,能够帮助企业用户高效管理LinkedIn账号,提升品牌影响力和市场竞争力。

Quasar Alpha

Quasar Alpha是一款预发布AI模型,具备100万token的超大上下文窗口,可高效处理长文本和复杂文档。其在代码生成、指令遵循、多模态处理等方面表现出色,支持联网搜索以增强信息准确性。适用于代码开发、长文本分析、创意写作及智能问答等多种场景,目前可通过OpenRouter平台免费使用,存在一定请求限制。

Animon

Animon 是日本 Animon Dream Factory 推出的全球首个专注于动漫制作的 AI 视频生成平台。它结合日本传统动漫美学与尖端 AI 技术,用户只需上传一张插画或 CG 图片并输入动作描述,即可在 3 分钟内生成 5 秒的动画视频。平台具备专业二次元质感、快速生成、无限生成与低成本等特点,适用于二次元内容创作、创意尝试、前期制作、动画资源生成和动画教学等场景。