实时

Cool Backgrounds

一个免费背景生成器,Cool Backgrounds主要提供三角几何图形背景、科技粒子效果背景、CSS 渐变背景背景、渐变地形图背景l图生成。

Figma Slides

一款用于创建演示文稿的强大工具,Figma Slides为团队提供设计和制作幻灯片动画的协作平台。

选股通

一款专注于A股市场的投资工具,只要帮助用户进行主题投资。其主要功能包括实时盯盘、选股策略推荐、市场资讯推送等,能够帮助用户及时把握市场机会。

LivePortrait

利用AI技术将静态照片转换为视频,展现逼真的面部表情和动作。

Byrdhouse AI

一个提供AI实时翻译的视频会议网站,它可以让用户在不同语言之间无缝沟通和协作。

Seaweed APT

Seaweed APT是字节跳动研发的对抗性后训练模型,支持图像和视频的一站式生成。其通过在真实数据上进行对抗性训练,实现单步高质量输出,包括1024px图像和1280×720、24fps视频。该模型采用先进的生成器和判别器设计,结合近似R1正则化技术,提升训练稳定性和生成质量。适用于视频广告、影视创作、社交媒体等内容生产场景。

CosyVoice

一种深度融合文本理解和语音生成的一项新型语音合成技术,CosyVoice能够精准解析并诠释各类文本内容,将其转化为宛如真人般的自然语音。

Parakeet TDT 0.6B

Parakeet TDT 0.6B 是一款由英伟达开发的开源自动语音识别(ASR)模型,采用 FastConformer 和 TDT 架构,具备高速转录、高精度识别、歌词转录、文本格式化等功能。模型在 Hugging Face Open ASR Leaderboard 中表现优异,实时因子高达 3386,适用于会议记录、法律医疗、字幕生成及音乐索引等多种场景。

Open Avatar Chat

Open Avatar Chat是阿里开源的模块化实时数字人对话系统,支持低延迟交互与多模态输入输出。系统采用模块化架构,允许灵活配置语音识别、语言模型和语音合成等组件,兼容本地与云服务。支持2D/3D数字人渲染,适用于客户服务、教育、娱乐及企业应用等多个场景,为开发者提供高效、灵活的AI对话解决方案。

Vozard

一款由iMobie开发的AI驱动的实时语音变声软件,提供超过100种逼真的语音效果。用户可以在在线聊天、游戏等场景中使用。