AI

哄哄模拟器

哄哄模拟器是一款利用AI技术提升用户情商和沟通技巧的应用。该应用基于Moonshot的Kimi智能助手大模型,融合了自然语言处理和人际交往的知识,通过模拟日常生活和恋爱中的沟通场景,帮助用户改善情感智慧和沟通能力。它支持网页版和iOS版本,具备模拟争执场景、文字交流实训、情感状态模拟、沉浸式音效、恋爱交往文本分析以及场景角色定制等功能。

FLUX.1 Kontext

FLUX.1 Kontext是由Black Forest Labs推出的图像生成与编辑模型,支持上下文感知的图像处理。它基于文本和图像提示进行生成与编辑,具备对象修改、风格转换、背景替换、角色一致性保持和文本编辑等功能。FLUX.1 Kontext Pro版本支持快速迭代编辑,Kontext Max版本在提示词遵循和排版生成方面表现优异,而dev开源版本适合定制化开发。

Pippo

Pippo是由Meta Reality Labs研发的图像到视频生成模型,可基于单张照片生成多视角高清人像视频。采用多视角扩散变换器架构,结合ControlMLP模块与注意力偏差技术,实现更丰富的视角生成和更高的3D一致性。支持高分辨率输出及细节自动补全,适用于虚拟现实、影视制作、游戏开发等多个领域。技术方案涵盖多阶段训练流程,确保生成质量与稳定性。

RSSFlow Reader

一款智能的RSS阅读器浏览器扩展,具有AI驱动的RSS摘要和多维度订阅视图功能。

AudioNotes.ai

AudioNotes.ai 是一个高效的语音转文本服务,特别适合需要快速记录和整理语音信息的用户。它的自动语音识别和文本改善功能,加上灵活的摘要选项,使用户能够轻松地将语音内容转换...

TeleAI 视频生成大模型

TeleAI视频生成大模型是一款基于两阶段生成框架的AI工具,能够根据文本描述生成高质量视频,具备主体外观一致性、动作控制精准性以及场景过渡流畅性等特点。它广泛应用于影视制作、广告行业、教育培训、游戏开发及新闻报道等领域,助力提升创作效率并降低成本。

魔音工坊

魔音工坊是由北京小问智能科技有限公司开发的一款配音软件,为用户提供一站式AI配音服务。它被广泛应用于短视频制作、有声书、广告、宣传纪录片等领域,是一款专业的AI语音配音与...

Airgram

Airgram是一个可以自动记录、转录和总结会议的人工智能助手。它与Zoom、Google Meet、Microsoft Teams和Webex等流行的通信平台无缝合作。

TANGOFLUX

TANGOFLUX是一款高效文本到音频生成模型,具备约5.15亿参数量,能够在3.7秒内生成30秒高质量音频。它采用CLAP-Ranked Preference Optimization框架优化音频输出,支持多种应用场景,包括多媒体内容创作、音频制作、播客、教育及虚拟助手开发。其开源特性推动了相关领域的技术进步。