CoGenAV

首页

CoGenAV

列表

默认

浏览次数

发布日期

CoGenAV

CoGenAV是一种先进的多模态学习模型，专注于音频和视觉信号的对齐与融合。通过对比特征对齐和生成文本预测的双重目标进行训练，利用同步音频、视频和文本数据，学习捕捉时间对应关系和语义信息。CoGenAV具备音频视觉语音识别、视觉语音识别、噪声环境下的语音处理、语音重建与增强、主动说话人检测等功能，适用于智能助手、视频内容分析、工业应用和医疗健康等多个场景。

AI项目与工具 2025年06月11日 80 点赞 0 评论 626 浏览

CoGenAV 首页 CoGenAV

列表 默认 浏览次数 发布日期

CoGenAV

CoGenAV

首页

CoGenAV

列表

默认

浏览次数

发布日期