谷歌DeepMind推出V2A技术,可为无声视频添加逼真音效 DeepMind推出的V2A(Video-to-Audio)模型能够将视频内容与文本提示相结合,生成包含对话、音效和音乐的详细音频轨道。它不仅能够与DeepMind自身的视频生成模型Veo协同工作,还能与其他视频生成模型,如Sora、可灵或Gen 3等,进行集成,从而为视频添加戏剧性的音乐、逼真的音效或与视频中角色和情绪相匹配的对话。V2A的强大之处在于其能够为每个视频输入生成无限数量的音轨。该模 AI项目与工具 2025年06月12日 21 点赞 0 评论 191 浏览
Genie 2 Genie 2是一款由DeepMind开发的大规模基础世界模型,其核心功能包括基于单一图片生成可交互3D游戏世界、模拟物体交互及物理效果、支持多类型动作控制、具备长时间记忆能力以及实时生成新场景内容。该工具不仅适用于智能体训练与评估,还广泛应用于游戏开发、模拟与训练、机器人学习以及虚拟现实和增强现实等领域。 AI项目与工具 2025年06月12日 40 点赞 0 评论 189 浏览
Agentar Agentar是蚂蚁数科推出的智能体开发平台,面向金融机构提供一站式AI开发工具。平台基于大量金融数据与AI技术,支持零代码、低代码开发,具备高安全性与合规性。其核心功能涵盖可信智能体技术、高质量知识库、可视化编排及丰富服务组件,适用于智能投研、客服、风控、营销与合规管理等场景,助力金融机构提升决策效率与智能化水平。 AI项目与工具 2025年06月11日 90 点赞 0 评论 187 浏览
AiPathly AiPathly是一款面向希望进入AI领域的专业人士的综合性平台,提供个性化技能评估、定制学习路径、职业匹配报告及实时行业洞察等功能。用户可通过模拟项目积累实践经验,并借助简历和作品集优化服务提升求职竞争力。无论是职业转型者、技能提升者还是学生群体,均可借助AiPathly实现高效成长与成功转型。 AI项目与工具 2025年06月12日 97 点赞 0 评论 186 浏览
妙构 妙构是一款基于AI技术的视频内容分析工具,能够从视觉、音频和创意结构等多个维度对视频进行深度解析,提供专业的优化建议。其功能包括趋势分析、案例学习、智能反馈等,适用于视频创作者、内容策划及营销人员,帮助提升视频质量与传播效果。 AI项目与工具 2025年06月11日 86 点赞 0 评论 185 浏览
LLM Engineer Toolkit 一个精心整理的LLM工具库,它将120多个与LLM相关的库按照功能和用途进行了细致分类,涵盖了从训练微调、应用开发、推理服务到安全评估等 LLM 开发全流程所需的工具。 Ai学习资源 2025年06月05日 71 点赞 0 评论 178 浏览
URO URO-Bench 是一个面向端到端语音对话模型的综合评估工具,支持多语言、多轮对话及副语言信息处理。它包含基础和高级两个赛道,分别涵盖16个和20个数据集,覆盖开放性问答、情感生成、多语言任务等。支持多种评估指标,提供简单易用的评估流程,并兼容多种语音对话模型。适用于智能家居、个人助理、语言学习等多个实际应用场景。 AI项目与工具 2025年06月12日 47 点赞 0 评论 173 浏览
Speech Studio Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发... Ai语音工具 1970年01月01日 0 点赞 0 评论 173 浏览
AxBench AxBench是斯坦福大学推出的语言模型可解释性评估框架,支持概念检测与模型转向任务。它通过合成数据生成训练集,评估模型对特定概念的识别能力和干预后的表现。提供统一的评估平台,支持多种控制方法,如提示、微调和稀疏自编码器,并采用多维评分机制,适用于AI安全、伦理及内容生成等场景。 AI项目与工具 2025年06月12日 98 点赞 0 评论 168 浏览
HealthBench HealthBench是OpenAI推出的开源医疗评估工具,用于衡量大型语言模型在医疗保健领域的表现和安全性。它包含5000个由医生设计的多轮对话,涵盖多种健康场景,并通过多维度评分标准评估模型的准确性、沟通质量等。支持按主题和行为维度进行细分分析,帮助开发者识别模型优势与不足,指导优化方向。适用于模型性能评估、安全测试及医疗AI工具选择。 AI项目与工具 2025年06月11日 79 点赞 0 评论 158 浏览