AI - 智狐AI导航

谷歌DeepMind推出V2A技术，可为无声视频添加逼真音效

DeepMind推出的V2A（Video-to-Audio）模型能够将视频内容与文本提示相结合，生成包含对话、音效和音乐的详细音频轨道。它不仅能够与DeepMind自身的视频生成模型Veo协同工作，还能与其他视频生成模型，如Sora、可灵或Gen 3等，进行集成，从而为视频添加戏剧性的音乐、逼真的音效或与视频中角色和情绪相匹配的对话。V2A的强大之处在于其能够为每个视频输入生成无限数量的音轨。该模

AI项目与工具 2025年06月12日 21 点赞 0 评论 549 浏览

豆包AI

“豆包”是字节跳动公司基于云雀模型开发的 AI 工具，提供聊天机器人、写作助手以及英语学习助手等功能，它可以回答各种问题并进行对话，帮助人们获取信息。

AI写作对话 2025年06月05日 51 点赞 0 评论 549 浏览

SocraticLM

SocraticLM 是一款基于苏格拉底教学法的人工智能模型，由中科大与科大讯飞联合开发。它通过提问引导学生主动思考，具备多轮对话能力和个性化教学功能。模型在 SocraTeach 数据集上训练，教学性能优于 GPT-4，整体质量提升 12%。其综合评估系统涵盖五项教学维度，适用于数学教学、个性化辅导及在线教育平台，为教育技术发展提供了新思路。

AI项目与工具 2025年06月12日 47 点赞 0 评论 549 浏览

TimeSuite

TimeSuite是一种由上海AI Lab开发的框架，专注于提升多模态大型语言模型在长视频理解任务中的表现。它通过引入高效的长视频处理框架、高质量的视频数据集TimePro和Temporal Grounded Caption任务，提升了模型对视频内容的时间感知能力，减少了幻觉风险，并显著提高了长视频问答和时间定位任务的性能。其核心技术包括视频令牌压缩、时间自适应位置编码、U-Net结构及多样化任务

AI项目与工具 2025年06月12日 78 点赞 0 评论 549 浏览

千图AI设计室

提供在线设计作品解读，AI抠图、批量AI背景擦除、A证件照制作、AI自动背景、老照片修复等功能，更有设计师彩虹屁模块，让AI每天夸夸助力设计师释放无限创意。

创作工具 2026年06月25日 0 点赞 0 评论 549 浏览

Auto Think

Auto Think是快手Kwaipilot团队开源的KwaiCoder-AutoThink-preview自动思考大模型，针对深度思考大模型的“过度思考”问题，提出了一种全新的训练范式。模型融合“思考”和“非思考”能力，能根据问题难度自动切换模式，提升复杂任务表现。在代码和数学类任务中，性能提升可达20分。其技术原理包括最小提示干预和多阶段强化学习，适用于视频生成、文案创作、智能客服等多个场景。

AI项目与工具 2025年06月11日 26 点赞 0 评论 549 浏览