OmniTalker OmniTalker 是一款由阿里巴巴开发的实时多模态交互技术,支持文本、图像、音频和视频的同步处理,并能生成自然流畅的语音响应。其核心技术包括 Thinker-Talker 架构和 TMRoPE 时间对齐技术,实现音视频精准同步与高效流式处理。适用于智能语音助手、内容创作、教育、客服及工业质检等场景,具有高实时性与稳定性。 AI项目与工具 2025年06月12日 59 点赞 0 评论 717 浏览
Notiv Notiv是一款面向学生的AI学习工具,可自动分析笔记并生成复习题、抽认卡和重点总结,提升学习效率。它提供个性化学习建议,支持快速备考模式,并具备智能总结和互动式学习功能,适用于日常学习、在线课程及团队协作等场景。 AI项目与工具 2025年06月11日 20 点赞 0 评论 717 浏览
InstructMove InstructMove是由东京大学与Adobe合作开发的图像编辑模型,基于视频帧对变化学习如何根据指令进行图像操作。它能够执行非刚性编辑、视角调整和元素重排等任务,同时支持精确的局部编辑。该模型采用真实视频数据训练,提升编辑自然性与真实性,适用于影视、广告、设计等多个领域。其技术基于多模态语言模型和扩散模型,结合掩码和ControlNet等控制机制,实现灵活高效的图像编辑。 AI项目与工具 2025年06月12日 21 点赞 0 评论 717 浏览
Opus Clip Opus Clip是一款由Opus公司开发的AI视频剪辑工具,它能够自动从长视频中提取亮点片段,并生成短视频。该工具利用AI技术分析视频内容,识别重要时刻。Opus Clip简化了视频编辑流程,使得即使是非专业用户也能够快速制作出适合社交媒体分享的短视频。此外,它还提供了手动选择和编辑片段的功能,以及基本的视频编辑工具。 AI项目与工具 2025年06月12日 33 点赞 0 评论 717 浏览
BlockDance BlockDance是由复旦大学与字节跳动联合开发的扩散模型加速技术,通过识别结构相似的时空特征(STSS)减少冗余计算,提升推理效率达25%-50%。结合强化学习的BlockDance-Ada模块实现动态资源分配,平衡速度与质量。适用于图像、视频生成及实时应用,支持多种模型,兼顾高效与高质,适用于资源受限环境。 AI项目与工具 2025年06月12日 38 点赞 0 评论 717 浏览
Ai Drawing Generator 一个免费的在线AI图像生成器,它可以将用户提供的文本描述或者简单涂鸦转化为详细的图像。 Ai绘画生成 2025年06月05日 26 点赞 0 评论 717 浏览
CreateBookAI 一个在线AI绘本创作工具,CreateBookAI通过AI技术帮助用户通过只需几个简单步骤即可生成全插图的个性化儿童书籍,适用于各种场合。 Ai绘画生成 2025年06月05日 45 点赞 0 评论 716 浏览
Deepfake Defenders Deepfake Defenders 是一个由中国科学院自动化研究所的 VisionRush 团队开发的开源 AI 模型,主要用于检测和防御 Deepfake 技术生成的伪造图像和视频。它通过分析媒体内容中的细微像素变化来识别伪造内容,并提供像素级分析、实时检测等功能。该模型采用卷积神经网络(CNN)、生成对抗网络(GAN)等技术,支持多模态分析,具备开源协作特性,广泛应用于社交媒体监控、新闻验证 AI项目与工具 2025年06月12日 20 点赞 0 评论 716 浏览
logo123 logo123,智能LOGO设计生成器,只需输入品牌名称就能免费在线生成公司logo设计及配套企业VI,轻松打造您的个性品牌! 图片处理 2025年06月05日 65 点赞 0 评论 716 浏览