AI项目与工具

LLaVA

LLaVA-OneVision是字节跳动开发的开源多模态AI模型，主要功能包括多模态理解、任务迁移、跨场景能力、开源贡献及高性能。该模型采用多模态架构，集成了视觉和语言信息，通过Siglip视觉编码器和Qwen-2语言模型，实现高效特征映射和任务迁移学习。广泛应用于图像和视频分析、内容创作辅助、聊天机器人、教育和培训以及安全监控等领域。

AI项目与工具 2025年06月12日 34 点赞 0 评论 823 浏览

YouTube Dubbing

YouTube Dubbing是一款利用AI技术实现跨语言视频观看的浏览器插件。它通过智能同步配音和字幕翻译功能，帮助用户轻松克服语言障碍，提升视频观看体验。支持多语言、多平台操作，提供多种语音风格和高级功能如倍速播放、背景音保留等，适合语言学习、国际教育、商务会议等多种应用场景。

AI项目与工具 2025年06月12日 93 点赞 0 评论 823 浏览

photoeditor

PhotoEditor是一款基于人工智能技术的在线图片编辑工具，支持多种格式的照片编辑，具备智能对象移除、自动图像增强、人像修饰、图像放大和多样化编辑工具等功能。凭借其对像素和上下文的精准分析，能够生成自然且高质量的结果，适用于社交媒体内容创作、电子商务产品图片处理、旅游照片优化和个人相册整理等多种应用场景。 ---

AI项目与工具 2025年06月12日 69 点赞 0 评论 822 浏览

OmniSearch

OmniSearch是一款由阿里巴巴通义实验室开发的多模态检索增强生成框架，具备自适应规划能力。它能够动态解析复杂问题，根据检索结果和问题情境调整检索策略，模拟人类解决复杂问题的行为，提升检索效率和准确性。OmniSearch支持多模态信息处理，包括文本、图像等，并通过递归检索与推理流程逐步接近问题解答，显著提高多模态检索的灵活性和效果。

AI项目与工具 2025年06月12日 52 点赞 0 评论 822 浏览

Slax Note

SlaxNote是一款利用语音识别技术的AI语音笔记应用，能够实时将语音转换为文本，并自动润色以提升文本质量。它特别适用于户外灵感捕捉、想法整理和内容总结。其主要功能包括实时语音转文字、自动润色、录音保存以及用户友好的界面设计，广泛应用于会议记录、灵感捕捉、日常笔记、亲子时光记录及内容创作等多个场景。

AI项目与工具 2025年06月12日 14 点赞 0 评论 822 浏览

Airparser

Airparser是一款利用GPT技术开发的数据提取工具，能够自动从电子邮件、PDF、文档等多种文件中提取结构化数据，支持60多种语言的文本识别。它具备强大的文档兼容性、自动化处理能力和与第三方应用的集成能力，广泛应用于客户关系管理、人力资源管理、财务管理等领域，帮助用户高效处理和管理数据。

AI项目与工具 2025年06月12日 96 点赞 0 评论 822 浏览

OpenMemory MCP

OpenMemory MCP 是一款基于开放模型上下文协议（MCP）的开源工具，支持 AI 工具间共享上下文信息，提升交互效率。具备本地化存储、统一管理界面、标准化 API 及多平台兼容性，适用于软件开发、项目管理等场景。数据全程本地处理，确保隐私与安全，采用 Docker 部署并结合零知识证明技术增强安全性。</p>

AI项目与工具 2025年06月11日 51 点赞 0 评论 822 浏览