图像识别

首页

图像识别

列表

默认

浏览次数

发布日期

Step

Step

覆盖了从个人使用到企业级应用的多个方面的多模态大模型。

创作工具 2026年06月21日 0 点赞 0 评论 734 浏览

Gemini

Gemini

Gemini

Gemini是Google DeepMind推出的全新AI模型，集成了多模态推理功能，超越了以往模型的性能，适用于科学文献洞察、竞争性编程等多种应用场景。

Ai平台模型 2025年06月05日 100 点赞 0 评论 741 浏览

SynthID

SynthID

SynthID是一款由DeepMind研发的技术工具，通过在AI生成的内容中嵌入数字水印来验证其真实性与原创性。它支持多种内容形式，包括文本、音乐、图像和视频，并具备良好的抗修改性和检测稳定性。SynthID不仅不影响内容质量，还提升了信息可信度，广泛应用于新闻、版权保护、教育、法律及社交媒体等领域。

AI项目与工具 2025年06月12日 43 点赞 0 评论 743 浏览

VLM

VLM

VLM-R1 是由 Om AI Lab 开发的视觉语言模型，基于 Qwen2.5-VL 架构，结合强化学习优化技术，具备精准的指代表达理解和多模态处理能力。该模型适用于复杂场景下的视觉分析，支持自然语言指令定位图像目标，并在跨域数据中表现出良好的泛化能力。其应用场景涵盖智能交互、无障碍辅助、自动驾驶、医疗影像分析等多个领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 744 浏览

Migician

Migician

Migician是一款由多所高校联合开发的多模态大语言模型，专为多图像定位任务设计。它基于大规模数据集MGrounding-630k，采用端到端架构和两阶段训练方法，支持跨图像精准定位与多任务处理。Migician适用于自动驾驶、安防监控、医疗影像等多个领域，具有高效的推理能力和灵活的输入方式。

AI项目与工具 2025年06月12日 90 点赞 0 评论 746 浏览

捷通华声—人工智能技术与服务提供商

捷通华声—人工智能技术与服务提供商

“灵云科技源自清华服务全球”的发展战略

创作工具 2026年06月21日 0 点赞 0 评论 750 浏览

海螺AI视频

海螺AI视频

多功能的AI助手，通过提供视频创作、音乐创作、图像识别和文本写作等功能，帮助用户提升工作和学习的效率。它的智能化和高效率的特点，使其成为提升生产力的有力工具。

Ai视频生成 2026年06月21日 0 点赞 0 评论 759 浏览

苏打办公

苏打办公

苏打办公是一款提供在线协作和办公工具的平台，拥有多项实用功能，帮助用户方便地进行团队协作、文件管理和项目管理。

创作工具 2026年06月21日 0 点赞 0 评论 763 浏览

ChiChat

ChiChat

ChiChat是一款由AI技术支持的多功能智能助手平台，提供自然语言交互、文档分析、图像识别及创意图像生成等功能。其核心特性包括支持多页文档解析、多层图像识别、DALL-E图像生成以及实时搜索能力。ChiChat适用于客户服务、教育辅导、企业知识管理及个人事务处理等多种应用场景。

AI项目与工具 2025年06月12日 72 点赞 0 评论 766 浏览

知存科技

知存科技

专注研发基于存算一体先进技术的人工智能芯片

创作工具 2026年06月21日 0 点赞 0 评论 767 浏览

微信公众账号

微信扫一扫加关注