深度学习

首页

深度学习

列表

默认

浏览次数

发布日期

OmniParse

OmniParse

OmniParse是一款开源数据解析平台，支持多种文件类型的非结构化数据转换为结构化格式，包括文档、图像、视频、音频及网页内容。其核心功能涵盖表格提取、图像字幕生成、音视频转录以及网页内容结构化处理，利用自然语言处理、光学字符识别及深度学习技术提升解析效率与准确性。OmniParse完全在本地运行，确保数据隐私与安全，广泛应用于文档自动化处理、客户服务、市场研究、法律合规及医疗记录管理等领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 586 浏览

SmartEraser

SmartEraser

SmartEraser是中科大与微软亚洲研究院联合开发的图像编辑工具，采用“掩码区域引导”技术实现精准对象移除，同时保留周围上下文。基于Syn4Removal数据集训练，支持多种掩码输入，适用于复杂场景，广泛应用于照片编辑、设计、文物修复及科研等领域。

AI项目与工具 2025年06月12日 36 点赞 0 评论 587 浏览

PlanGEN

PlanGEN

PlanGEN 是谷歌研发的多智能体协作框架，用于解决复杂问题的规划与推理。它包含约束、验证和选择三大智能体，支持多智能体协作、约束引导、算法自适应选择等功能。提供四种实现方式，适用于不同复杂度任务，如日程安排、数学证明、自动驾驶等。具有模型不可知性，可与多种大语言模型结合，具备良好的可扩展性和灵活性。

AI项目与工具 2025年06月12日 35 点赞 0 评论 589 浏览

代悟

代悟是一款基于深度学习技术和知识图谱的智能AI搜索引擎，专注于为开发者提供高效、精准的技术支持。它能够解析复杂的技术问题，提供代码示例、文档检索、错误诊断及性能优化建议等功能。代悟支持多语言开发环境，适用于代码开发、问题解决、技术学习及项目规划等多个场景。

AI项目与工具 2025年06月12日 52 点赞 0 评论 589 浏览

Wan2.1

Wan2.1

Wan2.1是阿里云推出的开源AI视频生成模型，支持文生视频与图生视频，具备复杂运动生成和物理模拟能力。采用因果3D VAE与视频Diffusion Transformer架构，性能卓越，尤其在Vbench评测中表现领先。提供专业版与极速版，适应不同场景需求，已开源并支持多种框架，便于开发与研究。

AI项目与工具 2025年06月12日 47 点赞 0 评论 590 浏览

生数

生数以其创新的多模态大模型和深度生成式算法研究，为艺术设计、游戏制作、影视后期和内容社交等领域提供了强大的技术支持和解决方案。

创作工具 2026年06月21日 0 点赞 0 评论 590 浏览

ElevenLabs

ElevenLabs

ElevenLabs 是一个为内容创作者和出版商提供功能强大且用途广泛的 AI 语音软件的平台。它允许用户使用其先进的多用途 AI 语音工具以任何语音和风格生成高质量的口语音频。

Ai语音工具 2025年06月05日 12 点赞 0 评论 592 浏览

疯语咒AI

疯语咒AI

疯语咒AI是AI技术和教育的先行者，提供海量免费的AI学习材料。

Ai学习资源 2025年06月05日 21 点赞 0 评论 593 浏览

书生·筑梦2.0（Vchitect 2.0）

书生·筑梦2.0（Vchitect 2.0）

书生·筑梦2.0是一款由上海人工智能实验室开发的开源视频生成大模型，支持文本到视频和图像到视频的转换，生成高质量的2K分辨率视频内容。它具备灵活的宽高比选择、强大的超分辨率处理能力以及创新的视频评测框架，适用于广告、教育、影视等多个领域。

AI项目与工具 2025年06月12日 32 点赞 0 评论 594 浏览

Eagle

Eagle

Eagle是一个由英伟达开发的多模态大模型，专长于处理高分辨率图像，提高视觉问答和文档理解能力。该模型采用多专家视觉编码器架构，通过简单的特征融合策略实现图像内容的深入理解。Eagle模型已开源，适用于多个行业，具有高分辨率图像处理、多模态理解、多专家视觉编码器、特征融合策略和预对齐训练等特点。

AI项目与工具 2025年06月12日 38 点赞 0 评论 597 浏览

微信公众账号

微信扫一扫加关注