开发 - 智狐AI导航

Gemini Fullstack LangGraph Quickstart

Gemini Fullstack LangGraph Quickstart 是谷歌DeepMind推出的开源项目，旨在帮助开发者快速搭建基于 Google Gemini 2.5 和 LangGraph 的全栈智能研究助手。项目包含 React 前端和 LangGraph 后端，支持动态生成搜索查询、网络研究、反思推理、迭代优化搜索结果，并生成带有引用的综合答案。支持本地开发和 Docker 部署，

AI项目与工具 2025年06月11日 93 点赞 0 评论 799 浏览

OCode

OCode 是终端原生 AI 编程助手，为开发者提供深度代码库智能和自动任务执行功能。它与本地 Ollama 模型无缝集成，支持多文件重构、项目理解、开发自动化、数据处理、系统操作、交互式操作、文件操作、文本处理和开发工具等功能。OCode 通过终端原生工作流、深度代码库智能、自动任务执行、直接 Ollama 集成和可扩展插件层提升编程效率和质量，适用于前端开发、设计与开发协作、无代码开发、数据管

AI项目与工具 2025年06月11日 61 点赞 0 评论 906 浏览

Google AI Edge Gallery

Google AI Edge Gallery 是谷歌推出的实验性应用，支持在 Android 设备上本地运行机器学习和生成式人工智能模型，无需联网。用户可切换不同模型，进行图像问答、文本生成、多轮对话等操作，并实时查看性能指标。应用支持自带模型测试，提供丰富的开发者资源，助力探索设备端 AI 的强大功能。

AI项目与工具 2025年06月11日 75 点赞 0 评论 832 浏览

灵码 IDE

灵码 IDE是通义推出的AI原生IDE，深度适配千问3大模型，集成编程智能体、行间建议预测、行间会话等功能。支持多种编程语言和主流IDE，具备代码生成、续写、注释、单元测试生成、异常排查等能力，可提升开发效率。开发者可通过自然语言描述任务，实现端到端的编码操作，适用于新功能开发、工程级任务及企业数据个性化场景。

AI项目与工具 2025年06月11日 13 点赞 0 评论 783 浏览

OmniConsistency

OmniConsistency 是新加坡国立大学推出的图像风格迁移模型，旨在解决复杂场景下风格化图像的一致性问题。该模型采用两阶段训练策略，将风格学习与一致性学习解耦，并支持与任意风格的 LoRA 模块集成，实现高效且灵活的风格化效果。它在多种风格下保持图像的语义、结构和细节一致性，具备更高的灵活性和泛化能力，在实验中表现出与 GPT-4o 相当的性能。

AI项目与工具 2025年06月11日 40 点赞 0 评论 768 浏览

HunyuanPortrait

HunyuanPortrait是由腾讯Hunyuan团队联合多所高校推出的基于扩散模型的肖像动画生成工具。它能够根据一张肖像图片和视频片段，生成高度可控且逼真的动画，保持身份一致性并捕捉细微表情变化。该工具在时间一致性和泛化能力方面表现优异，适用于虚拟现实、游戏、人机交互等多个领域。

AI项目与工具 2025年06月11日 24 点赞 0 评论 765 浏览

WonderPlay

WonderPlay 是斯坦福大学与犹他大学联合开发的新型框架，能够从单张图片和用户定义的动作生成动态3D场景。它结合物理模拟与视频生成技术，支持多种物理材质和动作类型，实现逼真的动态效果。用户可通过简单操作与场景互动，生成丰富的物理响应。该工具具备交互式查看器，适用于AR/VR、影视特效、教育、游戏开发等多个领域。

AI项目与工具 2025年06月11日 35 点赞 0 评论 654 浏览

Direct3D

Direct3D-S2是由南京大学、DreamTech、复旦大学和牛津大学联合开发的高分辨率3D生成框架，基于稀疏体积表示和空间稀疏注意力（SSA）机制，提升扩散变换器（DiT）的计算效率并降低训练成本。该框架包含全端到端的稀疏SDF变分自编码器（SS-VAE），支持多分辨率训练，在1024³分辨率下仅需8个GPU即可训练。Direct3D-S2能够从图像生成高分辨率3D形状，具有精细几何细节和高

AI项目与工具 2025年06月11日 23 点赞 0 评论 821 浏览

Cartwheel

Cartwheel 是一款基于文本到动画（Text-to-Motion）技术的 AI 3D 动画生成平台，用户只需输入文本描述即可快速生成高质量的 3D 角色动画。平台结合深度学习与传统动画技术，支持动作捕捉、自动化运动合成，并与主流 3D 软件无缝集成。其功能包括文本驱动动画、可编辑动画、动作库预设等，适用于游戏开发、影视制作、广告营销、VR/AR 及教育等多个场景。Cartwheel 提供不同

AI项目与工具 2025年06月11日 14 点赞 0 评论 719 浏览

Morphik

Morphik是一款开源的多模态检索增强生成（RAG）工具，专为处理高技术性和视觉内容丰富的文档设计。支持图像、PDF、视频等多种格式的文档搜索，采用ColPali技术理解文档中的视觉内容，具备快速元数据提取功能，可提取边界框、标签、分类等信息。其主要功能包括多模态数据处理、智能解析文件、知识图谱构建、自然语言规则引擎和数据管理与集成，适用于技术文档处理、企业知识管理和智能应用开发等场景。

AI项目与工具 2025年06月11日 27 点赞 0 评论 627 浏览

开发

首页

开发

列表

默认

浏览次数

发布日期