学习 - 智狐AI导航

Gemini 2.5 Pro

Gemini 2.5 Pro 是谷歌推出的高性能 AI 模型，具备深度推理能力，可在多模态输入下进行复杂任务处理。支持文本、图像、音频、视频及代码等多种输入形式，拥有 100 万 token 的上下文窗口。在推理、代码生成和多模态任务中表现优异，适用于学术研究、软件开发、创意工作和企业应用等多个领域。

AI项目与工具 2025年06月12日 75 点赞 0 评论 770 浏览

ClassPoint AI

ClassPoint AI 是一种由 AI 驱动，可从 PowerPoint 幻灯片生成测验问题。它使用先进的人工智能技术来分析幻灯片内容，只需单击一下即可创建发人深省的问题。

PPT资源 2025年06月05日 40 点赞 0 评论 770 浏览

Visio Studio

一款先进的图像捕获、背景移除和编辑工具。它为用户提供了一个全面的解决方案，用于创建高质量的视觉效果并增强其图像。

Ai图片处理 2025年06月05日 75 点赞 0 评论 770 浏览

OmniConsistency

OmniConsistency 是新加坡国立大学推出的图像风格迁移模型，旨在解决复杂场景下风格化图像的一致性问题。该模型采用两阶段训练策略，将风格学习与一致性学习解耦，并支持与任意风格的 LoRA 模块集成，实现高效且灵活的风格化效果。它在多种风格下保持图像的语义、结构和细节一致性，具备更高的灵活性和泛化能力，在实验中表现出与 GPT-4o 相当的性能。

AI项目与工具 2025年06月11日 40 点赞 0 评论 770 浏览

爱五笔

为用户提供一个在线的五笔词库，让用户可以高效地定制自己的五笔词库，兼容主流词库格式，方便用户更换输入法软件以后仍然能使用自己的词库。

排版编辑 2025年06月05日 41 点赞 0 评论 771 浏览

PrimitiveAnything

PrimitiveAnything是由腾讯AIPD与清华大学联合开发的3D形状生成框架，通过将复杂3D形状分解为基本基元并自回归生成，实现高质量、高保真度的3D模型重建。其支持从文本或图像生成内容，具备高效存储、模块化设计及良好的泛化能力，适用于3D建模、游戏开发、UGC创作及VR/AR应用等领域。

AI项目与工具 2025年06月11日 14 点赞 0 评论 771 浏览

ChatTTSPlus

ChatTTSPlus 是一款基于深度学习的语音合成工具，它通过 TensorRT 技术实现了显著的性能提升，同时支持语音克隆、模型压缩与加速等功能。该工具不仅适用于桌面端，还能够部署于移动设备，满足多种应用场景需求，包括有声读物制作、语言学习辅助、客户服务及娱乐等领域。 ---

AI项目与工具 2025年06月12日 13 点赞 0 评论 771 浏览

SAM2Point

SAM2Point是一种基于SAM2的3D分割技术，无需额外训练或2D-3D投影，即可直接对任意3D数据进行零样本分割。该工具通过将3D数据体素化，并将其模拟为多方向视频流，实现精确的空间分割。SAM2Point支持多种3D提示类型，如点、框和掩码，展现了在多种场景下的泛化能力，包括3D物体、室内室外环境以及LiDAR数据，为未来的3D可提示分割研究提供了新起点。

AI项目与工具 2025年06月12日 75 点赞 0 评论 772 浏览

ViTPose

ViTPose 是一种基于 Transformer 架构的人体姿态估计模型，通过图像块处理和特征提取实现关键点定位。提供多种版本，适用于不同任务需求。模型结构简洁，支持灵活扩展和参数调整，具备知识迁移能力。ViTPose+ 拓展至动物姿态估计，提升适用范围。在多个数据集上达到 SOTA 性能，广泛应用于运动分析、虚拟现实等领域。

AI项目与工具 2025年06月12日 28 点赞 0 评论 772 浏览

DualPipe

DualPipe是由DeepSeek开发的开源双向流水线并行技术，通过将前向和反向计算分离为独立管道并行执行，显著提升大规模深度学习模型的训练效率。该技术优化了计算与通信的重叠，降低内存峰值，提高资源利用率，并支持多模态处理、多任务学习等应用场景。适用于需要高效训练和推理的AI系统。

AI项目与工具 2025年06月12日 92 点赞 0 评论 773 浏览

学习

首页

学习

列表

默认

浏览次数

发布日期