ViT - 智狐AI导航

KYP.ai

KYP.ai的功能只要是通过工具识别可以通过自动化工具解决的障碍和低效，并向客户管理员提供建议。

AI服务商 2025年06月05日 49 点赞 0 评论 881 浏览

Civitai

Civitai（C站）是一个让人们可以轻松分享和发现AI艺术创作资源的平台。平台用户可以上传和共享他们使用自己的数据训练的AI生成自定义模型，或者浏览和下载其他用户创建的模型。

Ai绘画生成 2025年06月05日 58 点赞 0 评论 791 浏览

Fish Speech

Fish Speech是一款开源的文本到语音（TTS）工具，支持中文、英文和日文。它通过大约15万小时的多语种数据训练，实现了接近人类水平的语音合成效果。该工具的特点包括低显存需求（仅需4GB）、快速推理速度、高自定义性和灵活性。Fish Speech支持多种语音生成模型，如VITS2、Bert-VITS2等，适用于智能助手、自动客服、语言学习等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 778 浏览

ViTPose

ViTPose 是一种基于 Transformer 架构的人体姿态估计模型，通过图像块处理和特征提取实现关键点定位。提供多种版本，适用于不同任务需求。模型结构简洁，支持灵活扩展和参数调整，具备知识迁移能力。ViTPose+ 拓展至动物姿态估计，提升适用范围。在多个数据集上达到 SOTA 性能，广泛应用于运动分析、虚拟现实等领域。

AI项目与工具 2025年06月12日 28 点赞 0 评论 772 浏览

FastVLM

FastVLM是一款高效的视觉语言模型，采用FastViTHD混合视觉编码器，显著提升高分辨率图像处理速度并减少token数量。其在保持高性能的同时，降低了计算成本和模型复杂度。适用于视觉问答、图文匹配、文档理解、图像描述生成等多模态任务，具备良好的实用性和扩展性。

AI项目与工具 2025年06月11日 85 点赞 0 评论 736 浏览

Fish Speech 1.5

Fish Speech 1.5是一款基于深度学习的文本转语音（TTS）工具，支持多语言文本输入，通过Transformer、VITS、VQVAE和GPT等技术实现高质量语音合成。它具备零样本和少样本语音合成能力，延迟时间短，无需依赖音素，泛化性强，且支持本地化部署。Fish Speech 1.5可应用于有声读物、辅助技术、语言学习及客户服务等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 692 浏览

EfficientTAM是一款由Meta AI研发的轻量级视频对象分割与跟踪模型，基于非层次化Vision Transformer（ViT）构建，通过引入高效记忆模块显著降低了计算复杂度。它能够实现高质量的视频对象分割与多目标跟踪，同时保持较低的延迟和较小的模型尺寸，特别适用于移动设备上的实时视频处理。该模型已在多个视频分割基准测试中表现出色，并支持多种应用场景，包括移动视频编辑、视频监控、增强现

AI项目与工具 2025年06月12日 65 点赞 0 评论 670 浏览

Diagram

Diagram是一个提供用于创建和编辑图表的各种工具和集成的网站。Diagram有四个主要产品：Generative Creativity、Automator、Magician 和 Genius。

Ai绘画生成 2025年06月05日 25 点赞 0 评论 649 浏览

迅排设计

一款漂亮且功能强大的在线海报设计器，图片编辑器，仿稿定设计，迅排设计Poster-Design适用于海报生成、电商产品图、文章长图、视频/公众号封面等多种场景。

Ai开源项目 2025年06月05日 78 点赞 0 评论 628 浏览

Civitai社区 – C站

Civitai 社区是一个专为 AI 艺术家设计的平台，它提供了一个分享和发现 AI 艺术创作资源的空间。通过这个平台，用户不仅可以获取丰富的模型资源，还能成为充满活力的创作社区的一...

Ai绘画生成 2026年06月22日 0 点赞 0 评论 524 浏览

ViT

首页

ViT

列表

默认

浏览次数

发布日期