模型

EfficientTAM

EfficientTAM是一款由Meta AI研发的轻量级视频对象分割与跟踪模型,基于非层次化Vision Transformer(ViT)构建,通过引入高效记忆模块显著降低了计算复杂度。它能够实现高质量的视频对象分割与多目标跟踪,同时保持较低的延迟和较小的模型尺寸,特别适用于移动设备上的实时视频处理。该模型已在多个视频分割基准测试中表现出色,并支持多种应用场景,包括移动视频编辑、视频监控、增强现

数字鸭AI助手

数字鸭AI助手,一个同时具备ChatGPT4聊天 + Midjourney V5绘画双服务的小程序,上百个场景应用助你生活学习工作更方便。

提示词交易站| Tipstore

提示词交易站| Tipstore,你可以在这里找到各类提示词,帮助你更好的使用AI工具,提升工作效率。如果您是一位优秀的提示词创作者,您可以在这里销售自己的提示词。

Seamless Communication

强大的AI同声传译工具,它通过实时处理和翻译语音,极大地促进了跨语言沟通。其低延迟、高准确度和多语言支持的特点,使其成为国际会议、多语言工作环境和任何需要实时语音翻译的...

BLIP3

BLIP3-o是Salesforce Research等机构推出的多模态AI模型,结合自回归与扩散模型优势,实现高效图像理解和生成。基于CLIP语义特征,支持文本与图像间的双向转换及图像编辑。采用顺序预训练策略,提升模型性能。完全开源,适用于创意设计、视觉问答、艺术生成等多种场景。

沃研Turbo大模型

沃恩智慧公司专为大学生设计的科研大模型,有期刊推荐、文献摘要、论文精读、翻译润色、创新点评估、个性化论文推荐以及AI降重等功能。

Gemini 2.5 Pro (I/O 版)

Gemini 2.5 Pro (I/O 版) 是 Google 推出的多模态 AI 模型,具备强大的编程能力和多模态内容生成功能。它能基于提示词或手绘草图快速生成交互式 Web 应用、游戏及模拟程序,并支持代码生成、编辑与优化。该模型在多个基准测试中表现优异,适用于 Web 开发、游戏制作、教育工具构建及企业级应用开发等领域。最新版本进一步提升了性能与灵活性。

Chatgpt4o.ai

一个提供免费访问GPT-4o模型的平台,用户可以提出各种问题并获得答案。

Windows AI Foundry

Windows AI Foundry 是微软推出的全新 AI 开发平台,提供从模型选择、优化、微调到部署的全生命周期支持。平台整合 Windows ML,支持在多种硬件上高效部署模型,并基于 Foundry Local 提供优化后的开源模型库。同时,提供即用型 AI API 和 LoRA 技术,帮助开发者快速集成和微调模型,提升开发效率与灵活性。

Parler

Parler-TTS是一款由Hugging Face开发的开源文本到语音(TTS)模型,能够模仿特定说话者的风格,生成高质量、自然的语音。该模型采用轻量级设计,包括文本编码器、解码器和音频编解码器,通过整合文本描述和嵌入层,优化了语音生成过程。Parler-TTS的所有资源公开,促进了高质量、可控TTS模型的发展。此外,用户还可以根据需要对模型进行自定义训练和微调。