应用 - 智狐AI导航

GPT Shortcut

让生产力加倍的 GPT 快捷指令

AI写作对话 2026年06月22日 0 点赞 0 评论 749 浏览

Reverb ASR

Reverb ASR是一款基于深度学习的开源自动语音识别与说话人分离工具，采用20万小时高质量英语语音数据训练，具备高精度语音转录能力，支持逐字稿控制及多种解码模式。其显著特点是擅长处理长时间语音内容，并在长篇幅识别任务中超越其他开源模型。Reverb ASR适用于播客、会议记录、法庭记录等多个应用场景，为用户提供灵活且高效的语音转文字解决方案。

AI项目与工具 2025年06月12日 55 点赞 0 评论 748 浏览

OpenMusic

OpenMusic是一款基于QA-MDT技术的文生音乐工具，支持从文本生成高质量音乐作品，具备质量感知训练、多样化风格生成及复杂推理能力。它广泛应用于音乐制作、多媒体内容创作、音乐教育等领域，同时提供音频编辑与处理功能，旨在提升音乐创作效率和质量。

AI项目与工具 2025年06月12日 87 点赞 0 评论 748 浏览

ELI5

像我五岁一样解释（ELI5） ...

教育学习 2026年06月22日 0 点赞 0 评论 747 浏览

Komiko

Komiko是一款基于先进生成式AI技术的动漫创作工具，支持用户在无限画布上轻松完成漫画创作，涵盖角色设计、对话气泡添加、视觉效果调整等多功能模块。其核心优势在于降低创作门槛，促进创意落地，并通过角色一致性维护保证作品质量，适用于个人创作、教育学习、市场营销等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 747 浏览

Food Mood

Food Mood 是 Google AI 推出的创意菜谱生成工具，支持用户将两种不同国家的菜系进行融合，创造出独特的食谱。用户可选择菜品类别、用餐人数、添加特定食材，并根据饮食偏好（如素食、无麸质）进行定制。工具提供随机生成功能，帮助用户获得灵感，生成的食谱包含详细食材清单、制作步骤、精致插图和实用贴士。

AI项目与工具 2025年06月11日 58 点赞 0 评论 747 浏览

ComicsMaker

ComicsMaker是一款基于人工智能技术的在线漫画创作平台，提供页面设计、漫画风格生成、图像处理、姿势创建、图片修复等功能，支持高清画质输出及多种漫画风格选择，适用于个人创作、教学辅助及商业用途，助力用户快速实现漫画创作目标。

AI项目与工具 2025年06月12日 30 点赞 0 评论 747 浏览

VLM

VLM-R1 是由 Om AI Lab 开发的视觉语言模型，基于 Qwen2.5-VL 架构，结合强化学习优化技术，具备精准的指代表达理解和多模态处理能力。该模型适用于复杂场景下的视觉分析，支持自然语言指令定位图像目标，并在跨域数据中表现出良好的泛化能力。其应用场景涵盖智能交互、无障碍辅助、自动驾驶、医疗影像分析等多个领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 746 浏览

MATRIX

MATRIX-Gen是一个基于多智能体模拟技术的系统，通过构建虚拟社会生成高质量训练指令数据，用于提升大型语言模型的表现。该工具支持多种应用场景，如软件开发、商业活动、医疗诊断、教育和客户服务，能够显著提高模型在不同领域的性能，并促进其自我进化。

AI项目与工具 2025年06月12日 73 点赞 0 评论 746 浏览

CausVid是一种由Adobe和MIT联合开发的实时视频生成技术，基于自回归生成模型和蒸馏预训练技术，实现了低延迟、高效率的视频创作。其核心功能包括即时视频生成、快速流式生成、零样本图像到视频转换、视频风格迁移、长视频生成以及交互式剧情生成等。CausVid通过分布匹配蒸馏、非对称蒸馏策略和滑动窗口机制等技术手段，优化了视频生成的质量与稳定性，适用于内容创作、新闻报道、教育培训、游戏开发及广告营

AI项目与工具 2025年06月12日 80 点赞 0 评论 746 浏览

应用

首页

应用

列表

默认

浏览次数

发布日期