AI - 智狐AI导航

Xiaomi MiMo

Xiaomi MiMo 是小米推出的推理型大模型，具备强大的数学推理与代码生成能力。通过预训练与后训练相结合，利用大量高价值语料及强化学习算法，在 7B 参数规模下实现超越更大模型的表现。支持多场景应用，包括教育、科研、软件开发等，已开源至 HuggingFace，便于开发者使用与研究。

AI项目与工具 2025年06月11日 95 点赞 0 评论 793 浏览

Dolphin

Dolphin是由清华大学与海天瑞声联合开发的面向东方语言的语音识别大模型，支持40种语言及22种中文方言，具备高精度语音转文字能力。采用CTC-Attention架构，结合E-Branchformer和Transformer技术，提升识别效率与准确性。模型开源，支持自定义语言与地区设置，适用于会议记录、语音输入、智能助手等多种场景。

AI项目与工具 2025年06月12日 20 点赞 0 评论 793 浏览

Edicho

Edicho 是一种基于扩散模型的图像编辑工具，能够在多图像间实现一致性编辑，无需额外训练。其核心技术包括 Corr-Attention 注意力模块和 Corr-CFG 去噪策略，通过显式图像对应关系提升编辑质量与一致性。适用于图像修复、风格转换、内容创作、医学影像增强等场景，具备良好的兼容性与扩展性。

AI项目与工具 2025年06月12日 67 点赞 0 评论 793 浏览

GPTMaket

GPTMaket，一个AI智能出题平台, 由GPT提供支持。

教育学习 2025年06月05日 74 点赞 0 评论 793 浏览

博查AI搜索

国内首个多模型AI搜索引擎，它基于大模型和实时搜索技术，能够理解自然语言提问，并细分检索直接生成准确的答案。

Ai办公效率 2025年06月05日 44 点赞 0 评论 793 浏览

KataList Ai

一个利用AI将剧本转化为视觉故事的工具。通过KataList Ai可以生成创意提案、故事板和视频，并提供音乐和旁白等一站式服务。

Ai视频生成 2025年06月05日 37 点赞 0 评论 793 浏览

VRAG

VRAG-RL是阿里巴巴通义大模型团队推出的视觉感知驱动的多模态RAG推理框架，旨在提升视觉语言模型在处理视觉丰富信息时的检索、推理和理解能力。通过定义视觉感知动作空间，实现从粗粒度到细粒度的信息获取，并结合强化学习和综合奖励机制优化模型性能。该框架支持多轮交互推理，具备良好的可扩展性，适用于智能文档问答、视觉信息检索、多模态内容生成等多种场景。

AI项目与工具 2025年06月11日 84 点赞 0 评论 793 浏览

VideoFusion

VideoFusion 是一款开源的短视频处理工具，支持自动去除黑边、水印和字幕，智能旋转视频方向，提升画质，并兼容多种视频格式。具备批量处理、自定义设置和实时进度反馈功能，适用于视频创作者、自媒体运营及企业等多场景应用。

AI项目与工具 2025年06月12日 27 点赞 0 评论 793 浏览

LipDub

LipDub是一款利用AI技术的多语言配音工具，可将视频实时翻译成27种语言，确保声音与口型同步。其核心功能包括实时录制与翻译、高质量翻译、多语言支持及便捷分享，适用于教育、商务、旅游及娱乐等多种场景，助力全球化的跨文化交流与内容传播。

AI项目与工具 2025年06月12日 61 点赞 0 评论 793 浏览

Imagine Explainers

Imagine Explainers 是一款基于 AI 的视频生成工具，支持用户根据主题和时长快速生成高质量动画视频。提供多种模板、角色和风格选择，支持 AI 语音或自定义音频。适用于教育、商业、营销等多个领域，能够将复杂内容转化为直观的视觉表达，提升信息传达效率。

AI项目与工具 2025年06月11日 85 点赞 0 评论 793 浏览

AI

首页

AI

列表

默认

浏览次数

发布日期