AI - 智狐AI导航

G3D.ai

G3D.AI 提供了一个全面的人工智能解决方案，用以支持游戏开发的各个阶段。从视觉艺术到叙事构建，该平台通过自动化工具极大地提高了游戏开发的效率和创造力，尤其适合需要快速原型...

创作工具 2026年06月26日 0 点赞 0 评论 558 浏览

MMedAgent

MMedAgent是一款面向医疗领域的多模态AI平台，集成了指令优化的多模态大型语言模型（MLLM）及一系列定制化医疗工具，支持多种医学成像模式（如MRI、CT、X射线等），可高效处理视觉问答、分类、定位、分割、医学报告生成（MRG）及检索增强生成（RAG）等任务，显著提升了医疗数据处理效率与准确性。

AI项目与工具 2025年06月12日 45 点赞 0 评论 558 浏览

Yescribe.ai

一款AI驱动的转录服务，Yescribe.ai能够将音频和视频文件准确快速地转换为文本。支持98种语言、多种格式，并确保各行业的安全转录。

Ai语音工具 2025年06月05日 16 点赞 0 评论 558 浏览

Versatile

Versatile-OCR-Program是一款开源多模态OCR工具，支持从教育材料中提取文本、公式、表格等结构化数据，输出为JSON或Markdown格式，准确率高达90%-95%。它基于DocLayout-YOLO、Google Vision和MathPix等技术，支持多语言处理，适用于教育数据集制作、教学辅助、AI模型训练及个人学习等场景。

AI项目与工具 2025年06月11日 77 点赞 0 评论 559 浏览

PandaAI

PandaAI 是一款基于自然语言处理技术的智能数据分析平台，支持用户通过自然语言提问实现快速数据处理与可视化。它具备多数据源集成、智能图表生成、团队协作等功能，适用于商业分析、数据科学及数据管理等场景。平台提供免费与付费版本，满足不同用户需求，结合 LLM 与 RAG 技术提升数据分析效率。

AI项目与工具 2025年06月12日 65 点赞 0 评论 559 浏览

Google Beam

Google Beam是谷歌推出的AI驱动的3D视频通信平台，能够将2D视频流转换为逼真的3D效果，提升远程通话的自然度和直观性。用户可实现眼神交流和细微表情识别，增强沟通效果。支持实时语音翻译，打破语言障碍，并基于Google Cloud提供企业级可靠性，适用于远程协作、教育、医疗、国际合作和个人社交等多种场景。

AI项目与工具 2025年06月11日 76 点赞 0 评论 559 浏览

言之画

言之画是由出门问问推出的AI图像内容创作平台，用户只需输入一句话描述，便可以快速生成高质量商用图片素材。

Ai绘画生成 2026年06月26日 0 点赞 0 评论 559 浏览

MedGemma

MedGemma是谷歌推出的开源AI模型，专注于医疗图像与文本分析。它包含4B参数的多模态模型和27B参数的纯文本模型。4B模型擅长解读医疗图像并生成诊断报告，27B模型则用于医疗文本理解与临床推理。支持本地运行或通过Google Cloud部署，适用于医疗诊断、患者分诊、临床决策辅助等场景，提升医疗服务效率与准确性。

AI项目与工具 2025年06月11日 81 点赞 0 评论 559 浏览

URO

URO-Bench 是一个面向端到端语音对话模型的综合评估工具，支持多语言、多轮对话及副语言信息处理。它包含基础和高级两个赛道，分别涵盖16个和20个数据集，覆盖开放性问答、情感生成、多语言任务等。支持多种评估指标，提供简单易用的评估流程，并兼容多种语音对话模型。适用于智能家居、个人助理、语言学习等多个实际应用场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 559 浏览

图怪兽

图怪兽是一个集在线图片编辑与设计于一体的多功能平台，提供多样化的模板资源，涵盖多种应用场景。通过AI技术支持的颜色搜索和一键抠图等功能，大幅提高设计效率。该平台支持多终端同步使用，模板版权合规，适合各类用户群体，让设计工作更加高效和简便。

AI项目与工具 2025年06月12日 62 点赞 0 评论 559 浏览

AI

首页

AI

列表

默认

浏览次数

发布日期