自然语言 - 智狐AI导航

FunASR

FunASR是一个由阿里巴巴达摩院开源的多功能语音识别工具包，涵盖语音识别（ASR）、语音活动检测（VAD）、标点恢复、说话人验证及分离等功能。它支持工业级模型的训练与微调，并提供预训练模型和易用接口，便于快速部署。新增的Whisper-large-v3-turbo模型进一步提升了其性能，广泛应用于智能助手、会议记录、客服系统和语音搜索等领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 791 浏览

Director

Director是一款基于VideoDB的视频智能处理框架，利用自然语言指令实现视频搜索、编辑、合成及生成等功能，同时支持实时流式传输。它提供了聊天式用户界面和预构建的视频代理，便于开发者和创作者快速构建定制化解决方案。此外，Director适用于视频内容管理、编辑、创作以及教育等多个领域，为企业和内容生产者提升工作效率。

AI项目与工具 2025年06月12日 59 点赞 0 评论 791 浏览

Style AI

Style AI 是一款支持图像、视频生成与编辑的 AI 工具，能够将照片转换为各种艺术风格，如古典绘画或现代数字艺术，同时保留图像核心元素。用户可通过自然语言指令轻松编辑图像，支持无缝合并多张照片，生成集体照或新场景，并能根据文字描述直接生成图像和视频。该工具提供高效、精准的解决方案，适用于艺术创作、创意设计、视频制作、照片编辑及虚拟场景合成等多种场景。

AI项目与工具 2025年06月11日 30 点赞 0 评论 792 浏览

蓝心千询

蓝心千询是vivo推出的一款AI对话机器人。它基于蓝心大模型，具备多种功能和应用场景。蓝心千询可以进行自然对话，快速回答知识信息的问题，还可以进行文学创作、图片生成，甚至编...

创作工具 2026年06月21日 0 点赞 0 评论 793 浏览

Felo Search

一款由ChatGPT和AI Agent提供支持的多语言AI搜索引擎，打破语言障碍，轻松获取全球信息的途径，特别适合需要详细和全面答案的研究人员和学习者，以及希望快速掌握实时新闻和权威信息的用户。

Ai办公效率 2025年06月05日 14 点赞 0 评论 795 浏览

OpenSPG

OpenSPG是一款基于SPG框架的知识图谱引擎，融合了LPG的结构性与RDF的语义性，旨在解决RDF/OWL语义复杂性问题。它提供了明确的语义表示、逻辑规则定义及灵活的算子框架，支持多种基础引擎和服务适配，广泛应用于金融、企业运营、客户服务、搜索引擎、医疗健康等领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 795 浏览

Pixtral 12B是一款由法国初创企业Mistral开发的多模态AI模型，能够同时处理图像和文本数据。该模型包含120亿参数，大小约为24GB，基于Nemo 12B文本模型构建。它具备强大的图像和文本处理能力，能够执行图像描述生成、统计照片中的物体数量等任务，并在多个基准测试中表现出色。Pixtral 12B将根据Apache 2.0许可证开源，用户可以自由下载和微调该模型。应用场景广泛，包括

AI项目与工具 2025年06月12日 69 点赞 0 评论 796 浏览

GoodWeBot

GoodWeBot 是一款基于 RPA 技术的开源 AI 微信机器人，支持一键运行，具备智能回复、群发消息、自动加好友、标签管理等功能。它集成了主流 AI 平台，操作简便，适用于企业营销、客户服务及个人社交管理等场景，兼具高效性和合规性。

AI项目与工具 2025年06月11日 94 点赞 0 评论 796 浏览

Scenethesis

Scenethesis是NVIDIA推出的AI框架，可通过文本生成高质量的3D场景。它结合LLM与视觉技术，经过布局规划、视觉细化、物理优化和场景验证四个阶段，确保生成结果具备物理合理性和空间连贯性。支持用户交互与多样化场景构建，广泛应用于VR/AR、游戏开发、具身智能及虚拟内容创作等领域。

AI项目与工具 2025年06月11日 13 点赞 0 评论 796 浏览

QA

QA-MDT是一款基于文本生成高质量音乐的开源工具，其核心技术包括质量感知训练、掩蔽扩散变换器以及音乐与文本的同步优化。它能够根据用户提供的文本描述生成多样化的音乐作品，并通过质量控制确保输出结果的高保真度。此外，QA-MDT支持音乐与文本的一致性增强，适用于广告、影视配乐、音乐教育及智能设备等多个领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 798 浏览

自然语言

首页

自然语言

列表

默认

浏览次数

发布日期