AI - 智狐AI导航

Product Avatar

Product Avatar 是一款由 TopView 推出的 AI 工具，能够将产品图片转化为由虚拟人物手持展示的视频内容。用户只需上传图片并选择模板，即可生成高质量视频，无需真人模特。支持多语言与唇形同步，适用于电商、社交媒体及广告营销等场景，帮助品牌提升产品展示效果与全球市场沟通能力。

AI项目与工具 2025年06月12日 94 点赞 0 评论 735 浏览

LlamaV

LlamaV-o1是由阿联酋穆罕默德·本·扎耶德人工智能大学等机构开发的多模态视觉推理模型，具备结构化推理和透明性，支持文本、图像和视频等多种模态的信息处理。该模型引入了VRC-Bench基准测试，涵盖4000多个推理步骤，用于全面评估推理能力。其性能优于多个开源模型，适用于医疗影像分析、金融数据解读、教育辅助和工业检测等场景，具有高准确性和可解释性。

AI项目与工具 2025年06月12日 74 点赞 0 评论 579 浏览

Kokoro

Kokoro-TTS是一款由hexgrad开发的轻量级文本转语音工具，基于StyleTTS 2与ISTFTNet架构，支持多种语音风格和自然语调，具备实时处理能力。支持美式与英式英语，提供10种语音包，适用于教育、游戏、客服等多种场景。支持本地部署与API集成，确保数据安全与高效运行。

AI项目与工具 2025年06月12日 33 点赞 0 评论 941 浏览

KHOJ

KHOJ是一款开源的AI助手，支持多源知识整合与语义搜索，兼容多种文档格式和AI模型。提供图像生成、语音交互、跨平台访问等功能，支持本地与云端部署，适用于个人知识管理、学习研究、团队协作等场景，具有高度灵活性和可扩展性。

AI项目与工具 2025年06月12日 24 点赞 0 评论 852 浏览

Luma Ray2

Luma Ray2 是 Luma AI 推出的视频生成模型，基于多模态架构，支持文本和图像输入，生成高质量、连贯的视频内容。相较前代，视频时长从 5 秒提升至 1 分钟，支持电影级运镜和逼真特效，适用于影视制作、广告、游戏动画及教育等多个领域。

AI项目与工具 2025年06月12日 28 点赞 0 评论 677 浏览

Pipecat

Pipecat是一款开源Python框架，用于构建语音和多模态对话系统。它整合了语音识别、文本转语音及对话处理功能，支持与主流AI平台集成，采用模块化管道架构，提升开发效率。基于帧的实时处理机制确保流畅交互，适用于语音助手、企业服务、教育、医疗及多模态应用等多种场景。

AI项目与工具 2025年06月12日 78 点赞 0 评论 811 浏览

Loora

Loora是一款AI驱动的英语口语学习工具，通过模拟真实场景帮助用户提升英语表达能力。支持商务、面试、日常交流等多场景练习，提供实时发音、语法及流利度反馈。具备24小时可用性、个性化课程设计、语音识别与翻译功能，并支持学习进度跟踪，适用于各类英语学习者。

AI项目与工具 2025年06月12日 30 点赞 0 评论 695 浏览

MagicSchool

MagicSchool是一款面向教育领域的AI平台，提供课程规划、视频问题生成、行为干预方案制定和内容创作等功能，帮助教师提高教学效率与质量。平台支持多语言操作，内置80多种AI工具，适用于课堂教学、备课、学生个性化支持及家校沟通等多种场景，具备良好的实用性与扩展性。

AI项目与工具 2025年06月12日 31 点赞 0 评论 593 浏览

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库，具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别，适用于语音助手、会议记录、实时字幕等场景，提供灵活的音频输入与预处理机制，便于开发者快速集成和扩展。

AI项目与工具 2025年06月12日 97 点赞 0 评论 865 浏览

Step R

Step R-mini是一款由阶跃星辰推出的推理模型，具备主动规划、尝试与反思能力，适用于数学、逻辑推理、代码开发及文学创作等多种场景。模型基于慢思考机制，支持深度推理与多步骤验证，表现优异。其技术特点包括强化学习、数据质量优化、测试时计算扩展及模型规模增长，实现文理兼修，广泛应用于教育、科研、企业办公等领域。

AI项目与工具 2025年06月12日 43 点赞 0 评论 529 浏览

AI

首页

AI

列表

默认

浏览次数

发布日期