教育

Kimi

Kimi-VL是月之暗面推出的轻量级多模态视觉语言模型,支持图像、视频、文档等多种输入形式。其基于轻量级MoE架构和原生分辨率视觉编码器,具备强大的图像感知、数学推理和OCR能力。在长上下文(128K)和复杂任务中表现优异,尤其在多模态推理和长视频理解方面超越同类模型。适用于智能客服、教育、医疗、内容创作等多个领域。

Whispo

Whispo是一款AI驱动的语音转录工具,支持用户通过快捷键快速录制语音并将其转写为文本,同时具备本地数据处理、隐私保护及基于大型语言模型的文本后处理功能。它适用于会议记录、教育、自动字幕生成等多个场景,旨在提升工作效率和用户体验。

Nova A.I.

一款简单却强大的在线视频编辑和日志软件,由计算机视觉视频搜索引擎提供支持。

Instant AI

Instant AI是一种AI驱动的PPT自动生成工具,可帮助用户毫不费力地在 Google 幻灯片中创建令人惊叹的演示文稿。

ACE

ACE是一款基于扩散Transformer架构的多模态图像生成与编辑工具,通过长上下文条件单元(LCU)和统一条件格式实现自然语言指令的理解与执行。它支持图像生成、编辑、多轮交互等多种任务,适用于艺术创作、媒体制作、广告设计、教育培训等多个领域,提供高效且灵活的视觉内容解决方案。

易健EasyHealth

易健EasyHealth是一款基于大语言模型技术开发的微信小程序,提供AI智能问答、情感智能算法、健康档案管理、健康数据分析及个性化健康咨询等多功能服务。用户可免费注册并自定义AI助手性格与回答风格,同时享受多语言支持和定制化健康建议,用于个人健康管理、健康咨询、疾病预防、健康教育及心理支持等多个应用场景。

Mathtutor on Groq

Mathtutor on Groq 是一款基于 Groq 架构的 AI 辅导工具,通过语音识别功能接收数学问题,结合强大的数学引擎提供实时解题过程与答案。其主要功能包括语音输入、LaTeX 公式渲染、高精度计算及自然语言处理支持,适用于代数、微积分等领域的学习与教学辅助。此外,它还集成了 xRx 框架、Whisper 和 Llama 模型,确保高效且精准的问题解决能力。Mathtutor on G

Insight

Insight-V是一款由南洋理工大学、腾讯和清华大学联合研发的多模态大型语言模型,专为提升长链视觉推理能力而设计。该模型通过多智能体系统将任务分解为推理与总结两步,并采用两阶段训练流程优化性能。其渐进式数据生成和多粒度评估方法进一步提升了模型的推理精度,在多个视觉推理基准测试中表现出色。

元镜

元镜是一款基于人机共生引擎的AI视频创作工具,支持从创意脚本生成到成片输出的全流程制作。具备多模态分镜设计、智能工作流和一键成片功能,提升视频创作效率与质量。适用于短视频、广告、教育、影视及政务宣传等多个领域,满足多样化内容生产需求。

LiveCC

LiveCC是一款由新加坡国立大学Show Lab与字节跳动联合开发的实时视频解说模型,基于自动语音识别字幕进行训练。它能够实时生成自然流畅的视频评论和回答相关问题,适用于体育、新闻、教育等多个场景。模型采用流式训练方法,结合大规模数据集和Qwen2-VL架构,具备低延迟和高质量的生成能力。LiveCC通过LiveSports-3K基准测试评估性能,广泛应用于视频内容分析与智能交互场景。