AI项目与工具

Fish Agent

Fish Agent是一款集成了自动语音识别(ASR)与文本到语音(TTS)技术的端到端语音处理工具,能够直接实现语音到语音的转换,无需传统语义编码器/解码器。它支持多种语言,适用于语音转换、环境音频信息捕捉等场景,并基于深度学习技术优化了语音处理性能。Fish Agent可广泛应用于内容创作、教育、客户服务及娱乐等领域。

DeepTutor

DeepTutor 是一款基于人工智能的智能辅导系统,支持文本、图表、公式等多种内容的深度理解与解析。用户可上传 PDF 文档并选择不同模式进行提问,系统提供上下文相关的详细解答,并具备视觉内容解读、学习进度跟踪等功能。适用于学生学习、文献分析、知识图谱构建等场景,支持多语言界面,提升学习与研究效率。

PRDKit

PRDKit 是一款基于 AI 的产品需求文档生成工具,帮助产品经理快速构建结构化文档并生成可视化内容。支持自动生成推广文案、流程图和线框图,可提取网页或截图信息,并与多种协作和设计工具集成,提升团队效率和产品落地质量。

twee

twee是一款面向英语教师的AI工具平台,主要功能包括基于YouTube视频生成问题、创作多样化教学内容(如对话、故事、文章等),并支持多种练习类型(词汇、听力、口语、语法等)。它通过智能化手段简化课程准备,提升教学效率,适用于课堂教学、个性化学习及远程教学等多种场景。

MetaGPT

MetaGPT是一个基于大语言模型和多智能体协作系统的元编程框架,用于解决复杂问题。它通过将标准化操作程序(SOPs)编码成提示序列,实现了高效的工作流程和减少错误。MetaGPT的角色专业化与分工协作、结构化通信、可执行反馈机制和模拟真实团队协作等特点,使其在软件开发、项目管理、自动化测试和数据分析等方面具有广泛应用。

Hume AI

Hume AI是一款专注于情感识别与表达的AI工具,通过实时分析语音和面部表情,实现对人类情感的深度理解。其核心产品Hume EVI能够识别和回应用户情绪,提供拟人化对话体验。该工具支持情绪可视化、个性化声音设计等功能,并已在客户服务、心理健康、教育、娱乐及智能家居等领域得到应用。

NoteLLM

NoteLLM 是一款基于多模态大型语言模型的笔记推荐框架,支持文本与图像信息的融合处理。通过自动生成标签、压缩嵌入、对比学习和指令微调等技术,提升推荐准确性与相关性。其升级版 NoteLLM-2 引入多模态上下文学习与晚期融合机制,增强视觉信息处理能力,适用于个性化推荐、冷启动优化及内容创作辅助等场景。

TinyR1

TinyR1-Preview是由北京大学与360公司联合研发的32B参数推理模型,采用“分治-融合”策略,通过智能融合数学、编程、科学领域的子模型,实现高性能表现。其在数学领域(如AIME)表现优异,仅用5%参数量即可达到原版R1模型95%以上的性能。模型轻量且高效,适用于教育、科研、开发及企业等多种场景,具备良好的部署灵活性与实用性。

SignLLM

SignLLM是一款支持多语言手语生成的AI模型,能将文本转换为自然流畅的手语视频,覆盖包括ASL、GSL、LSA、KSL在内的八种手语。其核心技术包括离散化与层次化表示、自监督学习、符号-文本对齐等。该工具可用于教育、医疗、法律、媒体等多个场景,提升听障人群的沟通便利性与信息获取能力。

Pidgeon

Pidgeon是一款利用人工智能技术的新闻聚合应用,主要功能包括生成简洁的新闻摘要、整合全球新闻资源、支持多语言及个性化定制。用户可通过智能分类筛选新闻内容,并享受无广告干扰的阅读体验。此外,Pidgeon还提供离线阅读和多模式切换功能,适用于快速获取全球资讯的用户。