语言处理

讯飞星火

科大讯飞推出的新一代GPT人工智能模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。

Browser Operator

Browser Operator 是 Opera 浏览器推出的 AI 工具,通过自然语言指令实现网页浏览任务的自动化操作,如购物、预订、信息收集等。支持用户随时监控和干预任务,所有操作在本地完成,确保数据隐私。适用于多种日常场景,提升浏览效率和用户体验。

AirOps

AirOps 是一款用于辅助AI SQL语句生成和修改的软件,它基于机器学习技术,能够自动分析和优化SQL查询语句。

Voice Changer

Voice Changer是一款基于状态空间模型的音频处理工具,可将音频中的语音转换为不同音色,同时保留情感和表达细节。用户可通过选择预设声音库或克隆个人声音实现个性化转换,并对语音细节进行精细调整。该工具广泛应用于内容创作、游戏配音、有声书制作及品牌音频开发等领域,提供高质量的音频输出和灵活的控制选项。

WebThinker

WebThinker是一款由多家科研机构联合开发的AI工具,旨在增强大型推理模型在复杂任务中的表现。它支持自主搜索、网页导航与实时报告生成,结合深度网页探索器和强化学习策略,提升信息获取与内容创作的效率与质量。适用于科学研究、数据分析、教育辅助等多种场景,显著增强了模型在知识密集型任务中的可靠性与实用性。

BotSharp

一个基于.NET开发的开源AI多智能体应用开发框架,它可以快速将大型语言模型(LLMs)快速集成到现有业务系统中。

Gliglish

Gliglish 是一款基于 AI 技术的口语学习平台,通过语音识别和自然语言处理技术,模拟真实对话场景,帮助用户提升口语和听力能力。支持多语言学习,包括英语、中文、日语、韩语、德语、法语等,并提供即时语法和发音反馈。用户可调节对话速度,实现个性化学习。此外,Gliglish 支持多语言语音输入和输出,适合语言初学者及需要强化特定语言技能的学习者。

OpenMusic

OpenMusic是一款基于QA-MDT技术的文生音乐工具,支持从文本生成高质量音乐作品,具备质量感知训练、多样化风格生成及复杂推理能力。它广泛应用于音乐制作、多媒体内容创作、音乐教育等领域,同时提供音频编辑与处理功能,旨在提升音乐创作效率和质量。

AVD2

AVD2是由多所高校联合开发的自动驾驶事故视频理解框架,通过生成高质量事故视频并结合自然语言描述与推理,提升对复杂事故场景的理解能力。其功能涵盖事故视频生成、原因分析、预防建议及数据集增强,支持自动驾驶系统的安全优化与研究。基于先进模型如Open-Sora 1.2和ADAPT,AVD2在多项评估中表现优异,为自动驾驶安全提供了重要技术支撑。

IngestAI

IngestAI是一款无需编码即可将企业文档转化为智能问答机器人的AI平台,支持Slack、Discord、WhatsApp和Telegram等多种通信工具。通过自然语言处理技术,用户可以便捷地实现知识检索与交互,并享受实时更新和个性化推荐的服务。主要适用于客户服务、内部知识管理、员工培训、销售支持及项目协作等领域。