AI

Inworld

Inworld是一家生成式 AI 数字人/虚拟角色开发公司,人工智能角色就像虚拟人一样,可以说话、行动和感受情感。它们可用于游戏、娱乐和客户服务。

PDFtoChat

PDFtoChat 是一款基于 AI 技术的开源工具,支持用户通过自然语言对话与 PDF 文件交互。它具备强大的文档解析、智能检索和即时反馈能力,广泛应用于学术研究、法律咨询、商业分析、教育培训和技术文档查询等领域,显著提升文档处理效率。

ImBD

ImBD是一种用于检测机器修订文本的AI工具,采用风格偏好优化(SPO)和风格条件概率曲率(Style-CPC)技术,能有效区分人类写作与机器修订内容。该工具具备多场景适应能力,支持多种文本类型和领域,训练效率高、数据需求低,适用于学术、新闻、出版、教育等多个应用场景,提升文本检测的准确性与可靠性。

AI灵感PPT

用创作点睛,用AI添彩,一键生成PPT,在线灵活编辑PPT。轻松呈现精彩,AI灵感PPT同时也支持AI绘图、AI配音、AI写作。

Asendia AI

Asendia AI 是一款基于人工智能的求职辅助工具,提供个性化职业规划、智能职位匹配、AI模拟面试及详细反馈功能。用户可通过100多个专家审核的面试模板进行练习,并获得定制化建议以提升面试表现。平台还支持简历优化、技术概念复习和全球人才展示。对招聘方而言,AI面试官“Sarah”可实现24/7自动化筛选,提高招聘效率并降低成本。整体功能覆盖求职准备与招聘流程,适用于个人与企业用户。

ReadSpeaker

ReadSpeaker 提供了一系列强大的文本转语音解决方案,可在任何环境中即时部署逼真、定制的语音交互。

Chinese

Chinese-LiPS是由智源研究院与南开大学联合开发的高质量中文多模态语音识别数据集,包含100小时语音、视频及手动转录文本。其创新性融合唇读视频与幻灯片内容,显著提升语音识别性能,实验表明可降低字符错误率约35%。适用于教学、科普、虚拟讲解等复杂语境,为多模态语音识别研究提供丰富数据支持。

Muyan

Muyan-TTS是一款面向播客场景的开源文本转语音工具,基于超10万小时播客数据训练,支持零样本语音合成与说话人适配,可在0.33秒内生成1秒音频,适合实时与长内容合成。支持本地部署与API调用,应用于播客、有声书、视频配音、AI角色及新闻播报等领域,兼具高效性与灵活性。