工具

OSUM

OSUM是一款由西北工业大学研发的开源语音理解模型,结合Whisper编码器与Qwen2 LLM,支持语音识别、情感分析、说话者性别分类等多种任务。采用“ASR+X”多任务训练策略,提升模型泛化能力和稳定性。基于约5万小时语音数据训练,性能优异,适用于智能客服、教育、心理健康监测等多个领域。

腾讯智影

腾讯智影是一款云端智能视频创作工具,可以帮助用户搜集素材、剪辑视频、渲染导出和发布作品。

HouseCrafter

HouseCrafter是一款基于2D扩散模型的AI工具,可将平面图自动转换为高质量的3D室内场景。它具备多视图图像生成、全局一致性保障及用户交互编辑等功能,广泛应用于建筑设计、室内设计、房地产营销等领域,有效提升了虚拟环境创建的效率与准确性。

QuillBot

QuillBot是一款利用AI技术打造的多功能写作辅助工具,提供文本改写、语法检查、摘要生成、词汇替换及语气调整等功能。该工具广泛应用于学术写作、内容创作、商务文档编辑和语言学习等领域,帮助用户提升写作效率、增强文本原创性并改善语言表达效果。

ColoringBook

一个提供免费的AI涂色画生成器的网站,ColoringBook.AI通过文本和图像创建自定义的涂色画,并下载成千上万的可打印页面。

曦灵·数字人

百度曦灵平台引领数字人科技新纪元,这是一款结合了尖端人工智能技术和计算机图形学的数字人解决方案。

PicMenu

PicMenu是一款利用AI技术实现菜单可视化的工具,用户可通过上传菜单图片自动生成数字化展示图,支持多格式导出,适用于社交媒体、网站及打印场景。未来版本计划增加菜品详细信息展示,同时具备标签过滤功能,提升用户体验。PicMenu目前为开源项目,基础功能免费提供。

涌墨

涌墨是一款智能文档编写平台,提供全流程文档管理与智能生成服务。平台包含25类符合软件行业国标的文档模板,支持智能解析、内容生成及文档一致性管理。用户可通过项目为中心的工作流进行文档创建、编辑与优化,适用于招投标、规范文档、日常办公及市场调研等多种场景。其可视化功能和高度定制化设计提升了文档管理的效率与准确性。

CodeGeeX

CodeGeeX是一款基于大模型的全能的智能编程助手。它可以实现代码的生成与补全、自动添加注释、代码翻译以及智能问答等功能,能够帮助开发者显著提高工作效率。

The Matrix

The Matrix是一款基于AI的世界模拟器,能够生成高保真度、无限时长的视频流,支持实时交互控制。它融合了3A游戏数据与真实世界视频,具备零样本泛化能力。核心技术包括交互模块、移窗去噪过程模型和流一致性模型,适用于游戏开发、影视制作、虚拟现实、教育模拟及城市规划等多个领域。