AI

AskYourPDF

AskYourPDF是一款利用人工智能技术的PDF文档处理工具,支持用户通过自然语言查询快速检索和提取PDF文档中的信息。其主要功能包括交互式查询、即时摘要生成、关键词检索、页码标记等,并提供高效的数据加密保障。该工具适用于学术研究、法律审查、商业分析等多种场景,有效提高信息管理效率。

SONIFY.io

Sonify 在音频、数据和新兴技术的交叉领域进行创新。我们设计和开发音频优先的产品和数据驱动的解决方案。

星火插件

星火插件是一款基于星火大模型的浏览器扩展工具,集成了讯飞星火V4.0的AI能力,支持划词搜索、翻译、网页内容摘要生成及信息收藏等功能。它通过轻量化设计兼容主流浏览器,注重个性化配置,可跨平台使用,适用于信息检索、阅读、知识管理等多种场景,致力于提升用户的工作效率。

Bolt3D

Bolt3D是由谷歌研究院、牛津大学VGG团队与谷歌DeepMind联合开发的3D场景生成技术,基于潜在扩散模型,能在单块GPU上仅需6.25秒生成高质量3D场景。支持多视角输入,具备良好泛化能力,采用高斯溅射技术实现高保真表示,并支持实时交互。适用于游戏开发、VR/AR、建筑设计和影视制作等领域。

天工大模型

有时候,写作就像是一场冒险,不知道路在何方?天工大模型天工AI创作在这里,温柔地伸出手,为你点亮前行的路灯。咱们一起看看,这小助手都能帮你做什么吧!

Multi

Multi-Speaker 是 AudioShake 推出的高分辨率多说话人分离工具,支持将音频中不同说话人的语音精准分离至独立轨道,适用于广播级音频处理。它具备高保真音频处理能力,支持高采样率,能处理长达数小时的录音,在复杂场景下仍能保持稳定效果。广泛应用于影视、播客、无障碍服务及内容创作等领域,提升音频编辑效率与质量。

One Shot, One Talk

One Shot, One Talk是一项由中国科学技术大学和香港理工大学研究者开发的图像生成技术,它可以从单张图片生成具有个性化细节的全身动态说话头像。该工具支持逼真的动画效果,包括自然的表情变化和生动的身体动作,同时具备对新姿势和表情的泛化能力。One Shot, One Talk结合了姿势引导的图像到视频扩散模型和3DGS-mesh混合头像表示技术,提供了精确的控制能力和高质量的重建效果。

URM

URM是由阿里妈妈开发的通用推荐模型,结合大语言模型与电商领域知识,提升推荐效果。其采用多模态融合与Sequence-In-Set-Out生成方式,支持多场景、多目标、长尾及发现性推荐。具备高效率、零样本学习能力,适用于工业级推荐系统,已应用于阿里妈妈展示广告场景,优化用户体验与商家投放效果。

iTextMaster

iTextMaster是一款AI驱动的文本分析与交互工具,支持用户通过对话形式快速总结PDF文档和网页内容,具备精准搜索与智能推荐功能。它广泛应用于学术研究、法律行业、商业分析、教育以及项目管理等领域,助力用户高效处理信息并提升工作效率。