AI项目与工具

Tesseract

Tesseract是一款开源的光学字符识别(OCR)引擎,支持多语言识别和多种图像格式。其具备高精度的文字识别能力,适用于文档数字化、表格数据提取、发票识别及移动OCR应用等多个场景。支持跨平台运行,并提供丰富的编程接口和自定义训练功能,便于开发者集成和优化识别效果。

FaceLift

FaceLift是一种由Adobe与加州大学默塞德分校联合开发的AI工具,能够从单张人脸图像中重建出高精度的3D头部模型。其核心技术包括多视图扩散模型和GS-LRM重建器,支持多视角一致性、身份保持和4D新视图合成,适用于虚拟现实、数字娱乐、远程交互等多个领域。该工具具备强大的几何与纹理细节表现能力,且可与2D面部重动画技术集成,广泛应用于内容创作与科研场景。

Slidev

Slidev 是一款基于 Markdown + Vue 技术栈的开源幻灯片制作工具,支持代码高亮、实时编码演示、数学公式渲染、图表生成等功能。它提供丰富的主题和样式选项,支持在线编辑器和快速启动命令,适合技术分享、教学培训、产品演示等场景。Slidev 还具备交互性强、开发友好、演讲者模式、绘图注解和多种导出格式等优势。

FilmAgent

FilmAgent是一款由哈尔滨工业大学(深圳)研发的虚拟电影制作工具,基于多智能体协作框架,实现从剧本创作到镜头拍摄的全流程自动化。支持剧本生成、多智能体协作、镜头规划、语音合成等功能,适用于创意视频制作、影视教学及虚拟场景应用。系统在Unity 3D环境中运行,提升电影制作效率与创意表达能力。

ASAP

ASAP是一种由卡内基梅隆大学与英伟达联合开发的两阶段框架,用于解决仿人机器人在模拟与现实之间动力学不匹配的问题。它通过预训练阶段在模拟环境中学习运动策略,并在后训练阶段利用真实数据训练Delta动作模型,补偿动力学差异。该框架提高了机器人在复杂任务中的敏捷性、协调性和运动精度,支持多种应用场景,如体育、救援、工业、家庭服务及虚拟现实等,为仿人机器人的实际应用提供了高效的技术方案。

SurveyGO卷姬

SurveyGO是一款由清华大学与面壁智能团队联合开发的开源AI论文写作工具,支持根据用户输入的主题快速生成结构清晰、内容详实的综述文章。其核心技术LLMxMapReduce-V2利用文本卷积算法整合多篇文献,提升信息完整性与逻辑性。支持中英文双语输出,适用于科研、教学、行业分析等多种场景,显著提升文献综述的写作效率与质量。

千影 QianYing

千影 QianYing 是一款由巨人网络推出的 AI 工具,包含游戏视频生成大模型 YingGame 和视频配音大模型 YingSound。YingGame 支持角色动作交互控制与物理仿真,YingSound 具备视频语义理解和时间对齐能力,两者结合可生成高质量的有声游戏视频。该工具旨在降低游戏开发门槛,促进创作平等,并推动游戏行业的创新发展。

ExperAI

ExperAI是一款基于AI聊天机器人的创新型平台,支持文本和语音交互,可上传文档和自定义知识库以提升对话个性化水平。其功能包括创建数字个性、知识分享、客户服务、个性化推荐及社交媒体集成等,广泛应用于客户服务、教育、健康咨询、个人助理和市场调研等领域,旨在通过自然语言处理技术,为用户提供深入且高效的对话体验。

ArtHub.ai

ArtHub.ai 是一个集合艺术家与设计师的在线社区,专注于展示和分享由人工智能生成的艺术作品。平台具备艺术作品展示、关键词搜索、灵感获取等功能,支持用户上传和分享作品,促进社区互动与交流。此外,它还适用于艺术创作、设计灵感启发、教育学习、内容创作、广告营销以及游戏开发等多个领域。

deckrobot

DeckRobot 是一款基于AI技术的PPT生成工具,可快速创建符合品牌形象的高质量演示文稿。支持智能设计、内容生成、自动排版及品牌合规功能,适用于商务、教育、营销等多种场景,提升制作效率与专业性。