AI项目与工具

EMAGE

EMAGE是一款基于音频输入生成全身手势的AI框架，可同步生成面部表情、肢体动作及整体运动。通过掩蔽音频手势变换器和多模块VQ-VAE建模，实现高质量、多样化的手势生成。适用于虚拟现实、动画制作、数字人交互等领域，提升虚拟角色表现力与交互自然度。

AI项目与工具 2025年06月12日 13 点赞 0 评论 728 浏览

LATTE3D

LATTE3D 是由英伟达多伦多AI实验室开发的一种高效生成高质量3D对象的模型。它基于文本描述，能在约400毫秒内生成逼真的3D内容。LATTE3D采用摊销优化方法，增强了对新提示的适应能力。该模型支持文本到3D合成、快速生成、高质量渲染及3D风格化功能，适用于多种应用场景。

AI项目与工具 2024年01月01日 41 点赞 0 评论 728 浏览

Trae 插件

Trae 插件是一款基于 AI 的编程辅助工具，支持多种编程语言和主流 IDE，提供代码补全、生成、解释、注释、单测生成及智能问答等功能，提升开发效率与代码质量。支持多模型切换，具备高度可定制性，适用于快速开发、代码优化与团队协作等场景。

AI项目与工具 2025年06月11日 32 点赞 0 评论 728 浏览

Cal AI

Cal AI是一款基于AI技术的营养分析工具，通过图像识别技术分析食物的卡路里和营养成分。它支持多样的输入方式，包括拍照、条形码扫描和手动输入，并允许用户修正AI分析结果以提升准确性。Cal AI可生成个性化的饮食计划，适用于体重管理、健康饮食、健身规划及特殊人群如孕妇、哺乳期女性和糖尿病患者的营养需求。

AI项目与工具 2025年06月12日 13 点赞 0 评论 728 浏览

Tesseract

Tesseract是一款开源的光学字符识别（OCR）引擎，支持多语言识别和多种图像格式。其具备高精度的文字识别能力，适用于文档数字化、表格数据提取、发票识别及移动OCR应用等多个场景。支持跨平台运行，并提供丰富的编程接口和自定义训练功能，便于开发者集成和优化识别效果。

AI项目与工具 2025年06月12日 12 点赞 0 评论 728 浏览

Wavtool

Wavtool 是一款基于浏览器的 AI 音频创作平台，支持录制、编曲、混音和导出音乐，提供 AI 辅助创作功能，支持多轨处理及高级合成工具。用户可通过浏览器直接操作，无需安装软件，适合音乐爱好者、专业人士及教育用途。

AI项目与工具 2025年06月12日 20 点赞 0 评论 728 浏览

HourVideo

HourVideo是一项由斯坦福大学研发的长视频理解基准数据集，包含500个第一人称视角视频，涵盖77种日常活动，支持多模态模型的评估。数据集通过总结、感知、视觉推理和导航等任务，测试模型对长时间视频内容的信息识别与综合能力，推动长视频理解技术的发展。其高质量的问题生成流程和多阶段优化机制，使其成为学术研究的重要工具。

AI项目与工具 2025年06月12日 77 点赞 0 评论 728 浏览

NPOA

NPOA是一款开源的舆情监测工具，支持实时数据采集、情感分析、话题分类及多渠道媒体分析，适用于企业品牌管理、政府舆论监控、市场研究等多个领域。系统提供预警机制、可视化报告和大屏展示功能，便于用户快速获取关键信息并做出应对。

AI项目与工具 2025年06月12日 60 点赞 0 评论 728 浏览

Open Code Reasoning

Open Code Reasoning（OCR）是英伟达推出的开源代码推理AI模型，基于Nemotron架构设计，支持多种编程语言。它具备代码生成、逻辑补全、多语言处理及高效推理能力，适用于代码优化、教育、测试等多个场景。OCR提供32B、14B和7B三种参数版本，满足不同计算需求，并与主流框架兼容，具有良好的扩展性。

AI项目与工具 2025年06月11日 10 点赞 0 评论 728 浏览

HoloTime 是由北京大学深圳研究生院与鹏城实验室联合开发的全景 4D 场景生成框架，可将单张全景图像转化为动态视频，并进一步重建为沉浸式 4D 场景。其核心技术包括全景动画生成器（Panoramic Animator）和时空重建技术，结合 360World 数据集进行训练，实现高质量的视频生成与场景重建。该工具支持 VR/AR 应用，适用于虚拟旅游、影视制作、游戏开发等多个领域，提供高效的沉

AI项目与工具 2025年06月11日 20 点赞 0 评论 727 浏览

AI项目与工具 默认 浏览次数 发布时间

AI项目与工具

默认

浏览次数

发布时间