AI项目与工具

VSI

VSI-Bench是一种用于评估多模态大型语言模型(MLLMs)视觉空间智能的基准测试工具,包含超过5000个问题-答案对,覆盖多种真实室内场景视频。其任务类型包括配置型任务、测量估计和时空任务,可全面评估模型的空间认知、理解和记忆能力,并提供标准化的测试集用于模型性能对比。 ---

VideoTuna

VideoTuna是一款基于AI的开源视频生成工具,支持文本到视频、图像到视频以及文本到图像的转换。它提供预训练、微调和后训练对齐等功能,兼容U-Net和DiT架构,并计划引入3D视频生成能力。VideoTuna旨在简化视频内容创作流程,提升生成质量与可控性,适用于内容创作、电影制作、广告营销、教育培训等多个领域。

Windows AI Foundry

Windows AI Foundry 是微软推出的全新 AI 开发平台,提供从模型选择、优化、微调到部署的全生命周期支持。平台整合 Windows ML,支持在多种硬件上高效部署模型,并基于 Foundry Local 提供优化后的开源模型库。同时,提供即用型 AI API 和 LoRA 技术,帮助开发者快速集成和微调模型,提升开发效率与灵活性。

Averi

Averi是一款基于人工智能的营销管理平台,集成了策略制定、内容生成及团队协作功能。它能够依据企业实际情况提供定制化营销方案,并通过AI技术快速生成高质量的文案和广告内容,同时提供与认证营销专家对接的服务,适用于初创企业、中小企业及营销代理机构等不同规模的企业,以提升营销活动的整体效能。

BILIVE

BILIVE 是一款面向 B 站直播的 AI 工具,支持自动录制、弹幕渲染、语音识别、片段切片、封面生成及自动投稿。兼容低配置设备,无需 GPU,适合个人及小型团队使用,提升直播内容制作效率。

爱派

AiPy 是一款基于大语言模型与 Python 深度整合的 AI 工具,支持自然语言生成代码、数据处理与分析、可视化、API 调用、任务自动化等功能。具备本地部署能力,保障数据安全,适用于开发、数据分析、自动化任务等场景。用户可通过自然语言或直接输入代码进行交互,支持多种操作系统与环境配置,提升编程效率与灵活性。

Tripo AI

Tripo AI是一款由VAST推出的在线AI 3D模型生成平台,通过先进的AI技术将文本或图像快速转化为高质量的3D模型与角色。其核心功能包括文生3D、图生3D及纹理贴图支持,无需专业建模技能即可实现高效的3D创作。广泛应用于游戏开发、动画制作、影视特效、设计行业以及3D打印领域,显著提升工作效率并降低创作成本。

Voice Design

Voice Design是一款由ElevenLabs研发的AI语音生成工具,通过描述声音特征或虚构角色来快速生成独特的人类化语音。它支持32种语言,适用于视频旁白、广告配音、播客制作、游戏开发及虚拟助手等多个场景,为内容创作者提供高效且多样化的语音解决方案。

UNI

UNI-CourseHelper是一款基于AI技术的学习辅助工具,支持多模态问答、长文解析、思维链推理等功能,覆盖多个学科领域。通过Markdown格式展示答案,支持图片和文档提问,适用于学生、教师及研究人员,提升学习效率与理解深度。

ZEPIC

ZEPIC 是一款基于 AI 技术的营销自动化平台,专注于通过数据驱动的客户智能、全渠道互动及个性化营销提升企业营销效率。其核心功能涵盖数据管理、活动执行、客户细分及实时分析,支持跨电子邮件和 WhatsApp 渠道的营销活动,帮助企业优化客户旅程并实现精准营销。