学习

xLAM

xLAM 是 Salesforce 开源的一款大型语言模型,专为功能调用任务设计。该模型具备多语言支持、预训练模型、迁移学习、自然语言处理等主要功能,并基于 Transformer 架构实现。它在多个基准测试中表现出色,适用于自动化任务、模板共享、插件开发和教育等多个应用场景。

AudioJam

AudioJam是一款基于AI技术的音乐分析与编辑工具,提供和弦音调分析、乐器伴奏分离、变速播放、AB循环等功能,支持从歌曲中提取人声与各类乐器音轨并调节音量。其高精度和弦识别(准确率超90%)为音乐创作、学习和教学提供了强大支持,适用于多平台(Mac、Windows、iOS、Android、Web),是提升音乐学习与创作效率的理想选择。 ---

文鳐MaaS

文鳐MaaS是一个综合性的AI模型训练平台,它通过提供易操作的界面和强大的自监督学习能力,使用户能够根据自己的特定需求快速定制和部署AI模型。

Stable Virtual Camera

Stable Virtual Camera 是 Stability AI 推出的 AI 工具,能够将 2D 图像转换为具有真实深度和透视感的 3D 视频。用户可通过自定义相机轨迹生成多种宽高比的视频,支持最长 1000 帧的高质量输出。其核心技术包括生成式 AI、神经渲染和多视图一致性优化,确保视频在不同视角间过渡自然且保持 3D 一致性。适用于广告、内容创作及教育等多个领域。

LIGER

LIGER是一种由Meta AI等机构研发的混合检索模型,结合生成式检索与密集检索技术,提升推荐系统的效率与准确性。其核心功能包括高效生成候选项目、优化排序、处理冷启动问题及融合语义信息。LIGER通过多目标优化和语义融合机制,显著提高了推荐的精准度与适应性,广泛应用于电商、内容、社交及教育等领域。

PSHuman

PSHuman是一款基于跨尺度多视图扩散模型的单图像3D人像重建工具,仅需一张照片即可生成高保真度的3D人体模型,支持全身姿态和面部细节的精确重建。其核心技术包括多视角生成、SMPL-X人体模型融合及显式雕刻技术,确保模型在几何和纹理上的真实感。该工具适用于影视、游戏、VR/AR、时尚设计等多个领域,具备高效、精准和易用的特点。

HippoRAG 2

HippoRAG 2是俄亥俄州立大学开发的检索增强生成框架,旨在提升RAG系统在模拟人类长期记忆方面的表现。它通过个性化PageRank算法、深度段落整合和知识图谱构建,实现高效的多跳推理与上下文感知检索。系统具备持续学习能力,可实时吸收新知识,适用于智能问答、知识管理、教育、医疗及法律金融等领域。

SkipWatch AI

一款AI驱动的YouTube视频总结工具,可一键生成视频摘要,支持多语言,能提取关键信息,适用于学生、职场人士等用户群体。

univerbal

Univerbal是一款基于AI的多语言学习应用,支持超过22种语言,为用户提供个性化、实时反馈的语言学习体验。其核心功能涵盖AI对话练习、多语言支持、主题多样化及进度追踪,旨在帮助用户通过实际场景练习提升语言能力,尤其注重口语和发音的改善。此外,该应用还具备复习功能,助力用户巩固所学内容。

CG导航

CG导航为深夜CG工作室推出的CG行业版,cg领域从业人员提供便捷的上网服务。