模型

Boximator

Boximator是一种视频合成技术,通过引入硬框和软框实现对视频中对象的位置、形状或运动路径的精细控制。它基于视频扩散模型,通过多阶段训练和自跟踪技术,确保视频合成过程中的高质量和逼真度。应用场景包括电影和电视制作、游戏开发以及VR和AR内容创作。

Prometheus

Prometheus是一款基于潜在扩散模型的3D生成工具,能够从文本描述中快速生成高质量、高保真的3D场景。其核心技术包括两阶段训练框架、RGB-D潜在空间解耦、前馈生成策略和无分类器引导,确保生成结果在视觉和几何上的准确性与一致性。适用于内容创作、游戏开发、建筑设计等多个领域,显著提升了3D内容生成的效率和质量。

Eino

Eino是由字节跳动开源的大模型应用开发框架,采用Go语言构建,具备组件化设计、图编排引擎、流式处理和回调机制等功能,支持高效构建复杂AI应用。其可视化开发工具EinoDev降低了开发门槛,适用于智能客服、知识管理、内容创作等多种场景,具备高扩展性和良好的性能表现。

ChatTTS

ChatTTS是一个开源的专为对话场景设计的语音生成模型,特别适用于大语言模型(LLM)助手的对话任务,以及诸如对话式音频和视频介绍等应用。ChatTTS 不仅能说中文,英文也能 hold 住...

Wisemodel

Wisemodel,始智AI团队打造的中立开放AI开源社区平台,旨在打造中国版 “HuggingFace”。

SeaArt.Ai

一款高效且用户友好的AI绘图工具,即使没有专业技能,您也可以立即成为艺术家。

Project DIGITS

Project DIGITS 是 NVIDIA 推出的高性能 AI 计算设备,基于 Grace Blackwell 架构,配备 GB10 Superchip,提供高达 1 万万亿次的 AI 计算能力,支持运行 2000 亿参数的大模型。其具备 128GB 统一内存和 4TB NVMe 存储,支持本地开发与云端部署,适配多种 AI 应用场景,如研究、数据分析、教育及医疗等。

MiniCPM 3.0

MiniCPM 3.0是一款由面壁智能开发的高性能端侧AI模型,具有40亿参数。它采用LLMxMapReduce技术,支持无限长文本处理,增强了上下文理解能力。MiniCPM 3.0在Function Calling方面表现出色,接近GPT-4o的水平。该模型还包括RAG三件套,提升了中文检索和内容生成的质量。模型已开源,量化后仅占用2GB内存,适合端侧设备部署,保障数据安全和隐私。

MEXMA

MEXMA是一种由Meta AI研发的预训练跨语言句子编码器,通过结合句子级和词语级目标优化句子表示质量。它支持80种语言,广泛应用于跨语言信息检索、机器翻译、多语言文本分类、语义文本相似度评估及跨语言问答系统等领域,并展现出卓越的性能。

ChatHi

一个大模型集成平台,ChatHi集成了国内外知名文生文大模型13家,文生图大模型5家,是一款人工智能聊天助手,专注于提供智能化的对话体验和全面的信息检索。