场景

viable

在不影响质量的情况下,使你...

模袋云AI

模袋云AI是一个创新的在线设计工具,它利用人工智能技术帮助用户快速生成建筑设计概念图。

TextHarmony

TextHarmony是一款由华东师范大学与字节跳动联合开发的多模态生成模型,擅长视觉与文本信息的生成与理解。该模型基于Slide-LoRA技术,支持视觉文本生成、编辑、理解及感知等功能,广泛应用于文档分析、场景文本识别、视觉问题回答、图像编辑与增强以及信息检索等领域。通过高质量数据集的构建与多模态预训练,TextHarmony在视觉与语言生成任务中表现出色。

悟道大模型

北京智源研究院开发的一系列超大规模智能模型系统,悟道大模型旨在在语言处理领域达到或超越国际先进水平。

Emotion

Emotion-LLaMA是一款基于多模态输入的情绪识别与推理模型,结合音频、视觉和文本信息,提升情感理解的准确性与可解释性。模型采用改进版LLaMA架构,通过指令调整增强情感处理能力,并依托自建的MERR数据集进行训练与验证。在多个挑战赛中表现优异,适用于人机交互、教育、心理健康、客户服务等领域,具有广泛的应用前景。

Jay创作

Jay 创作是一款专为电商卖家打造的 AI 商拍工具,帮助电商卖家解决传统商拍成本高、效率低的问题,包括智能商拍服装模特图、商品场景图、商品抠图以及定制模特等。

多面AI面试

一款全自动AI面试评价系统,多面为企业提供招聘过程中对人才的管理、科学的甄别、AI提效的招聘需求。

图可丽抠图

图可丽抠图,专业的 AI 图像、视频处理工具,智能一键抠图、高清、修复、转卡通。

MIDI

MIDI是一种基于多实例扩散模型的3D场景生成技术,能将单张2D图像快速转化为高保真度的360度3D场景。它通过智能分割、多实例同步扩散和注意力机制,实现高效的3D建模与细节优化。具有良好的泛化能力,适用于游戏开发、虚拟现实、室内设计及文物数字化等多个领域。