模型

Transfusion

Transfusion是由Meta公司开发的多模态AI模型,能够同时生成文本和图像,并支持图像编辑功能。该模型通过结合语言模型的下一个token预测和扩散模型,在单一变换器架构上处理混合模态数据。Transfusion在预训练阶段利用了大量的文本和图像数据,表现出强大的扩展性和优异的性能。其主要功能包括多模态生成、混合模态序列训练、高效的注意力机制、模态特定编码、图像压缩、高质量图像生成、文本生成

VirtualWife

VirtualWife 是一款基于人工智能技术开发的虚拟角色项目,集成了自然语言处理、语音识别与合成、机器学习等功能,支持跨平台运行和个性化定制。其主要应用场景包括个人陪伴、心理健康辅导、在线教育、客户服务、娱乐互动和直播带货,致力于为用户提供智能化、多样化的交互体验。

WhisperFusion

一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。

Eluna.ai

一个由 AI 驱动的文生图平台。借助 eluna.ai,您可以利用大量功能将简单的文本转换为引人入胜的视觉设计。无论您的目标是生成详细的图像、尝试无限缩放、从图像中删除背景,还是放大现有图像,eluna.ai 都能满足您的需求。

FantasyID

FantasyID是由阿里巴巴集团与北京邮电大学联合开发的视频生成框架,基于扩散变换器和3D面部几何先验,实现高质量、身份一致的视频生成。其通过多视角增强和分层特征注入技术,提升面部动态表现,同时保持身份稳定性。支持多种应用场景,如虚拟形象、内容创作和数字人交互,具备无需微调的高效生成能力。

晓象

晓象是一款基于自研可信大模型的AI克隆工具,可创建各领域知识博主的虚拟分身。该工具能够模仿博主的声音、风格和表达方式,生成个性化的高质量内容,并支持实时互动,帮助用户获取知识分享和信息解读。应用场景广泛,包括知识传播、教育辅助、内容创作及信息解读。

法小飞

哈工大讯飞联合实验室推出的中文法律智能助手,集成多种自然语言处理技术并满足不同用户群体需求的中文法律科技服务系统。

Qwen2

Qwen2是由阿里云通义千问团队开发的大型语言模型系列,涵盖从0.5B到72B的不同规模版本。该系列模型在自然语言理解、代码编写、数学解题及多语言处理方面表现出色,尤其在Qwen2-72B模型上,其性能已超过Meta的Llama-3-70B。Qwen2支持最长128K tokens的上下文长度,并已在Hugging Face和ModelScope平台上开源。 ---

ProX

ProX是一种用于提升大型语言模型预训练数据质量的框架,通过自动化编程手段实现数据清洗和精炼。其主要特点包括自动化细粒度数据处理、无需人工干预、显著提升模型性能以及广泛的领域适应性。ProX在多种任务中展示了超过2%的性能提升,并有效降低了训练成本。