模型

Webdraw

Webdraw 是一款无代码 AI 应用开发平台,支持图像生成、视频制作、聊天助手等功能,用户可通过自然语言或可视化工具快速构建应用。平台集成多种 AI 模型,支持多模态内容创作,具备文件共享、实时协作和一键部署能力,适用于创意设计、个性化工具开发、教育及企业场景,降低 AI 技术使用门槛。

Pix2Gif

Pix2Gif是一个由微软研究院开发的基于运动引导的扩散模型,能够将静态图像转换成动态的GIF动画或视频。该模型通过运动引导的扩散过程实现图像到GIF的生成,并利用文本描述和运动幅度作为输入。Pix2Gif还引入了感知损失机制,确保生成的GIF帧在视觉上与原始图像保持一致性和连贯性。

青椒云图形工作站

青椒云高性能图形工作站,一键启动stable diffusion(免安装+大量墙外模型),AIGC动画制作插件、loar模型炼丹器(无配置要求)

Agent K v1.0

Agent K v1.0 是一款端到端自主数据科学智能体,由华为诺亚方舟实验室与伦敦大学学院团队联合开发。该工具能够自动化处理数据科学生命周期中的各个环节,支持多模态数据处理,具备动态多步骤问题解决能力,并通过结构化推理和动态记忆管理实现自我学习与优化。Agent K v1.0 在Kaggle多模态挑战赛中表现优异,广泛应用于金融、医疗、零售、制造及客户服务等领域。

Orpheus TTS

Orpheus TTS 是一款基于 Llama-3b 架构的开源文本到语音系统,支持自然、富有情感的语音生成。具备零样本语音克隆能力,无需预训练即可模仿特定语音,延迟低至 200 毫秒,适合实时应用。支持多种语音风格和情感控制,适用于有声读物、虚拟助手、游戏、教育等多个领域。

LeviTor

LeviTor是一款由多所高校和企业联合研发的图像到视频合成工具,它利用深度信息和K-means聚类点来控制视频中3D物体的轨迹,无需显式3D轨迹跟踪。通过高质量视频对象分割数据集训练,该工具能精准捕捉物体运动与交互,支持用户通过简单的2D图像操作实现复杂的3D效果,大幅降低了技术门槛,广泛应用于电影特效、游戏动画、虚拟现实等领域。

Hunyuan

Hunyuan-Large是一款由腾讯开发的大规模混合专家(MoE)模型,以其庞大的参数量成为当前参数规模最大的开源MoE模型之一。该模型基于Transformer架构,擅长处理长文本任务,同时在多语言自然语言处理、代码生成以及数学运算等领域展现出色性能。通过合成数据增强训练与创新的注意力机制,Hunyuan-Large实现了高效的推理吞吐量,并广泛应用于内容创作、教育辅助、知识问答及数据分析等多

SeedFoley

SeedFoley 是由字节跳动开发的端到端视频音效生成模型,能智能识别并生成与视频内容高度同步的动作和环境音效。通过融合视频时空特征与扩散生成技术,提升音效的准确性和细腻度,支持多种视频长度,适用于生活Vlog、短片制作、游戏视频等多种场景,显著提升视频的沉浸感和表现力。

BitsAI

BitsAI-CR是字节跳动推出的基于大型语言模型的自动化代码审查工具,采用两阶段处理流程提升审查精度。通过219条规则检测潜在问题,并结合“过时率”指标动态优化规则。支持多语言审查,可无缝集成到现有流程中,自动识别问题、生成评论并跟踪修改情况,提升代码质量与开发效率。

MathGPT

MathGPT,是国内首个专为数学打造的大模型。仅需要通过文字或图片上传数学题,即可得到对话式的解答反馈。另外,你也可以通过「随机来一题」的选项,随机生成数学题目并由系统给出解答。