模型

Audimee

一款由AI驱动的音乐创作工具,专注于为音乐人和制作人提供创新的声乐处理功能。用户可以使用Audimee将自己的声乐转换为免版税的声音,甚至可以训练自己的声音模型。

心辰Lingo语音大模型

实现了从语音输入到语音输出的全程无缝对接,心辰Lingo能够直接理解语音内容,捕捉语气、节奏和情绪,并以同样丰富的语音形式进行回复。

PixelDance

字节跳动研发的一种视频生成模型,PixelDance通过结合文本指导和首尾帧图片指导的方式,能够生成具有复杂场景与动作的视频。

VILA

VILA-U 是一款由 MIT 汉实验室开发的统一基础模型,整合了视频、图像和语言的理解与生成能力。它通过自回归框架简化模型结构,支持视觉理解、视觉生成、多模态学习和零样本学习等功能。VILA-U 在预训练阶段采用混合数据集,利用残差向量量化和深度变换器提升表示能力,适用于图像生成、内容创作辅助、自动化设计、教育和残障人士辅助等多种场景。

GeneralDyG

GeneralDyG是一种由南洋理工大学提出的通用动态图异常检测方法,适用于社交网络、电商、网络安全和金融等领域。该工具通过时间 ego-graph 采样、图神经网络和时间感知 Transformer 模块,有效捕捉动态图的多尺度特征,具备高适应性和计算效率。实验证明其性能优于多种主流方法,具有广泛的应用前景。

像塑

抖音AR特效开放平台,通过像塑抖音,您可以组合不同的素材与能力来构建可应用于人脸、身体或场景的炫酷趣味AR视效。

AigcCafe

AIGC Cafe 是一个专门为 Al 爱好者和开发者提供的平台,它提供了一系列的 AI 模型供用户使用和学习。

实在智能

实在智能,一款基于AI+RPA技术的智能助理,他可以模拟人类操作和决策流程,来提高工作的效率

PixVerse V2

PixVerse V2是一款基于Diffusion+Transformer(DiT)架构并结合自研时空注意力机制的AI视频生成工具。它支持生成长度可达40秒的视频,单个片段最长可达8秒,且能保持视频片段间的一致性。用户可通过简单操作生成并编辑视频,适用于创意专业人士、社交媒体用户、企业营销人员及独立艺术家等多种人群。

AutoCoder

AutoCoder是一款基于AI技术的自动编程工具,利用大模型和PLE架构实现端到端代码生成。它支持非技术背景用户通过自然语言描述需求生成软件应用,并具备快速原型制作、功能迭代及全生命周期管理能力,适用于快速原型开发、个性化软件生成及教育等多个领域。 ---