深度学习

Evo 2

Evo 2 是一款基于 StripedHyena 2 架构的 DNA 语言模型,可处理长达 100 万个碱基对的基因序列,支持长序列建模、DNA 生成、嵌入向量提取及零样本预测等功能。其基于大规模基因组数据训练,适用于基因治疗、合成生物学和进化研究等多个领域,为基因组学研究提供强大支持。

讯飞星火

科大讯飞推出的新一代GPT人工智能模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。

SynthID

SynthID是一款由DeepMind研发的技术工具,通过在AI生成的内容中嵌入数字水印来验证其真实性与原创性。它支持多种内容形式,包括文本、音乐、图像和视频,并具备良好的抗修改性和检测稳定性。SynthID不仅不影响内容质量,还提升了信息可信度,广泛应用于新闻、版权保护、教育、法律及社交媒体等领域。

Ingredients

Ingredients是一款基于多身份图像与视频扩散Transformer的视频生成框架,支持多身份特征的高效整合与动态分配。其核心模块包括面部提取器、多尺度投影器和ID路由器,能够保持身份一致性并生成高质量视频内容。无需额外训练即可实现个性化视频制作,适用于娱乐、广告、教育等多个领域。

3FS

3FS是DeepSeek推出的高性能分布式文件系统,专为AI训练和推理优化。采用SSD与RDMA技术,提供高达6.6 TiB/s的读取吞吐量,支持强一致性及通用文件接口。具备数据准备、加载、检查点和KVCache缓存功能,适用于大规模AI应用。在GraySort测试中表现优异,吞吐量达3.66 TiB/min,KVCache读取峰值达40 GiB/s,适用于多节点计算环境。

Vocalist.ai

一款可以使用定制的声乐模型将人声录音转换为专业品质的歌唱和说唱表演的录音室级AI声音转换工具,在几秒钟内将您的声音转变为世界一流的歌手和说唱歌手。

3DIS

3DIS-FLUX是一种基于深度学习的多实例图像生成框架,采用两阶段流程:先生成场景深度图,再进行细节渲染。通过注意力机制实现文本与图像的精准对齐,无需额外训练即可保持高生成质量。适用于电商设计、创意艺术、虚拟场景构建及广告内容生成等领域,具备良好的兼容性和性能优势。

Jodi

Jodi是由中国科学院计算技术研究所和中国科学院大学推出的扩散模型框架,基于联合建模图像域和多个标签域,实现视觉生成与理解的统一。它支持联合生成、可控生成和图像感知三种任务,利用线性扩散Transformer和角色切换机制,提升生成效率和跨领域一致性。Jodi使用Joint-1.6M数据集进行训练,包含20万张高质量图像和7个视觉域标签,适用于创意内容生成、多模态数据增强、图像编辑与修复等场景。

Ev

Ev-DeblurVSR是一款由多所高校联合开发的视频增强模型,利用事件相机数据提升视频去模糊和超分辨率效果。通过互惠特征去模糊模块和混合可变形对齐模块,实现高精度视频恢复。适用于监控、体育、自动驾驶等多个领域,支持快速部署与研究。

Voice

Voice-Pro是一款开源的多功能音频处理工具,集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等功能,支持超过100种语言,广泛应用于教育、娱乐和商业领域,显著提升音频处理效率和便捷性。