AI

Ming

Ming-Lite-Omni是蚂蚁集团开源的统一多模态大模型,基于MoE架构,支持文本、图像、音频和视频等多种模态的输入输出,具备强大的理解和生成能力。模型在多个任务中表现优异,如图像识别、视频理解、语音问答等,适用于OCR识别、知识问答、视频分析等多个领域。其高效处理能力和多模态交互特性,为用户提供一体化智能体验。

CodeFree

CodeFree是一款由中国电信研发云平台推出的AI辅助编程工具,集成了代码补全、智能问答、代码注释、代码解释、异常报错解析、单元测试生成、代码优化、测试助手、安全助手、文档助手及代码工程助手等12项功能。它贯穿软件开发的全流程,利用机器学习、深度学习、自然语言处理及上下文感知技术,帮助开发者提升效率、减少错误并优化代码质量。

GameGen

GameGen-O 是一款基于 Transformer 架构的AI工具,专注于开放世界游戏视频的生成。它具备角色生成、环境构建、动作模拟及交互式控制等功能,通过两阶段训练方法提升了生成质量和灵活性,可应用于游戏原型设计、场景生成及开发辅助等领域,有助于降低开发成本并提高创作效率。

VectorArt.ai

VectorArt.ai 是一款基于人工智能技术的在线平台,专注于通过文本或草图生成高质量的矢量图像。它支持 SVG 格式,具备无损缩放特性,适用于网页设计、平面印刷等多个场景。主要功能包括文本到图像生成、草图到图像转换、自定义 SVG 创建及多种插画风格选择,同时提供免费图像资源和布局优化工具。

Boogie AI

Boogie AI 是一款利用人工智能技术将用户上传的照片转化为舞蹈视频的应用程序。该应用具备AI舞蹈生成、动作选择、声音克隆和图生视频等功能,用户可以上传照片并选择不同的舞蹈动作,通过AI技术生成动态的舞蹈视频。该应用可应用于社交媒体分享、家庭聚会、朋友互动、个人娱乐和创意表达等多个场景,提供了一种独特且有趣的娱乐方式。

BioMedGPT

BioMedGPT-R1是由清华大学AI产业研究院与北京水木分子生物科技联合开发的多模态生物医药开源大模型。基于DeepSeek R1技术,实现生物模态(如分子、蛋白质)与自然语言的统一融合,支持跨模态问答与深度推理。该模型在药物分子理解、靶点挖掘等领域表现优异,适用于药物设计、临床前研究及医学文本分析等多种场景,具备较高的文本推理能力和多模态处理能力。

Meshy

Meshy是一个AI生成3D资产套件,提供文本转3D建模、AI纹理和建模工具以加速3D内容创建。

NeuralCam

NeuralCam是一款基于AI技术的智能相机应用,提供实时摄影指导和多种图像优化功能,包括自动人像、夜间拍摄、AI照明和智能HDR等。适用于低光环境、人像摄影、旅行记录及专业摄影等多种场景,旨在提升用户的拍摄质量和效率。支持免费下载并提供进阶订阅服务。

Coloromo AI

Coloromo AI可以将您的图片变成高分辨率的数字或印刷艺术,体验创作个性化艺术的乐趣——无需任何技能!

PDFtoChat

PDFtoChat 是一款基于 AI 技术的开源工具,支持用户通过自然语言对话与 PDF 文件交互。它具备强大的文档解析、智能检索和即时反馈能力,广泛应用于学术研究、法律咨询、商业分析、教育培训和技术文档查询等领域,显著提升文档处理效率。