AI项目与工具

Large Motion Model

Large Motion Model(LMM)是一款由新加坡南洋理工大学S-Lab和商汤科技合作研发的多模态运动生成框架。它支持从文本、音乐等多种模态生成逼真运动序列,具备高度精准的身体部位控制能力和强大的泛化能力。通过整合多样化的MotionVerse数据集以及创新性的ArtAttention机制和预训练策略,LMM在多个领域展现出高效的应用潜力,包括动画、虚拟现实、影视特效及运动分析等。

restorePhotos.io

restorePhotos.io 是一款基于GFPGAN模型的AI工具,专注于修复老旧和模糊的人脸照片。它具备用户友好的界面设计,支持批量处理及隐私保护功能,能够显著提升照片质量和清晰度。凭借其强大的技术支撑,restorePhotos.io 可应用于个人家庭、文化遗产保护、档案管理等多个领域,为用户提供高质量的照片修复服务。

Parler

Parler-TTS是一款由Hugging Face开发的开源文本到语音(TTS)模型,能够模仿特定说话者的风格,生成高质量、自然的语音。该模型采用轻量级设计,包括文本编码器、解码器和音频编解码器,通过整合文本描述和嵌入层,优化了语音生成过程。Parler-TTS的所有资源公开,促进了高质量、可控TTS模型的发展。此外,用户还可以根据需要对模型进行自定义训练和微调。

Meetily

Meetily 是一款注重隐私保护的 AI 会议助手,支持实时音频捕捉、语音转录、会议总结生成及行动项提取。所有数据处理均在本地完成,确保信息安全。具备离线功能、智能导出、跨会议语义搜索和多语言支持,适用于企业会议、远程协作、隐私敏感场景和个人使用,提升会议管理效率与便捷性。

PixVerse V2

PixVerse V2是一款基于Diffusion+Transformer(DiT)架构并结合自研时空注意力机制的AI视频生成工具。它支持生成长度可达40秒的视频,单个片段最长可达8秒,且能保持视频片段间的一致性。用户可通过简单操作生成并编辑视频,适用于创意专业人士、社交媒体用户、企业营销人员及独立艺术家等多种人群。

Custom

Custom-SVG 是一种基于文本提示生成定制风格 SVG 图形的框架,结合前馈模型与扩散模型的优势,实现结构规整且风格统一的矢量图形生成。支持风格定制、语义对齐和高效生成,适用于图形设计、UI 设计、网页设计及教育等多个领域。其核心技术包括路径级表示的扩散模型训练和基于图像扩散先验的风格迁移。

Instasize AI

Instasize AI是一款集图片与视频编辑于一体的多功能应用,具备强大的AI图像生成能力。其核心功能包括一键美化、滤镜调节、背景更改、文字添加、拼贴制作及尺寸适配等,适用于社交媒体发布、旅行记录、商业宣传和个人展示等多种场景,助力用户轻松打造高质量视觉内容。

GraphReasoning

GraphReasoning 是一种基于人工智能的知识图谱构建工具,能够将大量科学文献转化为结构化的知识图谱。其主要功能包括知识图谱构建、结构分析、图推理、多模态数据处理及路径采样策略等,旨在促进跨学科创新、材料设计及复杂问题解答。同时,该工具通过自然语言处理、机器学习和推理算法实现智能化分析,并提供可视化界面支持。

AutoCoder

AutoCoder是一款基于AI技术的自动编程工具,利用大模型和PLE架构实现端到端代码生成。它支持非技术背景用户通过自然语言描述需求生成软件应用,并具备快速原型制作、功能迭代及全生命周期管理能力,适用于快速原型开发、个性化软件生成及教育等多个领域。 ---

众影AI

众影AI是一款利用AI技术实现快速动画创作的工具,支持从剧本或音频直接生成角色表演动画,具备剧本转动画、声音转动画、AI作图、AI写剧本等功能。其角色库包含超过200种高精度形象,并提供多种表演动作,覆盖多种情绪表达。适合用于自媒体、教育、企业宣传、亲子互动及娱乐等领域。