AI项目与工具

LanPaint

LanPaint 是一款基于 Stable Diffusion 的高质量图像修复工具,无需额外训练即可实现精准修复。通过多轮迭代推理优化修复效果,支持多种参数调整,适用于图像修复、内容替换及艺术创作等多种场景,操作简便且效果自然。

AlgForce.ai

AlgForce.ai 是一个基于 AI 的数据分析平台,通过自然语言处理技术实现无代码查询与分析。其核心功能包括自然语言查询、AI 数据可视化、深度解读、仪表板定制、自动化报告生成及代码自动生成。该工具旨在降低数据使用门槛,为企业提供数据驱动的决策支持,广泛适用于销售、市场、客户服务等多个领域。

pipio

pipio是一款专业的视频AI配音工具,集成了高精度的口型匹配技术、多语言翻译能力和高质量的声音克隆功能。它支持超过40种语言,能够快速实现视频内容的本地化,适用于国际营销、教育培训、娱乐传媒等多个领域,显著提高了跨语言视频制作的效率。

FunAudioLLM

FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目,包含SenseVoice和CosyVoice两个子模型。SenseVoice擅长多语言语音识别和情感辨识,支持超过50种语言;CosyVoice则专注于自然语音生成,支持多种语言、音色和情感控制。该项目适用于多语言翻译、情感语音对话等场景,其相关模型和代码已公开发布。

Edimakor

Edimakor是一款基于AI技术的视频编辑工具,具备AI字幕翻译、智能脚本生成、文字转语音、AI视频生成等多种功能,大幅简化视频制作流程,提升工作效率。它适用于内容创作者、教育机构、企业宣传等多个领域,支持多语言字幕翻译与配音,助力全球化传播。

Hyprnote

Hyprnote是一款专注于会议场景的AI笔记工具,支持实时记录与智能总结,结合用户笔记生成结构化会议摘要。它具备离线使用、本地数据存储等功能,保障隐私安全。通过插件系统实现高度可扩展,适用于远程协作、学习管理及团队知识共享等多种场景,有效提升会议效率与信息整理能力。

WorldMem

WorldMem是由多所高校与研究机构联合开发的AI世界生成模型,通过引入记忆机制解决传统模型在长时间序列生成中的一致性问题。它支持动态环境模拟、多场景交互及长期一致性保持,适用于虚拟游戏、VR/AR、自动驾驶等多个领域,具备高度真实性和可扩展性。

LCVD

LCVD是一种由四川大学开发的高保真肖像动画生成框架,支持光照可控的动态视频生成。它通过分离肖像的内在与外在特征,并结合多条件分类器自由引导机制,实现对光照和姿态的精细控制。LCVD在图像质量、视频一致性和光照真实感方面表现突出,适用于虚拟现实、视频会议、影视制作及内容创作等多个领域。

咕噜口语SpeakGuru

SpeakGuru是一款由清华团队开发的AI口语练习工具,通过与虚拟人物对话提升英语口语能力。支持中文辅助、语法优化、发音评估等功能,涵盖100+真实场景,适配不同英语水平用户。内置错题本、词汇统计、个性化学习计划等模块,帮助用户全面掌握学习进度。已接入DeepSeek R1模型,提升智能化学习体验。

PaperTT

PaperTT是一款基于AI技术的学术服务平台,提供论文写作、AIGC检测、查重与降重等一站式解决方案。用户可通过输入需求快速生成结构完整的论文初稿,并利用查重工具检测相似度,通过降重优化提升原创性。平台还具备精准的AIGC识别功能,确保学术诚信。适用于高校学生、教师、研究人员及内容创作者,全面支持学术研究与写作过程。