AI项目与工具

FantasyID

FantasyID是由阿里巴巴集团与北京邮电大学联合开发的视频生成框架,基于扩散变换器和3D面部几何先验,实现高质量、身份一致的视频生成。其通过多视角增强和分层特征注入技术,提升面部动态表现,同时保持身份稳定性。支持多种应用场景,如虚拟形象、内容创作和数字人交互,具备无需微调的高效生成能力。

Pull Sense

Pull Sense 是一款基于 AI 的代码审查工具,支持 GitHub 集成,可自动检测语法错误、安全漏洞、性能问题及代码风格不一致等问题。用户可选择多种 AI 模型,并通过自带密钥确保数据安全。支持自定义规则、多语言覆盖及灵活触发机制,适用于初创公司、大型企业、开源项目及 CI/CD 流程,提升代码质量和开发效率。

RD

RD-Agent 是一款开源的自动化研究与开发工具,基于大语言模型和自主代理框架,专注于提升研发效率与质量。它支持从想法提出到实现的全流程自动化,具备智能决策支持、跨领域知识迁移和数据驱动创新等功能,广泛应用于金融量化、医疗数据分析、科研助理等领域,助力用户快速构建和优化模型。

GroundingBooth

GroundingBooth 是一种创新的文本到图像定制框架,通过结合文本-图像对齐模块和遮罩交叉注意力层,实现了前景主体与背景对象的空间精准对齐。其核心功能包括单主题与多主题定制、身份保留、文本-图像一致性保障及复杂场景下的高精度生成。该工具广泛应用于个性化商品定制、艺术创作、游戏设计、广告营销等多个领域,为视觉内容创作提供了强大的技术支持。

HK

HK-O1aw是一款由香港生成式AI研发中心与北京大学合作推出的专业法律推理大模型,基于深度学习技术和神经网络架构,专注于慢思考和链式推理。它能够深入分析法律文本,提供逻辑严密的法律意见,涵盖合同审查、消费者权益保护、商业调解等多个应用场景,适合法律从业者、教育机构以及普通用户使用。

S2V

S2V-01是MiniMax研发的视频生成模型,基于单图主体参考架构,可快速生成高质量视频。它能精准还原图像中的面部特征,保持角色一致性,并通过文本提示词灵活控制视频内容。支持720p、25fps高清输出,具备电影感镜头效果,适用于短视频、广告、游戏、教育等多种场景,具有高效、稳定和高自由度的特点。

PartEdit

PartEdit是一种基于预训练扩散模型的细粒度图像编辑工具,通过优化部分标记实现对图像对象各部分的精准定位与编辑。其采用非二进制掩码和自适应阈值策略,确保编辑内容自然融合,保留原始细节。支持真实图像和多部分同时编辑,无需重新训练模型,适用于艺术设计、影视制作、广告等多个领域。

PaSa

PaSa是由字节跳动研发的基于强化学习的学术论文检索系统,能够模仿人类研究者行为,自动调用搜索引擎、分析论文内容并追踪引文网络,提供精准全面的学术文献检索服务。其核心技术包括Crawler和Selector两个智能体,结合强化学习优化,显著提升了搜索效率与准确率。PaSa适用于学术研究、高校教学、知识产权分析等多个领域,具备高效检索和复杂查询处理能力。

Stable Diffusion整合包

Stable Diffusion整合包是一款专为新手用户设计的本地部署解决方案,由B站UP主秋葉aaaki开发。它包含Stable Diffusion WebUI、必要的运行环境、预装模型及常用插件,使得用户无需复杂的技术背景就能便捷地安装和使用AI绘画工具。最新版本支持自动更新和多版本切换,并提供了丰富的预装资源和汉化界面,极大地简化了环境配置过程。

Connected Papers

Connected Papers 是一个学术研究工具,通过构建可视化图表帮助用户探索和发现相关学术文献。用户可以输入论文标题、DOI 或关键词,工具会生成一个展示相似论文的网络图,其中论文按相似度排列,颜色深浅表示发表时间的远近,圆圈大小代表被引用次数。该工具主要功能包括视觉概览、重要论文追踪、参考书目构建、先前和衍生作品发现以及跨学科支持。应用场景涵盖学术研究、文献综述、课程学习和项目研究等。