AI项目与工具

Stable Diffusion整合包

Stable Diffusion整合包是一款专为新手用户设计的本地部署解决方案,由B站UP主秋葉aaaki开发。它包含Stable Diffusion WebUI、必要的运行环境、预装模型及常用插件,使得用户无需复杂的技术背景就能便捷地安装和使用AI绘画工具。最新版本支持自动更新和多版本切换,并提供了丰富的预装资源和汉化界面,极大地简化了环境配置过程。

HitPaw Univd

HitPaw Univd 是一款基于人工智能的多功能视频转换工具,支持超过1000种格式转换,具备无损音视频处理、AI画质修复、视频下载和内置编辑功能。适用于音乐转换、教学视频制作、视频压缩与格式适配等多种场景,兼具高效性与专业性。

Auphonic

Auphonic是一款利用人工智能技术的在线音频后期处理工具,提供自动音量平衡、降噪、混响减少、滤波、静音剪切等功能,适用于播客制作、广播电台、电影视频制作等多个场景,支持多语言语音转文字及视频章节生成,提供免费和多种付费订阅方案。

POINTS 1.5

POINTS 1.5 是腾讯微信开发的多模态大模型,基于LLaVA架构设计,包含视觉编码器、投影器和大型语言模型。它在复杂场景OCR、推理、关键信息提取、数学问题解析及图片翻译等方面表现突出,适用于票据识别、自动客服、新闻摘要、学术论文处理、旅游翻译和在线教育等多个领域。该模型通过高效的数据处理和特征融合技术,实现了跨模态任务的精准处理与高效输出。

钉钉宜搭

钉钉宜搭是阿里巴巴推出的低代码应用开发平台,帮助企业快速搭建数字化业务应用。通过可视化拖拽和配置,无需代码或仅需少量代码即可完成应用开发,降低开发门槛和成本。提供丰富的组件库,支持表单设计、流程设计、数据统计分析等功能,具备集成云原生和钉原生能力,支持多语言和国际化,适用于人力资源管理、采购流程管理、销售数据分析等多种场景。

VISION XL

VISION XL是一款基于潜在扩散模型的视频修复与超分辨率工具,支持视频去模糊、超分辨率提升、视频修复及帧平均等功能。它采用伪批一致性采样、批量一致性反演等技术,显著提高了处理效率和视频质量。VISION XL广泛应用于电影修复、监控视频增强、体育赛事直播等领域,能够满足高质量视频需求。

SPAR

SPAR是一种自我博弈框架,专为增强大型语言模型的指令遵循能力设计。它通过生成者和完善者的角色互动,利用树搜索技术和迭代优化,提升模型的自我完善能力。实验显示,SPAR在多个基准测试中表现出色,适用于智能助手、客户服务、教育技术及医疗咨询等多个应用场景。

Cooraft

Cooraft是一款基于AI技术开发的应用程序,主要功能是将普通照片转化为具有创意和艺术性的动画和渲染图。它支持多种艺术风格,如3D卡通、经典绘画等,并能为面部照片添加表情动画,生成艺术表情符号。无论是个人用户还是专业人士,都能利用此工具快速创作出具有独特风格的艺术作品,广泛应用于社交媒体分享、个性化表情包制作、专业摄影以及艺术创作等领域。

PlanGEN

PlanGEN 是谷歌研发的多智能体协作框架,用于解决复杂问题的规划与推理。它包含约束、验证和选择三大智能体,支持多智能体协作、约束引导、算法自适应选择等功能。提供四种实现方式,适用于不同复杂度任务,如日程安排、数学证明、自动驾驶等。具有模型不可知性,可与多种大语言模型结合,具备良好的可扩展性和灵活性。

Linky

Linky是一款基于AI技术的虚拟角色互动平台,支持用户创建和自定义虚拟角色,并通过互动对话、故事创作和角色扮演等方式进行深度交互。平台提供多种故事情境和Gacha机制,满足用户在社交、情感陪伴、创意表达及故事创作等方面的需求。凭借其高度拟真性和个性化推荐功能,Linky为用户带来了全新的虚拟角色互动体验。