AI工具

Chat2SVG

Chat2SVG 是一种基于大语言模型和图像扩散模型的文本到 SVG 生成工具,能够自动创建高质量矢量图形。通过多阶段处理流程,包括模板生成、细节增强和形状优化,确保图形在视觉质量和语义对齐方面达到较高标准。支持自然语言指令编辑,适用于设计原型、图标创作、教育演示及艺术创作等多种场景。

Archon

Archon 是一个开源 AI 智能体构建与优化平台,支持多智能体协作、领域知识集成、本地 LLM 集成等功能。它提供自动化代码生成、语义搜索、Streamlit 界面交互及 Docker 部署能力,适用于企业、教育、智能家居等多个场景。技术上融合 Pydantic AI 和 LangGraph,强调框架无关性和高效开发流程。

Kiss3DGen

Kiss3DGen是一款基于2D扩散模型的3D资产生成框架,通过“3D Bundle Image”结构实现多视角图像与法线图的融合,从而高效生成和编辑3D模型。它支持文本与图像输入,具备3D编辑、网格优化和纹理增强等功能,适用于游戏开发、影视制作、VR/AR、数字孪生及教育等多个领域。

AVD2

AVD2是由多所高校联合开发的自动驾驶事故视频理解框架,通过生成高质量事故视频并结合自然语言描述与推理,提升对复杂事故场景的理解能力。其功能涵盖事故视频生成、原因分析、预防建议及数据集增强,支持自动驾驶系统的安全优化与研究。基于先进模型如Open-Sora 1.2和ADAPT,AVD2在多项评估中表现优异,为自动驾驶安全提供了重要技术支撑。

Promptimize AI

Promptimize AI 是一款用于优化AI提示词的浏览器插件,支持多平台使用,可一键增强提示词、管理变量并实时提供建议,提高AI交互效率与输出质量。用户可保存常用提示词,方便调用,并享受隐私保护功能,适合内容创作、企业运营及教育等场景。

BuzzClip

BuzzClip 是一款基于人工智能的视频生成工具,专注于帮助用户在短时间内高效制作适合 TikTok 等平台的短视频内容。平台提供超过 100 个 AI 虚拟形象、多种预设模板及多语言支持,适用于品牌推广、产品展示和社交媒体运营等多种场景。用户可直接发布视频并进行品牌定制,具备完整的商业使用权和基础数据分析功能,提升内容创作效率与传播效果。

DeepTutor

DeepTutor 是一款基于人工智能的智能辅导系统,支持文本、图表、公式等多种内容的深度理解与解析。用户可上传 PDF 文档并选择不同模式进行提问,系统提供上下文相关的详细解答,并具备视觉内容解读、学习进度跟踪等功能。适用于学生学习、文献分析、知识图谱构建等场景,支持多语言界面,提升学习与研究效率。

Liquid

Liquid是由华中科技大学、字节跳动和香港大学联合开发的多模态生成框架,通过VQGAN将图像编码为离散视觉token并与文本共享词汇空间,使大型语言模型无需修改结构即可处理视觉任务。该框架降低训练成本,提升视觉生成与理解性能,并在多模态任务中表现出色。支持图像生成、视觉问答、多模态融合等应用,适用于创意设计、内容创作及智能交互等领域。

GPTExcel

GPTExcel 是一款基于AI的电子表格辅助工具,支持公式生成、自动化脚本编写、SQL查询生成等功能,简化复杂数据处理流程。它提供详细解释,帮助用户理解和应用生成内容,并支持表格模板创建、数据可视化和正则表达式生成,适用于多种应用场景,如财务、数据分析和人力资源管理。

Proxy Lite

Proxy Lite是一款开源的轻量级视觉语言模型,具有30亿参数,支持自动化网页操作。它通过“观察-思考-工具调用”机制,实现网页交互、数据抓取、表单填写等功能,适用于自动化测试、数据提取和智能任务辅助等场景。该工具资源占用低,可在消费级GPU上高效运行,适合开发者快速部署和使用。