AI工具

Molmo 72B

Molmo 72B是一款由艾伦人工智能研究所推出的开源多模态AI模型,集成了图像和文本处理能力,适用于图像描述生成、视觉问答、文档解析及多模态交互等多种任务。凭借其强大的视觉编码能力和先进的模型架构,Molmo 72B在学术基准测试中表现优异,为开源AI技术的发展做出了重要贡献。

VideoGrain

VideoGrain是由悉尼科技大学与浙江大学联合研发的零样本多粒度视频编辑框架,支持类别级、实例级和部件级的精细化视频修改。它通过调节时空交叉注意力和自注意力机制,提升文本提示对目标区域的控制能力,确保时间一致性与特征分离,显著优于现有T2I和T2V方法。该工具无需额外参数调整,具备高效计算性能,适用于影视制作、广告营销、内容创作等多个领域。

olmOCR

olmOCR 是一款开源 PDF 文档处理工具,结合文档锚定技术和 Qwen2-VL-7B-Instruct 模型,可高效提取结构化文本并保留原始布局。支持多种文档类型,具备大规模批量处理能力和低成本优势,适用于学术研究、法律文件处理、企业文档管理及数字图书馆建设等多个场景。其开源特性与可扩展性也增强了用户的使用灵活性。

YouWare

YouWare是由明超平(Leon Ming)创立的AI编程社区平台,帮助用户通过自然语言描述需求生成代码,并一键部署为网页应用。平台提供AI自动化编程、一键部署与分享、作品集管理、权限控制、一键美化、社区展示和MCP集成等功能。用户可基于他人项目进行再创作,适合个人创意展示、学习编程和项目协作。YouWare汇聚全球创作者,项目数量庞大,是降低编程门槛的创新工具。

Landing

Landing 是一款基于 AI 技术的落地页生成工具,可快速创建美观高效的页面。用户输入品牌信息后,系统自动生成文案、图像和设计布局,支持可视化编辑与多版本测试。具备多语言支持、表单集成、数据分析等功能,适用于电商、数字营销、品牌宣传及活动推广等多种场景,提升转化效率与用户体验。

RenderNet AI

一款功能强大的图像和视频生成器,可对角色设计、构图和风格进行广泛控制。RenderNet Al可进行视频换脸,可轻松通过照片更改视频人物面容。

Project AVA

Project AVA 是一款由雷蛇开发的 AI 游戏辅助工具,支持 MOBA、FPS 和 ARPG 等多种游戏类型。它提供实时游戏指导、赛后复盘分析、游戏攻略生成以及硬件性能优化功能,帮助玩家提升操作水平与游戏体验。同时支持多平台交互,便于用户与 AI 交流。

BetterBugs

BetterBugs是一款基于Chrome浏览器的扩展工具,通过一键式屏幕捕获、屏幕录制和自动技术信息收集等功能,帮助用户高效生成详细的bug报告。它支持与多种项目管理和沟通工具集成,适用于软件开发、质量保证、项目管理和客户支持等多个场景,旨在提升团队协作效率和问题解决速度。

GenFM

GenFM是一款由ElevenLabs开发的AI工具,可将PDF、文章、电子书等内容转换为多角色播客音频。它支持32种语言,具备自动化声音选择、人性化填充词添加及高度定制化功能,适用于教育、播客制作、有声书创作、商业推广等多个领域。

Stable Artisan

Stable Artisan是一款基于Discord平台的图像和视频生成机器人服务,利用Stability AI的AI技术和模型,如Stable Diffusion 3和Stable Video Diffusion,使用户能够通过自然语言提示生成高质量的图像和视频。此外,它还提供了一系列图像编辑工具,包括搜索替换、背景去除、高清放大、扩展外延、控制素描和结构等功能,适用于创意人士、设计师、内容创作