IT - 智狐AI导航

Step1X

Step1X-Edit 是由阶跃星辰团队推出的通用图像编辑框架，结合多模态大语言模型与扩散模型，支持多样化的图像编辑任务，如主体修改、背景更换、风格转换等。用户可通过自然语言指令进行操作，系统能精准理解并生成高质量图像。该工具基于大规模数据集训练，具备强大的真实场景适应能力，适用于创意设计、影视制作、社交媒体等多个领域。

AI项目与工具 2025年06月11日 81 点赞 0 评论 853 浏览

DeepWiki

DeepWiki是一款由Devin团队开发的AI代码阅读助手，基于自然语言处理技术，帮助用户理解GitHub代码库并提供详细的文档级解答。支持深度研究、交互式图表生成、私有仓库文档创建等功能，适用于开源项目学习、代码审查、团队协作及教育培训等场景。目前已索引超3万仓库，处理超40亿行代码，对开源项目免费开放。

AI项目与工具 2025年06月11日 36 点赞 0 评论 741 浏览

F

F-Lite是一款由Freepik与FAL开源项目联合开发的10B参数文本到图像生成模型，基于版权安全数据集训练，支持商业应用。它采用T5-XXL文本编码器，结合扩散模型架构，实现高精度图像生成。支持多分辨率输出，包含256、512和1024像素，并推出专为纹理优化的F-Lite Texture版本。模型通过强化学习和多项优化技术提升生成质量与效率，适用于创意设计、内容创作、游戏开发等多个领域。

AI项目与工具 2025年06月11日 10 点赞 0 评论 749 浏览

Cobra

Cobra是由清华大学、香港中文大学和腾讯ARC实验室联合开发的漫画线稿上色框架，采用因果稀疏注意力机制和局部可复用位置编码技术，实现高精度、高效率的自动上色。支持颜色提示调整，提升灵活性与个性化。适用于漫画、动画、插画等多种场景，具有高效的推理能力和良好的扩展性。项目已开源，包含技术论文与模型资源。

AI项目与工具 2025年06月11日 21 点赞 0 评论 731 浏览

UniTok

UniTok是由字节跳动联合高校研发的统一视觉分词器，支持视觉生成与理解任务。其采用多码本量化技术，将视觉特征分割并独立量化，显著提升离散token的表示能力。在ImageNet上实现78.6%的零样本分类准确率，图像重建质量达0.38。可作为多模态大语言模型的视觉输入模块，广泛应用于图像生成、视觉问答、内容创作及跨模态检索等场景。

AI项目与工具 2025年06月11日 22 点赞 0 评论 471 浏览

mrge

mrge 是一款基于 AI 的代码审查工具，具备自动审核、智能文件排序和 PR 管理等功能，帮助开发团队提升代码质量和审查效率。它支持 GitHub 集成，并提供安全隐私保护机制，适用于企业级开发与跨部门协作，有效识别安全漏洞并保障代码合规性。

AI项目与工具 2025年06月11日 44 点赞 0 评论 570 浏览

FastVLM

FastVLM是一款高效的视觉语言模型，采用FastViTHD混合视觉编码器，显著提升高分辨率图像处理速度并减少token数量。其在保持高性能的同时，降低了计算成本和模型复杂度。适用于视觉问答、图文匹配、文档理解、图像描述生成等多模态任务，具备良好的实用性和扩展性。

AI项目与工具 2025年06月11日 85 点赞 0 评论 735 浏览

GitFriend

GitFriend 是一款基于 AI 技术的 GitHub 辅助工具，支持 AI 聊天答疑、动态生成 README 文件、Gitmoji 表情符号集成以及 Google 账号登录等功能，旨在提升开发效率和项目管理体验，适合开发者及团队使用。

AI项目与工具 2025年06月11日 55 点赞 0 评论 824 浏览

StreamBridge

StreamBridge是一款由苹果与复旦大学联合开发的端侧视频大语言模型框架，支持实时视频流的理解与交互。通过内存缓冲区和轮次衰减压缩策略，实现长上下文处理与主动响应。项目配套发布Stream-IT数据集，包含60万样本，适用于多种视频理解任务，展现出在视频交互、自动驾驶、智能监控等领域的应用前景。

AI项目与工具 2025年06月11日 41 点赞 0 评论 737 浏览

SketchVideo

SketchVideo是一款基于草图和文本提示的视频生成与编辑框架，由多所高校与企业联合研发。它利用DiT模型和草图控制网络，实现对视频内容的精细控制，支持动态调整与细节保留。该工具适用于多种场景，如影视制作、教育、游戏开发等，具备高效生成与高质量输出能力。

AI项目与工具 2025年06月11日 83 点赞 0 评论 842 浏览

IT

首页

IT

列表

默认

浏览次数

发布日期